12-29-日报-AI资讯日报
AI 日报 2025/12/29
AI 日报
今日摘要
Jim Fan 复盘机器人领域:硬件已经很牛,但软件根本跟不上,VLM 方案"感觉不对"。
32B 开源模型跑出 OpenAI 级深度研究能力,秘诀是把预测 token 换成决定原子动作。
Vibe Coding 血泪经验值得收藏,Claude Code 从业余项目变成 10 亿美元产品的故事也很精彩。⚡ 快速导航
- 📰 今日 AI 资讯 - 最新动态速览
💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。
今日AI资讯
👀 只有一句话
DeepMind 纪录片破 2 亿播放,Jim Fan 却说机器人领域是"野蛮西部"——软件远没跟上硬件。
🔑 3 个关键词
#机器人困局 #VibeCoding最佳实践 #深度研究Agent
🔥 重磅 TOP 10
1. Jim Fan 年终复盘:机器人领域的三大教训
大家都在吹 Optimus、Figure 这些炫酷机器人,但 NVIDIA 高级研究科学家 Jim Fan 泼了盆冷水:硬件已经很牛了,但软件根本跟不上。更扎心的是,这些机器人娇贵得很——过热、电机坏、固件抽风是家常便饭,每天都在"伺候"它们。他还直言现在主流的 VLM-based VLA 方案"感觉不对",因为视觉语言模型的预训练目标是回答问题,会主动丢弃对灵巧操作至关重要的低级细节。他押注视频世界模型才是正道。 2026 年机器人圈,有得看了。
2. Step-DeepResearch:32B 参数干翻 OpenAI 和 Gemini 的深度研究 Agent
OpenAI 和 Google 的深度研究系统要收费,还是黑盒。现在有人用 32B 参数的开源模型,跑出了差不多的分数(Scale AI 基准测试 61.42 分)。秘诀是什么?把"预测下一个 token"换成"决定下一个原子动作"——规划、深度搜索、反思验证、报告生成,四步走。最骚的是架构超简单,就一个 ReAct 风格的 Agent,没有花里胡哨的多 Agent 编排。中等规模模型 + 正确的训练数据 = 专家级研究能力,这个公式值得记住。
3. Vibe Coding 最佳实践:100 万行代码换来的血泪经验
“有手就能 Vibe Coding”?太天真了。@vibekanban 的联合创始人用 AI 写了 100 万行代码后,总结出几条铁律:先规划再写码(AI 一旦开写就倾向于"最小修改",架构会越来越僵);开 YOLO 模式让 AI 自己跑,但前提是你的代码库有自动化测试;在系统提示里明确告诉 AI"我们追求最简单的改动,不在意迁移成本",否则它会偷懒。还有个骚操作:用 ESLint 禁止 AI 随意禁用 lint 规则。这份指南,建议收藏。
4. Claude Code 的起源:一个业余项目如何变成 10 亿美元 ARR 产品
你敢信吗?Claude Code 最初只是开发者 Boris Cherny 2024 年 9 月的业余项目。当时 Claude 连简单的 Bash 都经常写错,跑几分钟就崩。但现在,基于 Claude Sonnet 4.5 和 Opus 4.5,它能持续运行数小时甚至数天,完成超复杂的任务。关键技术是"Stop Hooks"机制——当 Claude 想停下来时,你可以用脚本"戳"它继续干活,比如跑测试、失败了就自动修复。Anthropic 对 AI Agent 的定义:LLM + 循环自动调用工具,Claude Code 就是这个定义的完美实践。
5. DeepMind 纪录片《The Thinking Game》4 周破 2 亿播放
Demis Hassabis 亲自安利:这部讲 AlphaFold 诞生故事的纪录片,4 周内 YouTube 播放量突破 2 亿。如果你想了解一个 AGI 实验室是怎么运作的,或者诺贝尔奖级别的项目是怎么做出来的,假期可以刷一刷。导演 Greg Kohs,配乐 Dan Deacon,制作阵容也很豪华。
6. LongVideoAgent:让 AI 真正"看懂"一小时长视频
现在的多模态大模型处理长视频,基本就是"压缩摘要 + 疯狂抽帧",细节全丢了。这篇新论文提出了 LongVideoAgent:一个主 Agent 负责推理和决策,一个定位 Agent 找相关片段,一个视觉 Agent 提取细节。用强化学习教主 Agent 什么时候该探索、什么时候该停。结果?GPT-5-mini 在长视频问答基准上从 62.4% 跳到 71.1%,Qwen2.5-3B 更是从 23.5% 飙到 47.4%,直接翻倍。Agent 化设计,才是长视频理解的正确打开方式。
7. Genfocus:一个专门调景深和光圈的 AI 小模型
这个模型很有意思,专门用来调整图片的景深和光圈效果,也能把浅景深照片改成全对焦。不是那种大而全的图像编辑模型,就是把一件事做到极致。模型已经开源在 HuggingFace 上了,摄影爱好者可以玩玩。
8. Sam Altman:Google 仍是巨大威胁,ChatGPT 每年要"红色警报"两次
Sam Altman 最新表态:Google 依然是 OpenAI 的巨大威胁,ChatGPT 团队可能"每年要进入红色警报状态两次,而且会持续很长时间"。这话说得很实在——AI 竞争远没到终局,巨头之间的神仙打架还会继续。

9. ChatGPT Plus 免费一个月的小技巧
这个羊毛值得薅:取消 ChatGPT Plus 订阅后,OpenAI 为了挽留你,会送你一个月免费(100% off)。虽然不知道这个策略会持续多久,但现在还能用。
10. 中国发布 AI 人类交互监管草案
中国正在制定针对"具有类人交互能力的 AI"的监管规则草案。具体细节还没完全公开,但方向很明确:当 AI 越来越像人的时候,监管也要跟上。这对国内做 AI 陪伴、AI 客服的团队来说,是个需要关注的信号。
📌 值得关注
[开源] awesome-llm-apps - 84K Star 的 LLM 应用合集,RAG 和 Agent 案例超全
[开源] vibe-kanban - 让 Claude Code/Codex 效率提升 10 倍的看板工具,7K Star
[开源] Mole - 深度清理 Mac 的工具,21K Star,国人作品
[开源] Fresh - 终端文本编辑器,简单强大,不用背 Vim 快捷键
[产品] 万物设计定制工坊 - 把任何复杂概念解构成 4K 高清图片,Refly.ai 出品
[商业] 法国电信巨头 Orange 员工在用国人做的 AI 工具站 - 间接服务世界 500 强?
[其他] 李飞飞"K12 教育浪费时间"言论澄清 - 原话被严重曲解,建议看原文
📊 更多动态
| # | 类型 | 标题 | 链接 |
|---|---|---|---|
| 1 | 开源 | TheAlgorithms/Python - 所有算法的 Python 实现 | GitHub |
| 2 | 开源 | RustPython - 用 Rust 写的 Python 解释器 | GitHub |
| 3 | 开源 | QuantConnect Lean - 算法交易引擎 | GitHub |
| 4 | 研究 | VLNVerse - 吴琦团队的具身导航全栈平台 | 详情 |
| 5 | 教程 | 如何不写代码构建 10 万美元 AI SaaS | 视频 |
| 6 | 工具 | Nuggt Canvas - 更好看的 MCP 客户端 |
❓ 相关问题
如何体验 ChatGPT Plus?
ChatGPT Plus 目前需要每月 $20 的订阅费用才能使用 GPT-4o 等高级功能。对于国内用户,可能面临信用卡支付困难或账号注册限制。
解决方案:
- 爱窝啦 Aivora 提供 ChatGPT Plus 的成品账号服务
- 极速发货,下单即用,无需处理支付和注册问题
- 提供稳定的独享账号,售后无忧
访问 aivora.cn 可查看完整的 AI 账号服务列表。