02-03-日报-AI资讯日报
今日摘要
Claude Sonnet 5 疑似明天发布,Vertex AI 日志泄露模型 ID,SWE-bench 跑出 80.9% 碾压全场。
GUI Agent 成为 AI 圈新宠,李想点名六款产品都在解决同一个问题:让 AI 真正帮你干活。
明天盯紧 Anthropic,等等党可能又要赢了。⚡ 快速导航
- 📰 今日 AI 资讯 - 最新动态速览
💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。
今日AI资讯
👀 只有一句话
Claude Sonnet 5 疑似明天发布,Vertex AI 日志已泄露模型 ID。
🔑 3 个关键词
#Claude5泄露 #OpenAI双倍额度 #GUI Agent崛起
🔥 重磅 TOP 10
1. Claude Sonnet 5 泄露:代号"Fennec",明天可能就发布
等等党又赢了?Vertex AI 的错误日志里赫然出现了 claude-sonnet-5@20260203——没错,日期就是明天。据传这款新模型在 SWE-bench 上跑出了 80.9% 的成绩,直接碾压现有所有编程模型。更离谱的是,定价据说比 Opus 4.5 便宜一半,但性能全面超越。100 万 token 上下文窗口保留,速度还更快了。如果消息属实,Anthropic 这波属于"降维打击"。明天见分晓。
2. OpenAI Codex App 正式发布,付费用户额度翻倍两个月
Sam Altman 亲自下场宣传:Codex App Mac 版上线了。他说自己"惊讶于有多喜欢它",这话从 CEO 嘴里说出来,要么是真香,要么是 KPI。更实在的是,为了庆祝发布,所有付费用户的速率限制直接翻倍,持续两个月。免费用户和 Go 计划也能用了。开发者狂喜。想体验最新 AI 编程工具的,现在是上车的好时机。
3. 李想盘点 2025-2026 最具突破性 AI 产品:GUI Agent 成主角
李想发了条朋友圈,点名六款产品:Claude Code、豆包手机、Manus、OpenClaw、MoltBook、Chrome Gemini。看着不相干,但背后都在解决同一个问题——怎么让 AI 真正帮你干活。答案是 GUI Agent:AI 直接看屏幕、模拟点击,绕过 App 不开放接口的问题。用户想要贾维斯,但贾维斯走到哪都吃闭门羹。GUI Agent 就是那把万能钥匙。
4. DeepThink 开源:仿造 Gemini 3 Pro DeepThink 的多专家协作系统
Gemini 3 Pro DeepThink 原版太贵,运作还是黑盒。于是有佬友自己搞了一个开源版本出来。多专家动态协作,Planner 根据问题复杂度自动分配 2-7 位专家并行拆解。集成 Exa 和 Tavily 搜索,实时注入最新资料。WebSocket 流式推送每位专家的独白、草稿、推理链,你可以围观整个深度思考过程。OpenAI API 兼容,前后端分离,易维护易扩展。穷人的 DeepThink,真香。

5. 阶跃星辰 Step 3.5 Flash 开源:196B 参数,OpenRouter 免费用
阶跃星辰开源了 Step 3.5 Flash,参数量 196B,但每个 token 只激活 11B,上下文支持 256K。推理速度是亮点,峰值 350 tok/s,非常快。现在推广阶段,OpenRouter 上免费用。Reddit 上 r/LocalLLaMA 的老哥评测说,128GB 设备跑本地模型,这款是新王者。想要又快又强的本地模型?这个值得一试。

6. Yoroll:AI 驱动的互动影游创作平台,一个人搞定整个游戏
上周 Genie 3 发布后,AI 互动游戏赛道开始爆发。Yoroll 就是这波浪潮里的新玩家:完全不用代码和拍摄,就能创建有分支剧情的互动影游。平台支持角色面部和声音一致性保持,每个选择都能触发实时生成的 AI 视频回复,还支持 QTE 等游戏交互。去年 Steam 国区互动影游卖得相当不错,现在你只要有个好剧本,一个人就能搞定整个游戏。
7. 微软 CTO 内部邮件曝光:当年 OpenAI 董事会为何解雇 Sam Altman
一封 2023 年 11 月的内部邮件被曝光,微软 CTO Kevin Scott 详细解释了 OpenAI 董事会解雇 Sam Altman 的真实原因。核心矛盾是 Ilya Sutskever 与 Sam 在资源分配上的分歧:研究团队和应用团队抢 GPU,Ilya 觉得是零和博弈。更私人的原因是 Jakub 被提拔后取得了 Ilya 多年未能实现的突破。这封邮件读起来像宫斗剧,但揭示了 AI 公司内部的真实张力。
8. Claude Code 使用技巧:Anthropic 内部总结,并行工作是头号秘诀
Claude Code 创建者 Boris 再次分享 Anthropic 内部总结的使用技巧。头号秘诀是并行工作:同时开 3-5 个 git worktree,每个跑一个独立的 Claude 会话。复杂任务先做计划,维护 CLAUDE.md 是长期投资,把重复操作做成技能。还有个骚操作:让 Claude 自动修复 bug,启用 Slack MCP,把 bug 讨论帖粘贴给它,只说"修复它"。不需要切换上下文。

9. 即刻推出超级椰子:AI 语音输入法,支持 Prompt 模式
即刻出了一款 AI 语音输入法叫超级椰子,类似 Typeless 和闪电说。支持转录和 Prompt 两种模式,有本地和云端模型。不在输入框中也能用,像 Raycast AI Shortcut 语音版。选中一篇文章语音说"总结一下",任意文本、图片、截图都支持 Prompt 处理。截图功能做得不错,滚动翻译、箭头标注、打马赛克、加水印,实用性很强。目前只有 Mac 版。

10. Karpathy 的 nanochat:100 美元能买到的最好 ChatGPT
Karpathy 大佬又出手了。nanochat 项目号称"100 美元能买到的最好 ChatGPT",目前 GitHub 上已经 4 万多 Star。这是一个极简的 ChatGPT 实现,代码量很小但功能完整。如果你想学习 ChatGPT 的核心原理,或者想自己搭一个轻量级的对话系统,这个项目是最好的教材。Karpathy 出品,必属精品。
📌 值得关注
- [产品] 元宝界面设计好但上下文工程差 - 腾讯元宝的 UI 很香,但 AI 理解能力还需加强
- [开源] claude-mem:给 Claude Code 加持久记忆 - 自动捕获编码会话,注入未来上下文,1.8 万 Star
- [开源] PageIndex:无向量的 RAG 方案 - 用树状结构替代向量检索,1.2 万 Star
- [工具] OpenClaw 烧钱实录:3 天 30 刀 1 亿 Tokens - 有佬友求推荐更便宜的 API 方案
- [商业] 阿里砸 30 亿发红包推广通义千问 - 想借春节重塑 AI 超级入口
- [研究] 东南大学发布全球首个混凝土科学大模型 - AI+工程材料的跨界尝试
😄 AI趣闻
Perplexity 疯了:问小米音箱问题,AI 陷入疯狂查询模式
今天最离谱的 AI 新闻:有用户问 Perplexity 关于小米音箱的问题,问到"OH2P 支持更高质量的蓝牙音频吗"时,AI 突然展开了疯狂查询模式,最后直接"疯了"……截图里 AI 的状态看起来像是陷入了无限循环。网友评论:“AI:我不管,我要把全网关于蓝牙音频的资料都查一遍!” 😂

🔮 AI趋势预测
Claude Sonnet 5 正式发布
- 预测时间:2026年2月3日-2月7日
- 预测概率:75%
- 预测依据:今日新闻
Claude Sonnet 5 泄露
+ Vertex AI 日志已出现
claude-sonnet-5@20260203,发布窗口指向明天
GUI Agent 成为主流交互方式
- 预测时间:2026年Q2
- 预测概率:70%
- 预测依据:今日新闻 李想盘点突破性 AI 产品 + 豆包手机、OpenClaw、Chrome Gemini 都在押注这条路线
OpenAI 与 Anthropic 编程模型大战升级
- 预测时间:2026年2月-3月
- 预测概率:80%
- 预测依据:今日新闻 Codex App 发布 + Claude Sonnet 5 泄露,两家在编程领域的竞争将白热化
本地大模型迎来新一波热潮
- 预测时间:2026年Q1
- 预测概率:65%
- 预测依据:今日新闻 Step 3.5 Flash 开源 + 128GB 设备可跑的高性能模型越来越多
❓ 相关问题
如何体验 Claude Sonnet 5?
Claude Sonnet 5 目前尚未正式发布,但根据泄露信息,可能在 2026 年 2 月 3 日上线。届时需要 Anthropic 付费账号才能使用。对于国内用户,可能面临支付困难或账号注册限制。
解决方案:访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧。