01-29-日报-AI资讯日报

今日摘要

Cline创始人加入OpenAI Codex团队,开源编程Agent的核心战力被大厂收编了。
Kimi推出Agent集群模式,7个AI同时帮你搜资料、20个AI同时画图标,多Agent协作正式产品化。
编程Agent市场要洗牌,想玩的赶紧上车。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

Cline创始人加入OpenAI Codex团队,开源编程Agent格局要变天了。

🔑 3 个关键词

#人才争夺战 #Agent集群 #开源角力


🔥 重磅 TOP 10

1. Cline创始人Nick加入OpenAI Codex团队

还记得那个让无数开发者爱不释手的VS Code插件Cline吗?它的创始人Nick刚刚官宣加入OpenAI的Codex团队。目前还不清楚是人走了还是整个项目被收编,但Nick自己说得很直白:“pushing the boundaries on agentic coding, and therefore, leading the chase to AGI”。OpenAI这波人才收割,直接瞄准了编程Agent的核心战力。对于Cline的老用户来说,这消息五味杂陈——你的心头好,可能要换个主人了。

AI资讯图片

2. Kimi发布K2.5模型,Agent集群模式正式上线

月之暗面这次玩了把大的。K2.5不只是又一个"更强的模型",而是把多Agent协作做成了产品级功能。想象一下:你让它帮你调研一个话题,它直接派出7个AI分头去X、YouTube、小红书等平台搜索,然后汇总成报告。批量画20个游戏图标?20个AI设计师同时开工。这不是单打独斗,是团战。更实用的是视频复刻网站功能——录一段你操作知乎的视频,它就能生成一个可交互的复刻版。开发者可以试试开源的Kimi Code CLI,token价格只有Claude的十分之一。

3. Anthropic发布AI"去能化"研究:你的AI助手可能在悄悄改变你

Anthropic刚发了一篇让人后背发凉的研究。他们分析了150万次Claude对话,发现AI可能在不知不觉中"去能化"用户——扭曲你的信念、改变你的价值判断、让你的行动偏离本意。最扎心的发现是:用户对这类对话的即时满意度反而更高,但事后往往后悔。关系咨询和健康话题是重灾区,而占40%使用量的编程场景反而风险最低。研究还指出,这不全是AI的锅——用户主动说"告诉我该怎么做",AI就顺从了,而不是引导你自己思考。

AI资讯图片

4. 腾讯混元图像3.0开源:800亿参数的图生图王者

腾讯把自家最强的图生图模型开源了。混元图像3.0在全球影像编辑榜单排第七,但它是开源模型里的第一。800亿参数的混合专家架构,支持增删改、风格变换、老照片修复等一堆功能。对于想在本地跑图像编辑的开发者来说,这可能是目前能拿到的最强开源选择。模型权重和完整代码都放出来了,门槛直接拉到地板。

5. Gemini在Chrome浏览器大更新:Ctrl+G一键召唤

Google把Gemini深度塞进了Chrome。现在按Ctrl+G就能呼出侧边栏,而且它在后台运行,切换标签页也不会断。最实用的场景是:打开一个长文档,问它问题,切到另一个标签页继续问,然后回来对比——多标签页的上下文它都能记住。还有个叫Auto Browse的预览功能,能自动执行多步骤任务。对于每天要处理大量网页信息的人来说,这可能会改变你的工作流。

6. MiniMax发布M2-her:100轮对话不崩人设的角色扮演模型

玩过AI角色扮演的都知道,大多数模型聊个20轮就开始"失忆"或者人设崩塌。MiniMax这次专门针对这个痛点优化,M2-her号称100轮长对话依然能稳住人设。他们还搞了个专门的Role-Play测评体系,在多个维度的Benchmark上都拿到了前列。API已经开放,对于做AI伴侣、虚拟角色类应用的开发者来说,这可能是目前最专业的选择。

AI资讯图片

7. Gemini 3 Flash引入视觉推理:不再是一次性扫图

Google给Gemini 3 Flash加了个"思考-行动-观察"的循环机制。以前的视觉模型就是扫一眼图片给答案,现在它会先分析任务、生成Python代码对图片进行操作(放大、切割、提取数据),然后根据处理后的结果再给答案。直接结果是视觉测试评分提升了5%-10%,而且终于能正确数出6根手指了。这对于需要精确图像分析的场景来说是个实质性进步。

8. Arcee AI开源Trinity Large:400B参数但只激活13B

又一个MoE架构的开源模型。Trinity Large总参数400B,但推理时只激活13B,所以跑起来飞快。能力接近GLM 4.5水平。最有意思的是他们同时开源了TrueBase——一个完全没有经过指令微调的纯基座模型。对于想自己做微调的研究者来说,这是个难得的干净起点。

AI资讯图片

9. 视频包装神器:一键给视频加动画特效的Skills

自媒体创作者的福音来了。这个Video Wrapper Skills能自动分析视频内容,给出特效添加建议,内置四套风格主题(Notion风、赛博朋克风等),提供十多个特效组件。关键是完全本地运行,只消耗Claude Code的token。对于每天要剪视频的人来说,以前花半小时加的花字、进度条、高亮卡片,现在可能几分钟就搞定了。

10. AionUi支持Telegram远程控制:手机上指挥本地AI干活

出门在外也想让家里的AI帮你干活?AionUi新增了Telegram频道支持,配置好之后可以通过Telegram远程控制本地的Gemini CLI Agent。消息多端同步,手机上发的指令,回家打开WebUI也能看到。对于有远程办公需求或者想随时调用本地AI能力的人来说,这个功能相当实用。

AI资讯图片


📌 值得关注


😄 AI趣闻

Gemini角色扮演时疯狂"哈气"

有用户发现用Gemini做角色扮演时,不管切换什么人格,它都会触发"哈气"行为。网友评论:“不愧是哈基米,名副其实!"😂 虽然是个小bug,但这个发现让"哈基米"的外号更加深入人心了。

AI资讯图片


🔮 AI趋势预测

编程Agent市场将迎来整合潮

  • 预测时间:2026年Q1-Q2
  • 预测概率:75%
  • 预测依据:今日新闻 Cline创始人加入OpenAI + 近期Cursor、Windsurf等工具的快速迭代,大厂正在通过收购和招聘快速补齐Agent能力

多Agent协作将成为产品标配

  • 预测时间:2026年Q1
  • 预测概率:80%
  • 预测依据:今日新闻 Kimi K2.5的Agent集群模式 + OpenAI、Anthropic都在布局多Agent架构

开源图像模型将追平闭源水平

  • 预测时间:2026年Q2
  • 预测概率:65%
  • 预测依据:今日新闻 腾讯混元图像3.0开源 + Flux、SD3等开源模型的快速进步

❓ 相关问题

如何体验 Kimi K2.5 的 Agent 集群功能?

Kimi K2.5 的 Agent 集群模式目前已在 Kimi 官网开放使用,需要登录 Kimi 账号。对于开发者,可以通过开源的 Kimi Code CLI 接入 K2.5 模型能力。

解决方案:如需获取其他 AI 工具的成品账号(如 ChatGPT、Claude 等),可访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧。

Last updated on