01-05-日报-AI资讯日报
今日摘要
Gemini 悄悄上线 Agent 功能,能自主规划任务调用工具,Google 这波直接对标 OpenAI。
开源圈玩起多模型协作,Claude+Codex+Gemini 组队写代码,单打独斗的时代要过去了。
Agent 应用爆发在即,开发者该研究工作流了。⚡ 快速导航
- 📰 今日 AI 资讯 - 最新动态速览
💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。
今日AI资讯
👀 只有一句话
Gemini 悄悄上线 Agent 功能,Google 这是要跟 OpenAI 正面刚了。
🔑 3 个关键词
#Agent大战 #多模型协作 #开源狂欢
🔥 重磅 TOP 10
1. Gemini 新上了一个 Agent 功能
以前用 AI 就是一问一答,现在 Google 直接让 Gemini 学会"自己干活"了。这个新上线的 Agent 功能,意味着 Gemini 可以自主规划任务、调用工具、完成复杂操作。虽然具体能力还在摸索中,但这明显是在对标 OpenAI 的 GPT Agent。Google 这波不声不响,直接放大招。

2. CCG:Claude Code + Codex + Gemini 多家 CLI 协作工作流
一个人写代码太累?让三个 AI 一起上。这个开源项目把 Claude Code、Codex、Gemini 缝合成一个工作流——Claude 当主导者,Codex 负责后端,Gemini 搞前端。还内置了 6 阶段开发流程和质量门控,90% 以上评分才算通过。开发者狂喜,等等党又赢了。

3. OpenCode:比 Claude Code 更易用的开源编程代理
Claude Code 好用但门槛高,OpenCode 来填坑了。API 接入简单、支持所有主流模型、还有可视化客户端——不用折腾命令行。更绝的是,它能直接调用 Claude Code 的 Skills,甚至用你 Claude 账号的模型额度。配合 oh-my-opencode 插件,多 Agent 异步协作,体验丝滑。

4. TuriX-CUA:让 AI 接管 Windows 和 MacOS
给 AI 装上眼睛和手,让它像人一样操作电脑。TuriX-CUA 每隔几秒截屏,问大模型"下一步点哪",然后自动执行。遇到弹窗知道关,网页加载慢知道等。最新版引入多模型架构,测试集通过率超 80%。支持 MCP 协议,可以挂载到 Claude Desktop 上指挥它干活。
5. Grok 4.2 以"OBSIDIAN"身份现身 Design Arena
xAI 的新模型悄悄上线测试了。在 Design Arena 上,Grok 4.2 化名"OBSIDIAN"参战,设计能力比上一代有明显提升,但据测试者反馈,还没到 Claude Opus 4.5 的水平。不过考虑到 xAI 的迭代速度,这个差距可能很快就会被追上。

6. AutoGLM-GUI v1.4.1:双模型协作,让 AI 自动操作安卓手机
想让 AI 帮你点奶茶?这个开源项目做到了。AutoGLM-GUI 新版引入双模型协作——大模型思考、小模型执行,还支持分层代理模式,一句话自动分解复杂操作。兼容阿里 Tongyi 团队开源的 MAI-UI,性能更强。从理解自然语言到打开 App、点击、输入、确认,全程自动。

7. Obsidian + AI:只需 3 个插件,重新爱上本地笔记
本地 Markdown 笔记 + AI,简直是天作之合。推荐配置:Baseline 主题 + 妙言字体 + Claudian 插件(把 Claude Code 整合到侧边栏)。还有 NoteToMP 插件一键发公众号草稿箱,官方剪藏插件把任意内容转 Markdown 存本地。极简配置,省 token 又高效。

8. BypassAIGC 新增论文 Word 排版功能
写论文被 AI 检测工具折磨的同学有救了。这个开源项目专门做 AIGC 降重,现在新增了 Word 排版功能(虽然还有点 bug)。默认启用思考模式提高文本质量,朱雀 AI 检测稳定过。配合 Gemini 2.5 反代使用,效果更佳。项目已经 500+ star,需求确实大。

9. Latent Space 年度榜单:2025 最值得读的 AI 论文合集
想了解 AI 圈顶级聪明人在关注什么?这份榜单就是枕头。有人用 Claude Code 下载了文章提到的所有论文,共 123 篇、800M。已上传飞书文档和 GitHub,免费自取。从经典论文到最新研究,一网打尽。

10. 从 0 开始无痛记单词:自然拼读练习应用
死记硬背单词太痛苦?这个开源项目汇总了大部分拼读方法和真人发音练习,16000+ 单词,学完直接毕业。从基础开始,增加正反馈,持续更新中。对英语学习者来说,这可能是今年最实用的开源项目之一。

📌 值得关注
[产品] CodePlan Beta 稳定运行,每日抽奖送月度入门版 - X-AIO 旗下品牌回馈用户,连抽十天
[产品] Pickle 1 AI 眼镜发布 - 号称"灵魂电脑",能记住你一生所有事
[研究] 字节推出 StoryMem 系统 - 解决 AI 视频生成中的角色一致性问题,提升 28.7%
[研究] 清华联合推出 UltraEval-Audio - 音频模型评测新框架开源发布
[开源] 元象开源 XVERSE-Ent 大模型 - 聚焦泛娱乐场景,中英双语支持
[商业] 月之暗面计划 Q1 推出 Kimi K2 升级版 - 多模态新模型,现金储备超 100 亿
[其他] 中文语料污染严重,连 Codex 都被污染了 - 引发社区热议
😄 AI趣闻
Gemini 3 表现得像"雌小鬼"?
有人去年用 Claude 写了个"雌小鬼"语言风格提示词,今天发现 Gemini 3 居然表现得更好。最离谱的是,Gemini 第一次就抓住了"用户是女生"这个细节——而 Grok 用了一整年都没认真对待过这个设定。网友评论:“我都早就忘了还有这一个设定……” 😂

🔮 AI趋势预测
Agent 应用将在 Q1 迎来爆发
- 预测时间:2025年Q1
- 预测概率:80%
- 预测依据:今日新闻 Gemini 新上 Agent 功能 + AutoGLM-GUI 双模型协作 + 多个 Agent 工具密集发布,技术成熟度已达临界点
多模型协作成为 AI 编程主流范式
- 预测时间:2025年Q1-Q2
- 预测概率:75%
- 预测依据:今日新闻 CCG 多模型工作流 + OpenCode 多 Agent 协作 + 单模型能力瓶颈推动协作需求
OpenAI 将推出音频优先硬件产品
- 预测时间:2025年Q2
- 预测概率:60%
- 预测依据:今日新闻 OpenAI 押注"语音优先"未来 + 重构音频团队动作明显
❓ 相关问题
如何体验 Gemini 3 Pro?
Gemini 3 Pro 是 Google 最新发布的多模态大模型,目前需要 Google AI Pro 订阅才能完整使用。对于国内用户,可能面临支付困难或账号注册限制。
解决方案:
- 爱窝啦 Aivora 提供 Gemini AI Pro 的成品账号服务
- 极速发货,下单即用,无需处理支付和注册问题
- 提供稳定的独享账号,售后无忧
访问 aivora.cn 可查看完整的 AI 账号服务列表。
如何体验 Claude Code?
Claude Code 是 Anthropic 推出的 AI 编程助手,需要 Claude Pro 订阅才能使用。对于国内用户,Anthropic 账号注册和支付都存在一定门槛。
解决方案:
- 爱窝啦 Aivora 提供 Claude Pro 的成品账号服务
- 极速发货,下单即用,无需处理支付和注册问题
- 提供稳定的独享账号,售后无忧
访问 aivora.cn 可查看完整的 AI 账号服务列表。
如何体验 ChatGPT Pro?
ChatGPT Pro 是 OpenAI 的高级订阅服务,月费 200 美元,提供 GPT-5.2 Pro 等顶级模型的无限使用。对于国内用户,支付和账号注册都存在障碍。
解决方案:
- 爱窝啦 Aivora 提供 ChatGPT Pro 的成品账号服务
- 极速发货,下单即用,无需处理支付和注册问题
- 提供稳定的独享账号,售后无忧
访问 aivora.cn 可查看完整的 AI 账号服务列表。
🛒 今日推荐产品
基于今日新闻,以下 AI 工具可在 aivora.cn 快速体验:
| 产品 | 今日相关新闻 | 推荐理由 |
|---|---|---|
| Gemini AI Pro | Gemini 新上 Agent 功能 | 今日新上线 Agent 功能,值得体验 |
| Claude Pro | OpenCode 支持 Claude 模型 | 配合 OpenCode 使用,编程效率翻倍 |
| ChatGPT Pro | GPT 5.2 Pro 模型 | 顶级推理能力,适合复杂任务 |