爱窝啦 AI 日报 2026/4/17
今日摘要
Codex 完成大跃进:能看屏幕、点鼠标、敲键盘,整台电脑都成了它的操作范围,300万开发者的工具悄悄变成了全能 Agent。
xAI 的 GPU 利用率只有 11%,被迫转型出租算力,马斯克的模型公司正在变成云服务商。
今天最值得点开的是前两条——编程工具的边界正在消失,这不是小更新。⚡ 快速导航
- 📰 今日 AI 资讯 - 最新动态速览
💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。
今日AI资讯
👀 只有一句话
Codex 悄悄从"写代码的工具"变成了"能操作你整台电脑的 Agent"——这个升级,比大多数人意识到的要激进得多。
🔑 3 个关键词
#Codex越界 #算力空转 #图像军备竞赛
🔥 重磅 TOP 10
1. Codex 大更新:从写代码工具变成能操作你电脑的助手
以前 Agent 碰到没有 API 的软件就直接卡死,现在不一样了。Codex 这次升级之后,能自己看屏幕、自己点鼠标、自己敲键盘,在 Mac 上跑多个 Agent 并行干活,还不会抢你正在用的窗口。每周 300 多万开发者在用这个工具,这次升级的意义不只是"加了几个功能"——它在悄悄把编程助手的边界往外推,推到整台电脑都是它的操作范围。新增 90 多个插件,JIRA、GitLab、CircleCI、微软全家桶全接进来了,图像生成也打通了,产品概念图和写代码可以在同一个流程里完成。
2. Codex 内置浏览器上线:直接在编辑器里圈点网页给 Agent 下指令
以前调试前端,你得在浏览器和编辑器之间来回切换,截图、复制、粘贴,一套流程下来能把人搞烦。现在 Codex 直接内置了带"评论模式"的浏览器,点一下网页元素,它自动截图、抓 DOM、把上下文塞进对话窗口,Agent 立刻知道你在说哪里。这个功能最早是 v0 先做的,现在 Codex 也跟上了。对做前端开发和游戏调试的人来说,这个体验变化是实实在在的——少了好几个来回,迭代速度直接快一截。
3. xAI 把自己变成 GPU 出租商,第一个客户是 Cursor
坐拥 20 万块 Nvidia GPU,GPU 利用率只有 11%——行业正常水平是 35%-45%。这个数字一出来,xAI 为什么突然要出租算力就说得通了。Cursor 计划用 xAI 的数万块 GPU 训练新版编程模型 Composer 2.5,这笔交易让马斯克的 xAI 从模型公司悄悄变成了云计算服务商,跟亚马逊、微软、Google 站到了同一条赛道。更微妙的是,xAI 今年 3 月刚从 Cursor 挖走了两位产品工程负责人——这两家公司的关系,已经不只是简单的买卖了。
4. gpt-image-2 实测:给 GitHub 链接直接生成中文宣传图,零错字
把项目的 GitHub 链接扔给它,让它生成卡片式宣传图,中文一个错字都没有。这件事听起来平常,但对比一下谷歌最近对 Gemini Nano 2 的降智操作,差距就出来了。gpt-image-2 现在的中文文字生成能力,已经到了可以直接用于对外宣传物料的程度,不需要再手动修字。对做内容、做产品的人来说,这个能力点是真实可用的,不是跑分上的数字游戏。

5. Nuvacore 成立:Nuvia 原班人马重出江湖,拿了 2.4 亿美元做 AI 时代的 ARM CPU
五年前,Gerard 创立 Nuvia 做 ARM CPU,被高通收购。五年后,他带着原班人马重新出发,新公司叫 Nuvacore,拿了红杉的投资,目标是做面向 AI 基础设施和 Agentic Computing 的通用 ARM CPU。时机选得很准:AI Agent 带来的 CPU 短缺已经开始浮现,AWS 多个客户都在抢 Graviton ARM CPU 产能。上次他们在方向未被验证时就成功了,这次风口更明确、融资更多、团队更强——湾区芯片圈最热门的抢人大战,大概率要开始了。
6. AI 智能体跑十步就崩?问题不在模型,在 Harness 没配好
Agent 跑到第七步突然开始胡编乱造,第十步输出一段残破的 JSON,整条链路夭折——这个场景很多人都遇过,第一反应是骂模型太蠢。但若石这篇博客给出了另一个视角:不是马不行,是缰绳没拴好。他提出的 Harness Engineering 有四个核心原则:能用代码约束的别指望模型自觉、关键状态必须外置、错误要能自动回滚、执行链路要可观测。这不是新概念,但把它系统化地讲清楚,对正在踩坑的 Agent 开发者来说,是真正有用的工程指南。
7. 李广密点评海外 AI 大厂:Anthropic 专注领跑,OpenAI 暂时被低估
张小珺《商业访谈录》里,李广密对三家公司的判断很有意思。Anthropic:果断放弃 C 端和多模态,All in Coding 和 Agent,创始人亲自带队清数据,信息高度保密,是目前最专注的领跑者。OpenAI:曾经陷入和 Google 抢流量的泥潭,对 Coding 赛道判断晚了几个月,但人才密度极高,正在快速补课,大概率能追平甚至交替领先。Google:最稳的追随者,Gemini 3.0 过度追跑分,忽视了实际体验。这个视角不是新闻,但作为理解三家公司战略差异的框架,值得存下来。
8. Video Use 开源:Claude Code 直接剪辑视频,去掉口头禅和空白段
Browser Use 公司又开源了一个 Agent 工具,这次是给视频剪辑用的。原理是先提取字幕并标注每个词的时间点,然后让 LLM 根据字幕来剪辑——去掉口头禅、措辞、空白时间段,也支持按需截图分析。适合口播类视频,局限也很明显:整体还是靠字幕文本驱动,不能理解画面内容。但对做知识分享、播客剪辑的人来说,这个工具能省掉不少手动找时间点的功夫,GitHub 直接可以去拿。
9. 谷歌 Gemini Mac 客户端上线,但功能简陋到让人尴尬
终于来了,但来了又感觉没来。全用 Swift 写的原生应用,UI 粗糙,Artifact 复杂一点的网页都渲染不了。对比 Claude 和 ChatGPT 的 Mac 客户端,这个版本更像是"先占个坑"。谷歌在模型能力上一直不差,但产品节奏慢、打磨不够,是老毛病了。现在 AI 客户端的竞争已经很激烈,这个状态上线,很难留住用户。

10. 警惕 X 上的 AI 训练诈骗:用 Google Site 伪造官方域名,执行命令就完蛋
套路是这样的:有人在 X 上说有 AI 训练项目可以参加,引你去 Telegram,然后发一个用 Google Site 搭建的伪造谷歌工作空间链接——域名和内容看起来完全是官方的。点进去提示"认证错误",让你执行一段指定命令,执行了就中招了。这个骗局的隐蔽性在于 Google Site 本身就是谷歌的服务,域名真实,普通人很难分辨。记住一条:任何让你在终端执行"修复命令"的链接,不管来源看起来多正规,都不要碰。
[产品] Impeccable 升级到 2.0,推出 CLI 工具检测 25 种 AI slop 设计 — 不用 LLM 就能扫描代码里的 AI 味设计,还有 Chrome 扩展一键检测网页,想做出有辨识度而不是千篇一律 AI 风格的产品,这个工具值得试试。
[产品] Logo 生成 Skill:发产品介绍就能生成 Logo,还能用代码生成动态展示网页 — 结合 Nana Banana 生成高级 Logo 展示图,支持动态网页,做 PPT 封面或官网素材的效率工具,实际效果看视频比描述更直观。
[开源] 阿里开源 Qwen3.6-35B-A3B — 小版本升级,但阿里还在持续开源这件事本身就值得记一下,模型在 HuggingFace 直接可以拿。
[商业] 《经济学人》封面:五位 AI 大佬掌控着塑造未来的模型,该信任他们吗? — 主流媒体开始正面讨论 AI 权力集中问题,这个叙事框架的出现本身就是一个信号。
[研究] Claude Opus 4.7 开始说"一句话锁死版本"“最硬的那一刀"这类网络黑话 — 模型语料污染问题浮出水面,训练数据里的网络用语正在影响模型输出风格,这个现象值得持续观察。
Claude 开始说黑话了,用户表示:我是在用 AI 还是在刷微博?
有人发现,最新版 Claude Opus 4.7 的回复里开始出现"一句话锁死版本"“最硬的那一刀"这类表达。以前 Claude 给人的印象是措辞严谨、有点学院派,现在突然开始说这种话,用户的第一反应是:这是 Claude 还是某个微博大 V?更有意思的是,有人觉得它和 Codex 的语气越来越像了。模型在悄悄学人说话,但学的是哪种人说的话——这个问题,大概只有训练团队自己知道。
🔮 AI趋势预测(4条)
Codex 系 Agent 工具将引发新一轮"桌面 AI 操作"竞赛
- 预测时间:2026年5月-6月
- 预测概率:75%
- 预测依据:今日新闻 Codex 大更新 显示 OpenAI 已将 Codex 从代码工具扩展为全桌面操作 Agent。这个方向一旦被验证可用,Cursor、GitHub Copilot、Replit 等竞品大概率会在 1-2 个月内跟进类似能力,桌面级 Agent 操作将成为编程工具的新标配。
xAI GPU 云业务将快速扩张,算力出租成为其重要收入来源
- 预测时间:2026年Q2
- 预测概率:65%
- 预测依据:今日新闻 xAI 出租 GPU 给 Cursor 揭示 xAI GPU 利用率仅 11%,远低于行业水平。空转算力变现压力明显,Cursor 只是第一个客户,接下来大概率会有更多 AI 公司跟进租用,xAI 的云计算业务轮廓将逐渐清晰。
AI 图像生成中文文字能力将成为国内用户选择模型的核心指标
- 预测时间:2026年5月
- 预测概率:70%
- 预测依据:今日新闻 gpt-image-2 中文零错字实测 引发大量讨论,对比 Gemini 降智的负面反馈,中文文字生成准确性正在成为国内用户评价图像模型的关键维度,国内厂商将加速跟进这一能力点。
ARM CPU 在 AI 数据中心的渗透率将加速提升,Nuvacore 等新玩家推动格局重塑
- 预测时间:2026年Q3
- 预测概率:60%
- 预测依据:今日新闻 Nuvacore 成立并获 2.4 亿美元融资 显示 AI Agent 带来的 CPU 需求激增已经让 AWS 客户开始抢 Graviton 产能。原 Nuvia 团队的重新集结,是市场对 ARM 服务器 CPU 需求爆发的直接响应,未来半年内这条赛道的竞争将明显加剧。
❓ 相关问题
如何体验 OpenAI Codex 最新版本?
Codex 目前集成在 OpenAI 的桌面应用中,需要 ChatGPT Pro 或 Team 订阅才能使用完整功能,包括最新的桌面操作 Agent 和内置浏览器能力。国内用户在注册和支付环节可能遇到障碍。
解决方案:访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧,省去注册和支付的麻烦,直接上手体验最新 Codex 功能。