03-06-日报-AI资讯日报
今日摘要
GPT-5.4 落地电脑操控,75%成功率反超人类,百万上下文API定价还算良心。
Raycast用自然语言直接生成Mac应用,阿里通义核心人物离职,CEO亲自下场接盘。
桌面Agent元年开局,开发者今天值得挨个试一遍。⚡ 快速导航
- 📰 今日 AI 资讯 - 最新动态速览
💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。
今日AI资讯
👀只有一句话
OpenAI 深夜甩出GPT-5.4,能直接操控你的电脑,操作成功率比人类还高。
🔑 3个关键词
#GPT5.4炸场#AI操控电脑 #阿里换帅风波
🔥 重磅 TOP 10
1. OpenAI 发布 GPT-5.4:首个能"亲手操作电脑"的通用模型
想象一下,你跟 AI 说"帮我把这份Excel 整理成 PPT 发邮件出去",它真的打开Excel、拖拖拽拽、切到 PowerPoint、排好版、打开邮箱——全程你只需要看着。GPT-5.4 就是这么个狠角色。在桌面操控测试中,它 75% 的成功率直接超过人类的72.4%,上代 GPT-5.2 才 47.3%。投行建模得分从 68.4% 飙到 87.3%,编程能力直接吞掉了 Codex 专用模型。更实用的是"工具搜索"功能,token 消耗直降47%,开发者的钱包终于能喘口气了。今天起Plus 用户就能用,等等党又赢了。
2. GPT-5.4 开放百万上下文,只对超出部分加倍计费
以前处理长文档最头疼的就是上下文窗口不够用——塞不下就得切片、拼接、来回折腾。现在 GPT-5.4 的 API 和 Codex 直接支持 100 万上下文。关键是计费方式很良心:272K 以内正常收费,只有超出的部分才两倍计费。对比 Claude 的百万上下文定价,这波性价比确实高出一截。代码能力也直接合并进了主模型,不用再单独调Codex,一个模型打天下。开发者狂喜,钱包微笑。

3. GPT-4.5 和 o1 pro 才是真巅峰?社区热议 5.2 是"便宜货"
就在大家为 GPT-5.4 欢呼的时候,社区里掀起了一波怀旧讨论。有用户拿出测试数据指出:除了编程 Agent 场景,GPT-4.5 和 o1 pro 在综合质量上至今无人超越。更有人直言"GPT o3 好过 5.2 thinking,5.2 就是个骗局"。这话说得挺狠,但也反映了一个现实——模型版本号往上涨,实际体验未必线性提升。今天 5.4 发布了,到底是真正的全面超越,还是又一轮"部分强部分弱"的取舍?值得你亲自上手试试。
4. 阿里确认通义千问负责人林俊旸离职,Qwen 灵魂到底是谁?
这条新闻的戏剧性拉满了。阿里正式确认通义千问核心人物林俊旸离职,CEO吴泳铭亲自牵头成立基础模型支持小组。但更有意思的是公关层面的微妙操作——阿里 PR 快速定调"林俊旸不是核心人物,只是活跃在海外社交媒体",称"Qwen 的灵魂是阿里云CTO"。内部信里其他人都用花名称呼,唯独对林用全名。网友评论:“分手前叫花名,分手后叫林某某。” 大厂人事风波,信息量巨大,阿里的开源大模型战略走向值得持续关注。
5. Raycast 推出 Glaze:用自然语言就能生成 Mac 应用
以前想做个简单的 Mac 小工具,得学Swift、配 Xcode、折腾签名证书,光环境搭建就够劝退一半人。现在 Raycast 发布了 Glaze,你只需要用自然语言描述"我想要一个倒计时工具"或者"帮我做个Markdown 编辑器",它就能直接生成一个原生 Mac 应用——甚至可以发布到应用商店。软件自定义的门槛被打到了地板上。这不是 demo 级别的玩具,是真能用的产品。对于那些有创意但不会写Swift 的人来说,这扇门终于打开了。
6. Claude Code 远程操控神器:飞书、Telegram、Discord 随时交互
在外面跑会议,突然想让 Claude Code 帮你改几行代码——以前只能等回到电脑前。现在这个开源 Skill 把 Claude Code 直接接入飞书、Telegram、Discord,手机上就能远程下指令、审批工具调用、实时看输出。配置过程做成了交互式向导,会一步步告诉你"点这里、填那个",小白也能搞定。密钥用 chmod 600 存储,日志自动脱敏,安全细节做得很到位。一行命令安装:npx skills add op7418/Claude-to-IM-skill,值得一试。

7. TuriX-CUA 开源:让 AI 像人一样操控 Mac和 Windows桌面
跟 GPT-5.4 的 Computer Use 相呼应,开源社区也在同一天给出了自己的答案。TuriX-CUA 是一个桌面操控 Agent框架,能让 AI 直接看屏幕、点鼠标、敲键盘——预订机票、搜YouTube点赞、在 Discord 收文件做图表然后回复老板,全都能干。架构上把 AI拆成"大脑、执行者、规划者、记忆管理"四个角色,每个角色可以换不同模型,灵活度很高。已经有专门的 Skill 可以接入 Claude Code。不需要目标软件提供 API,只要你能点到的地方,它都能点。
8. Codex 桌面端终于登陆 Windows
Windows 用户等了太久了。OpenAI 的 Codex桌面应用一直只有 Mac 版,今天终于推出 Windows 版本。配合 GPT-5.4 的发布,Windows 开发者现在可以直接在桌面端享受百万上下文、原生代码能力和 Computer Use 功能。虽然具体功能细节还没有完全铺开,但光是"不用再眼馋 Mac 用户"这一点,就足以让社区沸腾了。赶紧下载试试,看看你的开发工作流能提速多少。
9. 苹果发布 M5 系列芯片:AI 性能翻四倍,MacBook Pro 续航 24 小时
你现在出差带的充电器可能真的用不上了。苹果新发布的 M5 Max 芯片在端侧 AI 任务上性能翻了四倍,新款 MacBook Pro 满电状态下连续工作 24 小时——一整天的会议、写代码、跑本地模型,不用找插座。Studio Display XDR 也跟着升级,支持 5K 分辨率 + 120Hz 高刷。虽然苹果一如既往地把低端线做得"感人"(iPhone 17e 还是 60Hz刘海屏),但高端线这次确实给力。跑本地 AI 模型的同学,M5 Max 值得关注。
10. Google NotebookLM 推出"电影级视频概览":学习笔记变电影
以前整理学习笔记的终极形态是什么?思维导图?PPT?Google 说不够,给你直接做成电影。NotebookLM 新推出的视频概览功能,能把你上传的资料自动生成电影风格的讲解视频——有叙事结构、有视觉风格、有节奏把控。背后整合了多个 AI 模型协同工作,从脚本到画面全自动。目前只对Google AI Ultra 付费用户开放,只支持英语。虽然门槛不低,但这个方向太对了:未来的学习,可能真的是"看电影"。
📌 值得关注
- [产品] OpenAI 测试 ChatGPT 写作模板功能 — 上传你的历史文章就能克隆文风,终于不用反复调prompt了
- [产品] Google Canvas 全美公测 — 搜索结果一键变App,Google搜索终于不只是搜索了
- [开源] 宇树开源 OmniXtreme人形机器人架构 — 后空翻成功率大幅提升,开源机器人又进了一步
- [商业] 番茄小说和拼多多密测AI 互动剧 — 用户决定主角生死,电商和网文的边界越来越模糊
- [产品] 华为 AI眼镜曝光 — 支持拍摄和同声传译,预计 4 月跟 Pura90 一起发
- [开源] SEOMachine:Claude Code 专用 SEO 内容工作区 — GitHub 1400+ Star,自动研究、写作、优化长文,SEO 从业者可以看看
- [社区] GPT-5.4 免费账户用量实测 — 周限额只有约 211K token,免费用户悠着点用
😄 AI趣闻
Manus 说自己一岁了,但……它才几个月大?😂
Manus 今天发了条庆祝推文说"🎂Manus turns one today",但网友秒速打脸:你明明今年才出来的啊?看来 AI Agent 不仅能帮你干活,还学会了给自己虚报年龄。连宝总都忍不住评论:“感觉有点幻觉”。AI 的幻觉问题,这次倒是用在了自己身上。
🔮 AI趋势预测
GPT-5.4 的 Computer Use 能力引爆桌面 Agent 生态
- 预测时间:2026年4-5月
- 预测概率:80%
- 预测依据:今日新闻 GPT-5.4 原生支持电脑操控 + TuriX-CUA 开源 同天发布,桌面操控 Agent 的基础设施正在快速成熟,预计未来两个月内会涌现大量基于 Computer Use 的垂直应用
自然语言生成应用成为新赛道
- 预测时间:2026年Q2
- 预测概率:70%
- 预测依据:今日 Raycast 推出 Glaze 用对话生成 Mac 应用,加上此前多个类似产品的出现,“说话就能做App"正在从概念变成产品
阿里 Qwen 团队短期内发布重要更新以稳定军心
- 预测时间:2026年3-4月
- 预测概率:65%
- 预测依据:今日 阿里确认林俊旸离职 ,CEO 亲自牵头新小组,通常大厂在核心人员变动后会加速发布成果来回应市场质疑
OpenAI 在 GPT-5.2 退役前推出更多 Agent 工具集成
- 预测时间:2026年4-6月
- 预测概率:75%
- 预测依据:今日 GPT-5.4 公布了工具搜索(Tool Search)功能和 Codex Windows 版 ,加上 5.2 将于 6 月 5 日退役,OpenAI 会在过渡期内密集推出 Agent 生态工具
❓ 相关问题
如何体验 GPT-5.4?
GPT-5.4 目前需要 ChatGPT Plus、Team或 Pro 订阅才能使用,API 访问也需要付费账户。对于国内用户,可能面临支付困难或账号注册限制。
解决方案:访问 爱窝啦Aivora 获取成品账号,极速发货,售后无忧。