03-07-日报-AI资讯日报
今日摘要
GPT-5.4 百万上下文窗口很唬人,但连"50米外该走路还是开车"都答不对,常识依然是短板。
小米跟风推出手机端 Agent,OpenClaw 一天烧 25块,AI 替你干活的时代来了但钱包先倒下。
模型越来越聪明也越来越贵,等等党再观望一轮不亏。⚡ 快速导航
- 📰 今日 AI 资讯 - 最新动态速览
💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。
今日AI资讯
👀 只有一句话
GPT-5.4 带着百万上下文来了,但连"该不该开车去洗车"都答不对。
🔑 3个关键词
#GPT5.4翻车 #龙虾烧钱 #像素办公室
🔥 重磅 TOP 10
1. OpenAI 发布 GPT-5.4 系列:百万级上下文窗口,Pro 与Thinking版同步登场
你以为大模型的上下文窗口到20 万就够了?OpenAI 直接把 GPT-5.4 的API 拉到了100 万 token。这次一口气推出标准版、推理版 GPT-5.4 Thinking和高性能版 GPT-5.4 Pro 三款。金融和法律领域的跑分相当亮眼,令牌效率也有明显提升。但争议也跟着来了——定价贵得让人肉疼,安全评分还下降了。我的感觉是:能力确实在涨,但 OpenAI 的"高端路线"正在把一部分开发者推向竞品怀抱。

2. GPT-5.4 Thinking 依然过不了洗车测试
号称推理能力大幅升级的 GPT-5.4 Thinking,被一道小学生都能答对的题给难住了:“洗车店离我 50 米,我该走路还是开车?” 答案显而易见——走过去就行。但 GPT-5.4 Thinking 依然纠结不清。这说明什么?模型在数学和逻辑推理上确实强了,但常识推理这块的短板,依然没补上。越是"聪明"的模型越容易在最简单的问题上翻车,挺讽刺的。

3. 微软必应全面接入 Sora 2,免费视频生成向所有人开放
以前想用 Sora 得排队、得付费、得有OpenAI Pro 账号。现在微软直接把 Sora 2 塞进了必应视频创作者——全员免费。画质接近照片级,还自带音效,支持跨镜头连贯叙事。更狠的是引入了 C2PA 水印机制,每段视频都能溯源。免费额度用完还能用积分兑换,基本等于无限量。剪映们,压力来了。

4. 小米发布首款移动端 Agent产品 Xiaomi miclaw,邀请制内测开启
OpenClaw 火了之后,手机厂商终于坐不住了。小米基于自研 MiMo 大模型推出了移动端 Agent 产品 Xiaomi miclaw,定位就是"手机版小龙虾"——让 AI 直接操控手机完成复杂任务。想想看:对手机说一句"帮我订明天下午 3 点的会议室",AI 就自动打开日历、填好信息、发送邀请。目前是邀请制内测,但方向很明确——AI 正在从"对话框"走向"替你动手"。

5. 给 OpenClaw 小龙虾搞了个像素办公室,GitHub 项目火了
你有没有想过,自己的 AI Agent 在后台跑任务的时候,到底在干嘛?这个开源项目把它变成了一个像素风小人,在虚拟办公室里"上班"。AI 在思考?它走到电脑前疯狂敲键盘。空闲了?溜达去喝咖啡。代码报错?面壁思过。上线不到几天就拿下 1.5k Star,还支持多 Agent 串门和手机端监工。说真的,这才是程序员该有的摸鱼方式——看AI 替你打工。
6. OpenAI 发布 Codex Security 安全代理,研究预览版上线
写代码的朋友们应该深有体会:找bug 一小时,修 bug 五分钟,最痛苦的是定位问题在哪。OpenAI 新推出的 Codex Security 是一个专门搞应用安全的 AI Agent,它会分析整个项目上下文,自动检测、验证并修补复杂漏洞。关键词是"更高置信度、更少误报"——不再像传统安全扫描工具那样一扫一大片红色警告,结果大部分是虚惊一场。目前是研究预览阶段,但方向非常刚需。
7. 阿里 AI 战略之困:林俊旸离职背后的生态失位
林俊旸离开阿里千问团队的消息在圈内炸开了锅。表面看是人才流失,深层问题是什么?一位行业观察者给出了犀利分析:阿里在AI 生态的关键窗口期连续缺席。Coding、Agent、OpenClaw 这几波浪潮,没有一个跟千问强绑定。反观MiniMax、Moonshot 靠接入龙虾生态,token 消耗量直接逆袭。模型能力一时落后不可怕,可怕的是生态一直接不上。阿里官方虽然否认"集体离职",但战略层面的反思,恐怕才刚开始。

8. OpenClaw 一天烧掉 2500 万 token,25 块钱直接清零
龙虾虽好,钱包遭殃。有开发者在自己服务器上部署了 OpenClaw,接的是 MiniMax 的 M2.5 模型,只让它做"配个Telegram Bot、写几个定时任务"这种简单活儿。结果呢?半天烧完 25 块,2500 万 token,200 多次请求。问题出在 Agent 会疯狂"思考+调工具",一个任务触发几十次模型调用。这可能是 Agent 时代最真实的痛点——能力到位了,但用不起。
9. AI 破解Dia浏览器 Cookie 加密,居然成功了
Dia 浏览器用了一套颇为复杂的自定义加密格式:v10 前缀 + 16 字节 nonce + AES 密文,解密后还藏着16 字节 header,真正的 cookie 值从第 17 字节才开始。听起来挺硬核吧?结果让 AI 一步步拆解,竟然破解成功了。这件事有两面性:一方面展示了 AI 在逆向工程上的惊人能力,另一方面也给所有做安全的团队敲了警钟——你的加密方案,AI 可能比你更懂。
10. VAST 完成 5000 万美元融资,阿里百度抢投3D 生成新王者
3D 内容创作一直是"高门槛"的代名词——建模、渲染、材质,没几个月学不会。VAST 旗下的 TripoAI 平台已经聚集了 650 万创作者,累计生成近 1 亿个 3D 模型。这次拿下 5000 万美元 A 轮融资,阿里和恒旭资本联合领投,资金将用来迭代算法和构建 UGC 互动生态。目标很明确:让 3D 创作像发朋友圈一样简单。在AI 视频生成已经卷成红海的当下,3D 赛道可能是下一个爆发点。
📌 值得关注
- [产品] Codepilot 搞定长期记忆和助理功能 — AI 编程助手终于能"记住你"了,不用每次都从头解释项目背景
- [产品] OpenClaw 搭建飞书机器人,控制音乐、写文档样样行 — 把龙虾和飞书打通之后,真的有"AI秘书"那味了
- [产品] Get笔记上线OpenClaw Skill:对AI 说一句就能存笔记 — 不用切App,不用复制粘贴,信息流过就留住
- [开源]
Skill Publisher:一键把你的 Skill 发布到 GitHub
— 不熟悉 Git 的朋友有救了,
npx skills add搞定一切 - [产品] Roblox 推出 AI 实时改写功能,违规内容自动变礼貌话 — 不再是简单的"###“屏蔽,而是 AI 帮你换个说法,误判率降了 20倍
- [商业] 携程主动下线"AI 生意助手”,推动酒店定价回归理性 — AI 不是万能药,有时候主动关掉反而是更聪明的选择
- [产品] yt-dlp 原来也支持 B 站视频下载和字幕转写 — 老工具新发现,配合 NotebookLM Skill 可以快速把视频变文章
- [其他] 豆包依然一骑绝尘,春节后 AI 应用 DAU 格局未变 — 都砸了钱投广告,但用户就是认字节,下沉市场的壁垒比想象中高
😄 AI趣闻
Grok 安卓 APP 把"记忆"翻译成了"内存数"
有用户点进Grok 安卓 APP 的设置页面,发现记忆功能的名字居然叫**“内存数”——行吧,机翻的锅。更离谱的是,他翻了翻 Grok 到底"记住"了什么,结果发现当年聊的涩涩内容全被默默存下来了**,关键还得一条一条手动删。😂 教训:跟 AI聊天,嘴别太快。
玩了十多年 B 站,第一次发现 B 站有论坛
一位十年老用户在找小龙虾相关社区的时候,无意间发现B 站居然有个论坛叫"哔哩哔哩小站"。评论区瞬间炸了,大家纷纷表示"活了这么久第一次知道"。OpenClaw 的火爆带来的意外副作用:帮B 站挖出了自己都快忘了的产品。😂
🔮 AI趋势预测
手机厂商 Agent 大战全面爆发
- 预测时间:2026年4-5月
- 预测概率:80%
- 预测依据:今日新闻 小米发布 Xiaomi miclaw + 华为、OPPO、vivo 均已布局端侧大模型,OpenClaw 验证了Agent 形态的用户需求,手机厂商必然跟进
Agent 成本问题催生新一轮"模型价格战"
- 预测时间:2026年4月
- 预测概率:75%
- 预测依据:今日新闻 OpenClaw 一天烧 2500 万 token + Agent 场景的token 消耗量比对话场景高10-50 倍,模型厂商必须降价才能留住开发者
阿里千问团队进行重大战略调整
- 预测时间:2026年Q2
- 预测概率:70%
- 预测依据:今日新闻 阿里 AI 战略生态失位分析 + 林俊旸离职引发的行业关注,阿里大概率会在生态接入(尤其是 Agent/OpenClaw 方向)进行补课
AI 安全审计工具成为标配
- 预测时间:2026年5-6月
- 预测概率:60%
- 预测依据:今日新闻 OpenAI 发布 Codex Security + AI 破解 Dia 浏览器加密 ,攻防两端都在用 AI,安全审计工具将成为企业刚需
3D 生成赛道迎来资本密集期
- 预测时间:2026年Q2
- 预测概率:55%
- 预测依据:今日新闻 VAST 获 5000 万美元融资 + 视频生成赛道已趋红海,资本正在寻找下一个增长点,3D 生成是最可能的方向
❓ 相关问题
如何体验 GPT-5.4 最新模型?
GPT-5.4 系列刚刚发布,包含标准版、Thinking推理版和 Pro 高性能版。目前 API 版本支持百万级上下文窗口,但定价不菲,且国内用户面临支付和访问限制。
解决方案:访问 爱窝啦Aivora 获取成品账号,极速发货,售后无忧。