爱窝啦 AI 日报 2026/4/28

今日摘要

GPT-5.5 Pro视觉智商145,正式踩过门萨线,"AI比大多数人聪明"从比喻变成了跑分事实。
模型保质期从18个月压到3个月,DeepSeek V4发布当天就被指出只追平半年前的第二梯队。
今天最值得点开的底线:能力在涨,差距也在涨,欢呼之前先看清楚在跟谁比。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

AI智力天花板被砸碎的同一天,中国AI的真实差距可能正在悄悄拉大。

🔑 3 个关键词

#智力天花板崩塌 #中美差距暗战 #模型保质期缩短


🔥 重磅 TOP 10

1. AI智力天花板崩了,GPT-5.5 Pro视觉智商145,撞倒门萨俱乐部门槛

“LLM过不了130"曾是技术圈共识,今天这堵墙被砸得粉碎。GPT-5.5 Pro在LisanBench上跑出文本IQ 133、视觉IQ 145的成绩,线下非公开测试也有130分——门萨会员线踩上去了。这不只是一个跑分数字,而是一个信号:AI的认知能力正在以我们没预料到的速度逼近人类精英区间。对普通用户来说,意味着你现在用的这个工具,已经比绝大多数人"聪明"了。

image


2. 最强大模型,保质期越来越短了

一年前OpenAI和Anthropic的估值差了将近10倍,今天Anthropic在二级市场的隐含估值已经反超OpenAI破万亿。这不是某家公司的起落,而是整个行业竞争节奏变了。从"被追捧"到"被审视”,这个周期2023年前后还要12-18个月,现在已经压缩到3-6个月。今天的第一,三个月后可能就是被追赶的那个。等待党和观望党,这次真的赢了。

image


3. 阿里HappyHorse突然上线,实测让马斯克和奥尔特曼法庭开撕,还手搓了GTA6

没有预热,没有发布会,阿里ATH创新事业部的视频生成模型HappyHorse 1.0(快乐小马)直接开启灰度测试。在盲测平台Arena.ai上,它在文生视频、图生视频、视频编辑三个方向都拿到了亮眼成绩。实测内容更离谱:马斯克和奥尔特曼在法庭上互撕、手搓GTA6画面……现在就能在千问App里体验。国内视频生成赛道,又多了一个不按套路出牌的选手。

image


4. 离职字节后,北大教授泼了盆冷水:中国AI的真实差距,可能正在拉大

DeepSeek V4发布,社交媒体一片欢呼,但这位离职字节的北大教授直接说了实话:V4的实际能力,大致和半年前发布的Claude Sonnet 4.5在同一档。而Sonnet 4.5在半年前也只是第二梯队。跑分漂亮,差距却在悄悄拉大。这盆冷水泼得很及时——当大家都在庆祝"追上了"的时候,对手可能已经又跑出去一截了。


5. 刚刚,OpenAI 手机曝光,2028 年量产

音箱、眼镜、耳机、台灯、笔……OpenAI的硬件全家桶还嫌不够,这次直接盯上了手机。天风国际分析师郭明錤发布产业调查:OpenAI正与联发科、高通合作开发手机处理器,立讯精密拿下独家制造合同,预计2028年量产。处理器规格预计2026年底或2027年一季度敲定。这意味着两年后,手机市场将迎来一个完全不按传统手机逻辑出牌的新玩家——它的核心卖点不是摄像头,而是AI。

image


6. 4月AI混战大盘点:DeepSeek压轴登场,AI小龙加速商业化

整个4月,国内AI圈上演了一出"等DeepSeek V4"的连续剧:一轮又一轮"即将发布"的消息,带动其他大模型厂商疯狂跑分、抢人。V4终于来了,针对华为昇腾950芯片做了深度底层优化,这个细节很关键——国产算力生态正在被认真对待。与此同时,OpenAI这边GPT-5.5、GPT-Image-2接连亮相,两家的节奏形成了鲜明对比:一个在憋大招,一个在密集轰炸。

image


7. DeepSeek API计费大调整,输入缓存命中价降至首发价十分之一

开发者今天有个好消息。DeepSeek官方宣布,全系列模型API的输入缓存命中价格,永久降至原价的十分之一。V4-Pro还额外叠加了限时2.5折优惠。换句话说,如果你的应用场景有大量重复上下文(比如长对话、固定系统提示),成本直接砍掉九成。这对用DeepSeek做产品的开发者来说,是实实在在的降本信号,不是PPT上的数字。


8. Cursor 3 反馈整理:用户真正想要的不仅是"更炫的 IDE"

431条用户反馈摆在那里,说的是同一件事:Agent Window方向没问题,但现在最大的痛点是"进了Agent模式,就得为一个小操作切回旧IDE"。用户要的不是更炫的界面,而是一条稳定的工作流——Agent推进、人类随时无缝接管、调试、运行、提交,一气呵成。多Agent协作和多仓库支持,被认为是Cursor 3最值得押注的方向。这份反馈,基本就是下一版Cursor的产品路线图。

image


9. 时薪15美元的新工种:把iPhone绑在脑门上,替AI蒸馏自己

印度南部服装厂工人头戴摄像头,记录手部动作训练AI——这不是科幻片,是今天正在发生的事。Micro1在全球71个国家招募了约4000名工人,每月收到超过16万小时的视频素材。特斯拉、Figure AI等公司竞相开发人形机器人,真实世界的动作数据成了最稀缺的原材料。DoorDash甚至让送餐员顺带在家录家务视频。时薪15美元,用自己的身体动作喂养将来可能替代自己的机器人。这个画面,细想有点沉。

image


10. MOSS-Audio:开源统一音频理解模型,时间戳ASR精度碾压Gemini

以前做音频AI,语音识别、说话人识别、情感检测、音乐理解得分别跑不同的模型,现在OpenMOSS团队把这些全塞进了一个模型里。MOSS-Audio提供4B和8B两个尺寸,各有Instruct和Thinking版本,时间戳ASR精度远超Gemini-3.1-Pro。对做播客转录、会议记录、音频内容分析的开发者来说,这是一个值得认真看的开源选项——模型已经上了HuggingFace,今天就能拉下来跑。

image


📊 更多动态(5条)

[商业] Manus交易被要求撤销 — 细节未披露,但"被要求撤销"这几个字本身就够耐人寻味,Manus的商业化路径又多了一个问号。

[研究] AgentBound:首个AI Agent执行边界安全框架 — 数千个MCP服务器在无限制权限下运行,这篇论文提出了第一个系统性的访问控制方案,Agent安全这个话题终于有人认真做了。

[研究] SecureVibeBench:专门测AI写代码安全漏洞的基准 — Vibe coding越来越流行,但AI生成代码里藏着多少安全漏洞?这个基准首次还原了"人类开发者真实引入漏洞的场景",让人和AI的对比有了公平的尺子。

[产品] 只需10分钟,AI就能"养废"你的大脑 — 不是危言耸听:当你的肌肉记忆变成"遇到长文就扔给AI总结",深度阅读能力正在悄悄退化。这篇文章的问题问得很扎心,值得对照自己想一想。

[开源] Claude Code实践Harness工程,开发效率翻几倍 — 核心思想只有一句话:AI出错时,不是去纠正它,而是改进自己的提示、规则和约束。这篇文章把Harness工程在Claude Code里的具体落地写得很清楚,比大多数抽象讲概念的文章实用得多。


😄 AI趣闻

然后我好像摸索出了一个薅GPT 5.5 Pro网页端额度来写代码的方法

API太贵,Codex里用不了,但Pro订阅里可以用——这位朋友没有认命,而是发现了一条"曲线救国"的路:在ChatGPT里接入GitHub应用,授权仓库读写权限,然后直接让GPT 5.5 Pro帮你审代码、改代码、提交代码。最妙的是,他发现这个额度好像和Codex是分开算的。发现这个方法之后,他在帖子里加了一个"🥹"——那个表情包含了太多打工人对API账单的复杂情感。


🔮 AI趋势预测

OpenAI手机正式确认供应链合作伙伴

  • 预测时间:2026年Q3(2026年7-9月)
  • 预测概率:72%
  • 预测依据:今日新闻 OpenAI手机曝光,2028年量产 显示联发科/高通双线并行开发处理器,郭明錤预计2026年底或2027年Q1敲定最终规格。供应链消息一旦流出,正式官宣通常会在3-6个月内跟进,以稳定合作方预期。

AI模型"保质期"进一步压缩至2个月以内

  • 预测时间:2026年Q2-Q3
  • 预测概率:65%
  • 预测依据:今日新闻 最强大模型保质期越来越短 记录了领先周期从12-18个月压缩到3-6个月的轨迹。GPT-5.5、DeepSeek V4、HappyHorse在同一周密集亮相,竞争节奏还在加速,下一个季度内极可能出现"月度易主"的局面。

AI Agent安全标准化提上议程

  • 预测时间:2026年Q2(2026年5-6月)
  • 预测概率:58%
  • 预测依据:今日论文 AgentBoundSecureVibeBench 同日出现,说明学术界已在集中攻克Agent安全问题。MCP协议快速普及带来的安全漏洞正在引发关注,主流AI平台(OpenAI/Anthropic/Google)在未来1-2个月内发布Agent安全指南或访问控制规范的概率正在上升。

国内视频生成赛道迎来新一轮公开评测混战

  • 预测时间:2026年5月
  • 预测概率:80%
  • 预测依据:今日新闻 阿里HappyHorse突然上线 在Arena.ai盲测中拿到亮眼成绩,且直接开放公众体验。国内视频生成赛道已有可灵、即梦、HappyHorse等多个玩家,一旦有新选手公开跑分,其他家必然跟进,5月大概率出现一轮集中的横向评测和用户口碑争夺战。

❓ 相关问题

如何体验 GPT-5.5 Pro?

GPT-5.5 Pro 目前需要 ChatGPT Pro 订阅(月费约200美元)才能使用,国内用户还面临支付方式受限和网络访问门槛。直接调用 API 的费用也相当高,不适合日常高频使用。

解决方案:访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧,省去注册和支付的麻烦。

Last updated on