爱窝啦 AI 日报 2026/5/19

今日摘要

Google I/O 明天开幕,Cursor 同日发布自研模型 Composer 2.5,AI 编程军备竞赛今天正式升级。
几十个 AI 工具的系统提示词被一锅端上 GitHub,单日涨星 13 万——那些藏在产品背后的秘密,今天全摆出来了。
今晚重点看前两条,明天留时间看 Google I/O 直播。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

Google I/O 明天开幕,Cursor 自研模型今天悄悄上线——AI 编程工具的军备竞赛,今晚进入新阶段。

🔑 3 个关键词

#GoogleIO前夜 #编程模型自研 #系统提示词大曝光


🔥 重磅 TOP 10

1. Google I/O 明日开幕,全线产品将迎来 AI 大更新

倒计时结束了。Google 官方今晚亲自预热:明天的 I/O 大会将覆盖 Search、Gemini、Google AI Studio、DeepMind 全线产品。这不是普通的年度发布会——过去一年 Gemini 系列在多项基准上已经追平甚至超越 GPT,明天的发布极可能直接改写 AI 产品格局。Search 的 AI 化改造、Gemini 新版本、以及传说中的 Project Astra 进展,都可能在明天亮相。对于每天用 Google 全家桶的人来说,明天的发布会值得专门留出时间看直播。今晚先把闹钟定好。


2. Cursor 发布自研编程模型 Composer 2.5,底座是 Kimi,还要跟 SpaceX 联手造更大的

两个月前,开发者从 API 请求头里挖出 kimi-k2p5-rl 的模型 ID,Cursor 被迫承认底座是 Kimi——这次他们直接写进了博客,算是把透明度补回来了。Composer 2.5 主打长任务不掉链子:连续几十上百步的编程任务,中途不容易忘了自己在干什么。官方说效率最多比同等模型高十倍,为了推这个新模型,还把未来一周的默认额度直接翻倍。更大的消息是:Cursor 宣布跟 SpaceX AI 联合从零训练一个新模型,算力是这次的十倍,跑在 Colossus 2 的百万张 H100 等效集群上。AI 编程工具的军备竞赛,今天又升了一个档。

image


3. 几十个 AI 编程工具的系统提示词被一锅端了,GitHub 单日涨星 13 万+

这个仓库今天炸了。Cursor、Windsurf、Devin、Replit、Lovable、Manus、Kiro、v0……几乎你叫得出名字的 AI 编程工具,系统提示词、内部工具调用、底层模型信息,全被收录进来了。单日涨星超过 13 万,直接冲上 GitHub Trending 榜首。对普通用户来说,这是一次难得的"掀桌子"时刻——那些产品背后到底在用什么模型、怎么给 AI 下指令,今天全摆在明面上了。对这些公司来说,这大概是今年最不想看到的一个仓库。


4. 英伟达用 4bit 精度预训练了 12B 大模型,中文圈几乎没人注意到

过去几年,预训练一直被 16bit 和 8bit 统治。推理阶段可以量化省显存,但真拿 4bit 去做预训练,梯度会飘、loss 会崩——这几乎是业界默认的"不可能"。英伟达用一种叫 NVFP4 的新格式打破了这个认知:不是粗暴地把所有数字砍成 4bit,而是把数字切成小 block,每一小块单独配 scale。结果是性能提升 2-3 倍、内存减少 50%,而且智能几乎无损。这不是小优化,是预训练方向的一次范式转变。训练更大的模型,以后可能真的不需要那么多显存了。

image


5. 云南小伙花 3000 块、用国产 AI 工具做了部短片,好莱坞连夜发寻人启事

三分钟多的 AI 动画短片,播放量几天内突破千万,好莱坞知名制片人看完直接在全网发跨国寻人启事。找到的这个人,是云南的一个年轻小伙,一个人花 10 天、成本 3000 元,全程用国产 AI 工具做出来的。这件事的冲击力不在于"AI 能做短片"——那大家都知道。冲击力在于:一个人、一台电脑、3000 块,就能做出让好莱坞主动找上门的东西。以前这条路需要团队、需要资金、需要人脉。现在门槛变了。

image


6. 未来 5 年最大的机会:用 AI 把所有行业重做一遍

注意力经济的时代结束了。这篇文章的核心判断是:智能体出现之后,商业逻辑从"让人看见"变成了"替人办成"——用户不再需要在十几个 APP 之间跳转比较,只需要表达一个意图。盛景网联的分析认为,未来 20 年内智能体经济将贡献全球 99% 的 GDP。这个数字听起来很夸张,但背后的逻辑值得认真想一想:当 AI 能替你完成大部分决策和执行,流量和注意力还值钱吗?对创业者和打工人来说,这篇文章提供了一个值得认真对待的框架。

image


7. 陆奇,机器人赛道最低调的"天使"

王兴被封"具身智能投资第一人"的时候,很少有人注意到陆奇早就在这条赛道上布局了。根据 IT 桔子数据,2025 年前三季度,奇绩创坛是国内出手投资机器人公司最多的机构,超过了高瓴、IDG,也超过了蚂蚁和美团。智元机器人、多家早期具身智能公司,背后都有奇绩的名字。从 YC 中国到大模型再到机器人,陆奇每次转向都比大多数人早半步。这篇文章是一个很好的视角:看懂陆奇在押什么,大概就能看懂接下来 2-3 年机器人赛道的钱会往哪里流。

image


8. NOVA 框架:AI 自我迭代能发现真正的新知识吗?有上限吗?

“生成、验证、积累、再训练”——这是当前 AI 自我改进的标准循环。NOVA 框架把这个过程建模成一个自适应采样过程,试图回答一个根本性问题:AI 通过迭代自我改进,到底能不能发现真正的新知识?代价是什么?研究识别出了几种典型失败模式,包括知识污染和收益递减。这不是一篇工程论文,是在给 AI scaling 的天花板画边界。对于关心 AGI 路径的人来说,这个框架提供了一个难得的理论视角。


9. 手机端也能跑高清图像生成?ElasticDiT 把 DiT 架构塞进了移动设备

Stable Diffusion 3 和 FLUX.1 背后的 DiT 架构,一直是高保真图像生成的标准范式,但部署到手机上几乎是不可能的任务——计算量和内存开销都太大。ElasticDiT 用弹性架构加稀疏注意力机制,在不明显损失质量的前提下,把这套架构压进了移动设备。如果这个方向跑通,意味着以后在手机上本地生成高质量图片不再需要联网调用云端 API。隐私、速度、成本,三个问题一起解决。


10. 扩散模型的 RL 微调不需要每一步都优化?少做反而效果更好

用强化学习对扩散模型做偏好对齐,主流做法是对整条去噪轨迹全程施加 RL——计算量大,效果还不一定好。这篇论文发现,RL 微调的影响在不同去噪阶段差异很大:早期阶段影响小,后期阶段才是关键。跳过早期阶段的优化,不仅省算力,偏好对齐效果反而更好。“少做反而更好"这个结论,在 AI 训练领域出现的频率越来越高——这本身就是一个值得记住的信号。


📌 值得关注

[产品] GPT-Image-2 迪斯科球风格 Logo 提示词走红 — Spotify 换了个迪斯科球风格 Logo,全网开始用 GPT-Image-2 复刻这个风格,提示词已经被反推出来了,今天就能直接用。

[研究] DiffVAS:用扩散模型引导无人机在部分可观测环境中主动搜索 — 把扩散模型用到无人机搜索任务上,应用场景包括野生动物盗猎热点检测和搜救任务,是 AI + 遥感的一个新交叉点。

[研究] 神经符号融合新框架 LoH:让规则学习和神经网络真正统一 — 神经网络擅长从数据里学,符号系统擅长推理,LoH 试图把两者统一在同一套语言里,是 NeSy 方向少见的系统性工作。


😄 AI趣闻

搞抽象太好玩了 @CuiMao 我做了个格斗游戏《萃猫大战阿迪王》 帮萃猫打败阿迪王即可给她的Claude账号解封。…

这事好玩的地方,是 AI 没站在发布会大屏上讲大道理,而是钻进一个很小的动作里:少点几下、少等一会儿、少重复一遍。如今工具越聪明,越像办公室里那个爱搭把手的人,活不一定干得惊天动地,胜在你一回头,零碎事儿已经少了一截。

🔮 AI趋势预测

Google 多模态能力全面升级,Gemini 新版本正式亮相

  • 预测时间:2026年5月20日(明天)
  • 预测概率:92%
  • 预测依据:今日新闻 Google I/O 明日开幕预热 + Google 官方已明确预告覆盖 Search、Gemini、DeepMind 全线,历届 I/O 均有旗舰模型更新,今年竞争压力更大,发布力度只会更强不会更弱。

AI 编程工具进入"自研模型"时代,第三方模型依赖度下降

  • 预测时间:2026年Q3
  • 预测概率:72%
  • 预测依据:今日新闻 Cursor 发布 Composer 2.5 + Cursor 已从依赖 OpenAI/Anthropic 转向基于 Kimi 二次训练,并宣布与 SpaceX 联合从零训练更大模型;这个信号表明头部编程工具正在把模型能力内化为核心竞争力,而非外采。Windsurf、Replit 等跟进自研的概率在未来一个季度内会显著上升。

手机端本地 AI 图像生成进入可用阶段

  • 预测时间:2026年Q3-Q4
  • 预测概率:65%
  • 预测依据:今日论文 ElasticDiT 展示了 DiT 架构在移动设备上的可行性 + 英伟达 4bit 预训练突破( 今日新闻 )进一步压缩了模型运行成本;两个方向同时推进,手机端本地图像生成从"实验室可行"到"产品可用"的距离正在快速缩短。

AI 系统提示词透明度压力倒逼行业规范化

  • 预测时间:2026年Q2-Q3
  • 预测概率:58%
  • 预测依据:今日 系统提示词大规模泄露仓库 单日涨星 13 万,引发广泛关注 + 过去半年已有多起类似事件;当用户和开发者开始系统性地挖掘和传播这些信息,AI 公司面临的透明度压力会持续上升,部分公司可能主动公开系统提示词框架以抢占信任优势。

❓ 相关问题

如何体验 Google Gemini 最新版本?

Google Gemini 目前可以通过 gemini.google.com 直接访问,但国内用户面临网络访问限制,且部分高级功能(如 Gemini Advanced)需要绑定境外支付方式的 Google One 订阅。明天 Google I/O 发布后,新版本功能可能需要一段时间才能全量开放,且优先对付费用户开放。

解决方案:访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧,省去注册和支付的麻烦,明天发布会结束后第一时间就能上手体验新功能。

Last updated on