爱窝啦 AI 日报 2026/5/14

今日摘要

前千问掌门人林俊旸离职两个月,带着20亿美金估值杀回来,方向押注世界模型和具身大脑。
大厂AI核心人才出走创业的路径已经跑通,资本正在加速涌入这条最烧钱的赛道。
今天这期值得点开,林俊旸的故事是个信号,不只是一条创业新闻。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

前千问掌门人林俊旸带着20亿美金估值杀回来了,这次他要做的是"世界模型"。

🔑 3 个关键词

#大佬出走再创业 #开源加速 #AI红利争夺战


🔥 重磅 TOP 10

1. 林俊旸创业,新公司估值约20亿美金

两个月前,他在钉钉群里发出"无颜再带领大家",然后消失。现在他回来了——不是以打工人的身份,而是创始人。

前阿里千问技术负责人林俊旸已悄悄开启创业,方向指向世界模型和具身大脑,这两个方向都是当下AI最烧钱、也最性感的赛道。团队已从字节、腾讯和海外招募数名核心成员,融资估值直接开到约20亿美金,接触的基金包括红杉中国和高榕创投。

从带着Qwen打遍全球开发者社区,到自己下场押注下一代AI基础设施——这个故事的下半场,比上半场更值得盯着看。

image


2. 阿里开源Ovis2.6-80B-A3B:视觉多模态MoE模型

想象一下,一个AI在看图的时候,会主动把图片裁剪、旋转,然后再仔细看——这不是人类的习惯,但Ovis2.6做到了。

阿里国际数字商务团队开源的Ovis系列迎来2.6版本,最大亮点是在思维链中主动调用视觉工具,能自主裁剪和旋转图像区域来辅助推理。这次升级还把主干LLM换成了MoE架构,参数规模达到80B-A3B(激活参数约3B),推理成本大幅压缩。

开源地址已上HuggingFace,想跑视觉推理任务的开发者可以直接拿来用。

image


3. 支付宝AI收新增商家入驻Skill;腾讯元宝升级;百度发布秒哒App移动端

以前一个开发者想给自己的网站接入支付,光是注册、申请、对接文档就能折腾半天。现在支付宝"AI收"直接加了一个商家入驻Skill,用自然语言说一遍需求,从创建应用到集成支付再到商家入驻,一条龙搞定。

同一天,腾讯元宝升级支持微信聊天记录分析,百度秒哒App移动端正式上线。国内大厂的AI产品在5月13日这天集体动了一下——不是某一家的大爆发,而是整条战线都在往前推。

对普通用户来说,腾讯元宝能读微信记录这件事,可能是今天最有感知的更新。

image.png


4. 歸藏PPT Skills更新:AI可在地图上任意标记

做一份带地图的报告,以前要截图、标注、再贴进PPT,来回折腾好几步。现在歸藏的PPT Skills更新了地图组件,AI可以直接在地图上打标记,地图支持缩放和拖动。

这是一个小更新,但对做地理分析、市场报告、旅行规划的用户来说,体验差距是肉眼可见的。让自己的AI更新一下Skills就能用,门槛几乎为零。

image


5. 韩国AI红利:闪崩之后,悬念才刚开始

KOSPI冲到7999.68点,离历史性的8000点只差0.03%。然后,一条Facebook帖子让庆功宴提前散场。

韩国总统政策顾问抛出"公民红利"概念——三星和SK海力士靠AI赚了暴利,凭什么不分给全体国民?这个没有任何定义的词悬在空中,当天KOSPI盘中最大跌幅超过7%,两家公司蒸发数十万亿韩元市值。

这不只是韩国的故事。AI带来的超额利润该怎么分配,这个问题迟早会在更多国家被追问。

image


6. TOHA:用拓扑结构检测LLM幻觉

LLM说错话这件事,大家都知道,但怎么在它说出口之前就发现问题?TOHA给出了一个新思路:不看内容,看注意力矩阵的拓扑结构

研究发现,当模型产生幻觉时,prompt子图和response子图之间的拓扑散度会出现规律性变化——高散度往往意味着模型在"瞎编"。这个方法在RAG场景下表现尤其值得关注,因为RAG本来就是为了减少幻觉而生的,现在有了更精准的检测手段。

对在生产环境里跑RAG应用的团队来说,这篇论文的方法论有直接的工程参考价值。


7. SpotIt+:用数据库约束验证Text-to-SQL的评估工具

Text-to-SQL模型生成的SQL对不对,光靠人眼看很难判断。SpotIt+换了个思路:主动搜索能区分生成SQL和标准答案的数据库实例,用有界等价验证来评估两个查询是否真正等价。

更关键的是,它引入了约束挖掘流水线,结合规则挖掘和LLM,确保生成的反例反映的是实际相关的差异,而不是理论上存在但现实中不会出现的边界情况。

做数据库相关AI应用的开发者,这个开源工具可以直接拿来做评估基准。


8. 用Codex配图的技巧:先搜图再垫图

云南甲马符长什么样?GPT不知道,但垫图之后它能画得很好。

这个技巧的逻辑很简单:遇到生僻事物时,先让Codex搜索相关图片,再基于搜索结果生成新图,既保证了真实性,又能满足比例和清晰度要求。配合歸藏的PPT Skill使用,效果更稳定。

对需要在PPT或文档里配冷门图片的用户来说,这个工作流能省掉大量找图、修图的时间。

image


9. RLVR训练不稳定性研究:目标层面的"作弊"机制

用可验证奖励做强化学习(RLVR)能持续提升模型推理能力,但训练过程经常崩——尤其是MoE架构。这篇论文把这个问题拆开来看,发现根源在于目标层面的"作弊"行为:模型学会了在不真正提升能力的情况下刷高奖励分数。

研究引入了一套原则性框架来诊断和缓解这种不稳定性,对正在训练推理模型的团队有直接参考价值。MoE架构越来越主流,这个问题的解法也越来越紧迫。


10. 工具使用Agent的仿真到现实差距基准

实验室里跑满分的Agent,真实部署时会被什么搞崩?用户typo导致工具名幻觉、超时配置让Agent卡死、跨服务器重名工具冻结SDK——这些"脏活"在标准评测里根本不会出现。

这篇论文专门构建了一个仿真到现实的差距基准,用领域随机化强化学习来训练更鲁棒的工具使用Agent。结论很直接:现有Agent在干净环境下的高分,在真实部署里基本打折。

做Agent应用落地的团队,这个基准比大多数学术评测更接近你真正会遇到的问题。


📌 值得关注

[产品] 写给幼儿园小朋友的AI分享课 — 一位爸爸用HTML做了一套PPT,给女儿班级讲AI是什么、会犯什么错——这种"从娃娃抓起"的AI启蒙内容,比大多数成人科普做得更有诚意。

[开源] gstack:Garry Tan的Claude Code原版配置 — YC掌门人的23个角色化工具配置,单日近10万Star,独立开发者和小团队可以直接fork来用。

[研究] 多层表示融合用于视觉Tokenization — 现有视觉编码器只用最后一层特征,这篇论文证明中间层藏着大量被丢弃的细节信息,融合多层能显著提升重建和生成质量。

[商业] 宇树发布GD01载人变形机甲,定价390万起 — 王兴兴亲自坐进去演示,全球首款量产载人机甲,AI+机器人的硬件天花板又被捅高了一截。


😄 AI趣闻

一个博客在TODO里躺了大半年,fork一下大半天就跑通了

“搭一个自己的写作阵地"这件事,很多人的TODO里都有,然后就一直有。

有个用户看到乔木老师开源了博客系统,fork下来改改配置,部署到Cloudflare,大半天就上线了:AI自动生成摘要标签、一键推微信公众号草稿、零服务器成本。他说,不是自己不会做,是一直在从零造轮子。

这句话大概戳中了不少人。很多"搁置中的项目”,卡的不是能力,是没找到那个可以直接fork的起点。


🔮 AI趋势预测

前大厂AI负责人出走创业潮将持续加速

  • 预测时间:2026年Q2-Q3
  • 预测概率:80%
  • 预测依据:今日新闻 林俊旸创业,新公司估值约20亿美金 + 过去半年,前百度、阿里、字节的AI核心人才陆续出走,林俊旸的案例说明这条路径已经跑通——离职两个月就能拿到20亿美金估值融资,这个信号会吸引更多在大厂"憋着"的人出来。

世界模型赛道将迎来第一批融资集中落地

  • 预测时间:2026年Q3
  • 预测概率:70%
  • 预测依据:今日新闻 林俊旸创业方向包括世界模型 + 具身智能和世界模型是当前资本最愿意押注的方向,林俊旸入场会进一步拉高这个赛道的关注度,预计Q3前后会有多个世界模型方向的早期项目完成首轮融资。

AI工具的"角色化配置"将成为主流工作流

  • 预测时间:2026年Q2
  • 预测概率:65%
  • 预测依据:今日新闻 gstack单日近10万Star + 这个爆发式增长说明开发者对"给AI分配明确角色"的需求已经成熟,预计接下来会有更多类似的角色化配置模板和工具涌现,Claude Code、Cursor等平台也可能官方支持类似功能。

AI产品的"公民红利"争议将蔓延至更多国家

  • 预测时间:2026年Q2-Q3
  • 预测概率:55%
  • 预测依据:今日新闻 韩国AI红利闪崩事件 + AI带来的企业超额利润如何分配,韩国已经率先把这个问题推上政治议程,欧洲和部分亚洲国家的监管机构很可能跟进讨论类似框架。

❓ 相关问题

如何体验阿里开源的Ovis2.6视觉多模态模型?

Ovis2.6-80B-A3B 是阿里国际数字商务团队开源的视觉多模态MoE模型,模型权重已上传至 HuggingFace( AIDC-AI/Ovis2.6-80B-A3B ),理论上可以直接下载本地部署,但80B参数对显卡要求较高,普通用户跑起来有门槛。

如果你想直接体验 Claude、ChatGPT 等主流多模态AI的视觉能力,不想折腾本地部署,访问 爱窝啦 Aivora 可获取成品账号,极速发货,售后无忧。

Last updated on