爱窝啦 AI 日报 2026/6/2

今日摘要

英伟达同一天推出端侧超算芯片 RTX Spark、开源物理世界模型 Cosmos 3,把 Agent 战场从云端同时推进到桌面和机器人。
AI 编程独角兽 Cognition 不到一年估值从百亿飙至 260 亿,而 DuckDuckGo "无 AI 搜索"流量反向爆增——两个信号叠在一起,说明这轮 AI 浪潮正在同时制造信徒和叛徒。
今天的底线:英伟达的两张牌值得认真读,Cosmos 3 已上 Hugging Face,现在就能拉下来跑。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

英伟达用一块新芯片和一个开源世界模型,同时向 PC 厂商和机器人行业递出了两张底牌。

🔑 3 个关键词

#英伟达双拳出击 #AI编程造富神话 #开源加速狂奔


🔥 重磅 TOP 10

1. 英伟达发布 RTX Spark:专为 AI Agent 打造的个人超级芯片

买电脑的人以前问"多少核",现在可能要开始问"能跑几亿参数"了。英伟达在台北电脑展正式发布 RTX Spark,这块芯片不是为了打游戏——它提供 1 PFLOPS AI 算力、最高 128GB 统一内存,能本地跑 120B 参数的大模型,还能渲染 90GB 以上的 3D 场景、剪辑 12K 视频。微软同步发布博客,双方联手打造原生 Agent 运行环境,首批搭载设备包括 Surface Laptop Ultra、Dell XPS 16、联想 Yoga Pro 9N 等,预计秋季上线。这不只是一块快芯片,而是英伟达把 Agent 这条赛道从云端往桌面硬拉的第一步。

image


2. 英伟达开源 Cosmos 3:会"理解-预测-行动"的物理世界 AI

以前机器人要么会看、要么会动,很少既能读懂物理世界又能规划动作。Cosmos 3 把这三件事塞进了一个架构:物理推理 + 视频生成 + 动作生成,完整走完"理解→预测→行动"的闭环。英伟达同时开源了 8B 和 32B 两个版本,支持文本→图像、视频→视频、动作+视频→视频三种输入输出模式,还附带 6 个数据集。模型已上传 Hugging Face,今天就能拉下来玩。对做具身智能、机器人仿真或游戏 NPC 的开发者来说,这是一个难得的直接可用的起点。

image


3. 估值 260 亿美元,Cognition AI 凭 Devin 成全球 AI 编程第一独角兽

三个华人年轻人,合计拿过 5 枚国际信息学奥林匹克金牌,从一间短租房里搭出了全球首位"AI 软件工程师" Devin 的雏形。现在,Cognition AI 刚刚完成超过 10 亿美元新融资,投后估值冲到 260 亿美元——从百亿到 260 亿,不到一年。本轮由 Lux Capital、General Catalyst、8VC 领投,Founders Fund 等跟投。资本市场用这个数字表达的判断很清晰:AI 编程 Agent 这条赛道,他们认为 Cognition 已经是目前最值钱的那张票。

image


4. MiniMax M3 发布:1M 超长上下文 + 全新稀疏注意力架构

100 万 token 的上下文窗口,听起来很猛,但通常意味着算力开销爆炸。MiniMax M3 用了一套新架构 MSA(MoE with Segment-wise Attention),让 100 万上下文下每个 token 的计算量只有上一代的约 1/20。除了更省算力,M3 还从训练阶段就原生融合了文本、图片、视频和桌面操作的多模态能力。价格层面,小于 512K 的 API 调用现在有 7 天限时五折。对于需要处理超长文档、跨模态任务的开发者,这是一个值得今天去跑一遍 benchmark 的新选手。

image


5. vibe coding 工具与技巧全开源:Codex 和 Claude Code 是今年的成人节礼物

六一儿童节这天,有人把最近 vibe coding 用到的所有工具和技巧打包整理,全部免费开源。Codex 和 Claude Code(CC)被称作"成年人的六一儿童节玩具"——这个比喻倒是准,两个工具现在能做的事,放三年前绝对是玩具级别的梦想。如果你一直想系统入门 AI 编程工作流但不知道从哪里下手,这份整理可能是目前中文社区里最省时间的一个起点。


6. DuckDuckGo 升级"无 AI"搜索入口,流量正在爆增

当所有搜索引擎都在拼命塞 AI 摘要的时候,DuckDuckGo 反而把"不要 AI"当成了卖点,还在流量上打出了正向反馈。这次他们进一步降低了访问"纯搜索模式"的门槛,让不想被 AI 总结覆盖原始结果的用户更容易切换。在 Hacker News 上这条新闻拿到了 272 点和 141 条评论——对 AI 生成内容感到审美疲劳的用户显然不是少数。这条新闻本身就是一个信号:AI 渗透搜索的同时,反向需求也在同步增长。


7. RAG 不是机器学习——把 ML 工具包套进来是最贵的误解

很多团队在搭企业级 RAG 系统时,会把超参数优化、训练/测试集评估、SHAP 可解释性这套 ML 工具链搬进来——结果发现越调越乱,真正的问题反而被遮住了。这篇文章的核心论点很直接:RAG 解决的是检索和生成问题,答案已经在文档里,不是预测问题;ML 框架天生就不是为这个场景设计的。正确的方向是:按问题类型路由、按失败模式评估、放大领域专家知识而不是替代它。如果你的 RAG 项目跑偏了却找不到原因,这篇值得认真读一遍。


8. Hermes WebUI:在网页或手机上运行 Hermes Agent 的最佳前端

今天 GitHub 日榜第一。Hermes WebUI 是专门为 Hermes Agent 打造的 Web 前端,让你不用开终端,直接从浏览器或手机访问本地 Agent。今日新增 945 颗星,总星数已破 11K。项目用 Python 编写,定位清晰:如果你本地部署了 Hermes Agent 但每次都要开命令行才能用,这个 WebUI 就是帮你把操作界面从终端搬到浏览器的那一层。对想把本地 Agent 做成"随时可用"状态的开发者来说,这是今天最值得收藏的一个仓库。


9. 歸藏的 HTML/Markdown 预览 App「即览」被苹果审核卡住了

功能已经做好,测试资格原本打算当晚发出去,结果被苹果审核拦住。歸藏(guizang.ai)做的这个 iOS App「即览」,核心功能是在手机上直接预览 HTML 和 Markdown 文件,界面演示视频看起来非常流畅清爽。独立开发者最怕的两件事:一是做不出来,二是做出来了上不了架。现在卡在第二件事上——苹果 App Store 的审核节奏向来是"你急它不急"。感兴趣的可以先关注作者账号,等审核放行。

image


10. 面馆:一个关于 AI 时代"好产品"的寓言

2030 年,AI 创业者小王在面馆碰到了做过两款国民级产品的张哥。小王说自己七年做了 AI 办公、Agent OS、AI 游戏、AI 教育,每款都拿到融资,数据也不错,就是长不成国民级产品。张哥一边吃面一边说:这条街上开过多少家餐饮,卖沙拉的、轻食的、量子料理的,一个比一个洋气,最后全倒了——这家牛肉面他吃了三十年,味道没变过。这篇短篇在即刻上传播很广,因为它说的不只是 AI 创业,说的是所有人都在问但没人能答出来的那个问题:什么样的产品,用户真的离不开?

image


📌 值得关注

[产品] CodePilot 0.55.0 预览版发布,支持 Codex 作为 Agent 引擎 — UI 整体重构,可接 Codex 内置模型或自定义模型,测试版,带日志反馈 bug 更受欢迎

[商业] Instagram 出现史上最离谱的账号劫持漏洞 — HN 1172 分、289 条评论,Meta 的 AI 功能这次被绕进了安全漏洞,细节比想象中荒唐

[其他] WaytoAGI × 红杉中国 AI 孵化营,6.15 上海开营,6.2 截止报名 — 两周食宿全包,线下 build 项目,有意者今天是最后机会


用 AI 帮自己的封面图脱丑,结果发现提示词才是真正的坑

在 X 上混久了会发现一件事:大家的文章封面普遍很丑,包括自己的。向阳乔木决定正面解决这个问题——先找到一位朋友分享的"满意提示词",再丢给 ChatGPT 优化,把里面所有的硬性限定词去掉,给 AI 留出充分发挥空间,最后做出了一套任意文章都能生成 5:2 大字封面的通用工作流,提示词放在评论区公开。整个流程的逻辑是:与其自己调参,不如让 AI 先帮你把提示词调好,再用调好的提示词去生成图。这件事本身挺正常,但细想一下——用 AI 优化提示词、再用优化后的提示词驱动 AI,等于人只负责提出"我想要好看的封面"这个需求,剩下全交出去了。以后设计师的工作可能真的只剩一件事:告诉 AI"这个不好看"。

Tweet Image


🔮 AI趋势预测

端侧 Agent 硬件进入实质落地阶段

  • 预测时间:2026年Q3
  • 预测概率:75%
  • 预测依据:今日新闻 英伟达发布 RTX Spark 显示英伟达已联合微软、Dell、联想等主流 PC 厂商完成首批设备排期,秋季上线节点明确。这意味着"本地跑大模型 + 原生 Agent"的硬件生态不再是 PPT,而是有具体设备型号和交付时间的商业计划。

AI 编程 Agent 赛道估值泡沫风险上升

  • 预测时间:2026年Q3
  • 预测概率:60%
  • 预测依据:今日新闻 Cognition AI 估值 260 亿美元 显示 AI 编程赛道头部公司估值在不到一年内从百亿翻到 260 亿。历史上但凡某个赛道的头部估值在一年内翻倍以上,后续往往伴随二线公司融资收紧或估值重定价。

物理世界 AI 模型成为机器人创业标配底座

  • 预测时间:2026年Q3
  • 预测概率:70%
  • 预测依据:今日新闻 英伟达开源 Cosmos 3 将物理推理、视频预测、动作生成合并进单一开源架构,且同时开放 6 个数据集。这种"模型 + 数据"的一体化开源策略,极大降低了机器人和具身智能创业团队的起步门槛,预计 Q3 会看到一批基于 Cosmos 3 的垂直应用项目冒出来。

“无 AI"和"减 AI"产品形成细分市场

  • 预测时间:2026年Q3
  • 预测概率:55%
  • 预测依据:今日新闻 DuckDuckGo 无 AI 搜索流量爆增 表明在 AI 功能大规模铺开的同时,用户中出现了明显的反向偏好。这类需求目前还被主流产品忽视,但随着 AI 渗透率继续提升,“我就不想要 AI 帮我总结"这个需求可能催生出一批差异化工具。

❓ 相关问题

如何体验 Claude(Opus 4.8)?

Claude Opus 4.8 目前需要订阅 Claude Pro 或通过 API 使用,国内用户面临信用卡支付限制和网络访问门槛,注册流程也不算顺畅。

解决方案:访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧,省去繁琐注册流程直接上手。

Last updated on