爱窝啦 AI 日报 2026/5/8

今日摘要

Anthropic 接入马斯克的 Colossus 算力集群,Claude Code 调用额度翻倍,Agent 编排能力同步上线。
浏览器、移动端、终端全线沦陷——Agent 不再是工具,正在变成 7×24 小时跑任务的"数字员工"。
今天值得点开,第 1、2、6 条连着读,能看清 Agent 时代的轮廓。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

Anthropic 拿下马斯克的算力集群,Claude 速率翻倍——AI 圈的算力版图,今晚悄悄重画了。

🔑 3 个关键词

#算力重组 #Agent全面爆发 #浏览器也沦陷了


🔥 重磅 TOP 10

1. Claude 牵手 SpaceX,调用限制全放开、Agent 深夜爆更

一觉醒来,AI 圈格局变了。Anthropic 在开发者大会 Code with Claude 上宣布与 SpaceX 达成合作,接入 Colossus 算力集群——那个原本属于马斯克 xAI 的、塞了超过 22 万张 NVIDIA GPU 的数据中心。算力到位,限制立刻松绑:Claude Code 的 5 小时调用额度直接翻倍到 10 小时,Pro 和 Max 用户高峰时段的降速限制取消,Opus 系列 API 速率大幅上调。同步上线的还有托管 Agent 的三大新能力:多智能体编排、目标结果(Outcomes)和自主推演(Dreaming)。对开发者来说,这不只是"额度多了",而是 Claude 从一个聊天工具,正式变成了可以跑复杂任务的生产力基础设施。

image


2. OpenAI Codex 推出 Chrome 扩展,浏览器也成了 Agent 的地盘

以前 Codex 只在终端和 IDE 里转,现在它直接进了你的浏览器。Mac 和 Windows 用户今天起可以在 Codex app 里装 Chrome 插件,让它在后台多标签并行跑任务,不占你正在用的界面。真正有意思的地方在于:它能处理那些"必须登录才能干"的活儿——查内部后台、刷 dashboard、在 CRM 里更新客户信息、走完需要点好几个页面的复杂表单。Codex 的策略是"能用插件就用插件,必须登录就走 Chrome,两边混着来"。这意味着 Agent 的触角第一次真正伸进了需要身份验证的私有系统。欧盟和英国暂未开放,但方向已经很清楚了。


3. xAI 并入 SpaceX,马斯克 AI 版图大重组

这件事比看起来复杂得多。根据特斯拉提交给 SEC 的文件,2025 年 3 月 xAI 与 X(前 Twitter)合并成立了新母公司 X.AI Holdings Corp,随后在 2026 年 2 月被 SpaceX 并购,正式成为 SpaceX 的全资子公司。Colossus 数据中心——一期就有 10 万颗 H100——也随之归入 SpaceX 旗下。Anthropic 这次拿到的算力,正是这个集群。特斯拉、xAI、SpaceX 三家之间的股权关系已经复杂到需要专门的 SEC 文件才能说清楚。马斯克的 AI 棋局,正在以一种很多人没预料到的方式重新落子。

image


4. DeepSeek-TUI 冲上 GitHub 热榜第一,终端 Agent 又出新玩法

一个美国独立开发者 Hunter Bown,用 DeepSeek-V4 手搓了一个终端原生编程 Agent,今天 Star 数单日暴涨 2434,总 Star 超过 1 万。它叫 DeepSeek-TUI,定位是"DeepSeek 版 Claude Code"——直接在终端里聊天、编辑文件、跑 shell 命令、管理任务,甚至能协调代码库里的子 Agent。不需要 IDE,不需要 Web 界面,打开终端就能用。对那些习惯命令行的开发者来说,这种"不离开终端就能调 AI"的体验,比套一层 GUI 顺手多了。一个人、一个项目、一天破万 Star,这种事在 GitHub 上越来越常见了。

image


5. 字节发布全模态大模型 Doubao-Seed-2.0-lite,千问上线 PC 端 AI 语音输入

同一天,两家国内大厂各出一招。字节跳动的 Doubao-Seed-2.0-lite 主打"全模态"——能听、能看、还能直接上手操作,是豆包系列里第一个把多模态能力做到这个密度的版本。另一边,千问 PC 端上线了 AI 语音输入,快捷键呼出,在任意桌面应用里直接开口说话,支持去语气词、纠错、格式化整理,还能自动生成邮件回复,适配钉钉、微信、邮件等场景。两件事放在一起看,国内 AI 的竞争已经从"谁的模型更强",悄悄转移到"谁先把 AI 嵌进你的日常操作习惯里"。

image


6. Anthropic 工程负责人:我现在大部分工作从手机完成,夜里有几千个 Agent 在跑

Boris Cherny 在红杉 AI Ascent 大会上说的这段话,值得认真对待。他的 Claude App 里常驻 5 到 10 个 session、几百个 Agent,夜里有几千个在跑深度任务。他管这种工作方式叫 Loop——让 Claude 用 cron 起定时任务,每分钟、每五分钟、或者每天跑一次。这不是在炫技,而是在描述一种正在发生的工作范式转变:AI 不再是你主动去问的工具,而是在后台持续运转的"数字员工"。手机变成了调度中心,睡觉的时候 Agent 还在干活。这个画面,比任何产品发布会的 PPT 都更直接地说明了 Agent 时代到底意味着什么。


7. TRAE SOLO 移动端正式上线,三端同步,Agent 不再是程序员专属

以前用 AI 写代码,你得坐在电脑前。TRAE SOLO 移动端上线之后,这个前提消失了。这次是移动端、Web 端、桌面端(含 Windows)全量开放,三端真正同步联动。打开 App,首页让你选模式:Code 还是 MTC(More Than Coding)。MTC 这个定位很关键——它在告诉你,这个工具不只是给会写代码的人用的。通勤路上、出差途中,碎片时间都能接上 Agent 继续跑任务。结合 Boris Cherny 说的那种"手机调度 Agent"的工作方式,移动端 AI 工具的竞争,今天正式打响。


8. Mirage:把 S3、Google Drive、Slack、Gmail 全接进一个虚拟文件系统

6 周时间,重写了 bash,写了 110 万行代码。Mirage 是一个给 AI Agent 用的统一虚拟文件系统,最大的亮点是:cat、grep、head、管道这些 bash 命令,现在可以跨 S3、Google Drive、Slack、Gmail、GitHub、Linear、Notion、Postgres、MongoDB、SSH 等异构服务直接用。换句话说,Agent 不再需要为每个服务单独写集成代码——文件系统变成了资源中心,bash 调用检索一切。对于要处理多数据源的 Agent 工作流来说,这个抽象层的价值很实在:少写一大堆胶水代码,多干正事。


9. OpenSlide:用 React 写 PPT,整个工作流为 AI Agent 设计

做 PPT 这件事,终于有人认真用 AI 重新设计了一遍。OpenSlide 是一个开源项目,用 React 框架写 PPT,每个元素都是组件,可以手动改,也可以给 AI 留评论让它自己读、自己改。相比直接生成 HTML,React 组件的扩展性更好,各种图表都能接。还集成了 SVGL——一个收录了 1500+ 品牌 Logo 的库,写技术 PPT 再也不用到处找 Claude、Cursor、Gemini 的 Logo 了。整个工作流的设计逻辑是:人负责提需求和审核,AI 负责写代码和修改。这个思路比"让 AI 直接生成一个 PPT 文件"要扎实得多。

image


10. 某输入法"流量劫持"AI 产品,被告索赔一亿元

这个瓜有点意思。上个月,一家杭州 AI 公司把一家深圳 AI 公司告上了法庭,索赔一亿元。起因是:某输入法内置的 AI 智能体,会在用户正常使用另一款 AI 产品时,自动弹出来、遮住对方界面,把用户引向自己的 AI 问答功能。原告认为这是典型的"流量劫持型不正当竞争"。AI 产品的竞争已经激烈到要在输入法层面抢用户了,而且抢的方式直接触碰了法律红线。这个案子的走向值得关注——它可能成为 AI 产品竞争边界的一个标志性判例。


📌 值得关注(5-10条)

[开源] Warp 开源 14 个预构建 DevOps 技能库 - 覆盖 CI 修复、文档更新、Issue 分类等场景,支持 cron 定时和 webhook 触发,DevOps 自动化直接拿来用,不用从零搭。

[开源] MATLAB Agentic Toolkit:让 Agent 直接写 MATLAB 代码 - 包含 MCP Server 和 Agent Skills,能在本地 MATLAB 上执行代码、跑测试、做静态分析,科研和工程圈的人可以认真看一眼。

[开源] claude-mem:给 Claude Code 装上"长期记忆" - 自动捕获编码会话里的所有操作,用 AI 压缩后注入到下一次会话,解决了 Claude Code 每次开新对话就"失忆"的痛点。

[开源] sim:可视化构建、部署和编排 AI Agent 的工作台 - 定位是"AI 工作团队的核心智能层",TypeScript 写的,2.8 万 Star,想搭 Agent 工作流的可以看看。

[商业] Conflict-Aware Fusion:LLM 的"逻辑惯性"问题终于被系统研究了 - 研究发现 GPT-4o、Qwen 等主流模型在规则被扰动时会出现"逻辑惯性"——明明规则变了,模型还按老逻辑推理。这个问题比幻觉更隐蔽,值得关注。


📊 更多动态(可选)

#类型标题链接
1开源prompts.chat(原 Awesome ChatGPT Prompts):16 万 Star 的提示词社区,支持自托管链接
2开源AutoGPT:18 万 Star,让所有人都能构建 AI Agent 的老牌项目链接
3开源OpenHands:AI 驱动的开发助手,7.2 万 Star链接
4开源Flowise:可视化构建 AI Agent,5.2 万 Star链接
5研究SafeRedir:图像生成模型的"遗忘"机制,防止模型复现 NSFW 内容和版权风格链接

😄 AI趣闻

ChatGPT 中文里那句"我会稳稳地接住你",已经被玩成了梗

问数学题,它说"我会稳稳地接住你"。让它写代码,它说"我就在这里,不逃,不躲,不闪避,稳稳地接住你"。这句话在中文互联网被吐槽了大半年,有人把 ChatGPT P 成一个救生气垫张开双臂等着接人,重庆一位 20 岁的开发者甚至因为觉得这个梗太好笑,专门做了个开源工具。更绝的是,OpenAI 自己的研究员陈博远在 4 月发布新图像模型时,画了一格漫画自嘲——新模型又学会说这句话了。WIRED 把这个现象梳理了一遍,给它起了个名字叫"mode collapse"。AI 学语言,有时候就是会死磕一句话猛用,直到全世界都知道它在用。


🔮 AI趋势预测(3-5条)

Agent 从"工具"变成"员工",移动端成为主战场

  • 预测时间:2026年Q2-Q3
  • 预测概率:80%
  • 预测依据:今日新闻 Anthropic 工程负责人谈手机调度 Agent + TRAE SOLO 移动端上线 。当 Anthropic 自己的工程负责人都在用手机跑几千个 Agent,移动端 AI 工具的爆发不是趋势预测,而是已经在发生的事。接下来 2-3 个月,主流 AI 产品的移动端体验会成为竞争核心指标。

Claude 生态将迎来开发者爆发期

  • 预测时间:2026年6月
  • 预测概率:75%
  • 预测依据:今日新闻 Claude 速率翻倍 + Agent 新能力上线 。调用限制一直是开发者用 Claude 构建产品的最大障碍。额度翻倍 + Opus API 速率大幅上调,意味着之前因为"太贵太慢"而放弃的项目,现在有理由重新启动。预计 6 月前后会看到一批基于 Claude 的 Agent 产品集中上线。

AI 产品竞争引发更多法律纠纷,“流量劫持"成新战场

  • 预测时间:2026年Q3
  • 预测概率:65%
  • 预测依据:今日新闻 某输入法被告流量劫持索赔一亿 。AI 产品的分发渠道越来越集中在输入法、浏览器插件、系统级入口,这些位置天然具备"拦截"其他产品流量的能力。这个案子一旦有判决,会成为行业参考标准,预计类似诉讼在 Q3 前后会明显增多。

浏览器将成为 Agent 的核心战场

  • 预测时间:2026年Q2
  • 预测概率:70%
  • 预测依据:今日新闻 OpenAI Codex 推出 Chrome 扩展 。Codex 进入浏览器,意味着 Agent 第一次能处理需要登录验证的私有系统。这个能力一旦成熟,Google、Microsoft、Anthropic 都会跟进。接下来 2 个月,“浏览器 Agent"会成为各家产品的标配功能方向。

❓ 相关问题

如何体验 Claude(包括 Claude Code 和 Claude Opus)?

Claude 目前需要注册 Anthropic 账号并订阅 Pro 或 Max 套餐才能完整使用,Claude Code 的高级功能需要付费订阅。对于国内用户,可能面临支付困难、网络访问限制或账号注册门槛。

解决方案:访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧,省去注册和支付的麻烦,直接上手体验今天提到的 Claude Code 速率翻倍、Agent 新能力等所有更新。

Last updated on