爱窝啦 AI 日报 2026/6/4

今日摘要

微软Build 2026宣布Windows全面押注Agent平台,16亿台设备一夜变成Agent跑道。
国内腾讯阿里字节同步开抢Skill商店,争的不是功能,是Agent时代的流量入口。
应用分发权的战争今天正式打响,这期值得点开。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

微软Build 2026把Windows变成Agent跑道,国内腾讯阿里字节同步开抢Skill商店——AI时代的"应用分发权",今天正式开战。

🔑 3 个关键词

#Agent入口争夺战 #Windows押注Agent #Skill商店卡位


🔥 重磅 TOP 10

1. 16亿Windows用户,一夜冲进Agent时代

纳德拉站在Build 2026台上说出那句话时,台下沉默了两秒:Windows,就是跑Agent的最佳平台。 不是PPT口号——“龙虾之父"Peter Steinberger当场官宣Windows完整支持OpenClaw,Copilot同步推出全新品类Autopilots,首位成员叫Scout。以前你开机是为了用Office、打游戏,以后开机可能是为了让Agent替你把事情办完再叫你。16亿台设备,一夜变成Agent跑道。这场发布会的真正意义,不在于某个新功能,而在于微软把所有筹码全押到了"PC = Agent运行环境"这个赌注上。

image


2. 腾讯、阿里、字节,混战Skill商店

一个资深产品经理把自己写PRD的全套方法论打包成Skill文件,挂上架,任何人的Agent装上就能照这个框架输出——这不是科幻,是今年3月腾讯、阿里、字节同时上线Skill商店后正在发生的事。此后两个月,智谱、美团、小红书接连入场。问题来了:这些商店目前几乎都免费,字节扣子是唯一试水付费的。不赚钱抢什么?答案很简单——谁掌握Skill分发权,谁就掌握Agent时代的流量入口。这场仗的本质,和当年抢应用商店一模一样,只是主角从App换成了Skill。

image


3. 别盯着GPU了,英特尔甩出重磅大招,能否终结英伟达的算力垄断?

过去两年,AI圈的逻辑只有一个:谁有更多GPU谁就赢。英伟达靠这个把股价推上天。但在COMPUTEX 2026上,英特尔CEO陈立武说了一句让人很难忽视的话:AI的下一阶段,不能只看GPU。 押注的是Agentic AI——智能体不是"问一句答一句"的回合制机器,而是要进入真实工作流,自己思考、规划、行动、反思。这种范式对计算架构的要求和传统GPU训练完全不同。英特尔能不能借这个窗口打破英伟达的垄断,现在还是问号。但方向判断本身,值得认真对待。

image


4. 微软一口气发布7个MAI自研模型

同样是Build 2026周,微软还悄悄推出了7个MAI模型:2个LLM、2个图片生成、2个语音、1个语音识别。坦白说,从旁观者角度评价:基本是二流水准,也没开源。 但微软的逻辑不是冲跑分,而是给企业客户提供"在Azure上微调出自己专属模型"的能力——这是一套企业定制化底座,不追求最强,只追求最容易集成。对大量已经押注微软云的企业来说,这套东西的价值不在于绝对性能,而在于不用离开自己熟悉的环境就能把AI能力调出来用。

image


5. GPT 5.5 Pro教你把Codex的Goal指令用明白

很多人用Codex,写了半天Goal指令,AI交出来的东西还是跑偏。有人直接让GPT 5.5 Pro研究了一遍官方文档,整理出两个关键技巧:一是不知道怎么写时,先跑/plan模式,让AI反过来问你缺了哪些成功条件;二是一个好的Goal有六要素——结果、验证、约束、边界、迭代策略、阻塞条件。 听起来像废话,但按这个框架写出来的指令,AI跑偏率会大幅下降。提示词模板直接在原帖里,收藏备用,下次写复杂任务前先跑一遍plan,省得后面反复拉回来。


6. Kimi Code正式发布,国产编程Agent又多一个玩家

“这就发了!Proudly based on Kimi Code。"——就这一句话配一张截图,Kimi Code宣告入场。国内编程Agent这条赛道,Codex、Claude Code、DeepSeek Harness、Cursor都在,Kimi Code挤进来,竞争烈度又上一个台阶。有观点认为光卷TUI和Coding没前途,真正的出路是尽快做GUI、支持办公任务、打通通用Agent。Coding能力是地基,地基打好之后盖什么楼,才是真正的分野。Kimi Code刚亮相,这个问题留给它自己回答。

image


7. 小红书悄悄上线AI对话功能

搜攻略这件事,小红书一直有个别人很难复制的优势:国内真人语料密度最高的平台之一,而且图文并茂。 现在把AI对话直接接进去,用户搜旅游、搜美食,不再是翻一堆笔记自己整理,而是可以直接问、直接得到有图有文的答案。这个组合对内容搜索场景来说相当顺手。不是颠覆性发布,但作为一个今天就能用的功能,很实在——特别是对经常在小红书找攻略的用户,体感变化会比较直接。


8. Ethan He:模型进步的真相不是新算法,是修数据

Latent Space访谈了Ethan He,几个判断听完让人很有共鸣:模型质量提升,往往不来自新算法,而是来自修数据和训练流程里的bug——这个观点最近被多位研究员在播客里反复提到,不是巧合。另一个细节:GPT Image生成一张图要几分钟,大部分时间不是在生成像素,而是在"思考"怎么改写提示词。他还预测扩散模型会成为人机交互的前端层,用户看到的所有界面都由生成模型实时渲染。这是今天最值得慢慢读的一手行业判断。


9. 有人写了个Skill专门监控Codex重置消息

Codex用久了会遇到一个问题:触发重置的瞬间如果你不在场,额度就这么悄悄流走了。有开发者干脆写了一个Skill,专门盯着Codex的重置消息,一旦触发立刻切换到fast模型,把剩余用量抢先消耗掉。 安装方式是把指令发给Codex自己读取执行——用AI来管理AI的用量,有一点俄罗斯套娃的意思。如果你也在跑长任务,这个小工具可以救不少额度,装好之后自己会盯着,你去喝杯水也不怕。


10. GPT Image Gen V2,自拍图以假乱真

有人用详细的英文提示词,让GPT Image Gen V2生成了一张中国短视频App风格的竖屏自拍——前置摄像头、广角微畸变、脸占上半画面、光线自然。那张图摆出来,说是真人拍的,很难辨别。这不是什么特殊技术演示,只是一条普通社区分享,但它说明了一件事:图像生成在自拍这个场景下的"以假乱真"能力,已经不是未来时。 对内容创作者来说是工具,对信息环境来说是隐患,这两件事同时成立,而且都在今天。


📌 值得关注

[产品] Gemini全平台开放Thinking Levels — Web、iOS、Android同步上线,用户可以自己调节思考深度,按需省Token或拉满推理,细粒度控制以前只有部分用户能用。

[开源] opendataloader-pdf:面向AI就绪数据的PDF解析器 — GitHub今日热榜,23K星,Java实现,专为AI数据管道设计,需要批量处理PDF喂给模型的工程师值得看一眼。

[产品] Codex Site插件:生成网页并直接部署上线 — 类似Claude Design但多了自动部署这步,生成页面直接可访问;目前仅限Business和组织用户,Pro用户暂时只能等。

[其他] 澳洲旅游局宣传片:AI制作片段和实拍已无差异 — 真人实拍+AI混剪,肉眼很难区分,AI视频商业落地的时间节点比大多数人预估的要早得多。


坐在家里,远程指挥另一台电脑写代码

办公室那台电脑项目环境配好了、依赖装好了,但人在家,懒得开远程桌面一格一格盯着敲。有人发现Codex其实藏了一个功能:设置 → 连接 → 控制其他设备,把家里电脑和公司电脑都加进来,本机创建项目时可以直接选"远程项目”,让另一台机器上的Codex跑任务。 换句话说,你坐在沙发上,家里或公司的那台电脑正在老老实实写代码,CPU在转,你在刷手机。

以前是"人等编译”,现在升级成"人在沙发,机器在工位"。当然,跑完之后code review这件事,还是得你自己坐直了来。

Tweet Image


😄 AI趣闻

让 Claude 设计图标,SVG 直接出图,矢量这个词救了场子

有人让 Claude Design 设计了个图标,不生成 PNG、不走导出流程,直接吐出一段 SVG 代码,贴进浏览器就能看。效果嘛,本人评价是"看着还行"——这四个字在程序员语境里大概等于"我妈说好看"。不过 SVG 这事确实有点东西:放大一万倍不糊,改颜色只要改一行代码,比截图存下来的 PNG 体面多了。网友在评论区默默补了一句:设计师失业的方式,居然是从矢量图开始的。

🔮 AI趋势预测

Skill商店进入付费变现阶段

  • 预测时间:2026年Q3
  • 预测概率:72%
  • 预测依据:今日新闻 腾讯、阿里、字节混战Skill商店 显示,目前多数平台仍免费试水,字节扣子已率先探索付费;历史上App Store、小程序商店均经历"免费跑量→付费分成"的路径,Skill商店复制这条路线概率较高,Q3内有望看到第一批付费Skill产品规模化分发。

Windows平台成为国内Agent应用的重要分发渠道

  • 预测时间:2026年Q3
  • 预测概率:65%
  • 预测依据:今日新闻 16亿Windows用户冲进Agent时代 表明微软已将Windows定位为Agent运行平台,OpenClaw原生支持落地;国内企业级用户高度依赖Windows生态,Agent工具一旦深度整合进系统层,分发门槛将大幅降低,国内厂商跟进适配动作预计在Q3集中出现。

国内编程Agent头部格局基本成型,中小玩家出清加速

  • 预测时间:2026年Q3
  • 预测概率:68%
  • 预测依据:今日新闻 Kimi Code正式发布 后,赛道内已聚集Kimi Code、DeepSeek Harness及各大厂产品;用户连续11天不间断使用、单次任务8小时的黏性数据说明迁移成本正在升高,窗口期收窄,没有差异化的中小产品将加速淘汰。

AI图像生成进入内容监管强化周期

  • 预测时间:2026年Q3
  • 预测概率:60%
  • 预测依据:今日新闻 GPT Image Gen V2自拍以假乱真 加上近期深度伪造事件持续发酵,技术能力已显著超前于现有监管规则;预计Q3内会有更明确的平台内容标注要求或政策草案出台,以匹配当前生成图像的真实性风险。

❓ 相关问题

如何体验 Codex?

Codex 目前需要 ChatGPT Pro 或更高级别订阅才能使用,部分高级功能(如 Site 插件、多设备远程控制)仅限 Business 及组织账号。对国内用户来说,注册、支付和续费都存在一定门槛,账号封控风险也比较高。

解决方案:访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧。

Last updated on