爱窝啦 AI 日报 2026/4/18

今日摘要

Anthropic 发布 Claude Design + Opus 4.7,AI 直接读你的代码库生成专属设计系统,AI PPT 和设计稿创业公司集体躺平。
同一天 Codex 把 UI 测试、预览、图片生成全塞进来,工具链整合的速度已经快过大多数垂直产品的迭代速度。
今天是平台吃掉垂直工具的教科书案例,做 AI 设计/开发工具的人,今晚值得认真想想。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

Anthropic 突然甩出 Claude Design + Opus 4.7,一刀砍掉了一整批 AI 设计和 PPT 创业公司。

🔑 3 个关键词

#Claude设计师上岗 #Codex全面进化 #工具链重组


🔥 重磅 TOP 10

1. Claude Design 正式亮相,一批 AI 设计产品白做了

做 PPT 的产品经理最近可能要睡不着了。Anthropic 发布 Claude Design,你描述需求,Claude 直接出设计稿,然后通过聊天、批注、拖拽滑块反复调整,直到满意为止。背后跑的是今天同步发布的 Claude Opus 4.7,目前视觉能力最强的版本。

真正狠的地方在于:团队首次使用时,Claude 会自动读你的代码库和设计文件,生成一套专属设计系统(品牌色、字体、组件),之后每个项目自动套用。做完的东西可以导出为 Canva、PDF、PPTX 或独立 HTML。Pro、Max、Team、Enterprise 用户今天起逐步开放。

那些专门做 AI 设计稿、AI PPT 的垂直产品,这次真的很难受。


2. OpenAI Codex 大升级:All-in-One 开发工具,Computer Use 直接内置

没等来新图片模型,等来了 Codex 的全面进化。现在的 Codex 不只是写代码,它把 ChatGPT 的功能全塞进来了——内置 Artifact,写完的网页直接打开预览;支持在网页上直接标注评论,让它改哪儿指哪儿;Computer Use 功能让它能自己跑 UI 测试,这是 Web 开发里最烦人的一环,现在 AI 自己搞定。

侧边栏甚至能打开 PDF、PPT,不只是代码文件。还能先生成图片草稿确认方向,再开始写代码。

一句话:以前要配一堆工具才能跑通的开发流程,现在一个 Codex 全包了。


3. Codex Computer Use Mac 版交互亮相,体验直接拉满

光说功能不够直观,看交互才知道差距在哪。Codex 的 Mac 版 Computer Use 演示出来了,操作流畅、界面清爽,AI 在屏幕上自主操作的过程几乎没有卡顿感。

跟之前那些"能用但很割裂"的 Computer Use 实现比,这次的体验明显上了一个台阶。对于想用 AI 做自动化测试、自动操作桌面应用的开发者来说,这个演示值得认真看一遍。


4. HeyGen 发布 hyperframes CLI:纯 HTML 动效直接渲染成视频

以前想做一个有动效的科普视频,要么找设计师,要么自己学 AE,门槛极高。HeyGen 的 hyperframes CLI 把这条路打通了:用 HTML 写动效,直接渲染成视频,支持 GSAP、Lottie、CSS、Three.js 这些主流框架,完整的视频渲染管线(获取、编码、音频混合)全都有,还带编辑器 UI 可以手动调整。

更狠的玩法是:接上 Seedance 2.0 这样的模型,扔一张照片进去,剩下全交给 Claude Code,零人工介入就能出一条人脸出镜的科普视频。

用过 Remotion 的开发者,这次可以认真考虑迁移了。


5. Clicky:截图 + 语音 + 蓝色光标,AI 手把手教你操作任何软件

不会用剪映调滤镜?以前的做法是截图发给 Claude,Claude 告诉你大概在哪,然后你自己找。繁琐,而且容易找不到。

Clicky 把这个流程压缩成了:按快捷键说一句话,它自动截图、语音转文字、发给 Claude,生成语音回复,同时屏幕上出现一个蓝色光标直接指向你该点的位置,鼠标跟过去点就行了。

不限于教你操作软件,网页问题、解题指引都能用。需要 Claude API 和 11Labs API,但代码已开源,可以自己魔改。对于经常要教别人用软件的人来说,这个工具的想象空间很大。


6. GPT-Image-2 悄悄在 LMArena 现身,写字效果基本完美

OpenAI 的新图片模型 GPT-Image-2 还没正式发布,但已经在 LMArena 里以 duct-tape-1 的代号跑起来了。实测效果很强,最让人惊喜的是文字渲染——生成图片里的文字基本完美,这一直是图像模型的老大难问题。

想提前体验的话,在 LMArena 上传两张空白图片作为参考,可以把抽到它的概率提升到约 50%。正式发布估计不远了,等等党这次可能等不了多久。

image


7. Chrome 空白页塞进 AI 搜索、Deep Research 和图片生成入口

流量入口的战争,Google 直接在最高频的地方动手了。Chrome 浏览器的新标签页(空白页)现在新增了 AI 搜索模式、Deep Research 和图片生成的快捷入口。

这个改动看起来不大,但逻辑很清楚:每天有多少人打开新标签页?有了这个入口,AI 功能的日活数据会直接起飞。对于其他 AI 搜索产品来说,这是一个很难绕过去的渠道优势。

image


8. Arrow 1.1 发布:纯代码画 SVG,过程本身就是一场表演

Arrow 更新到 1.1 和 1.1 Max,专门用来生成 SVG 图片的模型,完全通过代码绘制,不是传统的像素图。最有意思的地方不只是结果,而是过程——你能实时看到 AI 一笔一笔把图画出来,线条慢慢成形,有点像看人手绘。

支持文字生成 SVG 和图片转 SVG,生成的文件浏览器直接渲染,体积小、可缩放。在线地址:app.quiver.ai。对于需要高质量矢量图的设计师和开发者,值得试一试。


9. Codex 能做类似 Cowork 的事,还没有沙盒限制

Cowork 类工具的核心痛点一直是沙盒限制——能做的事被框死了,稍微复杂一点的任务就卡住。Codex 现在能做类似的协作式开发,但没有这个限制,能力范围明显更宽。

演示视频里,Codex 在处理复杂任务时的连贯性和自主性都很强,不需要频繁人工介入。对于想用 AI 做真正复杂项目的开发者,这个方向值得持续关注。


10. Computer Use 让 AI 反向工程自己,顺手开源了权限管理工具 permiso

有人用 Computer Use 让 AI 对自己进行逆向工程,然后用 vibe coding 的方式写出了一个权限管理小工具 permiso,已经开源在 GitHub 上。

这件事本身有点递归的荒诞感——AI 用自己的能力分析自己,再把分析结果变成代码。更实际的价值是 permiso 这个工具本身:它处理的是 macOS 应用权限流程,界面和交互都做得很干净。开源地址:github.com/zats/permiso,感兴趣的可以直接去看。


[产品] 阿里开源 Qwen3.6-35B-A3B — 小版本升级,但阿里持续开源这件事本身就值得记一笔,开源生态的压舱石还在。

[产品] Impeccable 升级到 2.0,推出 CLI 工具检测 AI 设计味 — 无需 LLM 就能扫描代码,检测 25 种"AI slop"设计模式,还有 Chrome 扩展一键检测网页,想做出有人味设计的开发者可以认真看看。

[商业] Kimi 月之暗面急招人 — 连发多个"急急急",说明业务在快速扩张,国内大模型公司的人才争夺战还在加速。

[研究] Claude Opus 4.7 在 Vertex AI 上被提前发现 — 正式发布前就被眼尖的人在 Vertex AI 上抓到了,这种"提前泄露"的方式已经成了大模型发布的固定前戏。

[其他] Nana Banana 用 AI 画《红楼梦》《金瓶梅》角色头像 — 风格统一、古典感强,AI 图像在中国古典文学视觉化上的效果越来越有意思了。


有人让 AI 用 Computer Use 反向工程自己

想象一下:你让一个人对着镜子,把自己的行为逻辑全部写成说明书,然后交给别人用。这件事放在人身上听起来很荒唐,但有人真的让 AI 用 Computer Use 分析自己的运作方式,然后顺手把分析结果写成了一个开源工具。

整个过程大概就是:AI 看着自己,想了想,然后说"好,我来写个程序描述我自己"。工具做出来了,还挺好用。这种递归感,不知道该说是聪明还是有点迷。


🔮 AI趋势预测

Claude 系列加速向设计和创意工具渗透

  • 预测时间:2026年Q2(5-6月)
  • 预测概率:78%
  • 预测依据:今日新闻 Claude Design 发布 表明 Anthropic 已经把视觉能力作为核心战略方向,Opus 4.7 同步发布且定位为"最强视觉模型",这个节奏说明后续还有更多创意工具在路上,而不是一次性发布。

OpenAI Codex 成为开发者主力工具,替代多个垂直产品

  • 预测时间:2026年5-6月
  • 预测概率:72%
  • 预测依据:今日新闻 Codex 大升级 显示 Codex 已经把 UI 测试、Artifact 预览、图片生成、文件查看全部整合,All-in-One 的趋势一旦形成,开发者迁移成本会快速降低,垂直工具的生存空间会进一步压缩。

GPT-Image-2 正式发布,图像文字渲染成为新标准

  • 预测时间:2026年4月底至5月初
  • 预测概率:82%
  • 预测依据:今日新闻 GPT-Image-2 在 LMArena 现身 显示模型已经在测试阶段,写字效果基本完美,这个能力一旦正式开放,会直接拉高整个行业对图像模型文字渲染的预期门槛。

AI 工具入口之争从 App 转向操作系统和浏览器原生位置

  • 预测时间:2026年Q2
  • 预测概率:68%
  • 预测依据:今日新闻 Chrome 空白页新增 AI 入口 是一个明确信号——流量入口的争夺已经从独立 App 下沉到浏览器和系统级别,接下来 Microsoft、Apple 大概率会跟进类似动作。

❓ 相关问题

如何体验 Claude Design 和 Claude Opus 4.7?

Claude Design 目前以研究预览形式开放,需要 Anthropic 的 Pro、Max、Team 或 Enterprise 订阅才能使用,正在逐步放量。对于国内用户,直接注册 Anthropic 账号可能面临支付困难和地区限制。

解决方案:访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧,省去折腾账号的时间,直接上手体验 Claude Design 和 Opus 4.7 的最新能力。

Last updated on