爱窝啦 AI 日报 2026/4/27

今日摘要

GPT Image 2 今天刷屏,4K 输出、云朵涂鸦、浮雕海报,普通人第一次摸到图像生成的天花板在哪里。
会写提示词和不会写的差距,已经肉眼可见——这不是玩具,是一门正在分化的手艺。
今天值得点开,重点看第 1、3、4 条,抄作业的机会都给你备好了。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

GPT Image 2 正在把"会用提示词"变成一门真正的手艺——今天的主线,是普通人第一次感受到图像生成的天花板在哪里。

🔑 3 个关键词

#GPT图像2爆发 #Claude悄悄进化 #Sama在想大事


🔥 重磅 TOP 10

1. GPT Image 2 解锁 4K 输出:让 GPT 导出 PSD 分层文件,里面的图居然是 4K 的

甲方要 4K 图,你只有一张 PPT 截图——这个死局,有人用了一个意想不到的方法破掉了。让 GPT 直接生成 PSD 分层压缩包,解压一看,里面每张图居然是 4K 尺寸。这不是官方功能,是用户自己"歪打正着"发现的野路子。对设计师来说,这意味着以后交付高清素材可能不再需要专门的图像软件介入。当然,稳定性还待验证,但这个思路本身就值得记一下。

image


2. Claude Opus 4.7 视觉能力被严重低估:只给一张参考图,它能还原整套 PPT 排版

以前做 PPT 要么自己排版,要么给模板让 AI 填内容。现在有人只给了 Opus 4.7 一张风格参考图,它不仅还原了排版,还能基于这个风格创作出全新的页面——而且每轮生成后会自动截图做还原度分析,多轮自我修复。这个能力在 4.6 时代根本做不到。AI 生成 PPT 的三条路线(图片生成、HTML 生成、直接生成 PPT 文件),现在看来第三条正在被 Claude 悄悄拿下。

image


3. 《Relief City Atlas》:用 ChatGPT Image 2 做立体浮雕城市海报,哈尔滨冬、上海秋、广州夏、北京春

四座城市,四个季节,每张海报从右下角一个小小旅人出发,一条线串联整座城的古今变迁。这组作品的震撼不在于"AI 能生成图",而在于构图叙事的完整性——立体浮雕 + 微缩模型风格,画面层次感极强。提示词已放评论区,想复刻的可以直接去抄作业。这是 GPT Image 2 目前最能打的使用场景之一:有明确风格语言 + 有叙事结构的系列创作。

image


4. GPT Image 2 刺绣风 Prompt 实测:蚕丝白底色的质感,复刻了好久还是差点意思

有人用 GPT Image 2 生成了一组精致立体刺绣风插画——蚕丝白底、奶白丝线、小鸟停在花枝上,光看截图真的以为是实物刺绣。但有趣的是,作者自己复刻了很久,始终差那么一点"蚕丝白 + 奶白"的质感。这说明 GPT Image 2 对提示词的响应存在一定随机性,同样的词不一定每次都能复现。完整 Prompt 已附在原帖,想研究图像生成质感控制的可以去对比测试。


5. Sama 发推:是时候重新思考操作系统和用户界面的设计了,还需要一个人和 Agent 都能用的协议

这条推文只有两句话,但信息量很大。Altman 说"现在是认真重新思考操作系统和 UI 设计的好时机",还提到互联网需要一个"人和 Agent 同等可用"的协议。这不是随口一说——背后是 OpenAI 在 Agent 方向的持续押注。当 AI Agent 开始大规模替代人工操作,现有的 UI 逻辑(为人类手指和眼睛设计的)确实需要从头重构。这个信号值得盯紧。


6. Sama 转发:GPT-5.5 in Codex 好到有人开始改睡眠习惯,不敢睡太久怕错过工作窗口

原帖两个极端并排放:一边是"后 AGI 时代没人工作、经济崩溃",另一边是"GPT-5.5 in Codex 太好用,我要改成多相睡眠,不敢睡太久怕错过工作时间"。Sama 转发这条,态度很明显——他更认同后者。Sebastien Bubeck(微软研究院)也在评论里说,现在大概把以前两周的工作压缩到了一天。这不是夸张,是真实的工作流变化正在发生。


7. GPT Image 2 云朵涂鸦实测:识别云朵像什么,在原图上直接画出来,Banana Pro 做不到这个

提示词很简单:识别云朵形状,不改原图,用涂鸦形式在原图上把像的东西画出来。GPT Image 2 完成了,Banana Pro 没做到。这个能力的核心是"图像理解 + 精准叠加编辑"的组合——不只是生成,而是在理解原图内容的基础上做增量创作。对做创意内容的人来说,这个方向的想象空间很大:以后可能不需要 PS,直接在原图上"AI 涂鸦"就能出效果。

image


8. Cursor Agent 消耗 token 有多猛:改一个 4 万 token 的 HTML 文件,3 轮对话干了 4000 万 token

这个数字看一眼就懂了——4 万 token 的文件,3 轮对话,消耗了 4000 万 token,相当于 Claude Pro 订阅 5 小时的用量。Cursor Agent 的 token 消耗是真的猛。但作者也说了,效果是真的好,一次性完成任务还覆盖了测试流程。这是一个典型的"效率 vs 成本"取舍:如果你有额度(比如 Cursor 给的 1 万刀),那就是神器;如果自己付费,得掂量一下。

image


9. GPT Image 2 序列帧实验翻车:想生成 4x4 动画帧,结果模糊得像 Stable Diffusion 1.0

GPT Image 2 能稳定生成透明背景图片,有人顺势想用它生成 4x4 序列帧来做小动画——结果翻车了,图片模糊到"梦回 SD 1.0"。这条值得记,不是因为失败,而是因为它划出了 GPT Image 2 的一条边界:单张高质量图像没问题,但多帧序列输出目前还不行。知道工具的边界,比只知道它能做什么更重要。

image


10. AI 时代的超级个体,大部分在前 AI 时代就已经是超级个体了

这句话扎心就扎心在够直接。AI 工具确实在放大个人能力,但放大的前提是你本来就有东西可以被放大。那些用 AI 用得飞起的人,往往在没有 AI 的时候就已经是那个领域里最能折腾的人。这不是泼冷水,而是一个更务实的判断:与其焦虑"AI 会不会取代我",不如先问"我有没有值得被放大的核心能力"。


📊 更多动态(2条)


😄 AI趣闻

失联 2 个多月,用了 8 年的机场竟然满血复活了

用了 8 年的"机场"(VPN 服务商),突然失联两个多月,就在大家以为它凉透了的时候,它悄悄满血复活了。这种感觉大概就像一个老朋友突然消失,你已经开始物色替代品,结果人家拍拍你肩膀说"我回来了"。AI 工具用得越顺手,对这类基础设施的依赖就越深——它一断,你才发现自己的工作流有多脆弱。


🔮 AI趋势预测(4条)

GPT Image 2 将催生专业"提示词工程师"细分赛道

  • 预测时间:2026年Q2-Q3
  • 预测概率:75%
  • 预测依据:今日多条实测( 刺绣风 Prompt城市浮雕海报 )显示,GPT Image 2 对提示词的响应存在明显质量差异,“会写 Prompt"和"不会写"之间的输出差距肉眼可见。这个差距会推动专门针对图像生成的提示词课程、模板库和付费社区快速涌现。

Claude Opus 系列将在 PPT/文档生成领域形成明显竞争优势

  • 预测时间:2026年Q2
  • 预测概率:70%
  • 预测依据:今日实测( Opus 4.7 视觉能力 )显示,Opus 4.7 已能基于参考图还原并创作 PPT 排版,且具备多轮自我修复能力。这是其他主流模型目前明显落后的方向,Anthropic 如果持续迭代,Claude 在专业文档生成场景的市占率会显著提升。

“Agent 友好型"操作系统或协议层将出现早期原型

  • 预测时间:2026年Q3
  • 预测概率:55%
  • 预测依据:Sama 今日明确表态( 重新思考 OS 和 UI 设计 ),提出需要"人和 Agent 同等可用"的协议。OpenAI 有动机、有资源推动这个方向,加上 Agent 应用正在快速落地,底层协议的需求会越来越迫切,预计会有团队率先做出可演示的原型。

Cursor 等 AI 编程工具将推出更精细的 token 用量控制功能

  • 预测时间:2026年Q2
  • 预测概率:65%
  • 预测依据:今日实测( Cursor Agent 消耗 4000 万 token )暴露了 Agent 模式下 token 消耗失控的问题。这个痛点足够普遍,用户反馈压力会推动 Cursor 等工具在近期版本中加入更细粒度的用量上限设置或消耗预警机制。

❓ 相关问题

如何体验 Claude Opus 4.7?

Claude Opus 4.7 目前通过 Anthropic 官网的 Claude.ai 提供访问,但 Opus 级别模型需要 Claude Pro 订阅(月费约 20 美元),且国内用户面临支付方式受限和网络访问门槛。

解决方案:访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧,省去注册和支付的麻烦,直接上手体验 Opus 4.7 的 PPT 生成和视觉多模态能力。

Last updated on