爱窝啦 AI 日报 2026/5/9

今日摘要

Karpathy 在红杉大会宣告"软件3.0已来",提示词就是新代码,大模型正在吞噬传统开发范式。
谷歌推出 Gemini Flash-Lite 主打低价,却被 DeepSeek 的定价衬得尴尬,价格战的标杆已经换人了。
今天有主线:软件3.0是值得认真读的大命题,顺手看看谷歌的价格困境,两条一起看才完整。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

Karpathy 在红杉大会上宣告"软件3.0已来"——提示词就是新代码,传统架构正在被大模型吞噬。

🔑 3 个关键词

#软件3.0革命 #AI工具爆发 #谷歌价格尴尬


🔥 重磅 TOP 10

1. Karpathy 红杉大会:软件3.0时代,提示词就是代码

以前写软件,你得一行一行敲代码;后来是整理数据集训练神经网络;现在呢?把一张图片扔给模型,直接出结果,管道代码全省了。Karpathy 在2026红杉AI大会上把这个范式叫做"软件3.0"——大语言模型就是解释器,你的提示词和上下文就是编程手段。他还提出"智能体工程"概念:Vibe Coding 让所有人都能编程,但专业工程师不能因为用了AI就引入Bug,真正的挑战是在不降低质量的前提下大幅提速。这不是在聊未来,这是在描述今天已经发生的事。

image


2. 阮一峰周刊第395期:软件开发的第三种方式

《大教堂与集市》把软件开发分成两种:封闭精英团队 vs 开放社区协作。这个比喻用了近30年,但现在出现了第三种——AI驱动开发。不是大教堂,不是集市,更像是一个随时待命的超级助手,让一个人就能干一支团队的活。配合Karpathy的"软件3.0"一起读,今天的主线就完整了。值得花20分钟认真看。

image


3. 谷歌推出 Gemini 3.1 Flash-Lite,主打低延迟低价

谷歌又在Flash系列上套了一层Lite。定位是低延迟、低价格,听起来很美——但实际对比下来,价格只比DeepSeek V4 Pro便宜一点点,跟DeepSeek V4 Flash比还差得远。主打"便宜",结果便宜的标杆已经被DeepSeek拉到了另一个维度。对开发者来说,如果你已经在用谷歌生态,这个新选项值得测一测延迟表现;如果你只看价格,DeepSeek的性价比目前还是更强。谷歌这次的定价策略,有点像在打折的奢侈品店门口贴"超值"——跟旁边的拼多多比,还是贵。


4. Microsoft AI-For-Beginners:12周24课,4.7万星的AI入门课

想系统学AI但不知道从哪下手?微软这个开源课程今天在GitHub Trending上冲到了47292星。12周、24节课,用Jupyter Notebook做载体,从基础概念到实际动手全覆盖。不是那种"看完还是不会"的理论课,每节课都有可以跑的代码。对于想从零入门、或者想给团队做AI培训的人来说,这是目前能找到的最系统的免费资源之一。收藏了不看的那种,这次真的值得打开。


5. GPT Image 2 封面生成 Prompt:中文科技媒体爆款图一键生成

做内容的人都懂那个痛:文章写完了,封面图要么找不到合适的,要么设计师排期排到下周。这个Prompt直接解决这个问题——把文章内容扔进去,GPT Image 2自动提取核心新闻、关键数字、情绪基调,生成16:9的中文科技媒体风格封面,要求"3秒内看懂新闻重点"。风格参考B站科技区爆款缩略图和财经新闻视觉,不要极简风,要"行业大事件"感。今天就能用,内容创作者直接收藏。


6. Sam Altman 发了一张 ChatGPT 截图,配文"call me maybe"

OpenAI CEO Sam Altman 深夜发了一条推,就一句歌词"call me maybe",配了一张ChatGPT的截图,没有任何解释。这种神秘发帖在AI圈通常意味着:要么在预告新功能,要么就是老板在玩梗。结合近期ChatGPT持续强化语音交互的节奏,不少人猜测这可能暗示实时通话功能的新进展。Altman这种发帖方式历史上多次对应功能预告——“call me"的字面意思指向性太强,很难说是纯粹玩梗。

image


7. GEO红皮书:10万字拆解黑帽GEO,帮你避开AI营销坑

GEO(生成式引擎优化)2025年火起来之后,行业迅速变质:黑帽手段横行,服务商割韭菜,最后被央视315点名。这份10万字的《GEO红皮书》是对这一年乱象的正面回应——拆解常见黑帽手段、教你甄别服务商水平、提供风险自查清单。基于国内外前沿论文和实战踩坑经验整理,免费领取。如果你的公司正在考虑做AI时代的内容营销,这份资料值得先读完再决策,比被坑了再后悔省事多了。


8. 最近抖音爆火的"法天象地"效果,直接生成视频比图片更震撼

抖音上那种把户外照片做成山河壮阔感的"法天象地"效果,最近刷屏了。大多数人在生成图片,但有人试了直接生成视频——效果更好。用的是GPT-Image-2.0加上C-Down 3.0,提示词也一并放出来了。这条值得关注的不只是这个特效本身,而是"图生视频"的工作流正在被越来越多普通用户跑通,门槛低到抖音用户都在玩,这个信号比任何技术报告都直接。


9. 用AI做PPT的最省力路径:大纲→生图→Keynote

下周要做分享,PPT还没动?这个流程值得抄:先跟AI讨论出大纲,把大纲发给Youmind或GPT生图做底图模板,再把图粘进Keynote,缺的页面手动补文字调整。全程不需要设计功底,也不需要从零排版。关键是"AI生图做底图"这一步——不是让AI帮你写内容,而是让AI帮你解决视觉层的工作量。对于经常要做演示的人,这个工作流今天就能跑通,比对着空白幻灯片发呆强多了。


10. Lex Fridman 访谈 VLC 和 FFmpeg 开发者:开源软件的硬核故事

VLC最早是为了在校园网播卫星电视信号设计的,从第一天起就被设计成能处理"坏掉的文件”——这就是为什么下载一半的AVI文件只有VLC能播。还有个冷知识:VLC官网25%的流量来自搜索"cone player",因为很多人只记得那个锥子图标。在AI工具满天飞的今天,这期访谈提醒了一件事:那些真正改变了数十亿人使用习惯的软件,往往是一小群人用极其朴素的工程哲学做出来的。


📌 值得关注(5条)

[研究] LLM驱动的神经架构搜索新方法 - 让大模型直接生成可执行的架构代码,NAS不再只是调参游戏,LLM+自动化设计的交叉方向值得盯着。

[研究] 视频奖励模型新范式:先思考再打分 - 把推理过程和评分解耦,视频生成的后训练质量有望大幅提升,下一代视频模型可能就靠这类方法拉开差距。

[开源] CVPR2026:基于RWKV的多模态害虫识别框架 - 中科院合肥所的成果,RWKV在农业视觉场景的落地,比"大模型做农业"的口号具体多了。

[其他] 用飞书划线+Agent构建个人偏好系统 - 把阅读标注变成Agent的训练信号,你的批注就是你最真实的偏好数据,这个思路很有意思。

[商业] PKU SAIIC × WAIC北京场路演,5月14日 - 优秀项目给算力和投融资支持,有AI创业想法的团队可以去看看。


😄 AI趣闻

乡亲们开始整AI鱼缸了

养鱼这件事,以前的终极形态是"买个好看的缸,然后隔三差五发现鱼死了"。现在有人给鱼缸装上摄像头,接上多模态模型,让AI全天候盯着鱼。鱼游得慢了,AI提醒你;水质变了,AI报警。鱼大概是第一批被AI监控的生物,待遇比很多打工人还好。看到这条新闻,我第一反应不是"技术真厉害",而是:我家那条金鱼当年要是有这个,可能就不会那么早离开我了。

image


🔮 AI趋势预测

ChatGPT 推出增强版实时语音/通话功能

  • 预测时间:2026年6月
  • 预测概率:70%
  • 预测依据:今日新闻 Sam Altman 发布"call me maybe"暗示帖 + OpenAI近期持续强化语音交互能力,Altman这种神秘发帖历史上多次对应功能预告,“call me"的字面意思指向性极强,不像纯粹玩梗。

“智能体工程"成为独立职业方向

  • 预测时间:2026年Q3
  • 预测概率:75%
  • 预测依据:今日新闻 Karpathy 红杉大会分享 明确提出"Agentic Engineering"概念 + 本周已有Agent Skills黑客松举办,社区自发形成学习和实践生态,职业分化通常在概念被权威人物命名后6-12个月内加速。

谷歌 Gemini 系列在低价市场被迫进一步降价

  • 预测时间:2026年Q3
  • 预测概率:65%
  • 预测依据:今日新闻 Gemini 3.1 Flash-Lite 定价对比 显示谷歌"低价"产品仍远贵于DeepSeek V4 Flash + DeepSeek持续压低行业价格基准,谷歌若要在开发者市场保持竞争力,价格调整几乎是必然选项。

AI生成内容工具向"一键出成品"方向集中爆发


❓ 相关问题

如何体验 ChatGPT 最新的语音和图像功能?

ChatGPT 目前需要注册 OpenAI 账号,部分高级功能(如 GPT-4o 语音模式、GPT Image 2 图像生成)需要订阅 ChatGPT Plus,月费约20美元。国内用户面临网络访问限制和信用卡支付门槛,直接注册和付费有一定难度。

解决方案:访问 爱窝啦 Aivora 获取成品账号,支持 ChatGPT、Claude、Gemini 等主流模型,极速发货,售后无忧,省去繁琐的注册和支付流程。

Last updated on