爱窝啦 AI 日报 2026/5/23

今日摘要

30多款主流AI工具的系统提示词被一个GitHub仓库单日扒到13万星,Cursor、Kiro、Claude Code的"产品配方"全曝光。
不只是吃瓜——Codex同日上线/goal长任务模式,DeepSeek API再砍75%,AI工具的护城河和价格底线同时被重写。
今天值得点开:提示词泄露教你逆向学产品设计,降价潮教你省钱,两件事都跟你有关。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

138K星的GitHub仓库把30+主流AI工具的系统提示词全扒光了,AI圈最大的"底裤"事件今天炸了。

🔑 3 个关键词

#系统提示词大曝光 #降价潮继续 #Agent长任务时代


🔥 重磅 TOP 10

1. 30+主流AI工具系统提示词遭集体扒光,GitHub单日13万星

你有没有想过,每天用的那些AI工具,背后到底在偷偷给模型塞了什么"说明书"?现在不用猜了。一个GitHub仓库把Cursor、Claude Code、Devin、Manus、Kiro、Windsurf、Perplexity、v0等30多款主流AI产品的系统提示词、内部工具调用逻辑和底层模型信息全部公开,单日涨到13万星,直接成为史上增速最快的仓库之一。

这不只是技术好奇心的满足——系统提示词是这些产品的核心竞争力,相当于把人家的产品配方直接晒网上。对开发者来说,这是一份绝佳的逆向工程教材;对这些公司来说,护城河被扒了一层。等着看后续有没有公司发律师函。


2. Codex史诗级更新:双Command键截图+/goal长任务模式上线

以前用Codex写代码,遇到界面问题还得自己截图、粘贴、描述,来回折腾好几步。现在不用了:同时按住左右两个Command键,Codex直接把你鼠标所在窗口截下来,连屏幕上没显示的文本也一并塞进上下文——这个细节处理得相当到位。

更猛的是/goal模式正式上线:给它一个目标,它会自主执行几小时甚至几天,中途可以随时暂停、修改方向、再继续。这已经不是"代码补全工具"了,更像一个能独立跑任务的异步开发助手。内置浏览器也同步升级,支持直接在注释里编辑页面元素。开启方式:在config.toml里加上goals = true

image


3. AI墨水屏便签:让AI主动把你该看的事推到屏幕上

每天早上打开电脑,第一件事是切calendar、翻GitHub、看消息——这套流程你做了多少遍了?藏师傅做了一个AI屏幕便签Skill,接入墨水屏设备后,AI会根据你当前的状态和记忆,主动决定在屏幕上显示什么内容。16种widget自由组合,2-1-1布局拆4个槽位,瞥一眼就够。

不是你去找信息,是AI把信息送到你眼前。这个思路的转变比技术本身更值得关注——从"拉取"到"推送",从"你问AI答"到"AI主动感知"。墨水屏功耗极低,常亮不费电,这个组合有点意思。


4. LLM存在系统性政治偏见,一致性训练可有效缓解

给同一个LLM提两个政治立场相反但结构完全对称的问题,它给出的回答往往不对称——这不是偶然,研究者把这种现象命名为"隐性政治偏见",并归纳出7种具体的偏见运作机制。

研究提出了两个量化指标:情感一致性(衡量措辞和框架的对称性)和立场一致性(衡量结论的对称性)。更重要的是,他们发现通过一致性训练可以显著降低这种偏见,而不需要大规模重新训练模型。对于正在做内容审核、政策分析或新闻摘要类AI应用的团队,这篇论文的方法论值得认真看一遍。


5. 视觉文档图像编辑基准VDE Bench发布

你有没有试过让AI帮你改一张截图里的文字,结果字体、背景全乱了?这个痛点终于有人认真研究了。VDE Bench专门评估图像编辑模型在"视觉文档"场景下的能力——也就是在保留原始字体风格和背景的前提下,精准修改图片里的文字内容。

这个方向之前几乎没有系统性的评测标准,导致各家模型自说自话。有了统一基准,才能真正比较谁在这个任务上更靠谱。对做文档处理、合同编辑、UI截图修改的AI应用来说,这个基准的出现意味着这个细分赛道开始被认真对待了。


6. MuKV:多粒度KV缓存压缩,让长视频问答不再爆显存

长视频问答是个让人头疼的问题:视频越长,token越多,显存直接爆。现有方法要么每帧都缓存(冗余严重),要么跳帧(细节丢失)。MuKV提出多粒度KV缓存压缩方案,同时处理帧内空间细节和跨帧时序上下文,在保留关键信息的同时大幅压缩内存占用。

实际意义很直接:同样的硬件,能处理更长的视频,回答更准确。对正在做视频理解、监控分析、长视频摘要的团队,这个方向的进展值得跟踪——显存墙一直是视频AI落地的最大拦路虎之一。


7. 多模态视频时序定位:模型其实"知道"答案,只是不说

问一个视频大模型"这件事发生在第几秒",它经常答错。但研究者发现了一个反直觉的事实:模型的注意力机制其实已经正确定位了时间戳,只是在生成文字答案时"说错了"。

这个发现改变了问题的解法方向——不需要重新训练模型,只需要从注意力层提取时序信号,就能大幅提升时间定位精度。成本极低,效果显著。对做视频检索、体育分析、会议记录等需要精确时间定位的应用来说,这个方法可以直接拿来用。


8. WaytoAGI联合红杉中国开启AGI House第一季,招募Builder入驻

红杉中国和WaytoAGI联手做了一件事:给真正在做AGI应用的Builder提供一个物理空间和资源网络。AGI House第一季正式开始招募,目标是把正在做AI产品的人聚在一起,互相碰撞、互相加速。

这个模式在硅谷已经跑通过——当年YC早期也是靠物理聚集效应快速筛出一批优质项目。红杉的背书意味着这不只是个社群活动,后续的资金和资源对接会是真实的。如果你正在做AI创业,这个入口值得认真看一眼。

image


9. 洪水场景自动驾驶数据集FRED发布,首个专注水害路况的多模态数据集

自动驾驶在晴天高速上跑得挺好,但遇到积水路面就容易翻车——字面意义上的。FRED是目前已知第一个专门针对洪水/积水路况的多模态自动驾驶数据集,包含高分辨率摄像头图像、64线激光雷达点云和高精度IMU/GNSS数据,采集自5个不同地点的真实水害场景。

极端天气下的自动驾驶安全一直是行业短板,缺数据是根本原因之一。FRED的出现填补了这个空白,对做自动驾驶感知、路况识别或恶劣天气鲁棒性研究的团队来说,这是一份难得的真实场景数据资源。


10. 字节与Meta营收仅一线之隔,豆包月活超3.4亿

两家公司的营收差距已经缩小到可以忽略的程度,但更值得关注的是AI这条线:字节在模型、应用、算力、硬件全产业链同步布局,豆包月活跃用户突破3.4亿,在C端的渗透速度远超其他竞品。

这不只是一场商业竞争的数字比较——字节和Meta正在互相照出对方的短板,一个在海外社交上补课,一个在AI应用上狂奔。两者的竞逐已经从流量战升级为AI生态战,而这场战争的终局还远没到来。

image


📌 值得关注

[产品] DeepSeek-V4-Pro API降至原定价1/4,输入3元/百万token — 5月31日优惠期结束后新定价直接打到骨折,国内开发者的API成本压力几乎可以忽略不计,现在切换或保留都是稳的。

[产品] Codex PPT Skills一键直出3:4介绍图 — 做产品介绍图不用开PS了,Codex的PPT Skills直接生成标准比例图片,设计门槛再降一截。

[商业] 大华股份星汉大模型:V系列视觉+L系列行业模型双轨并进 — “基模+行业Know-how"的产业AI新范式,CV遇上Agent的乘数效应正在制造业腹地发生,这个路子比纯卖算力更有护城河。


😄 AI趣闻

M5 Stack新设备到货,有麦克风有扬声器,玩法直接翻倍

有一种人,看到新硬件的第一反应不是"这能干嘛”,而是"这能接什么AI"。

归藏师傅收到M5 Stack新设备,第一条推文不是开箱晒图,而是直接宣布:有麦克风有扬声器,可玩性强多了。顺手还补了一句——他家出个新的就断货。说得云淡风轻,但背后的意思是:这批人已经把嵌入式硬件当成AI实验的乐高积木在玩了。

普通人买个新设备,想的是怎么用。这批人买个新设备,想的是怎么让AI住进去。

image


🔮 AI趋势预测

系统提示词保护将成为AI产品新议题

  • 预测时间:2026年6月-7月
  • 预测概率:72%
  • 预测依据:今日新闻 30+主流AI工具系统提示词遭集体扒光 单日13万星,核心产品逻辑被公开曝光。这个信号说明系统提示词已经成为可被逆向的竞争资产,接下来会有公司开始通过法律手段或技术加密保护提示词,同时也会有更多"提示词工程"类产品和课程涌现。

DeepSeek带动国内API价格战进入新阶段

  • 预测时间:2026年6月
  • 预测概率:80%
  • 预测依据:今日新闻 DeepSeek-V4-Pro API降至原定价1/4 ,输入仅3元/百万token。这个定价会直接逼迫阿里、百度、腾讯等国内云厂商跟进降价,API价格战的下一轮将在6月前后集中爆发,最终受益的是中小开发者和AI应用创业团队。

Agent长任务模式将成为编程工具标配

  • 预测时间:2026年7月-8月
  • 预测概率:68%
  • 预测依据:今日新闻 Codex /goal长任务模式正式上线 ,支持持续执行数小时乃至数天的自主任务。Cursor、Windsurf等竞品已在跟进类似功能,“给目标、等结果"的异步开发模式一旦被用户接受,会迅速成为所有AI编程工具的基础能力门槛。

嵌入式AI硬件迎来小爆发

  • 预测时间:2026年7月
  • 预测概率:55%
  • 预测依据:今日素材中M5 Stack新设备断货、AI墨水屏便签等案例显示,开发者社区对"AI住进小硬件"的需求正在快速升温。结合语音交互成本持续下降,未来2-3个月内会有更多低成本AI硬件模块出现,并催生一批基于嵌入式设备的AI应用场景。

❓ 相关问题

如何体验 DeepSeek-V4-Pro?

DeepSeek-V4-Pro 目前可通过官方 API 接入,5月31日后正式定价为输入3元、输出6元/百万token,对国内开发者相当友好。但如果你想直接体验对话界面,而不是自己搭API,可能会遇到注册排队或访问不稳定的情况。

解决方案:访问 爱窝啦 Aivora 获取成品账号,包含 DeepSeek、Claude、ChatGPT 等主流模型,极速发货,售后无忧。

Last updated on