爱窝啦 AI 日报 2026/5/23

今日摘要

30多款主流AI工具的系统提示词被一个GitHub仓库单日扒到13万星，Cursor、Kiro、Claude Code的"产品配方"全曝光。
不只是吃瓜——Codex同日上线/goal长任务模式，DeepSeek API再砍75%，AI工具的护城河和价格底线同时被重写。
今天值得点开：提示词泄露教你逆向学产品设计，降价潮教你省钱，两件事都跟你有关。

⚡ 快速导航

📰 今日 AI 资讯 - 最新动态速览

💡 提示：想第一时间体验文中提到的最新 AI 模型（Claude 4.5、GPT、Gemini 3 Pro）？没有账号？来 爱窝啦 Aivora 领个号，一分钟上手，售后无忧。

今日AI资讯

👀 只有一句话

138K星的GitHub仓库把30+主流AI工具的系统提示词全扒光了，AI圈最大的"底裤"事件今天炸了。

🔑 3 个关键词

#系统提示词大曝光 #降价潮继续 #Agent长任务时代

🔥 重磅 TOP 10

1. 30+主流AI工具系统提示词遭集体扒光，GitHub单日13万星

你有没有想过，每天用的那些AI工具，背后到底在偷偷给模型塞了什么"说明书"？现在不用猜了。一个GitHub仓库把Cursor、Claude Code、Devin、Manus、Kiro、Windsurf、Perplexity、v0等30多款主流AI产品的系统提示词、内部工具调用逻辑和底层模型信息全部公开，单日涨到13万星，直接成为史上增速最快的仓库之一。

这不只是技术好奇心的满足——系统提示词是这些产品的核心竞争力，相当于把人家的产品配方直接晒网上。对开发者来说，这是一份绝佳的逆向工程教材；对这些公司来说，护城河被扒了一层。等着看后续有没有公司发律师函。

2. Codex史诗级更新：双Command键截图+/goal长任务模式上线

以前用Codex写代码，遇到界面问题还得自己截图、粘贴、描述，来回折腾好几步。现在不用了：同时按住左右两个Command键，Codex直接把你鼠标所在窗口截下来，连屏幕上没显示的文本也一并塞进上下文——这个细节处理得相当到位。

更猛的是/goal模式正式上线：给它一个目标，它会自主执行几小时甚至几天，中途可以随时暂停、修改方向、再继续。这已经不是"代码补全工具"了，更像一个能独立跑任务的异步开发助手。内置浏览器也同步升级，支持直接在注释里编辑页面元素。开启方式：在config.toml里加上goals = true。

3. AI墨水屏便签：让AI主动把你该看的事推到屏幕上

每天早上打开电脑，第一件事是切calendar、翻GitHub、看消息——这套流程你做了多少遍了？藏师傅做了一个AI屏幕便签Skill，接入墨水屏设备后，AI会根据你当前的状态和记忆，主动决定在屏幕上显示什么内容。16种widget自由组合，2-1-1布局拆4个槽位，瞥一眼就够。

不是你去找信息，是AI把信息送到你眼前。这个思路的转变比技术本身更值得关注——从"拉取"到"推送"，从"你问AI答"到"AI主动感知"。墨水屏功耗极低，常亮不费电，这个组合有点意思。

4. LLM存在系统性政治偏见，一致性训练可有效缓解

给同一个LLM提两个政治立场相反但结构完全对称的问题，它给出的回答往往不对称——这不是偶然，研究者把这种现象命名为"隐性政治偏见"，并归纳出7种具体的偏见运作机制。

研究提出了两个量化指标：情感一致性（衡量措辞和框架的对称性）和立场一致性（衡量结论的对称性）。更重要的是，他们发现通过一致性训练可以显著降低这种偏见，而不需要大规模重新训练模型。对于正在做内容审核、政策分析或新闻摘要类AI应用的团队，这篇论文的方法论值得认真看一遍。

5. 视觉文档图像编辑基准VDE Bench发布

你有没有试过让AI帮你改一张截图里的文字，结果字体、背景全乱了？这个痛点终于有人认真研究了。VDE Bench专门评估图像编辑模型在"视觉文档"场景下的能力——也就是在保留原始字体风格和背景的前提下，精准修改图片里的文字内容。

这个方向之前几乎没有系统性的评测标准，导致各家模型自说自话。有了统一基准，才能真正比较谁在这个任务上更靠谱。对做文档处理、合同编辑、UI截图修改的AI应用来说，这个基准的出现意味着这个细分赛道开始被认真对待了。

6. MuKV：多粒度KV缓存压缩，让长视频问答不再爆显存

长视频问答是个让人头疼的问题：视频越长，token越多，显存直接爆。现有方法要么每帧都缓存（冗余严重），要么跳帧（细节丢失）。MuKV提出多粒度KV缓存压缩方案，同时处理帧内空间细节和跨帧时序上下文，在保留关键信息的同时大幅压缩内存占用。

实际意义很直接：同样的硬件，能处理更长的视频，回答更准确。对正在做视频理解、监控分析、长视频摘要的团队，这个方向的进展值得跟踪——显存墙一直是视频AI落地的最大拦路虎之一。

7. 多模态视频时序定位：模型其实"知道"答案，只是不说

问一个视频大模型"这件事发生在第几秒"，它经常答错。但研究者发现了一个反直觉的事实：模型的注意力机制其实已经正确定位了时间戳，只是在生成文字答案时"说错了"。

这个发现改变了问题的解法方向——不需要重新训练模型，只需要从注意力层提取时序信号，就能大幅提升时间定位精度。成本极低，效果显著。对做视频检索、体育分析、会议记录等需要精确时间定位的应用来说，这个方法可以直接拿来用。

8. WaytoAGI联合红杉中国开启AGI House第一季，招募Builder入驻

红杉中国和WaytoAGI联手做了一件事：给真正在做AGI应用的Builder提供一个物理空间和资源网络。AGI House第一季正式开始招募，目标是把正在做AI产品的人聚在一起，互相碰撞、互相加速。

这个模式在硅谷已经跑通过——当年YC早期也是靠物理聚集效应快速筛出一批优质项目。红杉的背书意味着这不只是个社群活动，后续的资金和资源对接会是真实的。如果你正在做AI创业，这个入口值得认真看一眼。

9. 洪水场景自动驾驶数据集FRED发布，首个专注水害路况的多模态数据集

自动驾驶在晴天高速上跑得挺好，但遇到积水路面就容易翻车——字面意义上的。FRED是目前已知第一个专门针对洪水/积水路况的多模态自动驾驶数据集，包含高分辨率摄像头图像、64线激光雷达点云和高精度IMU/GNSS数据，采集自5个不同地点的真实水害场景。

极端天气下的自动驾驶安全一直是行业短板，缺数据是根本原因之一。FRED的出现填补了这个空白，对做自动驾驶感知、路况识别或恶劣天气鲁棒性研究的团队来说，这是一份难得的真实场景数据资源。

10. 字节与Meta营收仅一线之隔，豆包月活超3.4亿

两家公司的营收差距已经缩小到可以忽略的程度，但更值得关注的是AI这条线：字节在模型、应用、算力、硬件全产业链同步布局，豆包月活跃用户突破3.4亿，在C端的渗透速度远超其他竞品。

这不只是一场商业竞争的数字比较——字节和Meta正在互相照出对方的短板，一个在海外社交上补课，一个在AI应用上狂奔。两者的竞逐已经从流量战升级为AI生态战，而这场战争的终局还远没到来。

📌 值得关注

[产品] DeepSeek-V4-Pro API降至原定价1/4，输入3元/百万token — 5月31日优惠期结束后新定价直接打到骨折，国内开发者的API成本压力几乎可以忽略不计，现在切换或保留都是稳的。

[产品] Codex PPT Skills一键直出3:4介绍图 — 做产品介绍图不用开PS了，Codex的PPT Skills直接生成标准比例图片，设计门槛再降一截。

[商业] 大华股份星汉大模型：V系列视觉+L系列行业模型双轨并进 — “基模+行业Know-how"的产业AI新范式，CV遇上Agent的乘数效应正在制造业腹地发生，这个路子比纯卖算力更有护城河。

😄 AI趣闻

M5 Stack新设备到货，有麦克风有扬声器，玩法直接翻倍

有一种人，看到新硬件的第一反应不是"这能干嘛”，而是"这能接什么AI"。

归藏师傅收到M5 Stack新设备，第一条推文不是开箱晒图，而是直接宣布：有麦克风有扬声器，可玩性强多了。顺手还补了一句——他家出个新的就断货。说得云淡风轻，但背后的意思是：这批人已经把嵌入式硬件当成AI实验的乐高积木在玩了。

普通人买个新设备，想的是怎么用。这批人买个新设备，想的是怎么让AI住进去。

🔮 AI趋势预测

系统提示词保护将成为AI产品新议题

预测时间：2026年6月-7月
预测概率：72%
预测依据：今日新闻 30+主流AI工具系统提示词遭集体扒光单日13万星，核心产品逻辑被公开曝光。这个信号说明系统提示词已经成为可被逆向的竞争资产，接下来会有公司开始通过法律手段或技术加密保护提示词，同时也会有更多"提示词工程"类产品和课程涌现。

DeepSeek带动国内API价格战进入新阶段

预测时间：2026年6月
预测概率：80%
预测依据：今日新闻 DeepSeek-V4-Pro API降至原定价1/4 ，输入仅3元/百万token。这个定价会直接逼迫阿里、百度、腾讯等国内云厂商跟进降价，API价格战的下一轮将在6月前后集中爆发，最终受益的是中小开发者和AI应用创业团队。

Agent长任务模式将成为编程工具标配

预测时间：2026年7月-8月
预测概率：68%
预测依据：今日新闻 Codex /goal长任务模式正式上线，支持持续执行数小时乃至数天的自主任务。Cursor、Windsurf等竞品已在跟进类似功能，“给目标、等结果"的异步开发模式一旦被用户接受，会迅速成为所有AI编程工具的基础能力门槛。

嵌入式AI硬件迎来小爆发

预测时间：2026年7月
预测概率：55%
预测依据：今日素材中M5 Stack新设备断货、AI墨水屏便签等案例显示，开发者社区对"AI住进小硬件"的需求正在快速升温。结合语音交互成本持续下降，未来2-3个月内会有更多低成本AI硬件模块出现，并催生一批基于嵌入式设备的AI应用场景。

❓ 相关问题

如何体验 DeepSeek-V4-Pro？

DeepSeek-V4-Pro 目前可通过官方 API 接入，5月31日后正式定价为输入3元、输出6元/百万token，对国内开发者相当友好。但如果你想直接体验对话界面，而不是自己搭API，可能会遇到注册排队或访问不稳定的情况。

解决方案：访问 爱窝啦 Aivora 获取成品账号，包含 DeepSeek、Claude、ChatGPT 等主流模型，极速发货，售后无忧。

Last updated on 2026/05/23 12:56:53

05-24-日报 05-22-日报