爱窝啦 AI 日报 2026/3/31

今日摘要

微软开源 VibeVoice 语音模型狂揽 27K Star,企业微信、飞书、钉钉突然集体做 CLI 抢 AI 入口。
Anthropic 科学家演示 LLM 自主挖漏洞,已在 Linux 内核中发现大量未公开漏洞,安全圈要紧张了。
CLI 正在成为 AI 时代的新战场,没有命令行工具的服务会被 AI 直接忽略。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

微软开源语音模型 VibeVoice,CLI 突然成了 AI 圈的新战场。

🔑 3 个关键词

#开源狂欢 #CLI争夺战 #工具进化

🔥 重磅 TOP 6

1. 微软开源语音AI模型 VibeVoice,已获27K Star

微软这次直接开源了三个语音模型:VibeVoice-ASR-7B 能一次性处理 60 分钟长音频,自动标注说话人和时间戳;VibeVoice-TTS-1.5B 支持 90 分钟长篇语音生成,最多 4 个说话人;VibeVoice-Realtime-0.5B 实时 TTS 延迟只有 300 毫秒。有人已经用它做了个语音输入法 Vibing,macOS 和 Windows 都能用。开源这事,微软是认真的。

2. 企业微信做了 MCP,国内厂商开始抢 CLI 入口

企业微信、飞书、钉钉这些以封闭著称的厂商,突然都开始做 CLI 了。原因很简单:AI 天生就在命令行里运作,GUI 是给眼睛看的,AI 没有眼睛。装了飞书 CLI,AI 能查日程发消息;没装?“不好意思,这个我做不了。” Karpathy 最近写文章记录自己用 AI 做 app,大部分时间不是在写代码,是在浏览器标签之间跳来跳去配 API Key。他的结论很直接:“你的服务应该有一个 CLI 工具。”

image

3. Anthropic 科学家演示 LLM 自主挖掘漏洞

Anthropic 科学家 Nicholas Carlini 在演讲中透露,LLM 已经能自主发现和利用漏洞。他用模型在 5 万 Star 的开源项目 Ghost 中发现了未授权的盲注 SQL 漏洞,还能自主编写攻击脚本,成功提取出生产环境的管理员凭证和 API 密钥。更离谱的是,他在 Linux 内核的 NFSv4 守护进程中发现了一个自 2003 年起就存在的远程堆缓冲区溢出漏洞。他本人已经发现了大量 Linux 内核漏洞,多到没时间一一验证和报告。安全圈要开始紧张了。

4. Gemini Live 升级到 Gemini 3.1 Flash Live

Google 把 Gemini Live 升级到了 Gemini 3.1 Flash Live,语音交互体验应该会更流畅。具体提升多少,得等用户实测。但从命名来看,Google 这次主打的是"实时"和"快"。

5. 开源项目"同事.Skill":把同事蒸馏成 AI Skill

这个项目能把同事的技能与性格蒸馏成 AI Skill,让它替他工作。有人建议改名叫"同事Kill",成为 Skill 后就可以 Kill 掉了。虽然是个玩笑,但这个思路确实有点意思:如果能把团队成员的工作方式和专业知识提炼成可复用的 AI 能力,协作效率会高很多。

image

6. Mac Mini 当服务器,用屏幕共享就能远程操控

最近不少人因为 OpenClaw 入手了 Mac Mini,打算拿来跑模型或当开发服务器。但问题来了:专门给它配一台显示器,既占地方又浪费钱。其实 macOS 自带的"屏幕共享"功能就能完美解决这个问题——用你现有的 Mac 直接远程操控 Mac Mini,就像坐在它面前一样。设置方法很简单,两步就行:打开 Mac Mini 的屏幕共享,然后在你日常用的 Mac 上打开"屏幕共享"App,输入 IP 地址或主机名就能连上。

image

📌 值得关注

  • [开源] iOS/macOS 开发者开源 Review Swarm Skill - 刚加入 OpenAI Codex 的著名开发者 Thomas Ricouard 开源了一个只读、Multi Agents 并行审查的工作流 Skill,用于在代码变更中发现行为回归、安全隐私、性能可靠性、契约与测试覆盖四类关键风险

😄 AI趣闻

为了用 SeeDance 不排队,凌晨上班

有人为了用 SeeDance 不排队,凌晨爬起来上班。这事听起来有点离谱,但仔细想想,这不就是当年抢火车票的翻版吗?只不过这次抢的是 AI 工具的使用权。等到 AI 工具也开始限流、排队、抢号,你就知道它有多火了。

image

❓ 相关问题

如何体验微软开源的 VibeVoice 语音模型?

VibeVoice 是微软开源的语音 AI 模型,包含语音转文本、文本转语音和实时 TTS 三个模型。你可以直接在 GitHub 上找到项目代码和使用文档,按照说明部署到本地或云端环境。如果你想快速体验类似的语音 AI 能力,但不想自己搭建环境,可以访问 爱窝啦 Aivora 获取 ChatGPT、Claude 等主流 AI 工具的成品账号,极速发货,售后无忧。

Last updated on