03-02-日报-AI资讯日报
今日摘要
Google 发现 AI 推理 token 越多反而越蠢,提出"深度思考比率"新指标,准确率相关性达 0.83。
Block 裁员 40%,CEO 直言 AI 让公司不需要这么多人,股价暴涨 20%。打工人瑟瑟发抖。
今天的信号很明确:AI 正在重塑效率标准,无论是模型还是职场。⚡ 快速导航
- 📰 今日 AI 资讯 - 最新动态速览
💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。
今日AI资讯
👀 只有一句话
Google 发现:AI 想得越多,答案反而越差——深度思考比长篇大论更重要。
🔑 3 个关键词
#深度思考 #WiFi透视 #裁员风暴
🔥 重磅 TOP 10
1. Google 新论文:Think Deep, Not Just Long
以前我们总觉得 AI 推理时生成的 token 越多越聪明,就像考试时写满卷子的学生。Google 这篇论文直接打脸:生成 token 数量和准确率呈负相关(-0.54)!他们提出了"深度思考比率"(DTR)这个新指标,不看你说了多少,看你每个 token 在内部"纠结"了多少层才稳定下来。DTR 和准确率的相关性高达 0.83。更绝的是,只看前 50 个 token 就能预测答案准不准。用 DTR 筛选答案,一半推理成本就能达到更好效果。跟人一样,关键问题上的深度思考最重要,别搞表面勤奋。

2. WiFi DensePose:用 WiFi 信号"看见"人体姿态
不用摄像头,只靠 WiFi 信号就能还原房间里人的动作?这个开源项目一天斩获 2000+ Star,听起来像科幻片。原理是 WiFi 信号遇到人体会产生反射和散射,通过分析 CSI 数据推断位置和姿态。但冷静一下:作者自己承认,论文级的 DensePose 全身追踪还没实现,目前只是个"研究性玩具"。README 上"一键 docker run 就能穿墙追踪"的宣传有点过了。想玩可以试试,但别抱太高期望。
3. Block 裁员 4000 人,CEO 直言:AI 让我们不需要这么多人了
Jack Dorsey 的 Block(前身 Square)一刀砍掉 40% 员工。CEO 没藏着掖着,直接说 AI 工具让公司能用更少的人干更多的活。消息一出,股价暴涨 20%。这大概是 AI 对就业市场最直白的冲击案例了。华尔街欢呼,打工人心凉。AI 提效的故事讲了这么久,终于有大公司把"裁员"两个字和"AI"绑在一起公开说了。
4. Vibe Coding 论文:化学专业小哥 70 天写出 10 万行代码
一个化学专业的人,70 天用 AI 写了 10 万行 C# 分布式系统,还写了篇论文分享经验。核心技巧是文档化:按人类的短期记忆、工作记忆和长期记忆来组织文档。几条实用建议:尽早建"宪法"(项目目标、技术栈、核心约定);文档写给 AI 看,不是给人看;解释过两次的东西就固化成文档;卡住时创建专家 Agent 重启任务。不过有人吐槽:大部分人觉得自己在做 Agentic Engineering,其实只是在 Vibe Coding。
5. CodePilot:设计师出身的 Claude 套壳,2500 Star
设计师 @op7418 做的 Claude 套壳客户端,产品设计和交互相当优雅,GitHub 已经 2500 Star。每天都能看到作者在烧 Token 优化、持续修 bug。最近加了 Telegram 支持,马上要支持飞书和 Discord。支持 Skill、MCP 等标准协议。如果你用 Claude 但嫌官方客户端不够顺手,可以试试这个。

6. Tabbit AI 浏览器公测:工作交给 AI,时间留给自己
当行业在讨论"产品是给 Agent 做的,不是给人做的"时,Tabbit 团队反其道而行:花大力气做一个重视用户体验和设计美学的 AI 浏览器。他们的理念是"人是目的,不是方法"。技术会进化,但绝大多数人还是生活在真实的网页、文件、消息之间。今天起全面公测,官网免费下载,无需邀请码。
7. Meta 记忆系统设计论文:让 AI 学会"记住"
有人读到一篇 Meta 关于记忆系统设计的论文,直接丢给 Claude 让它学习借鉴。AI 的记忆能力一直是个痛点——聊着聊着就忘了前面说的话。Meta 这篇论文可能会给 AI 记忆系统带来新思路。对于做 AI 应用的开发者来说,值得关注。

8. 5 分钟理解 LLM 工作原理:带互动动画的教程
想快速搞懂大语言模型是怎么工作的?这篇文章只需要 5 分钟,而且带互动演示动画,相当 cool。不是那种干巴巴的技术文档,而是让你边玩边学。适合想入门 AI 但被各种术语劝退的朋友。
9. blot.new 可以白嫖 Claude 4.5
有人发现 blot.new 这个写前端的平台可以免费用 Claude 4.5,虽然有一定限制。如果你只是想体验一下 Claude 4.5 的能力,又不想付费,可以去试试。不过这种羊毛能薅多久就不好说了。
10. 《窃窃私语的耳环》:一个关于 AI 滥用的隐喻
Scott Alexander 写过一个短篇小说:有个耳环会给你建议,而且永远是对的。一开始帮你做重大决定,后来告诉你早餐吃什么、什么时候睡觉,最后指挥你每一块肌肉怎么动。戴着它的人通常很成功,但死后发现大脑几乎完全腐烂了。当你第一次把耳环放到耳边时,它会说:“你最好把我摘下来。” AI 更应该像外骨骼,强化人的能力,而不是替代人的思考。
📌 值得关注
- [研究] 统一多模态模型的语义一致性问题 - 模型文字推理很强,但让它画出来就崩了
- [研究] APPO:视频推理的感知优化 - 复杂视频推理靠的是感知能力,不是推理能力
- [研究] 临床推理的形式化验证框架 - 用数学方法审计 AI 生成的放射报告
- [开源] Shuffle Mamba:多模态图像融合 - 随机打乱策略消除固定扫描偏差
- [产品] 腾讯电视盒子内置混元大模型 - 语音输入查找播放,老人用着方便
😄 AI趣闻
Vibe Coding vs Agentic Engineering 之争
有人建议大家用"Agentic Engineering"代替"Vibe Coding",说这会影响 mindset。结果宝玉老师一针见血:问题是大部分人就真的是在 Vibe Coding,但觉得自己是在 Agentic Engineering 😂 Coding 越来越 cheap,但工程思维的价值越来越高——这话没毛病。
🔮 AI趋势预测
AI 裁员潮将在科技行业蔓延
- 预测时间:2026年Q2
- 预测概率:75%
- 预测依据:今日新闻 Block 裁员 4000 人 + Block 股价暴涨 20% 的市场反馈会激励其他公司效仿
深度思考指标(DTR)将成为模型评估新标准
- 预测时间:2026年4-5月
- 预测概率:60%
- 预测依据:今日新闻 Google Think Deep 论文 + 现有 token 数量评估方式的局限性日益明显
AI 浏览器赛道将迎来更多玩家
- 预测时间:2026年Q2
- 预测概率:70%
- 预测依据:今日新闻 Tabbit AI 浏览器公测 + 浏览器作为 AI Agent 入口的战略价值
❓ 相关问题
如何体验 Claude 4.5?
Claude 4.5 目前需要 Anthropic Pro 订阅才能使用。对于国内用户,可能面临支付困难或账号注册限制。
解决方案:访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧。