03-02-日报-AI资讯日报

今日摘要

Google 发现 AI 推理 token 越多反而越蠢,提出"深度思考比率"新指标,准确率相关性达 0.83。
Block 裁员 40%,CEO 直言 AI 让公司不需要这么多人,股价暴涨 20%。打工人瑟瑟发抖。
今天的信号很明确:AI 正在重塑效率标准,无论是模型还是职场。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

Google 发现:AI 想得越多,答案反而越差——深度思考比长篇大论更重要。

🔑 3 个关键词

#深度思考 #WiFi透视 #裁员风暴


🔥 重磅 TOP 10

1. Google 新论文:Think Deep, Not Just Long

以前我们总觉得 AI 推理时生成的 token 越多越聪明,就像考试时写满卷子的学生。Google 这篇论文直接打脸:生成 token 数量和准确率呈负相关(-0.54)!他们提出了"深度思考比率"(DTR)这个新指标,不看你说了多少,看你每个 token 在内部"纠结"了多少层才稳定下来。DTR 和准确率的相关性高达 0.83。更绝的是,只看前 50 个 token 就能预测答案准不准。用 DTR 筛选答案,一半推理成本就能达到更好效果。跟人一样,关键问题上的深度思考最重要,别搞表面勤奋。

图片

2. WiFi DensePose:用 WiFi 信号"看见"人体姿态

不用摄像头,只靠 WiFi 信号就能还原房间里人的动作?这个开源项目一天斩获 2000+ Star,听起来像科幻片。原理是 WiFi 信号遇到人体会产生反射和散射,通过分析 CSI 数据推断位置和姿态。但冷静一下:作者自己承认,论文级的 DensePose 全身追踪还没实现,目前只是个"研究性玩具"。README 上"一键 docker run 就能穿墙追踪"的宣传有点过了。想玩可以试试,但别抱太高期望。

图片

3. Block 裁员 4000 人,CEO 直言:AI 让我们不需要这么多人了

Jack Dorsey 的 Block(前身 Square)一刀砍掉 40% 员工。CEO 没藏着掖着,直接说 AI 工具让公司能用更少的人干更多的活。消息一出,股价暴涨 20%。这大概是 AI 对就业市场最直白的冲击案例了。华尔街欢呼,打工人心凉。AI 提效的故事讲了这么久,终于有大公司把"裁员"两个字和"AI"绑在一起公开说了。

4. Vibe Coding 论文:化学专业小哥 70 天写出 10 万行代码

一个化学专业的人,70 天用 AI 写了 10 万行 C# 分布式系统,还写了篇论文分享经验。核心技巧是文档化:按人类的短期记忆、工作记忆和长期记忆来组织文档。几条实用建议:尽早建"宪法"(项目目标、技术栈、核心约定);文档写给 AI 看,不是给人看;解释过两次的东西就固化成文档;卡住时创建专家 Agent 重启任务。不过有人吐槽:大部分人觉得自己在做 Agentic Engineering,其实只是在 Vibe Coding。

5. CodePilot:设计师出身的 Claude 套壳,2500 Star

设计师 @op7418 做的 Claude 套壳客户端,产品设计和交互相当优雅,GitHub 已经 2500 Star。每天都能看到作者在烧 Token 优化、持续修 bug。最近加了 Telegram 支持,马上要支持飞书和 Discord。支持 Skill、MCP 等标准协议。如果你用 Claude 但嫌官方客户端不够顺手,可以试试这个。

图片

6. Tabbit AI 浏览器公测:工作交给 AI,时间留给自己

当行业在讨论"产品是给 Agent 做的,不是给人做的"时,Tabbit 团队反其道而行:花大力气做一个重视用户体验和设计美学的 AI 浏览器。他们的理念是"人是目的,不是方法"。技术会进化,但绝大多数人还是生活在真实的网页、文件、消息之间。今天起全面公测,官网免费下载,无需邀请码。

图片

7. Meta 记忆系统设计论文:让 AI 学会"记住"

有人读到一篇 Meta 关于记忆系统设计的论文,直接丢给 Claude 让它学习借鉴。AI 的记忆能力一直是个痛点——聊着聊着就忘了前面说的话。Meta 这篇论文可能会给 AI 记忆系统带来新思路。对于做 AI 应用的开发者来说,值得关注。

图片

8. 5 分钟理解 LLM 工作原理:带互动动画的教程

想快速搞懂大语言模型是怎么工作的?这篇文章只需要 5 分钟,而且带互动演示动画,相当 cool。不是那种干巴巴的技术文档,而是让你边玩边学。适合想入门 AI 但被各种术语劝退的朋友。

9. blot.new 可以白嫖 Claude 4.5

有人发现 blot.new 这个写前端的平台可以免费用 Claude 4.5,虽然有一定限制。如果你只是想体验一下 Claude 4.5 的能力,又不想付费,可以去试试。不过这种羊毛能薅多久就不好说了。

10. 《窃窃私语的耳环》:一个关于 AI 滥用的隐喻

Scott Alexander 写过一个短篇小说:有个耳环会给你建议,而且永远是对的。一开始帮你做重大决定,后来告诉你早餐吃什么、什么时候睡觉,最后指挥你每一块肌肉怎么动。戴着它的人通常很成功,但死后发现大脑几乎完全腐烂了。当你第一次把耳环放到耳边时,它会说:“你最好把我摘下来。” AI 更应该像外骨骼,强化人的能力,而不是替代人的思考。


📌 值得关注


😄 AI趣闻

Vibe Coding vs Agentic Engineering 之争

有人建议大家用"Agentic Engineering"代替"Vibe Coding",说这会影响 mindset。结果宝玉老师一针见血:问题是大部分人就真的是在 Vibe Coding,但觉得自己是在 Agentic Engineering 😂 Coding 越来越 cheap,但工程思维的价值越来越高——这话没毛病。


🔮 AI趋势预测

AI 裁员潮将在科技行业蔓延

  • 预测时间:2026年Q2
  • 预测概率:75%
  • 预测依据:今日新闻 Block 裁员 4000 人 + Block 股价暴涨 20% 的市场反馈会激励其他公司效仿

深度思考指标(DTR)将成为模型评估新标准

  • 预测时间:2026年4-5月
  • 预测概率:60%
  • 预测依据:今日新闻 Google Think Deep 论文 + 现有 token 数量评估方式的局限性日益明显

AI 浏览器赛道将迎来更多玩家

  • 预测时间:2026年Q2
  • 预测概率:70%
  • 预测依据:今日新闻 Tabbit AI 浏览器公测 + 浏览器作为 AI Agent 入口的战略价值

❓ 相关问题

如何体验 Claude 4.5?

Claude 4.5 目前需要 Anthropic Pro 订阅才能使用。对于国内用户,可能面临支付困难或账号注册限制。

解决方案:访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧。

Last updated on