02-22-日报-AI资讯日报

今日摘要

多伦多小公司把Llama直接刻进芯片,推理速度是GPU的十倍,代价是这芯片只能跑这一个模型。
开源圈狂欢:PDF流程图秒变可编辑文件,小米机器人大模型上线,Agent框架扎堆更新。
专用芯片vs通用GPU的路线之争开打了,值得持续关注。

⚡ 快速导航

💡 提示:想第一时间体验文中提到的最新 AI 模型(Claude 4.5、GPT、Gemini 3 Pro)?没有账号?来 爱窝啦 Aivora 领个号,一分钟上手,售后无忧。

今日AI资讯

👀 只有一句话

一家多伦多小公司把AI模型直接"刻"进芯片里,推理速度是GPU的十倍——这可能改变整个AI硬件格局。

🔑 3 个关键词

#芯片革命 #开源狂欢 #Agent觉醒


🔥 重磅 TOP 10

1. Taalas发布HC1芯片:把Llama直接刻进硅片,推理速度碾压GPU十倍

以前跑个8B模型,GPU吭哧吭哧搬运参数,大部分能量都浪费在"搬家"上。Taalas说:既然每次都算同样的东西,干嘛还搬来搬去?直接把权重刻在晶体管里不行吗?

他们真这么干了。HC1芯片跑Llama 3.1 8B达到17000 tokens/秒,业界最快GPU才2000左右。功耗?十张卡加起来才2.5千瓦,空气冷却就够。代价是这芯片出厂那刻命运就定了——只能跑这一个模型,永远。

创始团队是AMD和NVIDIA的老兵,刚拿了1.69亿美元融资。这是一场"绝对专用"对"通用灵活"的豪赌。

图片


2. Edit Banana:北理工开源神器,把PDF流程图变成可编辑文件

收到同事发来的流程图PDF,想改个箭头方向?以前只能重画。现在不用了。

北理工开源的Edit Banana能把图片或PDF里的流程图、统计图直接转成DrawIO或PPTX格式。不是简单OCR,而是深度重建逻辑关系——每个形状、每条连线都能独立选中编辑。上传图片,两分钟后就能在嵌入式编辑器里直接改。

开源地址已放出,打工人狂喜。

图片


3. 小米开源具身智能大模型Xiaomi-Robotics-0:47亿参数,实时控制机器人

大模型控制机器人最头疼的问题是什么?延迟。你说"把杯子递给我",机器人想三秒才动,黄花菜都凉了。

小米机器人团队开源的Xiaomi-Robotics-0是个47亿参数的VLA模型,能同时理解视觉、语言,还能直接输出控制动作。关键是解决了推理延迟问题,实现了实时执行。看视觉、听指令、动手干活,一气呵成。

具身智能赛道又热闹了。

图片


4. VCP-SoM:纯语义驱动操作电脑,不需要AI"看到"屏幕

“点击右上角的小太阳图标”——你只需要说这句话,AI就能精准点击。不需要截图,不需要视觉模型看屏幕,纯语义驱动。

这个叫VCP-SoM的项目实现了无上下文、无视觉的电脑操作。你甚至可以说"点击狗粮本的入口"这种只有你自己懂的描述,它也能找到。支持步进式脚本,连续操作一气呵成。

作者自己都说"效果离谱到把我气笑了"。Agent操作电脑的新思路。


5. Superpowers:5.7万星的Agent技能框架,软件开发方法论大更新

GitHub上5.7万星的项目,不是什么花哨的demo,而是一套扎实的Agent技能框架和软件开发方法论。

Superpowers定义了一套让AI Agent高效完成任务的技能体系,从代码理解到任务分解,从工具调用到结果验证。不是教AI写代码,而是教AI像资深工程师一样思考和工作。

想认真做Agent开发的,这个仓库值得深挖。


6. Claude Code更新:Anthropic官方终端编程助手持续进化

6.8万星了。Claude Code是Anthropic官方的终端编程工具,理解你的代码库,用自然语言就能执行日常任务、解释复杂代码、处理git工作流。

最近更新后,代码理解能力和上下文管理又上了一个台阶。住在终端里的AI程序员,越来越像真正的同事了。


7. Accomplish:开源AI桌面助手,本地运行保护隐私

不想把私人文件传到云端,又想要AI帮忙整理?Accomplish是个开源的本地AI桌面助手。

它能根据内容自动分类、重命名、移动文件,能撰写草稿、总结长文档,还能自动化浏览器任务。关键是完全本地运行,数据不出你的电脑。可以和Notion、Google Drive配合使用,还能把常用流程保存成Skill随时调用。

AI Agent在桌面端落地的典型代表。

图片


8. MyCodeAgent:从零开发类Claude Code智能体的开源教程

想自己做一个Claude Code?这个开源项目手把手教你。

MyCodeAgent基于Datawhale的Hello-Agent教程,从零搭建代码智能体。过程中暴露了工具失控、协议脆弱、上下文膨胀等真实工程问题,然后一一解决。核心思路是:通过工程设计约束模型的不确定性,把"不可靠的聪明"转化为稳定生产力。

想深入理解Agent开发的,这是个很好的学习材料。

图片


9. PentAGI:全自主AI渗透测试代理,5400星

安全圈的Agent来了。PentAGI是一个能执行复杂渗透测试任务的全自主AI代理系统,不是简单的漏洞扫描,而是能像真正的渗透测试工程师一样思考和行动。

从信息收集到漏洞利用,从权限提升到报告生成,全流程自动化。当然,这种工具的使用需要严格遵守法律法规。

安全从业者的新工具,也是AI Agent能力边界的又一次拓展。


10. 国产AI选择指南:豆包、Kimi、元宝、智谱怎么选?

有人总结了国产AI的最佳使用姿势:写作选元宝,编程选智谱,既要写作又要编程选Kimi,全都要还想做视频选豆包。

小问题问豆包,速度快功能全;大任务给Kimi,质量好兼顾写作编程。不过豆包在鸿蒙系统上功能缺失严重,元宝干脆没有原生鸿蒙版本,千问倒是功能齐全。

选AI就像选工具,没有最好的,只有最合适的。


📌 值得关注


📊 更多动态

#类型标题链接
1开源FossFLOW - 制作等距基础设施图表链接
2开源ggml - 机器学习张量库更新链接
3学习《动手学大语言模型》官方代码仓库链接
4测试各大AI联网搜索能力对比测试链接

😄 AI趣闻

相亲经济学:8块钱蜜雪冰城看人品

煎蛋网友分享相亲心得:约蜜雪冰城,8块钱就能避雷。有人说以前没蜜雪冰城就约肯德基,“灯光好能看清对方长啥样,看上你的会一直聊还再买一杯,没看上的喝快点就走了”。

AI时代了,相亲还是得靠人类智慧 😂

图片


🔮 AI趋势预测

专用AI芯片赛道将迎来更多玩家

  • 预测时间:2026年Q2
  • 预测概率:70%
  • 预测依据:今日新闻 Taalas发布HC1芯片 + Groq、Cerebras等专用芯片公司持续获得关注,“专用vs通用"的路线之争正在升温

Agent工具链将趋于标准化

  • 预测时间:2026年3-4月
  • 预测概率:65%
  • 预测依据:今日多个Agent框架更新( SuperpowersMyCodeAgent ) + 行业正在从"各自为战"走向"最佳实践"共识

具身智能开源项目将密集发布

  • 预测时间:2026年Q1-Q2
  • 预测概率:75%
  • 预测依据:今日新闻 小米开源Xiaomi-Robotics-0 + 各大厂商在机器人领域布局加速,开源成为抢占生态的重要手段

❓ 相关问题

如何体验 Claude Code?

Claude Code 是 Anthropic 官方的终端编程工具,目前需要 Claude Pro 订阅才能使用完整功能。对于国内用户,可能面临支付困难或账号注册限制。

解决方案:访问 爱窝啦 Aivora 获取成品账号,极速发货,售后无忧。

Last updated on