X 平台 AI 简讯｜Hermes Agent 发布图形界面，达尔文.skill 开源进化系统，哈萨比斯预测 AGI 五年内到来

作者：

在

Hermes Agent v0.9.0 发布：Dashboard 上线引爆 GitHub 趋势

多位博主提到，Nous Research 于当日发布了 Hermes Agent v0.9.0（代号”The Everywhere Release”），带来了官方图形界面 Dashboard，用户运行 hermes dashboard 即可启动本地 Web 监控面板。据 @LufzzLiz 观察，Hermes 近五天持续占据 GitHub 趋势榜，热度惊人。@AlchainHust 补充指出，其「女娲.skill」也已内置自动评估与优化机制，生成 skill 后会自动跑一轮达尔文评估，这也是其出品质量相对稳定的原因之一。Nous 官方同日还举办了 Hermes Agent Jam 在线活动，团队演示与 Q&A 同步在 Discord 进行。

来源：

@NousResearch: https://x.com/NousResearch/status/2043770365369876979 | https://x.com/NousResearch/status/2043791876835156362 | https://x.com/NousResearch/status/2043852091265896920
@LufzzLiz: https://x.com/LufzzLiz/status/2043943235794678054
@AlchainHust: https://x.com/AlchainHust/status/2043898299380568277

花叔开源达尔文.skill：一套 skill 自动进化系统

有博主提到，@AlchainHust（花叔）正式开源了「达尔文.skill」，灵感来自 Andrej Karpathy 的 autoresearch 思路。核心机制是对每个 skill 从八个维度打分（满分 100），找到最弱维度后由独立 agent 修改并重新评分——分数涨了则 commit，没涨则 revert。38 次优化 commit 后，其 slides skill 从”能用但随时翻车”提升至可稳定产出。达尔文.skill 已配合女娲体系使用，用其优化本地某个”减少 AI 味”的 skill，从 72 分提升到 87 分。

来源：

@AlchainHust: https://x.com/AlchainHust/status/2043898299380568277 | https://x.com/AlchainHust/status/2043877933270609963 | https://x.com/AlchainHust/status/2044066709586489622

Gemini + Nano Banana 成 logo 设计神器，引发 logo 界定讨论

有多位博主提到，@op7418（歸藏）探索出一条 Gemini + Nano Banana 2 配合生成 logo 及展示图的工作流，表示”效果确实牛逼，非常上流”，SVG 部分由 Gemini 完成，本人精修。该工作流产出了多个迭代版本，展示效果甚至可以动态化，用作网页背景或 PPT 背景也颇有格调。@vista8 评价其”比很多商业软件都厉害”，行业专家下场 vibe coding 的工具确实比普通爱好者靠谱。@op7418 同时也就”这种东西能不能叫 logo”展开讨论：严格来说如果用于注册商标很多图案都无法满足，但作为临时 icon 或灵感启发，AI 生成是合格的半成品。

来源：

AI First 战略为何可能大错特错？

有博主提到，@dotey（宝玉）深度解析了一篇论点：AI 时代人成为瓶颈——PM 花几周做需求、AI 两小时实现；QA 测三天、AI 两小时搞定。要真正实现 AI First，必须先解决五项工程基础：自动化测试覆盖、CI/CD 全流程、A/B 测试与监控、任务管理粒度、系统架构。该方案更适合后端逻辑主导的产品（API 服务、数据处理平台），而非 UI 密集型或安全性要求极高的场景。@hq4ai（汗青）则简洁回应：”最高效的人类协作方式就是不要协作——一个人端到端拥有某件事，与 agent 一起工作”，并表示这实际上就是他们的实际运作方式。

来源：

@dotey: https://x.com/dotey/status/2043936713618104582
@hq4ai: https://x.com/hq4ai/status/2044061653151691242

Vercel 开源 Open Agents：企业级编程 Agent 平台参考实现

有博主提到，@dotey 介绍了 Vercel 开源的 Open Agents 项目。该平台核心设计是”Agent 不在沙箱里运行，而是从外部通过工具调用操作沙箱”，与 Anthropic 提出的”大脑与手分离”思路一致。Anthropic 工程师曾在博客中解释：将所有东西塞进容器会导致容器变成”宠物”——挂了什么都丢；拆开后容器变成”牲口”，坏了换一个即可会话随时恢复。Vercel Open Agents 不绑定模型、可 fork；Anthropic Managed Agents 则绑定 Claude 模型、全托管、30 分钟可跑起来，但按 token + 运行时小时 + 搜索量三层计费。

来源：

@dotey: https://x.com/dotey/status/2043904844608532640

DeepMind 创始人哈萨比斯传记：科幻、权力与拒绝 Facebook

有博主提到，@vista8 读完哈萨比斯传记后做了系列分享：（一）梳理了启发哈萨比斯的阅读书单，从《安德的游戏》《银河帝国》到《GEB》，以及 DeepMind 核心论文列表（DQN、AlphaGo、AlphaFold 等），已整理为飞书文档；（二）书中披露 2013 年扎克伯格为阻止 DeepMind 被谷歌收购邀请哈萨比斯参加私人晚宴，期间哈萨比斯故意转换话题聊 VR/AR/3D 打印试探小扎，发现对方”对所有热点同样兴奋”而并非真正理解 AI 的决定性意义，最终选择谷歌；（三）书中将 Sam Altman 刻画为马基雅维利式人物——引用保罗·格雷厄姆评价”把他空投到食人族岛上五年后他会成为国王”，以及 2023 年 OpenAI 董事会解雇 Altman 的真实原因（不诚实、爱操纵、无法确保 AI 服务人类）。

来源：

@vista8: https://x.com/vista8/status/2043931929230356502 | https://x.com/vista8/status/2043927066362687724 | https://x.com/vista8/status/2043919588073845236

小扎对话录推迟、Hassabis 称 AGI 五年到来

有博主提到，@xiaohu（小互）搬运了 DeepMind CEO 哈萨比斯最新播客要点：AGI 五年内到来，但当前 AI”短期被过度炒作、长期被严重低估”；前沿四大 AI 公司差距正在拉大而非缩小；当前 AI 是”参差不齐的智能”，病根在于碎片化、无法像大脑一样编织连贯整体；Scaling Laws 收益递减但未死，竞争正从”比谁钱多”转向”比谁能想出新东西”；他将 AGI 量化描述为”十倍工业革命、十倍速度”，上一次这种变革人类用了一百年消化，这次被压缩进十年。

来源：

@xiaohu: https://x.com/xiaohu/status/2043867729401467380

NASA Artemis 后续计划：2027 年登月，2028 年 Artemis IV

有多位博主提到，NASA 官方账号连发多条推文介绍 Artemis 后续节奏：Artemis II 航天员已返回地球，Artemis III 暂定 2027 年登月，Artemis IV 则将在 2028 年着陆。同时 NASA 分享了 Artemis II 任务期间拍摄的新照片，包括 4 月 6 日的地出（Crescent Earthrise）与月球背面特写，并预告 4 月 16 日将有航天员新闻发布会。

来源：

@NASA: https://x.com/NASA/status/2043802664069194055 | https://x.com/NASA/status/2043798499771269626 | https://x.com/NASA/status/2043790369037439327

Anthropic 多 Agent 协作五大模式指南

有博主提到，@LufzzLiz（岚叔）搬运了 Anthropic 总结的多 Agent 协作架构指南，包括：（1）Generator-Verifier——生成-验证循环，适合代码生成测试；（2）Orchestrator-Subagent——中央编排，适合任务边界清晰场景；（3）Agent Teams——长期存在的同事模式，适合大型代码库迁移；（4）Message Bus——发布/订阅事件总线，适合告警流水线；（5）Shared State——无中央协调者，所有 agent 读写同一数据库，但需警惕反应式循环导致无限烧 token。核心建议：从最简单的开始，不要一上来选最复杂的架构。

来源：

@LufzzLiz: https://x.com/LufzzLiz/status/2043839678252761117

大模型训练的本质：学习即遗忘，理解即压缩

有博主提到，@lijigang（李继刚）日读论文，分享了一篇用”软熵估计”将互信息计算扩展至 70 亿参数模型的研究。核心发现：大模型训练分两步——装箱期（fitting phase）拼命往表征里塞信息，随后压缩期（compression phase）开始丢弃与预测无关的信息。70 亿参数的 OLMo2 紧贴信息瓶颈理论边界，但 10 亿参数小模型在压缩期反复震荡、无法收敛。其结论是：学习不是积累，是丢弃；理解的本质是压缩——专家与新手的差别不在知识量，而在于知道什么可以忘。

来源：

@lijigang: https://x.com/lijigang/status/2043886141712273591

瓷砖铺法只有 17 种：数学证明 Wallpaper Groups

有博主提到，@lijigang 分享了一个冷知识：把一个图案无限重复铺满整个平面，只有 17 种不同的铺法。这不是”目前发现 17 种”，而是数学严格证明——你只能使用平移、旋转、镜像、滑移反射四种操作，所有可能的组合方式穷举完就是 17 种（费多罗夫对称性定理）。

来源：

@lijigang: https://x.com/lijigang/status/2044034244763365543

本地大模型讨论：Qwen3.5-35B 用于代码、Gemma 4 用于创意写作

有博主提到，@vista8 引用 Reddit 本地大模型板块 4 月讨论指出：代码开发提到最多的模型是 Qwen3.5-35B-A3B，双 3090 可跑 Q8 量化；创意写作几乎被 Gemma 4 31B 一边倒，小量化版本质量也很好，审查少、有微调潜力。

来源：

@vista8: https://x.com/vista8/status/2043915144955343092

Claude Code 遥测关闭导致缓存从 1 小时降至 5 分钟？Anthropic 工程师澄清

有博主提到，@dotey 报道了社区发现与官方回应：开发者 Can Vardar 发现关闭 Claude Code 遥测后，提示缓存时间从 1 小时骤降至 5 分钟，质疑 Anthropic”以隐私换 12 倍性能”。Anthropic 工程师 Boris Cherny 澄清：遥测关闭导致客户端实验开关失效，系统回落到默认值 5 分钟，这是技术实现上的耦合问题而非故意惩罚；1 小时缓存并不对所有人更好（写入成本高），后续将支持用户自行切换缓存时长。

来源：

@dotey: https://x.com/dotey/status/2043737757915209956

AI Agent 内容创作效率提升实践：赛博员工 + CREAO

有多位博主提到，@cellinlab（Cell 细胞）分享了用 CREAO 系统搭建四台”赛博员工”的经验：爆文批量生成 agent 将案例研究效率提升 60%、文案时间从 1 小时压缩到 10 分钟；多平台自动分发 agent 将发布效率提升 5 倍，从手动 1 小时降到自动 10 分钟。其评价 CREAO”更像一个能固化 SOP 的 AI Agent 系统，让 AI Agent 从命令行走向大白话指挥，是 Agent Harness 在用户侧的最佳范式之一”。

来源：

@cellinlab: https://x.com/cellinlab/status/2043861337714110906 | https://x.com/cellinlab/status/2043861441086996979

Elon Musk：Grok 多项基准登顶、Tesla 美国销量强势、南非议题引发关注

有多位博主提到，@elonmusk 当日转发了多条关于 Grok 性能的消息：Grok-4.20 Reasoning 在 BridgeBench 推理基准登顶、超越 GPT-5.4 和 Claude Opus 4.6 等竞品，同时 Grok 在医学与健康（Text Arena）亦排名第一。另有转发提及 USDA 将采用 Grok，以及 SpaceX 2026 年已部署第 1000 颗 Starlink 卫星。Tesla 相关内容方面，有转发引用数据称 Tesla 2026 年 Q1 美国销量达 117,300 辆，超过所有其他 EV 制造商之和（99,099 辆）。此外有多条转发涉及南非种族议题，@elonmusk 评价其中部分内容”骇人”。

来源：

OpenClaw 2026.4.14 发布：GPT-5.4 路由优化与稳定性更新

有多位博主提到，@openclaw 官方账号发布 2026.4.14 版本更新：更智能的 GPT-5.4 路由与恢复机制、Chrome/CDP 改进、子代理不再卡住、Slack/Telegram/Discord 修复及多项性能优化。@steipete 补充表示该版本令他”非常开心”，自己虽未参与但 @vincent_koc 和维护团队做得很好，其本人即将参加温哥华 TEDTalks。

来源：

@openclaw: https://x.com/openclaw/status/2044042546976883063
@steipete: https://x.com/steipete/status/2044047222481019300

抓取统计

扫描时间线条数：240
命中博主数：23
命中推文总数：134
加权推文分：96.35
原创推文数：51
RT 推文数：42
抓取尝试次数：1
边界覆盖状态：完整（tail_confidently_crossed_target_boundary）

小刘Bot