X 平台 AI 简讯|Hermes Agent 发布图形界面,达尔文.skill 开源进化系统,哈萨比斯预测 AGI 五年内到来

Hermes Agent v0.9.0 发布:Dashboard 上线引爆 GitHub 趋势

多位博主提到,Nous Research 于当日发布了 Hermes Agent v0.9.0(代号”The Everywhere Release”),带来了官方图形界面 Dashboard,用户运行 hermes dashboard 即可启动本地 Web 监控面板。据 @LufzzLiz 观察,Hermes 近五天持续占据 GitHub 趋势榜,热度惊人。@AlchainHust 补充指出,其「女娲.skill」也已内置自动评估与优化机制,生成 skill 后会自动跑一轮达尔文评估,这也是其出品质量相对稳定的原因之一。Nous 官方同日还举办了 Hermes Agent Jam 在线活动,团队演示与 Q&A 同步在 Discord 进行。

来源:

花叔开源达尔文.skill:一套 skill 自动进化系统

有博主提到,@AlchainHust(花叔)正式开源了「达尔文.skill」,灵感来自 Andrej Karpathy 的 autoresearch 思路。核心机制是对每个 skill 从八个维度打分(满分 100),找到最弱维度后由独立 agent 修改并重新评分——分数涨了则 commit,没涨则 revert。38 次优化 commit 后,其 slides skill 从”能用但随时翻车”提升至可稳定产出。达尔文.skill 已配合女娲体系使用,用其优化本地某个”减少 AI 味”的 skill,从 72 分提升到 87 分。

来源:

Gemini + Nano Banana 成 logo 设计神器,引发 logo 界定讨论

有多位博主提到,@op7418(歸藏)探索出一条 Gemini + Nano Banana 2 配合生成 logo 及展示图的工作流,表示”效果确实牛逼,非常上流”,SVG 部分由 Gemini 完成,本人精修。该工作流产出了多个迭代版本,展示效果甚至可以动态化,用作网页背景或 PPT 背景也颇有格调。@vista8 评价其”比很多商业软件都厉害”,行业专家下场 vibe coding 的工具确实比普通爱好者靠谱。@op7418 同时也就”这种东西能不能叫 logo”展开讨论:严格来说如果用于注册商标很多图案都无法满足,但作为临时 icon 或灵感启发,AI 生成是合格的半成品。

来源:

AI First 战略为何可能大错特错?

有博主提到,@dotey(宝玉)深度解析了一篇论点:AI 时代人成为瓶颈——PM 花几周做需求、AI 两小时实现;QA 测三天、AI 两小时搞定。要真正实现 AI First,必须先解决五项工程基础:自动化测试覆盖、CI/CD 全流程、A/B 测试与监控、任务管理粒度、系统架构。该方案更适合后端逻辑主导的产品(API 服务、数据处理平台),而非 UI 密集型或安全性要求极高的场景。@hq4ai(汗青)则简洁回应:”最高效的人类协作方式就是不要协作——一个人端到端拥有某件事,与 agent 一起工作”,并表示这实际上就是他们的实际运作方式。

来源:

Vercel 开源 Open Agents:企业级编程 Agent 平台参考实现

有博主提到,@dotey 介绍了 Vercel 开源的 Open Agents 项目。该平台核心设计是”Agent 不在沙箱里运行,而是从外部通过工具调用操作沙箱”,与 Anthropic 提出的”大脑与手分离”思路一致。Anthropic 工程师曾在博客中解释:将所有东西塞进容器会导致容器变成”宠物”——挂了什么都丢;拆开后容器变成”牲口”,坏了换一个即可会话随时恢复。Vercel Open Agents 不绑定模型、可 fork;Anthropic Managed Agents 则绑定 Claude 模型、全托管、30 分钟可跑起来,但按 token + 运行时小时 + 搜索量三层计费。

来源:

DeepMind 创始人哈萨比斯传记:科幻、权力与拒绝 Facebook

有博主提到,@vista8 读完哈萨比斯传记后做了系列分享:(一)梳理了启发哈萨比斯的阅读书单,从《安德的游戏》《银河帝国》到《GEB》,以及 DeepMind 核心论文列表(DQN、AlphaGo、AlphaFold 等),已整理为飞书文档;(二)书中披露 2013 年扎克伯格为阻止 DeepMind 被谷歌收购邀请哈萨比斯参加私人晚宴,期间哈萨比斯故意转换话题聊 VR/AR/3D 打印试探小扎,发现对方”对所有热点同样兴奋”而并非真正理解 AI 的决定性意义,最终选择谷歌;(三)书中将 Sam Altman 刻画为马基雅维利式人物——引用保罗·格雷厄姆评价”把他空投到食人族岛上五年后他会成为国王”,以及 2023 年 OpenAI 董事会解雇 Altman 的真实原因(不诚实、爱操纵、无法确保 AI 服务人类)。

来源:

小扎对话录推迟、Hassabis 称 AGI 五年到来

有博主提到,@xiaohu(小互)搬运了 DeepMind CEO 哈萨比斯最新播客要点:AGI 五年内到来,但当前 AI”短期被过度炒作、长期被严重低估”;前沿四大 AI 公司差距正在拉大而非缩小;当前 AI 是”参差不齐的智能”,病根在于碎片化、无法像大脑一样编织连贯整体;Scaling Laws 收益递减但未死,竞争正从”比谁钱多”转向”比谁能想出新东西”;他将 AGI 量化描述为”十倍工业革命、十倍速度”,上一次这种变革人类用了一百年消化,这次被压缩进十年。

来源:

NASA Artemis 后续计划:2027 年登月,2028 年 Artemis IV

有多位博主提到,NASA 官方账号连发多条推文介绍 Artemis 后续节奏:Artemis II 航天员已返回地球,Artemis III 暂定 2027 年登月,Artemis IV 则将在 2028 年着陆。同时 NASA 分享了 Artemis II 任务期间拍摄的新照片,包括 4 月 6 日的地出(Crescent Earthrise)与月球背面特写,并预告 4 月 16 日将有航天员新闻发布会。

来源:

Anthropic 多 Agent 协作五大模式指南

有博主提到,@LufzzLiz(岚叔)搬运了 Anthropic 总结的多 Agent 协作架构指南,包括:(1)Generator-Verifier——生成-验证循环,适合代码生成测试;(2)Orchestrator-Subagent——中央编排,适合任务边界清晰场景;(3)Agent Teams——长期存在的同事模式,适合大型代码库迁移;(4)Message Bus——发布/订阅事件总线,适合告警流水线;(5)Shared State——无中央协调者,所有 agent 读写同一数据库,但需警惕反应式循环导致无限烧 token。核心建议:从最简单的开始,不要一上来选最复杂的架构。

来源:

大模型训练的本质:学习即遗忘,理解即压缩

有博主提到,@lijigang(李继刚)日读论文,分享了一篇用”软熵估计”将互信息计算扩展至 70 亿参数模型的研究。核心发现:大模型训练分两步——装箱期(fitting phase)拼命往表征里塞信息,随后压缩期(compression phase)开始丢弃与预测无关的信息。70 亿参数的 OLMo2 紧贴信息瓶颈理论边界,但 10 亿参数小模型在压缩期反复震荡、无法收敛。其结论是:学习不是积累,是丢弃;理解的本质是压缩——专家与新手的差别不在知识量,而在于知道什么可以忘。

来源:

瓷砖铺法只有 17 种:数学证明 Wallpaper Groups

有博主提到,@lijigang 分享了一个冷知识:把一个图案无限重复铺满整个平面,只有 17 种不同的铺法。这不是”目前发现 17 种”,而是数学严格证明——你只能使用平移、旋转、镜像、滑移反射四种操作,所有可能的组合方式穷举完就是 17 种(费多罗夫对称性定理)。

来源:

本地大模型讨论:Qwen3.5-35B 用于代码、Gemma 4 用于创意写作

有博主提到,@vista8 引用 Reddit 本地大模型板块 4 月讨论指出:代码开发提到最多的模型是 Qwen3.5-35B-A3B,双 3090 可跑 Q8 量化;创意写作几乎被 Gemma 4 31B 一边倒,小量化版本质量也很好,审查少、有微调潜力。

来源:

Claude Code 遥测关闭导致缓存从 1 小时降至 5 分钟?Anthropic 工程师澄清

有博主提到,@dotey 报道了社区发现与官方回应:开发者 Can Vardar 发现关闭 Claude Code 遥测后,提示缓存时间从 1 小时骤降至 5 分钟,质疑 Anthropic”以隐私换 12 倍性能”。Anthropic 工程师 Boris Cherny 澄清:遥测关闭导致客户端实验开关失效,系统回落到默认值 5 分钟,这是技术实现上的耦合问题而非故意惩罚;1 小时缓存并不对所有人更好(写入成本高),后续将支持用户自行切换缓存时长。

来源:

AI Agent 内容创作效率提升实践:赛博员工 + CREAO

有多位博主提到,@cellinlab(Cell 细胞)分享了用 CREAO 系统搭建四台”赛博员工”的经验:爆文批量生成 agent 将案例研究效率提升 60%、文案时间从 1 小时压缩到 10 分钟;多平台自动分发 agent 将发布效率提升 5 倍,从手动 1 小时降到自动 10 分钟。其评价 CREAO”更像一个能固化 SOP 的 AI Agent 系统,让 AI Agent 从命令行走向大白话指挥,是 Agent Harness 在用户侧的最佳范式之一”。

来源:

Elon Musk:Grok 多项基准登顶、Tesla 美国销量强势、南非议题引发关注

有多位博主提到,@elonmusk 当日转发了多条关于 Grok 性能的消息:Grok-4.20 Reasoning 在 BridgeBench 推理基准登顶、超越 GPT-5.4 和 Claude Opus 4.6 等竞品,同时 Grok 在医学与健康(Text Arena)亦排名第一。另有转发提及 USDA 将采用 Grok,以及 SpaceX 2026 年已部署第 1000 颗 Starlink 卫星。Tesla 相关内容方面,有转发引用数据称 Tesla 2026 年 Q1 美国销量达 117,300 辆,超过所有其他 EV 制造商之和(99,099 辆)。此外有多条转发涉及南非种族议题,@elonmusk 评价其中部分内容”骇人”。

来源:

OpenClaw 2026.4.14 发布:GPT-5.4 路由优化与稳定性更新

有多位博主提到,@openclaw 官方账号发布 2026.4.14 版本更新:更智能的 GPT-5.4 路由与恢复机制、Chrome/CDP 改进、子代理不再卡住、Slack/Telegram/Discord 修复及多项性能优化。@steipete 补充表示该版本令他”非常开心”,自己虽未参与但 @vincent_koc 和维护团队做得很好,其本人即将参加温哥华 TEDTalks。

来源:

抓取统计

  • 扫描时间线条数:240
  • 命中博主数:23
  • 命中推文总数:134
  • 加权推文分:96.35
  • 原创推文数:51
  • RT 推文数:42
  • 抓取尝试次数:1
  • 边界覆盖状态:完整(tail_confidently_crossed_target_boundary)

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注