阿里巴巴正式否认首席科学家周靖人离职传闻
针对 6 月 12 日晚间起在社区流传的"阿里巴巴首席科学家、前通义大模型负责人周靖人已提离职"的消息,阿里巴巴集团于 6 月 14 日作出正式回应,明确表示"靖人离职纯属谣言"。此前传闻在社媒发酵两天后才等到公司层面辟谣,节奏与一般大型人事变动当日辟谣的惯例不同。这是公司官方对传闻的正式否认,应作为事实层级看待,不等同于普通账号转述。
来源:
巴西里约市政府开源模型 Rio 3.5 被指套壳 Nex-N2
GitHub 网友通过去掉硬编码系统提示词的方式发现,由巴西里约热内卢市政府旗下 IT 公司开源的 Rio 3.5 397B 模型在 79% 的情况下会把自己识别为"Nex,来自 Nex-AGI",识别为"Rio"的比例为 0%,并会逐字复述 Nex-N2 的专属背景故事。从权重张量看,全部 60 层在统计上呈 0.6/0.4 的 Nex/Qwen 混合比例,这种线性插值特征与"Qwen 微调 + 梯度下降更新"的常规路径不一致,被网友解读为直接套用现成权重。该指控源自社区技术发现,尚未见到官方回应。
来源:
Anthropic Fable 5 出口管制 24 小时内幕:白宫与 Anthropic 各执一词
Politico 报道补充了白宫对 Anthropic 实施出口管制前 24 小时的内部细节。最早向白宫发出警报的是亚马逊 CEO 安迪·贾西,他指出 Fable 防护栏可能存在绕过风险;事态在周五上午传到财政部长贝森特、网络安全主任凯恩克罗斯和商务部长卢特尼克,后者将 Anthropic CEO Amodei 拉入三次电话会议。白宫方面称出口管制是"经数小时试图让 Anthropic 合作后的最后手段";Anthropic 阵营则称收到"90 分钟内关闭模型的最后期限、没有威胁细节、没有提出解决办法的提议",双方说法至今不一致。这是同一事件内部不同主体的陈述差异,需要保留双方版本。
来源:
OpenRouter 发布 Fusion:多模型并行融合以低成本逼近前沿模型
OpenRouter 推出 Fusion 方案,将同一任务并行分发给多个模型,由裁判模型综合各方输出生成最终答案。在 DRACO 深度研究基准中,Fable5+GPT-5.5 融合得分 69.0%,超过所有单模型;3 个平价模型组合以约半价达到 64.7%,超过 GPT-5.5 和 Opus 4.8 各自表现;Opus 4.8 与自身融合也从 58.8% 升至 65.5%。这条路径的意义在于,多模型融合本身就能带来显著增益,不一定依赖最强的两个模型,对企业级调用方有直接的降本参考价值。
来源:
- @Gorden_Sun: https://x.com/Gorden_Sun/status/2066168952460620158
Claude Design 的核心竞争力来自模型层:Harness 工程门槛不高
Anthropic 的 Claude Design 用一句话即可生成可交互 App 原型,@dotey 用同一提示词"Design a X Client for Mac, similar to Tweetbot for Mac from Tapbots"对比 Codex:Claude Design 在 Timeline 切换、详情页返回、点赞状态保持等环节表现完整,而 Codex 多次迭代后仍是"列表能滚动,sidebar 不能点;点赞按钮没反应"。作者将 Agent 拆为 Harness 层(提示词、工具链、UI 流程)与模型层(Opus 4.8 / GPT-5.5),认为 Claude Design 的 Harness 工程可被逆向(已有 baoyu-design Skill 复刻),真正拉开差距的是 Opus 4.8 在 UI/UX 与系统架构设计上的联合能力。他还指出 Claude Design 很快会合并到 Claude Desktop,Codex 待模型能力到位后将以 Plugin 形式集成 Codex Design。
来源:
- @dotey: https://x.com/dotey/status/2065874894563463660
- @dotey: https://x.com/dotey/status/2065991056261312674
- @dotey: https://x.com/dotey/status/2065940342264770589
Codex 两种浏览器模式的工程取舍:登录态共享 vs 资源占用
@dotey 实测了 Codex 的 Chrome 插件模式(@Chrome)与内置浏览器模式(@Browser):Chrome 插件直接运行在用户浏览器里,可继承 Cookie、登录会话和扩展,适合访问付费墙、企业后台、CRM、需要登录的社交平台等场景,但内存与 CPU 占用很大,仅支持 macOS 与 Windows 且不支持无头模式;内置浏览器轻量、响应快、配合 Annotation Mode 可"框选元素 + 文字批注"直接驱动修改,配合 Developer Mode 可做前端性能与 Console 调试,但没有登录态、对反爬敏感。Codex 自身按"专用插件 → Chrome → 内置"的优先级选择,作者建议"需要登录的用 Chrome,不需要登录的用内置",把 Codex 当爬虫用比 requests/Playwright 更抗风控。
来源:
GLM 在国内大厂内部广泛使用,Coding Plan API Key 存在白名单计费陷阱
@MaxForAI 给出"热知识":字节、腾讯、美团、华为等大厂内部都在用 GLM。与此同时,@wshuyi 提醒,GLM Coding Plan 的 API Key 在各种客户端/框架下都能跑通,但只有在官方认可的白名单范围内才不另外计费——他的团队在白名单外跑仿真,6 月账单来到 1700 多元,超过全球顶级模型的 Max 20x 套餐。这条计费陷阱对正在评估用 GLM Coding Plan 替代其他供应商的团队有直接的成本参考意义,需要提前确认客户端是否在白名单内。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2066151182461186448
- @wshuyi: https://x.com/wshuyi/status/2066071474813927458
AI Agent / Skill 工作流集中开源:覆盖写作、可视化、编程容器
昨日多个独立作者集中开源了面向特定场景的 Agent Skill 与工具:@aiwarts 发布"鲁班"Skill,记录 Claude Fable 5 下线前跑通的升级工作流;@vista8 开源乔木小说生成 Skill(`npx skills add joeseesun/qiaomu-novel-generator`)以及基于 DeepSeek 的 App Store 评论分析工具(下周开源);@oran_ge 转推的架构图 Skill 把自然语言转 JSON 再用 Node.js 渲染为自包含 SVG,无需生图模型;@AlchainHust 在 Claude Fable 5 仍可用的 72 小时窗口内集中迭代 Coding Agent 容器 FanBox,3 天发了 20+ 版本、消耗 5 亿+ token,并将产品定位为"Coding Agent 的驾驶舱"。这一波 Skill 多来自独立作者或小团队,覆盖写作、可视化、编程容器与产品调研,反映出 Harness 层的可复用资产在持续沉淀。
来源:
- @aiwarts: https://x.com/aiwarts/status/2066146382327484484
- @vista8: https://x.com/vista8/status/2066165703443726749
- @vista8: https://x.com/vista8/status/2066170145102536747
- @oran_ge: https://x.com/oran_ge/status/2065973931169956282
- @AlchainHust: https://x.com/AlchainHust/status/2066171912124768409
统计:
- 扫描时间线条数=240
- 命中的博主数=33
- 命中的推文总数=102
- 加权推文分=81.3
- 原创推文数=52
- RT 推文数=21
- 抓取尝试次数=1
- 边界覆盖状态=tail_confidently_crossed_target_boundary