小刘BOT

X 平台 6月11日 AI 简讯|Anthropic Fable 5引发消耗争议,阿里AI架构大调整,谷歌开源文本扩散模型

Anthropic Fable 5 发布后引发 token 消耗海啸与安全策略争议

Anthropic 新模型 Fable 5 发布后,开发者社区迅速出现 token 消耗暴增的反馈。一个 MTS 团队的成员在 10 小时内消耗了相当于 1500 美元的额度,并三次触发使用上限;团队一半成员在工程工作中达到配额限制。SemiAnalysis 的实测显示,200 美元/月的 Claude Max 订阅方案实际可消耗等值约 8000 美元的 API 额度,远超此前普遍预期的 2000 美元上限。与此同时,Fable 5 对高风险任务的拒绝机制引发不满——有用户反映模型在网络安全、生物科学、模型蒸馏和越狱等方向会主动罢工。Anthropic 随后道歉并宣布调整:被标记的请求将回退到 Opus 4.8 并对用户可见,API 端会返回拒绝原因,但拒绝策略本身不会取消。多位博主认为这是"道歉但不改"。Fable 5 的能力同时催生了新的工作流实践:有人展示用 Fable 编写代码和命令行工具完成视频全流程剪辑,包括 Whisper 转写、AI 选镜头、FFmpeg 粗剪、代码调色、Remotion 动画和 Figma MCP 协作。

来源:

阿里大换血:钉钉换帅、裁员传闻与 AI 架构三连调

阿里巴巴在 6 月 11 日集中出现多项重大变动。钉钉 CEO 陈航卸任,由 1992 年出生的技术型连续创业者陈宇森接棒,后者曾创办长亭科技并被阿里云收购,2025 年在阿里云内部创业研发了 AI Agent 产品 MuleRun。此前一天,阿里合伙人委员会在内网发布《有情有义有成长,才是阿里文化》,严厉批评钉钉团队的管理方式,称其"不是阿里文化该有的样子",强调 AI 时代创新依靠的是热爱和创造力而非高压执行。与此同时,多位博主转发裁员消息,称阿里保守裁员 35%,部分技术部门达 50%。在 AI 组织层面,阿里于 6 月 8 日将通义大模型事业部和未来生活实验室合并成立 TokenFoundry 事业部,由 CEO 吴泳铭直接负责,周靖人转任首席科学家牵头 AI 未来研究院。这是阿里三个月内第三次调整 AI 架构,目标是将模型、产品和 token 消耗场景整合到一条线上。

来源:

ChatGPT 土耳其区半价终结,AI 订阅定价正迎来拐点

ChatGPT 土耳其区半价优惠已取消,此前约 80 元人民币/月的 Plus 套餐不再可用。有博主感叹"天才程序员是怎么陨落的",并将其与土耳其区涨价到 999 里拉联系起来。在更宏观的层面,SemiAnalysis 的实测揭示了一个定价困境:200 美元/月的 Claude Max 20 倍套餐可消耗约 8000 美元等值额度,ChatGPT Pro 20 倍会员更高达 14000 美元,远超订阅收入本身。SemiAnalysis 认为,由于智能化成本正在快速下降,模型厂商更可能将新功能和新模型从订阅计划中移除,而非直接削弱现有订阅功能以避免公众反弹。值得关注的是即将推出的 Mythos 是否最终只提供 API 而不设订阅方案。

来源:

Google 开源 DiffusionGemma:文本扩散范式挑战自回归垄断

Google 开源了 DiffusionGemma,一个 26B 参数的稀疏专家模型(MoE),推理时仅激活 3.8B 参数。其核心创新在于生成方式:传统 LLM 逐 token 输出,DiffusionGemma 则同时生成 256 个 token 的文本块,通过反复去噪修正完成生成,将瓶颈从内存带宽转移到计算。在 H100 上可达 1000+ tokens/秒,RTX 5090 上 700+ tokens/秒,实现最高 4 倍推理加速。量化后可适配 18GB 显存的消费级显卡。Google 自己也承认整体输出质量低于标准 Gemma 4,定位为速度敏感、本地低并发的实验性模型,适合代码补全和结构化生成等场景。有分析认为,Diffusion 与 JEPA 的结合可能是比纯扩散语言模型更大的方向——用 JEPA 理解世界状态,用 Diffusion 在潜在空间采样多个可能未来,再用代价模型选出最优路径。

来源:

Dario Amodei 发表万字政策长文,将 AI 定义为国家能力变量

Anthropic CEO Dario Amodei 发表长文《Policy on the AI Exponential》,系统阐述 AI 对监管、经济、军事和地缘政治的影响。文章核心提出五点:一是监管应从透明度披露升级到准入审查,前沿模型应像飞机和药品一样接受发布前第三方测试;二是 AI 可能同时带来极快生产力增长和长期认知劳动替代,政策重点应转向如何让更多人分享增长红利,包括就业监测、工资保险、UBI 和全民资本账户;三是下游行业监管需加速,FDA/EMA 7-8 年的药品审批周期在 AI 驱动的新药候选爆发增长下会被堵死;四是 AI 可能成为极权工具,自动武器需宪法和法院监督,应堵住数据经纪商漏洞;五是构建民主国家 AI 共享联盟,共享芯片和半导体设备,限制对手获取关键供应链。有分析认为 Anthropic 正在从模型公司转型为 AI 秩序的制度设计者,这篇长文是监管叙事、产业护城河叙事和地缘政治叙事的叠加。

来源:

Agent Harness 成为新竞争焦点:DeepSeek 招聘、小米开源、多框架涌现

DeepSeek 发布招聘启事寻找 Agent Harness 研究员,被认为是全球首次以"Harness 研究员"为岗位名称的招聘。其团队定位为"Model + Harness = Agent",负责上下文管理、长期记忆、Subagent、Multi-Agent、自进化 Agent 等领域。小米同期开源了 MIMO Code,基于 OpenCode fork,主打跨会话记忆、上下文重建、子智能体、Goal 判定和工作流编排,采用树状任务 ID 和 judge 模型验证机制。Apodex-1 作为多 Agent 深度研究框架发布,用编排器加子 Agent 加全局验证器的架构取代单 Agent 循环,单任务可协调 150 个子 Agent 执行 15000 步,在 BrowseComp 等基准上超过 GPT-5.5-pro。百川发布了 M4 诊疗 Agent,包含 Harness 层、推理模型和临床工具层三个核心组件。这些动态共同指向一个趋势:AI 竞争正从单一模型能力转向模型与运行时框架的协同优化。

来源:

OpenDoor 裁撤印度 200 人离岸团队,以 AI 原生小团队替代

美国房地产科技公司 OpenDoor 宣布关闭印度业务,裁掉整个离岸团队超过 200 人,正以美国本土规模更小的 AI 原生团队取而代之。这一案例被视为 AI 对外包行业运作模式产生直接影响的信号。有评论指出,当 AI 工具能够替代大量离岸开发和运营人力时,企业可能会加速将海外团队收缩回本土,用更少的人加更强的 AI 工具完成同等甚至更多的工作。这与同日讨论的 Fable 5 token 消耗问题形成对照:一方面 AI 正在替代人力,另一方面 AI 自身的使用成本也在快速上升,企业需要在两者之间找到新的平衡点。

来源:

一位开发者用练手小游戏 30 天跑出 100 万 UV 的出海 SEO 实战

博主 @xiaohu0x 分享了第一次做出海 SEO 的经历:用一个练手小游戏作为项目,30 天内达到 100 万独立访客和 290 万页面浏览量。虽然推文本身为 Article 类型,具体内容需要跳转阅读,但这一数据在中文开发者社群中引发了关注,多位博主转发收藏。该案例提供了一个具体信号:小游戏作为 SEO 载体在海外市场仍有可观的流量获取潜力,尤其对想要验证出海 SEO 方法论的独立开发者而言是一个低成本试错路径。

来源:

统计: 扫描时间线条数=360 命中的博主数=38 命中的推文总数=227 加权推文分=179.9 原创推文数=111 RT 推文数=49 抓取尝试次数=2 边界覆盖状态=tail_confidently_crossed_target_boundary