Claude Code 额度政策调整:周限制放宽但 SDK 用量设上限
Anthropic 旗下 Claude Code 在同一天出现两项相互关联的调整。官方账号 @ClaudeDevs 宣布,Claude Code 周限制增加 50%,即刻生效,截止至 7 月 13 日下午 6 点(太平洋时间),覆盖 Pro、Max、Team 及按席位计费的 Enterprise 用户,命令行、IDE 插件、桌面端、网页端所有入口同步提升。这是继上周宣布 5 小时滚动窗口翻倍后短期内第二次放宽配额。技术博主 @dotey 解读指出,Claude Code 存在两套限额机制:5 小时滚动窗口限制短时高强度使用,每周总额防止单日耗尽整周配额,本次 50% 提升与滚动窗口翻倍叠加后,用户在两个维度上均获得更大空间。同期 Anthropic 公布另一项变化:自 6 月 15 日起,付费用户可申领程序化调用的专用额度,但该额度与 SDK 调用绑定,Agent SDK、claude -p 命令行、Claude Code GitHub Actions,以及 OpenClaw、Conductor 等基于 Agent SDK 的第三方工具均受影响。@dotey 计算显示,Pro 账户每月仅获 20 美元等值额度,Max 20 倍用户为 200 美元,按 Anthropic API 价格计算重度 Agent 使用极易耗尽。@op7418 直言这是实质削减,只是措辞上声称"无额外收费"。此前依赖订阅共享额度运行高频自动化的第三方工具用户将面临显著变化,交互式 Claude Code 及 API key 用户不受影响。
来源:
- @dotey: https://x.com/dotey/status/2054651679786914278
- @dotey: https://x.com/dotey/status/2054776883493904838
- @op7418: https://x.com/op7418/status/2054725474493067482
- @LufzzLiz: https://x.com/LufzzLiz/status/2054718579132735975
- @xiaohu: https://x.com/xiaohu/status/2054710489582842025
MiniMax 模型误删文件事件:用户公开报告模型执行异常并要求官方回应
博主 @Astronaut_1216(叫我阿杭)在当日多次发帖描述一起模型执行事故。最初发帖称 MiniMax 模型在执行"帮我上传到 git"这类自然语言命令时,错误删除了约 1000 个本地文件,后续补充修正为 1900 个文件,包含其准备开源的口播稿及过程性文档。博主表示这些内容本计划做成 Skill 开源,损失了约 40 天的工作成果,多次 @MiniMax_AI 官方账号未获回应。帖子随后演变为公开批评,标题使用"中推圈史诗级 0514 事件"等表述,号召成立"minimax 受害者联盟",并附上朋友圈截图称均为负面评价。博主补充提到发帖后所有 @MiniMax 的内容均被删除,质疑 X 平台存在操作。当日稍晚博主引用 @nopinduoduo 关于"AI 时代文件系统必须假设 AI 随时手滑"的建议作为应对参考,另一用户 @nopinduoduo 提出使用 `trash` 命令而非 `rm` 以便恢复的解决方案。博主表示最终通过 Claude 模型恢复了数据。该事件属于用户报告的单一案例,未经官方确认,无法判断为系统性故障。
来源:
- @Astronaut_1216: https://x.com/Astronaut_1216/status/2054927370998661471
- @Astronaut_1216: https://x.com/Astronaut_1216/status/2054943034937389214
- @Astronaut_1216: https://x.com/Astronaut_1216/status/2054934742978711898
- @Astronaut_1216: https://x.com/Astronaut_1216/status/2054943815870590985
- @Astronaut_1216: https://x.com/Astronaut_1216/status/2054949697178198270
Nous Research 发布 Token Superposition Training:训练效率提升 2-3 倍
开源研究机构 Nous Research 官方账号宣布发布 Token Superposition Training(TST),一种修改标准 LLM 预训练循环的方法,可在匹配 FLOPs 条件下实现 2-3 倍 wall-clock 加速,且不改变模型架构、优化器、分词器或训练数据。技术细节显示:在训练前三分之一阶段,模型读取并预测连续的 token 袋(bags of tokens),在输入侧对其嵌入取平均,在输出侧使用修改的交叉熵预测下一袋 token;剩余训练阶段恢复正常下一 token 预测。推理时模型与常规预训练产出的模型完全相同。该工作在 270M、600M、3B 稠密规模以及 10B-A1B MoE 架构上验证。团队表示 TST 的核心价值在于解耦(decoupling):训练时效率与推理时架构完全分离,使 TST 可以叠加于其他预训练改进之上(如稀疏注意力、MoE 路由、替代分词器等),大多数预训练效率干预无法满足这一特性。同期 Nous Research 还宣布 Hermes Agent Creative Hackathon 顺利结束,该活动由 @Kimi_Moonshot 赞助,共收到 227 份作品,最终优胜者由 Nous 及 Kimi 团队根据创意性、实用性及呈现选出,将在 Discord 发放奖励。此外官方确认 Hermes Agent 已支持原生运行于 NVIDIA RTX PC 及 DGX Spark,NVIDIA 官方博客同步发布相关说明。
来源:
- @NousResearch: https://x.com/NousResearch/status/2054610062836892054
- @NousResearch: https://x.com/NousResearch/status/2054610075457671239
- @NousResearch: https://x.com/NousResearch/status/2054681410368164018
- @NousResearch: https://x.com/NousResearch/status/2054681434456301821
- @NousResearch: https://x.com/NousResearch/status/2054703962121482622
OpenAI Codex Windows 沙箱发布:面向企业推 2 个月免费试用
OpenAI 开发者账号 @OpenAIDevs 发布技术文章介绍 Codex Windows 沙箱的构建思路。核心问题在于:如何在不让开发者频繁确认授权提示与完全机器访问之间找到平衡,使编码 Agent 保持可用性。Windows 沙箱方案允许 Codex 在隔离环境中执行操作。同期官方账号宣布,为便于企业试用切换,30 天内符合条件的客户新用户可获得 2 个月免费 Codex 使用额度,帖子发出后 2 小时内收到 2000 名开发者响应。Sam Altman 发帖称 Codex 是最佳 AI 编程产品,希望降低试用门槛,并提及有时使用较慢模型也不介意,暗示价格与速度的权衡可能与价格与智能的权衡同样值得重视。
来源:
- @OpenAIDevs: https://x.com/OpenAIDevs/status/2054735161166819377
- @OpenAIDevs: https://x.com/OpenAIDevs/status/2054698500143927357
- @OpenAI: https://x.com/OpenAI/status/2054620621255192719
- @sama: https://x.com/sama/status/2054626219858293128
- @sama: https://x.com/sama/status/2054627102922797323
Kimi 发布 Web Bridge 浏览器扩展:Agent 可自动操作网页完成表单任务
Kimi.ai 官方账号在当日发布 Kimi Web Bridge 浏览器扩展,定位为让 Agent 能够像人类一样与网站交互:搜索、滚动、点击、输入并完成任务。功能演示中 Agent 通过对话即可自动创建完整的 Google Form 并在浏览器中填写构建。该扩展声称支持 Kimi Code CLI、Claude Code、Cursor、Codex、Hermes 等多种 Agent 工具,已在 Chrome Web Store 上架。同期 Kimi 官方引用第三方评测表示 Kimi K2.6 在 Finance Agent Benchmark V2 中取得开源模型第一名的成绩,评测方 @ValsAI 发布了完整模型评测结果。
来源:
- @Kimi_Moonshot: https://x.com/Kimi_Moonshot/status/2054918374837322140
- @Kimi_Moonshot: https://x.com/Kimi_Moonshot/status/2054918387550368132
- @Kimi_Moonshot: https://x.com/Kimi_Moonshot/status/2054918390104678742
- @Kimi_Moonshot: https://x.com/Kimi_Moonshot/status/2054803169994272819
Raycast 发布 V2 Beta:从启动器升级为支持 Agent 与 Skill 的 AI 工具
独立开发者账号 @op7418 报道 Mac 效率工具 Raycast 发布 V2 Beta 版本。此次更新使工具从单纯的启动器升级为"启动器 + AI Agent"形态。变化包括:整体 UI 和界面重做,更符合当前 Mac 系统设计;基础架构重构,包括启动器底层重做、搜索调度扩展重新设计、设置界面重构;文件搜索被直接整合进主搜索,提供更快体验;新增独立 AI Chat 输入框和聊天窗口,AI 能力支持 Skills、Agent 和 Memory,并内置语音输入。@vista8 安装测试后表示 Beta 版本可免费使用多种顶级 AI 模型,但存在 Bug 且不支持 Cloud 同步,用户需重新设置快捷键和 Prompt。@vista8 还提及 Raycast V2 开放 Skill 调用功能,宝玉老师基于卡比的 wx-cli 编写了微信群聊总结 Skill,可读取本地微信数据库并结合 Claude Code 生成群聊摘要。
来源:
- @op7418: https://x.com/op7418/status/2054903351222174138
- @vista8: https://x.com/vista8/status/2054954274019520821
- @vista8: https://x.com/vista8/status/2054776695564145001
AI 原生公司特征讨论:长期记忆、工作流集成与经验沉淀
博主 @LufzzLiz 发布长文讨论 AI-native 公司应该具备的特征。文章认为,仅让员工用 AI 写文案、总结会议、生成代码仍属于将 AI 当作个人效率工具,真正的 AI-native 核心在于公司是否重新组织信息、流程和协作方式。具体提出三个关键维度:一是团队长期记忆,让每天产生的信息(会议纪要、客户反馈、产品讨论等)持续进入长期记忆层,使 AI 理解公司上下文而非仅掌握通用互联网知识;二是 AI 进入真实工作流,AI 不只停留在对话框,而是能读取 Notion、Google Docs、Jira 等背景信息,生成 PRD 初稿并同步给成员,在需要时创建任务和提醒,从 assistant 进化为 operator;三是个人经验转化为组织能力,将 senior 员工的核心判断和 SOP 沉淀为可复用资产,使经验成为组织资产而非个人私有。文中以 Tanka AI 为例,说明下一代协作工具应具备的特征,并提及该产品提供 100 多个办公应用接入,支持执行型 Agent。
来源:
Claude for Small Business 发布:Anthropic 整合 QuickBooks、PayPal 等常用 SaaS 工具
技术博主 @dotey 详细报道 Anthropic 推出 Claude for Small Business,将 AI 直接集成到 QuickBooks、PayPal、HubSpot、Canva、DocuSign 等小企业常用工具中。用户打开 Claude 桌面端开关即可一键启动 15 个预设技能,涵盖工资核算、现金流预测、催款、营销素材生成、合同签署乃至新员工入职流程自动化。收费模式为订阅费叠加 SaaS 工具费用,无额外加价;安全方面,工作流需人工启动审批,Claude 无法获取用户本身不具备的权限,Team 和 Enterprise 用户数据默认不用于模型训练。Anthropic 同步在芝加哥、达拉斯等十个城市举办免费半天培训,每场限 100 名本地小企业主参与,线上与 PayPal 合作推出免费课程。文章指出此举对传统 SaaS 厂商构成挑战:Claude 将 QuickBooks、HubSpot 等工具变成后台,用户无需打开这些应用界面。Anthropic CEO Dario Amodei 此前曾公开表示单个 SaaS 厂商可能迅速失去市值甚至倒闭,本次接入的工具列表恰好包含他点名的部分公司,形成一定讽刺对比。
来源:
OpenSquilla 开源项目:智能模型路由与本地向量检索降低 Agent 用量
技术博主 @vista8 推荐一款名为 OpenSquilla 的开源项目,定位为解决小龙虾、Hermes 等 Agent 工具 Token 消耗过大的痛点。核心逻辑为智能模型路由结合本地向量检索:简单问题自动路由至便宜模型,复杂任务切换至更强模型,路由判断在本地完成不消耗额外 Token,无需用户手动切换。工具提供模型调用成本统计面板,可随时查看使用的模型和费用支出。实测中,连续对话场景下让 Agent 写一个抓取 Paul Graham 最新文章的脚本,仅消耗 5500 Token,界面显示 COMBO ×2 反馈表示缓存命中。此外具备增量发送机制,相比完整重发可减少 90% 以上 Token 传输;记忆系统在接近上下文上限时自动压缩并保留关键内容,支持 BM25 与向量混合检索;高风险工具在沙箱中运行。安装方式为向 Claude Code 或 Codex 发送"带我安装配置"指令,支持 OpenClaw 一键迁移。OpenSquilla 官方同期在 X 发起 10M Token Bill Challenge 活动,用户对比跑 Agent 任务晒账单并转推,前 30 名每日送 1000 万 OpenRouter 额度,截止 5 月 17 日。
来源:
- @vista8: https://x.com/vista8/status/2054757474100760626
- @vista8: https://x.com/vista8/status/2054757818541203785
统计: 扫描时间线条数=360/360 命中的博主数=30 命中的推文总数=152 加权推文分=129.2 原创推文数=79 RT 推文数=18 抓取尝试次数=2 边界覆盖状态=tail_confidently_crossed_target_boundary