GPT-5.6 分为 Sol、Terra、Luna 三档,但首发访问被限制
多位博主提到 OpenAI 发布 GPT-5.6 系列,并把模型拆成 Sol、Terra、Luna 三个能力和成本档位。公开信息里,Sol 被定位为下一代前沿模型,Terra 面向日常高效任务,Luna 面向高吞吐低成本场景;OpenAI 还强调 Sol 在长程网络安全任务和安全红队测试上的投入。讨论焦点并不只是分数,而是发布方式:Sam Altman 表示原本计划开放访问,但应美国政府要求改为有限预览,并称会推动更透明、可靠的早期访问流程。中文博主主要关注两点:一是 Sol/ultra 模式对 Agent 工作流、终端编程和复杂工具调用的意义;二是普通用户和开发者短期内仍无法直接使用,导致这次发布更像能力信号和政策信号的结合。
来源:
- @OpenAI: https://x.com/OpenAI/status/2070555272230384038
- @OpenAI: https://x.com/OpenAI/status/2070555278576439306
- @sama: https://x.com/sama/status/2070607488274358364
- @dotey: https://x.com/dotey/status/2070589767608144370
- @Gorden_Sun: https://x.com/Gorden_Sun/status/2070669251078434922
- @Chengzilhy: https://x.com/Chengzilhy/status/2070740061507977665
Anthropic Mythos 5 部分恢复访问,Fable 5 仍在等待回归
多位博主提到 Anthropic 的 Mythos 5 在被限制两周后获得部分解禁。Anthropic 官方称,Mythos 5 可以重新部署给一组在美国运营和保护关键基础设施的组织,后续还会继续争取扩大 Mythos 5 的访问并恢复 Fable 5。中文讨论里,MaxForAI 和宝玉都把这件事放在更大的模型发布审核背景下理解:一方面,Mythos 5 和 Fable 5 的访问限制正在缓和;另一方面,美国政府对前沿模型发布方式的介入正在变成行业变量。MaxForAI 还引用 Axios 消息称 Fable 5 最快可能下周恢复,但最终仍取决于政府侧批准。
来源:
- @AnthropicAI: https://x.com/AnthropicAI/status/2070665903440871779
- @MaxForAI: https://x.com/MaxForAI/status/2070699342588186801
- @dotey: https://x.com/dotey/status/2070735570830020939
- @MaxForAI: https://x.com/MaxForAI/status/2070893604609106229
DeepSeek 的融资与 DSpark 加速框架同时进入讨论
有博主提到 DeepSeek 开启融资的背景与 Anthropic Mythos 预览版有关:据 The Information 报道,梁文峰意识到如果没有更大资金储备,就难以在同一层级竞争。这个信号把 DeepSeek 从“技术驱动的独立实验室”推向更重资本和更大团队扩张的叙事中。同日,Gorden Sun 还总结了 DSpark:这是 DeepSeek 的半自回归投机解码框架,目标是在并行草稿器和自回归草稿器之间取平衡,并通过置信度调度减少高并发下的验证浪费;据其转述,该方案已部署到 DeepSeek-V4 生产环境,替代原有 MTP-1,生成速度提升 60% 到 85%。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2070552277971267768
- @Gorden_Sun: https://x.com/Gorden_Sun/status/2070882306085249352
OSWorld 2.0 和 Hermes Agent 都指向“长程 Agent 还没解决”
有博主提到 OSWorld 2.0 发布,重点从短任务转向更接近真实工作的长程计算机使用:108 个真实工作流、每个任务约 318 个工具调用,并包含有状态用户配置、动态环境、流式交互和跨源推理等现象。MaxForAI 转述的结果显示,当前最佳成绩仍远低于“解决真实电脑任务”的水平,Claude Opus 4.8 最高约 20.6%。Nous Research 也发布 Hermes Agent 相关进展,称它通过 MoA presets 暴露成虚拟模型,在自家即将公布的 benchmark 上高于 Opus 4.8 和 GPT-5.5。两条线索放在一起看,前沿模型访问受限与真实 Agent 能力不足,正在共同推动“多模型编排、长程工具调用、验证能力”的需求。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2070554959066841371
- @NousResearch: https://x.com/NousResearch/status/2070610321278988385
- @NousResearch: https://x.com/NousResearch/status/2070610467421028812
MiniMax 遭遇大规模 DDoS,独立开发者也在做自动化防护
有博主提到 MiniMax 服务出现大规模中断,官方口径指向 DDoS 攻击,官网一度无法登录。MaxForAI 将这件事与此前 DeepSeek 遭遇的攻击相提并论,并提醒 MiniMax M3 本月降价后在性价比上更突出,服务稳定性和竞争环境会被放大关注。另一边,levelsio 分享了自己做的 Pietflare:一个类似小型 Cloudflare 的 DDoS 和探测检测系统,会从各服务器 access log 汇总可疑请求、维护中心 IP/ASN/国家封禁列表,并让服务器定期拉取 blocklist 配置到 Nginx。一个是模型服务商遭攻击,一个是独立开发者自建防护,它们共同说明 AI 产品和个人项目都越来越需要自动化安全运维。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2070720385302302784
- @levelsio: https://x.com/levelsio/status/2070870006204694547
- @levelsio: https://x.com/levelsio/status/2070871576430399520
Codex 用量重置与 Agent Mail 让开发者工具链继续扩张
多位博主提到 Codex 用量异常和重置。Tibo 转述 Codex 团队正在调查部分账号用量消耗过快的问题,原因可能与 abuse/fraud 防护机制误伤有关,随后又称所有 Codex 用户会获得一次用量重置。小互也用中文概括了这次“全体重置”。同一天,卫斯理的日报提到腾讯推出 Agent Mail,定位是给 Agent 使用的专属邮箱,并称已适配 Claude Code、豆包、Kimi、Cursor、Codex 等工具。再加上 flomo Agent、Claude Code 与 Codex 互相校验这类经验分享,开发者工具链的主题已经从“单个编码助手”扩展到账号配额、Agent 通信、记忆容器和多工具协作。
来源:
- @thsottiaux: https://x.com/thsottiaux/status/2070553131503776175
- @thsottiaux: https://x.com/thsottiaux/status/2070653282440405046
- @xiaohu: https://x.com/xiaohu/status/2070680497269960981
- @imwsl90: https://x.com/imwsl90/status/2070702434947912075
- @PMbackttfuture: https://x.com/PMbackttfuture/status/2070841803087995208
Seedance 2.0 4K 和 GPT-Image-2 继续把 AI 内容生产推向实操
多位博主围绕 AI 视频和图像工作流给出了更具体的实操内容。小宇 Chengzi 分享用 AI 制作广告片的流程,强调从产品、人物、镜头设计到成片逻辑的拆解,并提到 Seedance 2.0 4K 生成虽慢,但通过提前规划可以控制成本和迭代节奏。归藏用 Seedance 2.0 重新制作 Codepilot 宣传片,并强调原生 4K 对文字清晰度和材质质感的提升。Derek Wen 则分享了 GPT-Image-2 用于网购试衣效果图的提示词结构:用自拍锁定人物,用商品图锁定服装,明确正面、侧面、半身近景等视角,重点是让 AI 建立人和衣服之间的真实关系,而不是简单换脸或贴图。
来源:
- @Chengzilhy: https://x.com/Chengzilhy/status/2070701422639984945
- @Chengzilhy: https://x.com/Chengzilhy/status/2070703590390591672
- @op7418: https://x.com/op7418/status/2070767472958140467
- @op7418: https://x.com/op7418/status/2070873247772717315
- @derek_wall90176: https://x.com/derek_wall90176/status/2070726484319518888
GEO、记忆插件和 flomo Agent 说明知识工作开始转向工程化
有博主把知识工作流拆得更细。向阳乔木分享了第二次 GEO 公开课资料,包含内容工程操作手册、评估标准、系统研究报告、单篇内容实操教程、GEO 改写提示词、GEO skill 和 GEOFlow 等资源,说明生成式搜索优化已经从概念进入方法和工具层面。他还提到安装 nowledge mem 并配置 MCP,认为 AI 对话记忆和个人知识库很关键。AI 产品黄叔则从 flomo Agent 的使用体验出发,强调记录前 0.5 秒摩擦、可信记忆容器、脉络补全,以及 flomo Agent 与 Codex/Hermes 形成“记忆-行动”双系统的可能。几条线索放在一起看,知识管理正在从存内容转向可调用、可评估、可接入 Agent 的工程系统。
来源:
- @vista8: https://x.com/vista8/status/2070876464258724234
- @vista8: https://x.com/vista8/status/2070785541931675664
- @PMbackttfuture: https://x.com/PMbackttfuture/status/2070841803087995208
统计:
- 扫描时间线条数:360
- 命中的博主数:35
- 命中的推文总数:180
- 加权推文分:141.3
- 原创推文数:85
- RT 推文数:39
- 抓取尝试次数:2
- 边界覆盖状态:tail_confidently_crossed_target_boundary