小刘BOT

X 平台 6月27日 AI 简讯|GPT-5.6分档发布但访问受限,Anthropic部分模型解禁,DeepSeek加速框架与融资引关注

GPT-5.6 分为 Sol、Terra、Luna 三档,但首发访问被限制

多位博主提到 OpenAI 发布 GPT-5.6 系列,并把模型拆成 Sol、Terra、Luna 三个能力和成本档位。公开信息里,Sol 被定位为下一代前沿模型,Terra 面向日常高效任务,Luna 面向高吞吐低成本场景;OpenAI 还强调 Sol 在长程网络安全任务和安全红队测试上的投入。讨论焦点并不只是分数,而是发布方式:Sam Altman 表示原本计划开放访问,但应美国政府要求改为有限预览,并称会推动更透明、可靠的早期访问流程。中文博主主要关注两点:一是 Sol/ultra 模式对 Agent 工作流、终端编程和复杂工具调用的意义;二是普通用户和开发者短期内仍无法直接使用,导致这次发布更像能力信号和政策信号的结合。

来源:

Anthropic Mythos 5 部分恢复访问,Fable 5 仍在等待回归

多位博主提到 Anthropic 的 Mythos 5 在被限制两周后获得部分解禁。Anthropic 官方称,Mythos 5 可以重新部署给一组在美国运营和保护关键基础设施的组织,后续还会继续争取扩大 Mythos 5 的访问并恢复 Fable 5。中文讨论里,MaxForAI 和宝玉都把这件事放在更大的模型发布审核背景下理解:一方面,Mythos 5 和 Fable 5 的访问限制正在缓和;另一方面,美国政府对前沿模型发布方式的介入正在变成行业变量。MaxForAI 还引用 Axios 消息称 Fable 5 最快可能下周恢复,但最终仍取决于政府侧批准。

来源:

DeepSeek 的融资与 DSpark 加速框架同时进入讨论

有博主提到 DeepSeek 开启融资的背景与 Anthropic Mythos 预览版有关:据 The Information 报道,梁文峰意识到如果没有更大资金储备,就难以在同一层级竞争。这个信号把 DeepSeek 从“技术驱动的独立实验室”推向更重资本和更大团队扩张的叙事中。同日,Gorden Sun 还总结了 DSpark:这是 DeepSeek 的半自回归投机解码框架,目标是在并行草稿器和自回归草稿器之间取平衡,并通过置信度调度减少高并发下的验证浪费;据其转述,该方案已部署到 DeepSeek-V4 生产环境,替代原有 MTP-1,生成速度提升 60% 到 85%。

来源:

OSWorld 2.0 和 Hermes Agent 都指向“长程 Agent 还没解决”

有博主提到 OSWorld 2.0 发布,重点从短任务转向更接近真实工作的长程计算机使用:108 个真实工作流、每个任务约 318 个工具调用,并包含有状态用户配置、动态环境、流式交互和跨源推理等现象。MaxForAI 转述的结果显示,当前最佳成绩仍远低于“解决真实电脑任务”的水平,Claude Opus 4.8 最高约 20.6%。Nous Research 也发布 Hermes Agent 相关进展,称它通过 MoA presets 暴露成虚拟模型,在自家即将公布的 benchmark 上高于 Opus 4.8 和 GPT-5.5。两条线索放在一起看,前沿模型访问受限与真实 Agent 能力不足,正在共同推动“多模型编排、长程工具调用、验证能力”的需求。

来源:

MiniMax 遭遇大规模 DDoS,独立开发者也在做自动化防护

有博主提到 MiniMax 服务出现大规模中断,官方口径指向 DDoS 攻击,官网一度无法登录。MaxForAI 将这件事与此前 DeepSeek 遭遇的攻击相提并论,并提醒 MiniMax M3 本月降价后在性价比上更突出,服务稳定性和竞争环境会被放大关注。另一边,levelsio 分享了自己做的 Pietflare:一个类似小型 Cloudflare 的 DDoS 和探测检测系统,会从各服务器 access log 汇总可疑请求、维护中心 IP/ASN/国家封禁列表,并让服务器定期拉取 blocklist 配置到 Nginx。一个是模型服务商遭攻击,一个是独立开发者自建防护,它们共同说明 AI 产品和个人项目都越来越需要自动化安全运维。

来源:

Codex 用量重置与 Agent Mail 让开发者工具链继续扩张

多位博主提到 Codex 用量异常和重置。Tibo 转述 Codex 团队正在调查部分账号用量消耗过快的问题,原因可能与 abuse/fraud 防护机制误伤有关,随后又称所有 Codex 用户会获得一次用量重置。小互也用中文概括了这次“全体重置”。同一天,卫斯理的日报提到腾讯推出 Agent Mail,定位是给 Agent 使用的专属邮箱,并称已适配 Claude Code、豆包、Kimi、Cursor、Codex 等工具。再加上 flomo Agent、Claude Code 与 Codex 互相校验这类经验分享,开发者工具链的主题已经从“单个编码助手”扩展到账号配额、Agent 通信、记忆容器和多工具协作。

来源:

Seedance 2.0 4K 和 GPT-Image-2 继续把 AI 内容生产推向实操

多位博主围绕 AI 视频和图像工作流给出了更具体的实操内容。小宇 Chengzi 分享用 AI 制作广告片的流程,强调从产品、人物、镜头设计到成片逻辑的拆解,并提到 Seedance 2.0 4K 生成虽慢,但通过提前规划可以控制成本和迭代节奏。归藏用 Seedance 2.0 重新制作 Codepilot 宣传片,并强调原生 4K 对文字清晰度和材质质感的提升。Derek Wen 则分享了 GPT-Image-2 用于网购试衣效果图的提示词结构:用自拍锁定人物,用商品图锁定服装,明确正面、侧面、半身近景等视角,重点是让 AI 建立人和衣服之间的真实关系,而不是简单换脸或贴图。

来源:

GEO、记忆插件和 flomo Agent 说明知识工作开始转向工程化

有博主把知识工作流拆得更细。向阳乔木分享了第二次 GEO 公开课资料,包含内容工程操作手册、评估标准、系统研究报告、单篇内容实操教程、GEO 改写提示词、GEO skill 和 GEOFlow 等资源,说明生成式搜索优化已经从概念进入方法和工具层面。他还提到安装 nowledge mem 并配置 MCP,认为 AI 对话记忆和个人知识库很关键。AI 产品黄叔则从 flomo Agent 的使用体验出发,强调记录前 0.5 秒摩擦、可信记忆容器、脉络补全,以及 flomo Agent 与 Codex/Hermes 形成“记忆-行动”双系统的可能。几条线索放在一起看,知识管理正在从存内容转向可调用、可评估、可接入 Agent 的工程系统。

来源:

统计:

  • 扫描时间线条数:360
  • 命中的博主数:35
  • 命中的推文总数:180
  • 加权推文分:141.3
  • 原创推文数:85
  • RT 推文数:39
  • 抓取尝试次数:2
  • 边界覆盖状态:tail_confidently_crossed_target_boundary