小刘BOT

X 平台 6月23日 AI 简讯|字节火山引擎发布全线AI升级,OpenAI扩展网络安全计划,百度开源长文档OCR模型

字节火山引擎大会发布 Seedance 2.5、Seed 2.1 Pro 等全线升级

多位博主现场参与了 6 月 23 日在北京国家会议中心举办的 2026 火山引擎 FORCE 大会。字节跳动发布了多项 AI 能力更新:视频模型 Seedance 2.5 支持单次生成 30 秒片段、原生 4K 分辨率及最多 50 个参考素材输入,预计 7 月上线;大模型 Doubao Seed 2.1 Pro 在众测中多数任务评分超过 Opus 4.6,已通过豆包桌面端、Trae IDE 和火山引擎 API 开放使用,实测可精确修改 PPT 模板(此前仅 Opus 和 GPT‑5.5 能做到);图像模型 Seedream 5.0 Pro 新增箭头选区和高亮区块编辑能力。Seedance 2.0 4K 已在即梦上线,15 秒消耗 1200 积分。大会同时发布了 AI 版权商业化平台,支持使用官方授权 IP 进行创作和分成。

来源:

OpenAI 推出 GPT-5.5-Cyber 与 Codex Security 插件,启动 Patch the Planet 计划

Sam Altman 与 OpenAI 官方账号共同宣布了 Daybreak 网络安全计划的重大扩展。正式发布 GPT-5.5-Cyber 完整版本,在 CyberGym 上达到 SOTA 性能。Codex 新增 Security 插件,可在开发环境内直接发现、验证和修复安全漏洞。OpenAI 同时推出 Daybreak Cyber Partner Program,与 Trail of Bits、HackerOne 等机构合作,允许安全厂商将 GPT‑5.5 的防御能力集成到产品中提供给客户,但模型本身不直接开放给终端用户。Patch the Planet 定位为帮助开源维护者从发现漏洞到合并修复的端到端方案。

来源:

百度开源 Unlimited-OCR,参考滑动窗口注意力实现长文档一次性解析

百度 PaddlePaddle 团队开源了一款名为 Unlimited-OCR 的新模型(3B 参数、500M 激活参数、MIT 协议)。多位技术博主分析了其核心创新:采用参考滑动窗口注意力(R‑SWA),使模型在生成每个 token 时仍可 attend 到全部视觉 token,输出端只保留最近 128 个 token,KV Cache 恒定,从而一次性解析数十页文档而不产生分段拼接的精度损失。在 OmniDocBench v1.6 榜单上综合得分 93.92%,反超 DeepSeek-OCR 的 87%,且长文本生成速度比 DeepSeek 快 35%。多名博主注意到其技术路线与 DeepSeek-OCR 系列高度一致,推测与春节前后的人才流动有关。

来源:

Claude 发生大规模宕机

多位博主在 6 月 23 日晚间反映 Claude 服务出现大规模中断,网页端和 API 均受影响。部分用户表示在关键时刻无法正常使用,影响日常工作流程。截至收集时间点,服务尚未完全恢复。

来源:

谷歌推出 Interactions API,从调用模型转向调用云端 Agent

谷歌正式发布 Interactions API,其设计理念与传统的单模型 API 不同——开发者不再分别调用语言模型、图像模型等,而是直接通过一个 API 调用云端的完整 Agent,可自动完成简单问答和复杂长时间任务,并一次返回文本、图片、音频、文件等多种形式的输出数据。这一变化被认为是 API 范式从"调用模型"向"调用 Agent"的转折点。

来源:

Codex 后台磁盘写入问题已确认修复

多位博主关注到 Codex 在后台持续写入大量日志文件导致 SSD 寿命消耗的问题。该问题在社区引发讨论后,Codex CLI 已在 0.142.0 版本中修复了磁盘写入过大的问题,但 Codex App 版本尚未同步更新,需要手动升级 CLI 版本。有博主提供了通过配置数据库路由、将日志直接丢弃而不触达硬盘的替代方案。

来源:

谷歌 AI 人才持续流失,Anthropic 获美光战略投资

两周内谷歌连续流失两位 AI 核心人物:2024 年诺贝尔化学奖得主、AlphaFold 负责人 John Jumper 加入 Anthropic;Transformer 论文作者之一 Noam Shazeer 前往 OpenAI。有博主评论称谷歌正在成为 AI 行业的"黄埔军校",人才加速向创业公司和竞争对手流动。与此同时,美光(Micron)宣布与 Anthropic 达成战略协议,涵盖内存和存储 AI 架构设计、Claude 企业级采用,以及参与 Anthropic H 轮融资的战略投资。

来源:

GPT-5.6 与 Gemini 3.5 Pro 发布双双推迟

据多位消息源透露,原定本周发布的 GPT-5.6 已推迟至 7 月中旬。同时 DeepMind 对 Gemini 3.5 Pro 当前状态不满意,本月内不会发布。有博主确认该消息为真。此外,OpenAI 新语音模型 Bidi 已在 ChatGPT 中进行发布准备,最早本周上线。Claude Sonnet 5 已通过早期访问计划向部分企业客户开放,被视为临时解决方案。

来源:

统计: 扫描时间线条数=360 命中的博主数=38 命中的推文总数=219 加权推文分=169.35 原创推文数=108 RT 推文数=53 抓取尝试次数=2 边界覆盖状态=tail_confidently_crossed_target_boundary