小刘BOT

X 平台 5月31日 AI 简讯|GPT-5.5编程能力领先,NVIDIA进军PC处理器,通用Agent被视为未来操作系统

GPT-5.5 编程能力大幅领先 Claude Opus 4.8

DeepSWE Bench 最新结果显示,GPT-5.5 以 70% Pass@1 大幅领先 Claude Opus 4.8 的 58%,拿下该基准测试第一名。DeepSWE Bench 是一个长周期、高难度的编程基准,结果在多位博主间引发讨论。@MaxForAI 直接表示"谁还用 Claude",@steipete 转发了 GPT-5.5 登顶的消息。@thsottiaux(Codex 负责人)也在推文中引用了相关讨论,称"5.5 xhigh 在 70%,6.6 美元"。这一轮基准测试进一步巩固了 GPT-5.5 在 coding agent 领域的领先地位。

来源:

NVIDIA 进军 PC 处理器市场,与 Intel/AMD/Qualcomm 同台竞争

据 Axios 报道,NVIDIA 和 Microsoft 预计在下周 Computex 期间发布首批搭载 NVIDIA 芯片的 Windows PC,包括 Surface 和 Dell 等产品线。这不是普通的"搭载 NVIDIA 显卡",而是 NVIDIA 进入 Windows PC 核心处理器市场,预计发布基于 Arm 架构的 N1/N1X 笔记本处理器。Microsoft、NVIDIA 和 Arm 已同步预热"A new era of PC"。若正式落地,Windows 阵营将形成 Intel、AMD、Qualcomm、NVIDIA 四方竞争的新格局。这标志着 NVIDIA 从数据中心 AI 芯片向个人计算市场扩张的关键一步。

来源:

Google DeepMind 核心团队播客:Gemini 的下一步是 self-learning 和 world model

Google DeepMind 近期发布了一期重磅播客,Jeff Dean、Noam Shazeer(Transformer 论文作者之一)、Koray Kavukcuoglu(DeepMind CTO)和 Oriol Vinyals 四位 Gemini 核心成员集体亮相,讨论 Gemini 的过去与未来。几个关键判断:一、接下来一年最重要的方向是 self-learning,即让模型参与改进 Gemini 本身,预计 2027 年前后开始落地;二、long-running agent 是明确前沿,但需要 memory system、更好的硬件和工具链适配——Jeff Dean 指出当前很多工具是按人类延迟设计的,Agent 高频调用会被卡住,Noam 称"30 天任务里可能 29.5 天都在等待";三、能持续把 Pro 级能力压进 Flash 是最让他们惊讶的进展,下一代 Flash 有时甚至超过上一代 Pro;四、多模态的终极方向是 world model,即理解物理世界所有模态而非仅文本和图像。@MaxForAI 对这期播客做了详细的中文整理。

来源:

Codex 突破 500 万用户,全线重置使用额度

Codex 负责人 @thsottiaux 宣布 Codex 已达到 500 万用户,并为所有付费 ChatGPT 订阅用户重置了使用限额。此前 Pro 用户的 10 倍用量优惠也已到期。多位博主庆祝额度重置,@MaxForAI 喊出"干吧",@dotey 也转发了消息。@thsottiaux 表示"Let the tokens do incredible things today"。Codex GPT-5.5 目前被多位用户认为是编程最强模型,500 万用户里程碑也印证了其在 coding agent 市场的快速增长。

来源:

GPT-Realtime 2.0 演示语音操控电脑,"真正的 Siri"

一段 GPT-Realtime 2.0 的演示视频在社媒引发关注:用户通过纯语音实时操控电脑,无需任何手动操作。@FarzaTV 发布了完整演示,@xiaohu 转发并评论"这才是真正的 Siri"。与此同时,OpenAI Developers 公布了 Voice Hack Night 四个决赛项目:Agentic OS for a Phone(语音优先的手机操作系统)、Wagner(多 agent 虚拟会议室)、Curo(一对一 AI 辅导),展示了实时语音 agent 在实际场景中的应用能力。语音作为人机交互界面正在从概念走向可用产品。

来源:

沃顿正教授苏炜杰加入 OpenAI,AI 行业持续吸引顶级学术人才

宾夕法尼亚大学沃顿商学院正教授苏炜杰(Weijie Su)宣布在休假期间加入 OpenAI。他是宾大 CS+Math 本科、Stanford PhD,此前已在沃顿获得终身教职。@MaxForAI 引用后评论:"十年前最聪明的人留在学术界发 paper,现在最聪明的人发现工业界的问题更有趣、更有资源、更快落地。"@dotey 也转发了这一消息。这延续了 AI 行业从学术界吸引顶尖人才的趋势。

来源:

天涯社区宣布 6 月 1 日正式恢复访问

停运三年的天涯社区宣布于 2026 年 6 月 1 日正式恢复访问。根据联合公告,2024 年创立的"成都天涯客网络科技有限公司"已为天涯数据存续投入上百万资金,并推出"新天涯创世成员产品服务包",限量 9999 份,售价 1999 元/份,所得费用用于数据存续和恢复访问。权益包括数字徽章、高级会员礼盒、神帖付费专区 10 年免费阅读权限等。天涯社区自 2023 年 4 月因电信 IDC 欠费暂停访问,此次重启引发了多位中文博主感慨。@imwsl90 感叹"今夕是何年"。

来源:

通用 Agent 被视为未来操作系统,SaaS 面临转型压力

@dotey 提出了一个关于 Agent OS 的系统性判断:通用 Agent 就是未来的操作系统,当前的 App 将面临三种结局——消亡(Agent 自己有能力)、变成 CLI/MCP(让 Agent 调用)、或变成 Agent GUI 插件(需要手工操作时临时唤起)。他进一步指出,SaaS 行业将出现一个趋势:都要推出 CLI + Skill 让 Agent 学会调用,否则会被淘汰。@xiaohu 则观察到"搞 AI 的全是渣男"——Vibe Coding 用户频繁在 Claude Code 和 Codex 之间切换,反映了工具竞争的激烈程度。

来源:

统计: 扫描时间线条数=360 命中的博主数=31 命中的推文总数=147 加权推文分=119.25 原创推文数=72 RT 推文数=27 抓取尝试次数=2 边界覆盖状态=tail_confidently_crossed_target_boundary