X 平台 6月1日 AI 简讯｜NVIDIA发布三款重磅产品，MiniMax推出M3模型，VAST完成近2亿美元融资

NVIDIA 在 Computex 发布 Nemotron 3 Ultra、RTX Spark 超级芯片和 Cosmos 3

NVIDIA 在台北 Computex 2026 上集中发布了三款重磅产品。Nemotron 3 Ultra 拥有 550B 参数（激活 55B），是目前美国最智能的开源权重模型，在 Artificial Analysis Intelligence Index 上得分 48，超过 Gemma 4 31B（39）和 gpt-oss-120b（33），但落后于 Kimi K2.6（54）；推理速度超过 300 token/s，远超同规模中国模型的 50-100 token/s。RTX Spark 超级芯片提供 1 PFLOPS AI 算力和最高 128GB 统一内存，与微软合作构建 Windows 原生 Agent 运行环境，计划秋季上线。Cosmos 3 是面向物理世界的 AI 模型，将物理推理、视频生成和动作生成统一到单一架构中，开源了 8B 和 32B 两个模型及 6 个数据集。此外，NVIDIA 还与 OpenClaw 合作开源了 67,453 个 ClawHub skills 的安全扫描数据集，Nous Research 的 Hermes Agent 也宣布原生支持 Windows 并集成到 RTX Spark。

来源：

@MaxForAI: https://x.com/MaxForAI/status/2061325324936511894
@Gorden_Sun: https://x.com/Gorden_Sun/status/2061392672997425300
@Gorden_Sun: https://x.com/Gorden_Sun/status/2061396998855745646
@openclaw: https://x.com/openclaw/status/2061324089432617406
@NousResearch: https://x.com/NousResearch/status/2061323987804713083

MiniMax 发布 M3 模型：百万上下文、稀疏注意力、原生多模态

MiniMax 发布了新一代旗舰模型 MiniMax M3，三个核心能力同步拉齐：标配 1M 超长上下文，采用新的 MSA（MoE with Segment-wise Attention）稀疏注意力架构，从训练起融合原生多模态能力（文本、图片、视频、桌面操作）。MSA 在 100 万上下文下每 token 计算量仅为上一代的约 1/20，prefill 提速 9 倍以上，decode 提速 15 倍以上。在编码和 Agent 能力上，SWE-Bench Pro 达到 59.0%，Terminal Bench 2.1 达到 66.0%。API 价格方面，小于 512k 的调用限时五折 7 天。LufzzLiz 评价这是一个明确押注 agentic coding 的模型，亮点在于把长上下文、工具调用、多模态理解和持续执行能力绑定在一起。

来源：

@op7418: https://x.com/op7418/status/2061327301644861608
@LufzzLiz: https://x.com/LufzzLiz/status/2061396269193679009

VAST 完成近 2 亿美元融资，估值达 10 亿美元

3D 建模初创公司 VAST 完成 A+ 及 A++ 两轮融资，合计近 2 亿美元，估值达到 10 亿美元，成为最新一家跻身独角兽行列的中国 AI 公司。领投方为渶策资本和国寿长三角科创基金，跟投方包括深圳市人工智能终端产业基金（荣耀为产业方）、深创投、元生资本等，春华创投、BV 百度风投等老股东也超额追投。这是 VAST 今年 3 月融资后时隔两月再度获得资本加持。据 Bloomberg 报道，VAST 由一位 29 岁的游戏玩家创立。

来源：

@MaxForAI: https://x.com/MaxForAI/status/2061383337168752960

Claude Opus 4.8 评价两极分化，多位博主分享实测体验

Anthropic 的 Claude Opus 4.8 在社区引发争议。MaxForAI 引用 @istdrc 的观点称"Opus 4.8 幻觉太多"，并直言做 Agent 的人才知道 4.8 有多差。但宝玉（@dotey）给出了不同看法：Opus 4.8 在 UI 设计和实现方面比 GPT-5.5 好很多，系统设计和计划方面质量也很高，推荐用 Claude Design 先做设计再分别给两个模型实现以对比差异。他还建议导入 Adobe Spectrum 2 等成熟 Design System 来提升一致性。Cell 细胞（@cellinlab）则用 Opus 4.8 在不到 2 分钟内从游戏截图生成了一个完成度很高的 Web 版沙滩城堡游戏，物理模拟效果出色。多位博主提到 Claude 和 Codex 的订阅额度已从 150% 逐步收紧。

来源：

@MaxForAI: https://x.com/MaxForAI/status/2061380643968422255
@dotey: https://x.com/dotey/status/2061463713941492062
@dotey: https://x.com/dotey/status/2061297781864624210
@cellinlab: https://x.com/cellinlab/status/2061274657345749252

Coze 3.0 发布，支持本地 Agent 接入和多 Agent 协作

马东锡 NLP（@dongxi_nlp）详细分享了 Coze 3.0 的多 Agent 协作实践。最大亮点是本地 Agent 接入功能：一行命令即可将本地的 Codex 和 Claude Code 纳入 Coze 的多 Agent 团队，无需额外配置网关。在实际任务中，他用三个 Agent 协作产出了一份 21 页的 tutorial——Codex Agent 深度理解代码仓库，Claude Agent 精读文章提炼核心概念，Coze Agent 在云端整合产出 Apple HIG 风格的 HTML tutorial。核心经验是"先定规则再分任务"：明确职责、固定 workspace、约定通知方式，项目文件作为唯一参考数据，版本可追溯。

来源：

@dongxi_nlp: https://x.com/dongxi_nlp/status/2061337633796633047
@dongxi_nlp: https://x.com/dongxi_nlp/status/2061337638146060562
@dongxi_nlp: https://x.com/dongxi_nlp/status/2061337642608771466

Vibe Coding 工具生态持续爆发：Skill 开源、Codepilot 重构、风格图谱上线

多位博主在六一集中开源了一批 Vibe Coding 工具。向阳乔木（@vista8）宣布免费开源所有近期 vibe coding 工具和 Skill，并分享了基于飞书 CLI 的 AI 读书方法论——用 Codex 把 Epub 按章节写入飞书文档，人工划线评论后再让 AI 解读，以及结合沉浸式翻译插件 read-frog 开发的单词学习系统（基于艾宾浩斯遗忘曲线）。歸藏（@op7418）发布 CodePilot 0.55.0 重构版本，UI 整体重构并支持将 Codex 作为 Agent 引擎。Gorden Sun 开源了一个一键生成可视化数学讲解视频的 Skill。古一（@MANISH1027512）转推了 VSC 社区上线的 620 种风格图谱 Style Atlas，覆盖材质、摄影工艺、动画漫画等 10 大风格语系，定位为 AIGC 视觉创作者的审美导航系统。

来源：

@vista8: https://x.com/vista8/status/2061445555038179559
@vista8: https://x.com/vista8/status/2061118430305210492
@vista8: https://x.com/vista8/status/2061126489048039724
@op7418: https://x.com/op7418/status/2061426771267125649
@Gorden_Sun: https://x.com/Gorden_Sun/status/2061338675313889627
@MANISH1027512: https://x.com/MANISH1027512/status/2061346504980463988

OpenAI Voice Hack Night 展示 Agentic 手机操作系统原型

小互（@xiaohu）分享了 OpenAI Voice Hack Night 上一个团队的现场 demo：一个为手机打造的"agentic 操作系统"。核心思路是"UI 即系统"——手机没有传统 App，界面由端侧本地模型实时生成（on the fly），重推理交给云端 GPT。开发者全程用语音指挥它订机票、删日历日程、查 AI 新闻、发邮件、列待办。小互认为这是大家都向往的 AI 助理形态，也是会颠覆手机商业模式的全新形态，因为所有界面都是即时生成的，无需调用任何 App 界面，苹果的 App Store 商业模式面临挑战。demo 过程中也出现了翻车（发邮件因登录配置失败）。

来源：

@xiaohu: https://x.com/xiaohu/status/2061414052916547705

AI 动画和 3D 文旅作品进入主流平台

Derek Wen（@derek_wall90176）分享了自己去年闲暇时间用 AI 制作的解释中华成语故事的动画片，已在芒果TV上线可直接点播。他感慨去年和今年的工具效果差别巨大，效率和效果都有显著提升，同时预告工作室创作的以中华传统文化历史为主题的 3D 风格 IP"活宝档案"系列动画片计划下月上线。此外，@berryxia 用 Claude 花了 2 周和 800 美金开发了一个可漫游的 3D 盛唐长安世界，支持实时语音 AI 交互，玩家可以和 NPC 对话、进入展馆、玩诗词小游戏。LufzzLiz 详细总结了该项目的技术架构：主项目用 Three.js 搭建 3D 场景，语音子项目用 Next.js + FastAPI 接入 Agora ConvoAI。

来源：

@derek_wall90176: https://x.com/derek_wall90176/status/2061443869250883613
@derek_wall90176: https://x.com/derek_wall90176/status/2061422628519465237
@LufzzLiz: https://x.com/LufzzLiz/status/2061298541520408854

宇树科技科创板 IPO 过会，OpenAI 招聘机器人工程师

据 36Kr 消息，宇树科技（Unitree Robotics）科创板 IPO 过会，这家四足机器人领域的头部公司即将登陆 A 股。与此同时，Sam Altman 发布了 OpenAI Robotics 的招聘信息，称团队正在开发对社会有用的机器人，短期目标是支持技术工人建设基础设施，长期愿景是让每个人都拥有个人机器人。OpenAI 的世界模拟研究项目已演变为 OpenAI Robotics，强调硬件和 ML 研究的协同设计。

来源：

@MaxForAI: https://x.com/MaxForAI/status/2061382987435139313
@sama: https://x.com/sama/status/2061117302528188712

Benedict Evans 与 Lenny Rachitsky 深度对话：AI 处于 1997 年阶段

Lenny Rachitsky 发布了与独立分析师 Benedict Evans 的播客对话。Evans 提出了几个核心判断：AI 目前相当于 1997 年的互联网——同样重大，但也同样处于早期，大多数东西还不太好用，最重要的用例可能今天还看不见；基础模型公司不会有持久的定价权，价值会向上层聚集；分发能力正成为比产品本身更重要的护城河，因为 AI 让软件更容易构建导致市场更嘈杂；OpenAI 和 Anthropic 收购咨询公司的逻辑是企业没有内部团队来重新设计工作流。关于就业，他用会计行业的历史说明自动化往往增加而非减少就业（杰文斯悖论），认为关键问题不是 AI 能做你工作的百分之多少，而是你的职业是"任务"还是"工作"。

来源：

@lennysan: https://x.com/lennysan/status/2061186157602566336
@lennysan: https://x.com/lennysan/status/2061186159699804486

统计：扫描时间线条数=360 命中的博主数=36 命中的推文总数=181 加权推文分=150.25 原创推文数=94 RT 推文数=27 抓取尝试次数=2 边界覆盖状态=tail_confidently_crossed_target_boundary