NVIDIA 在 Computex 发布 Nemotron 3 Ultra、RTX Spark 超级芯片和 Cosmos 3
NVIDIA 在台北 Computex 2026 上集中发布了三款重磅产品。Nemotron 3 Ultra 拥有 550B 参数(激活 55B),是目前美国最智能的开源权重模型,在 Artificial Analysis Intelligence Index 上得分 48,超过 Gemma 4 31B(39)和 gpt-oss-120b(33),但落后于 Kimi K2.6(54);推理速度超过 300 token/s,远超同规模中国模型的 50-100 token/s。RTX Spark 超级芯片提供 1 PFLOPS AI 算力和最高 128GB 统一内存,与微软合作构建 Windows 原生 Agent 运行环境,计划秋季上线。Cosmos 3 是面向物理世界的 AI 模型,将物理推理、视频生成和动作生成统一到单一架构中,开源了 8B 和 32B 两个模型及 6 个数据集。此外,NVIDIA 还与 OpenClaw 合作开源了 67,453 个 ClawHub skills 的安全扫描数据集,Nous Research 的 Hermes Agent 也宣布原生支持 Windows 并集成到 RTX Spark。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2061325324936511894
- @Gorden_Sun: https://x.com/Gorden_Sun/status/2061392672997425300
- @Gorden_Sun: https://x.com/Gorden_Sun/status/2061396998855745646
- @openclaw: https://x.com/openclaw/status/2061324089432617406
- @NousResearch: https://x.com/NousResearch/status/2061323987804713083
MiniMax 发布 M3 模型:百万上下文、稀疏注意力、原生多模态
MiniMax 发布了新一代旗舰模型 MiniMax M3,三个核心能力同步拉齐:标配 1M 超长上下文,采用新的 MSA(MoE with Segment-wise Attention)稀疏注意力架构,从训练起融合原生多模态能力(文本、图片、视频、桌面操作)。MSA 在 100 万上下文下每 token 计算量仅为上一代的约 1/20,prefill 提速 9 倍以上,decode 提速 15 倍以上。在编码和 Agent 能力上,SWE-Bench Pro 达到 59.0%,Terminal Bench 2.1 达到 66.0%。API 价格方面,小于 512k 的调用限时五折 7 天。LufzzLiz 评价这是一个明确押注 agentic coding 的模型,亮点在于把长上下文、工具调用、多模态理解和持续执行能力绑定在一起。
来源:
- @op7418: https://x.com/op7418/status/2061327301644861608
- @LufzzLiz: https://x.com/LufzzLiz/status/2061396269193679009
VAST 完成近 2 亿美元融资,估值达 10 亿美元
3D 建模初创公司 VAST 完成 A+ 及 A++ 两轮融资,合计近 2 亿美元,估值达到 10 亿美元,成为最新一家跻身独角兽行列的中国 AI 公司。领投方为渶策资本和国寿长三角科创基金,跟投方包括深圳市人工智能终端产业基金(荣耀为产业方)、深创投、元生资本等,春华创投、BV 百度风投等老股东也超额追投。这是 VAST 今年 3 月融资后时隔两月再度获得资本加持。据 Bloomberg 报道,VAST 由一位 29 岁的游戏玩家创立。
来源:
Claude Opus 4.8 评价两极分化,多位博主分享实测体验
Anthropic 的 Claude Opus 4.8 在社区引发争议。MaxForAI 引用 @istdrc 的观点称"Opus 4.8 幻觉太多",并直言做 Agent 的人才知道 4.8 有多差。但宝玉(@dotey)给出了不同看法:Opus 4.8 在 UI 设计和实现方面比 GPT-5.5 好很多,系统设计和计划方面质量也很高,推荐用 Claude Design 先做设计再分别给两个模型实现以对比差异。他还建议导入 Adobe Spectrum 2 等成熟 Design System 来提升一致性。Cell 细胞(@cellinlab)则用 Opus 4.8 在不到 2 分钟内从游戏截图生成了一个完成度很高的 Web 版沙滩城堡游戏,物理模拟效果出色。多位博主提到 Claude 和 Codex 的订阅额度已从 150% 逐步收紧。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2061380643968422255
- @dotey: https://x.com/dotey/status/2061463713941492062
- @dotey: https://x.com/dotey/status/2061297781864624210
- @cellinlab: https://x.com/cellinlab/status/2061274657345749252
Coze 3.0 发布,支持本地 Agent 接入和多 Agent 协作
马东锡 NLP(@dongxi_nlp)详细分享了 Coze 3.0 的多 Agent 协作实践。最大亮点是本地 Agent 接入功能:一行命令即可将本地的 Codex 和 Claude Code 纳入 Coze 的多 Agent 团队,无需额外配置网关。在实际任务中,他用三个 Agent 协作产出了一份 21 页的 tutorial——Codex Agent 深度理解代码仓库,Claude Agent 精读文章提炼核心概念,Coze Agent 在云端整合产出 Apple HIG 风格的 HTML tutorial。核心经验是"先定规则再分任务":明确职责、固定 workspace、约定通知方式,项目文件作为唯一参考数据,版本可追溯。
来源:
- @dongxi_nlp: https://x.com/dongxi_nlp/status/2061337633796633047
- @dongxi_nlp: https://x.com/dongxi_nlp/status/2061337638146060562
- @dongxi_nlp: https://x.com/dongxi_nlp/status/2061337642608771466
Vibe Coding 工具生态持续爆发:Skill 开源、Codepilot 重构、风格图谱上线
多位博主在六一集中开源了一批 Vibe Coding 工具。向阳乔木(@vista8)宣布免费开源所有近期 vibe coding 工具和 Skill,并分享了基于飞书 CLI 的 AI 读书方法论——用 Codex 把 Epub 按章节写入飞书文档,人工划线评论后再让 AI 解读,以及结合沉浸式翻译插件 read-frog 开发的单词学习系统(基于艾宾浩斯遗忘曲线)。歸藏(@op7418)发布 CodePilot 0.55.0 重构版本,UI 整体重构并支持将 Codex 作为 Agent 引擎。Gorden Sun 开源了一个一键生成可视化数学讲解视频的 Skill。古一(@MANISH1027512)转推了 VSC 社区上线的 620 种风格图谱 Style Atlas,覆盖材质、摄影工艺、动画漫画等 10 大风格语系,定位为 AIGC 视觉创作者的审美导航系统。
来源:
- @vista8: https://x.com/vista8/status/2061445555038179559
- @vista8: https://x.com/vista8/status/2061118430305210492
- @vista8: https://x.com/vista8/status/2061126489048039724
- @op7418: https://x.com/op7418/status/2061426771267125649
- @Gorden_Sun: https://x.com/Gorden_Sun/status/2061338675313889627
- @MANISH1027512: https://x.com/MANISH1027512/status/2061346504980463988
OpenAI Voice Hack Night 展示 Agentic 手机操作系统原型
小互(@xiaohu)分享了 OpenAI Voice Hack Night 上一个团队的现场 demo:一个为手机打造的"agentic 操作系统"。核心思路是"UI 即系统"——手机没有传统 App,界面由端侧本地模型实时生成(on the fly),重推理交给云端 GPT。开发者全程用语音指挥它订机票、删日历日程、查 AI 新闻、发邮件、列待办。小互认为这是大家都向往的 AI 助理形态,也是会颠覆手机商业模式的全新形态,因为所有界面都是即时生成的,无需调用任何 App 界面,苹果的 App Store 商业模式面临挑战。demo 过程中也出现了翻车(发邮件因登录配置失败)。
来源:
AI 动画和 3D 文旅作品进入主流平台
Derek Wen(@derek_wall90176)分享了自己去年闲暇时间用 AI 制作的解释中华成语故事的动画片,已在芒果TV上线可直接点播。他感慨去年和今年的工具效果差别巨大,效率和效果都有显著提升,同时预告工作室创作的以中华传统文化历史为主题的 3D 风格 IP"活宝档案"系列动画片计划下月上线。此外,@berryxia 用 Claude 花了 2 周和 800 美金开发了一个可漫游的 3D 盛唐长安世界,支持实时语音 AI 交互,玩家可以和 NPC 对话、进入展馆、玩诗词小游戏。LufzzLiz 详细总结了该项目的技术架构:主项目用 Three.js 搭建 3D 场景,语音子项目用 Next.js + FastAPI 接入 Agora ConvoAI。
来源:
- @derek_wall90176: https://x.com/derek_wall90176/status/2061443869250883613
- @derek_wall90176: https://x.com/derek_wall90176/status/2061422628519465237
- @LufzzLiz: https://x.com/LufzzLiz/status/2061298541520408854
宇树科技科创板 IPO 过会,OpenAI 招聘机器人工程师
据 36Kr 消息,宇树科技(Unitree Robotics)科创板 IPO 过会,这家四足机器人领域的头部公司即将登陆 A 股。与此同时,Sam Altman 发布了 OpenAI Robotics 的招聘信息,称团队正在开发对社会有用的机器人,短期目标是支持技术工人建设基础设施,长期愿景是让每个人都拥有个人机器人。OpenAI 的世界模拟研究项目已演变为 OpenAI Robotics,强调硬件和 ML 研究的协同设计。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2061382987435139313
- @sama: https://x.com/sama/status/2061117302528188712
Benedict Evans 与 Lenny Rachitsky 深度对话:AI 处于 1997 年阶段
Lenny Rachitsky 发布了与独立分析师 Benedict Evans 的播客对话。Evans 提出了几个核心判断:AI 目前相当于 1997 年的互联网——同样重大,但也同样处于早期,大多数东西还不太好用,最重要的用例可能今天还看不见;基础模型公司不会有持久的定价权,价值会向上层聚集;分发能力正成为比产品本身更重要的护城河,因为 AI 让软件更容易构建导致市场更嘈杂;OpenAI 和 Anthropic 收购咨询公司的逻辑是企业没有内部团队来重新设计工作流。关于就业,他用会计行业的历史说明自动化往往增加而非减少就业(杰文斯悖论),认为关键问题不是 AI 能做你工作的百分之多少,而是你的职业是"任务"还是"工作"。
来源:
- @lennysan: https://x.com/lennysan/status/2061186157602566336
- @lennysan: https://x.com/lennysan/status/2061186159699804486
统计: 扫描时间线条数=360 命中的博主数=36 命中的推文总数=181 加权推文分=150.25 原创推文数=94 RT 推文数=27 抓取尝试次数=2 边界覆盖状态=tail_confidently_crossed_target_boundary