OpenAI 通用推理模型自主解决近 80 年数学猜想
OpenAI 宣布,其一个内部通用推理模型自主解决了 1946 年 Paul Erdős 提出的平面单位距离问题,这是 AI 首次自主解决数学领域的重要公开问题。该问题长期被数学界认为方格网格类构造已近最优,但模型找到了一个全新的反例族,实现了 n^{1+δ}(δ 为固定正数)的单位距离对,突破了此前 n^{1+o(1)} 的上界。1998 年菲尔兹奖得主 Timothy Gowers 表示,如果这是人写的论文,他会毫不犹豫建议顶刊接收。值得注意的是,该证明来自一个通用推理模型而非专用数学系统,其思维链长达约 111,145 tokens。有工程师估算,整个推理过程可能花费了约 120 至 1000 美元的 token 成本,耗时 5 至 32 小时。Sam Altman 称这是"相当大的里程碑",并表示对此有"复杂的心情"。
来源:
- @OpenAI: https://x.com/OpenAI/status/2057176201782075690
- @MaxForAI: https://x.com/MaxForAI/status/2057280533726667192
- @oran_ge: https://x.com/oran_ge/status/2057380350188482592
- @sama: https://x.com/sama/status/2057203171198636251
Google AI 产品策略引发开发者信任危机
YouTube 科技博主 Theo(53.7 万订阅)公开批评 Google Antigravity 2.0,称 Google 已"没有能力在乎产品"。他指出,Antigravity 在官方演示视频中甚至出现了名为"Codex"的文件夹,质疑其抄袭痕迹明显;同时 Google 内部原本认真维护开发者关系的团队被边缘化,取而代之的是挖来 Windsurf 创始人组建的 Antigravity 团队。此前 Google 内部有多位开发者信任的核心沟通者(Demetri、Jack、Gal),如今这条线基本被 Antigravity 接管。Google Gemini 开发者关系负责人随后在播客中回应了多项批评,承认 3.5 Flash 已从聊天场景转向 Coding 和 Agent,并表示 Antigravity 方向是"开发者桌面工作台"。多位博主将 Google 的产品命名混乱(Gemini、AI Studio、Antigravity、Jules、Flow、Spark 等入口并存)视为其开发者体验的核心障碍。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2057324141599232243
- @MaxForAI: https://x.com/MaxForAI/status/2057470882592018568
- @MaxForAI: https://x.com/MaxForAI/status/2057389390578811289
Manus 创始团队考虑融资 10 亿美元回购公司以脱离 Meta
据彭博社报道,Manus 三位创始人肖弘、季逸超、张涛正在讨论从外部投资人融资约 10 亿美元,用于回购这家中国背景 AI 公司,新一轮估值可能至少对齐 Meta 此前 20 亿美元的收购价。Meta 于 2025 年 12 月宣布收购 Manus,交易估值约 20 至 30 亿美元;2026 年 4 月 27 日,中国方面要求 Meta 撤销该交易。Manus 此前因"通用 AI Agent"概念爆火,被视为中国版 DeepSeek 之后的新 AI 公司。目前 Manus 方面尚未回应,该报道也尚未被独立核实。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2057400768940974225
- @cellinlab: https://x.com/cellinlab/status/2057397893900665097
SpaceX 扩展 AI 计算服务,与 Anthropic 合作并计划轨道数据中心
Elon Musk 表示,SpaceX 正在大规模提供 AI 计算服务,最近与 Anthropic 扩大了合作伙伴关系,同时正在与其他公司讨论类似合作。他预计未来 SpaceX 将通过轨道数据中心以极高规模提供 AI 服务。同日,SpaceX 还宣布正在为 SpaceXAI 积极招聘世界级工程师和物理学家,即使没有 AI 经验也可申请。此前 xAI 世界模型负责人 Ethan He 宣布离职,他曾是 Grok Imagine 从零到一的核心成员。
来源:
- @elonmusk: https://x.com/elonmusk/status/2057228707606196434
- @elonmusk: https://x.com/elonmusk/status/2057327547411570907
- @MaxForAI: https://x.com/MaxForAI/status/2057276505294868730
Tesla 停产 Model S/X 并在中国推出 FSD
5 月 21 日,Tesla 举行了 Model S 和 Model X 签名版最后交付仪式,正式停产这两款旗舰车型。Elon Musk 引用多条推文表达对这两款车的情感,称"S & X will forever be in my heart"。同日,Tesla 宣布 FSD Supervised 正式进入中国大陆市场,此前特斯拉中国已急招 FSD 工程师。多位博主确认了这一消息,有用户表示准备在国内路况下测试 FSD 效果。此外,Lithuania 成为第二个批准 FSD Supervised 的欧洲国家。
来源:
- @elonmusk: https://x.com/elonmusk/status/2057272975242748372
- @xiaohu: https://x.com/xiaohu/status/2057279976467218765
- @MaxForAI: https://x.com/MaxForAI/status/2057303454960566321
- @elonmusk: https://x.com/elonmusk/status/2057259143950746090
腾讯开源多语种翻译模型 Hy-MT2,1.8B 轻量级可本地部署
腾讯开源了 Hy-MT2 多语种翻译模型,支持 33 种语言间的翻译,包含 1.8B、7B 和 30B-A3B 三个尺寸。官方称 7B 和 A3B 版本在翻译任务中超过了 DeepSeek V4、Kimi K2.6 等开源模型,1.8B 轻量级版本整体优于 Microsoft Translator、Doubao Translator 等商业翻译 API。得益于腾讯 AngelSlim 1.25 位极端量化,模型仅需 440MB 存储,可在主流移动芯片上本地推理,速度比上一代 Hy-MT1.5 快 1.5 倍。腾讯同步推出了翻译小程序。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2057387900975915378
- @Gorden_Sun: https://x.com/Gorden_Sun/status/2057479611811053836
- @TencentHunyuan: https://x.com/TencentHunyuan/status/2057384034544804136
Hugging Face 开源超快 DNA 模型 Carbon,单 GPU 两天处理完整人类基因组
Hugging Face 开源了基因组基础模型 Carbon,据称比此前最佳模型(Evo2)快 275 倍,可在不到两天内用一块 GPU 处理完整的人类基因组。Carbon 使用了一种独特的分词器,以 6 个碱基为一块切分序列,但在训练和推理中以单个碱基分辨率处理,兼顾了效率和精度。模型提供了交互式演示,支持探索 DNA 序列生成、基因结构研究、突变影响预测、蛋白质生成与折叠等功能。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2057295727043428857
- @lvwerra: https://x.com/lvwerra/status/2056774820872831234
中国 AI 短剧市场进入工业化量产阶段,AI 漫剧成增长主力
A16Z 关注到中国 AI 短剧行业。据多家行业数据,2025 年中国微短剧、漫剧市场规模达千亿元级,超过同期中国电影总票房(518.32 亿元)。其中 AI 漫剧增长最猛,2025 年市场规模约 168 至 200 亿元,2026 年 1 月上线 14634 部,日均 470 多部新剧。成本方面,AI 漫剧制作成本低至每分钟 500 元,约为传统动画短剧的五分之一。报道称 Seedance 2.0 将 15 秒视频可用率从行业平均约 20% 提升至接近 90%。平台方面,抖音精品漫剧高评级仿真人剧可获每分钟 1 至 3 万元保底。海外方面,2025 年市场规模约 1 亿美元,2026 年预计达 6.5 亿美元。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2057383573439525187
- @venturetwins: https://x.com/venturetwins/status/2057124460998869087
米哈游宣布三年最多投入 1000 亿人民币做 AI 大模型
据晚点报道,米哈游于 5 月 15 日在北京举办 AI 基础大模型技术分享会,刘伟在会上表示米哈游 AI 投入规模"三年最多 1000 亿人民币","没做出来也认,算是放一个大的烟花"。米哈游此前已成立"逆熵"研究部门、备案 Glossa 大模型,并陆续成立多家 AI 相关公司。刘伟还提到 AI for AI 理念,让大模型进入游戏研发循环。另一方面,米哈游联合创始人蔡浩宇的 Anuttacon 已推出 AI 游戏《Whispers from the Star》和角色表演模型 LPM 1.0,探索让 AI 角色能实时理解、回应玩家并表达情绪。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2057282085845696517
- @zephyr_z9: https://x.com/zephyr_z9/status/2056784984741175473
独立开发者猝死引发行业健康反思,Vibe Coding 成瘾风险受关注
一位独立开发者因长期熬夜工作猝死的消息在社交媒体引发广泛关注。与此同时,博主 MaxForAI 分享了自己连续 Vibe Coding 72 小时后首次梦游的经历,提醒开发者注意身体健康。他为此开发了 Tokenless 工具,据称可将 Claude Code 的 vibe coding 输入 tokens 降低 47.3%,普通对话响应 tokens 降低 80%。多位博主转发了关于 AI 编程即时反馈的成瘾性讨论,认为这容易让人忘记休息。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2057429912819044625
- @cellinlab: https://x.com/cellinlab/status/2057330312833646881
- @DIGITALYCHEE: https://x.com/DIGITALYCHEE/status/2057302477612224679
AI Agent 生态持续扩展:Grok Build、Hermes Agent、Multica 等多线推进
AI Agent 工具链呈现多线并进态势。Grok Build 发布 0.1 版本,新增 macOS Intel 和 Windows ARM64 支持,并进入 Vercel AI Gateway 和 Open Design 生态;Nous Research 的 Hermes Agent 推出 skill bundles 和浏览器技能目录,与 Grok Build 集成;多 Agent 管理工具 Multica 获多位博主推荐,支持 Claude/Codex/Gemini,适配 Windows/macOS/Linux。此外,OpenAI 的 Codex 在移动端新增编译完成推送通知、断线重连优化和 /fork 命令;Google 的 Antigravity 也推出了 2.0 版本但引发争议。Chrome DevTools for Agents 1.0 正式发布,让 Agent 能真正看见和调试浏览器。
来源:
- @elonmusk: https://x.com/elonmusk/status/2057254622113517793
- @NousResearch: https://x.com/NousResearch/status/2057278565897371856
- @imwsl90: https://x.com/imwsl90/status/2057269669539778729
- @Gorden_Sun: https://x.com/Gorden_Sun/status/2057473493869244917
统计: 扫描时间线条数=360 命中的博主数=42 命中的推文总数=251 加权推文分=200.3 原创推文数=121 RT 推文数=51 抓取尝试次数=2 边界覆盖状态=tail_confidently_crossed_target_boundary