Google I/O 2026 发布多项产品,Gemini 3.5 Flash 速度快但争议不断
Google I/O 2026 发布了 Gemini 3.5 Flash、Antigravity 2.0、Gemini Omni、Gemini Spark、Ask YouTube 等多项产品。Gemini 3.5 Flash 在 coding 和 agentic 能力上超过上一代旗舰 Gemini 3.1 Pro,生成速度极快,有博主测到 TPU 8i 上约 800-1480 tok/s。但多位博主指出其知识截止日期为 2025 年 1 月(17 个月前),且价格是 Gemini 3 Flash 的 3 倍。Antigravity 2.0 被多位博主指出界面和功能与 Codex 高度相似,甚至官宣视频中出现了 Codex 的文件夹截图。Ask YouTube 功能获得较好评价,可直接跳转视频相关时刻。Gemini Spark 被描述为云端 Agent 入口,类似云端运行的 Claude Code。Google 还发布了第 8 代 TPU,训练芯片 TPU 8t 和推理芯片 TPU 8i 分别针对不同场景设计。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2057056672913486023
- @Gorden_Sun: https://x.com/Gorden_Sun/status/2057002467234345453
- @op7418: https://x.com/op7418/status/2056904254175281353
- @xiaohu: https://x.com/xiaohu/status/2056886402785411247
Meta 全体大会录音泄露:扎克伯格称以员工为训练对象训练 AI,同时裁员 10%
Meta 全体大会的录音被泄露。在会上扎克伯格告诉员工,Meta 正在以内部工程师为训练对象来训练 AI,理由是公司员工平均智力高于外部劳动力,让内部人员构建工具和解决编码任务将比竞争对手更快地提升模型编码能力。Meta 人力资源主管确认公司将裁减 10% 的员工,约 8,000 名员工将在凌晨 4 点通过电子邮件被解雇,同时将超过 7,000 人调往围绕 AI 的新项目工作。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2057098481756676557
- @MorePerfectUS: https://x.com/MorePerfectUS/status/2056842597117636890
GitHub 遭入侵:恶意 VS Code 扩展导致内部仓库外泄,约 3,800 个仓库受影响
GitHub 检测到一台员工设备因被植入恶意代码的 VS Code 扩展而被入侵。GitHub 已移除该恶意扩展版本、隔离终端并启动事故响应。目前评估该活动仅涉及对 GitHub 内部仓库的外泄,攻击者声称的约 3,800 个仓库与官方调查结论一致。GitHub 已更换关键密钥,优先处理影响最大的凭证,并继续分析日志和监控后续活动。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2056979772232835533
- @github: https://x.com/github/status/2056884788179726685
DeepSeek 组建 Code 团队,正在北京招聘产品经理和研发工程师
DeepSeek 研究员发推表示 DeepSeek 正在组建一个新的 Code Harness 团队,从零打造 Code Harness(可称为 DeepSeek Code)。工作地点在北京,开放两个岗位:Harness 产品经理和 Harness 研发工程师。这意味着 DeepSeek 正在进入 AI 编程工具领域。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2057099281765691594
- @victor207755822: https://x.com/victor207755822/status/2057064415300841626
阿里发布真武 M890 AI 芯片及 128 卡超节点服务器
在 2026 阿里云峰会上,阿里发布基于平头哥新一代 AI 芯片真武 M890 的 128 卡超节点服务器,搭载互联芯片 ICN Switch 1.0,通信时延低至百纳秒级。这使得 128 块 AI 芯片可以作为一台计算机运行,满足 Agentic 时代对并发推理和大模型训练的需求。阿里云智能事业群高级副总裁表示阿里云已为 Agentic 时代做好了全栈准备。
来源:
OpenAI 宣布与新加坡政府合作,投资 3 亿新元建立首个海外应用 AI 实验室
OpenAI 承诺投资 3 亿新元以发展新加坡的人工智能能力,核心是在新加坡建立应用人工智能实验室,这是 OpenAI 在美国之外的第一个此类机构。OpenAI 将在未来几年创造 200 多个在新加坡的技术职位,并将新加坡作为面向前线部署工程师的全球枢纽之一。同时推出前置部署工程师培训计划,并探索面向 AI 初创企业的加速器项目。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2056976182995005877
- @gabrielchua: https://x.com/gabrielchua/status/2056956065795985853
Cerebras 运行千亿参数 Kimi K2.6 达到约 1000 tok/s,刷新前沿模型速度记录
Cerebras 在企业试运行中运行 Kimi K2.6(1000B 参数超大模型),达到约 1,000 tokens/s 的速度,据 Artificial Analysis 测量这是有史以来最快的前沿模型性能。Cerebras 上市首日大涨 68%,市值冲到 670 亿美元。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2056957427933995374
- @cerebras: https://x.com/cerebras/status/2056778123329274279
Nous Research 发布 CNA 方法:无需训练稀疏自编码器即可引导 LLM 行为
Nous Research 发布 Contrastive Neuron Attribution (CNA),一种通过识别和消融 MLP 稀疏电路来引导 LLM 行为的方法。给定一小组对比提示对,CNA 能隔离激活差异最大的前 0.1% MLP 神经元,消融该小电路即可移除目标行为而不影响模型其他能力。该方法已在 8 个指令微调模型上验证,包括 Llama-3.1-70B 和 Qwen2.5-72B。研究发现拒绝机制并非预训练模型中固有的,而是对齐微调将其连接为行为门控。
来源:
- @NousResearch: https://x.com/NousResearch/status/2056778746716107193
Railway 被 Google Cloud 封号导致服务中断 6 小时
服务超过 200 万开发者、月部署超过 1000 万次的 Railway 平台被其上游 Google Cloud 封号,导致服务中断约 6 小时,没有原因和解释。Railway 今年刚完成 1 亿美元 B 轮融资。Nous Research 也确认其 Nous Portal 用户受到影响。这一事件引发了关于云服务商单方面封号风险的讨论。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2056958635612504469
- @Railway: https://x.com/Railway/status/2056883076496789854
- @NousResearch: https://x.com/NousResearch/status/2056878995975630980
OpenAI 向 YC 当期创业公司提供 200 万美元 Token 换取股权
Sam Altman 在 Y Combinator 活动上宣布向当前批次的每家 YC 创业公司提供价值 200 万美元的 OpenAI Token,以换取股权。这一举措被视为 OpenAI 在开发者生态中的重大推广动作。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2056982131986051153
- @bosmeny: https://x.com/bosmeny/status/2056914385814401238
HuggingFace 推出硬件追踪功能,展示开源 AI 生态的真实硬件使用情况
HuggingFace 推出硬件追踪功能,展示真正驱动开源 AI 的硬件使用情况,包括热门 GPU 与 CPU、显存分布、推理硬件趋势等。这被视为开源 AI 生态系统硬件透明度的标志性事件。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2057102544724529394
- @julien_c: https://x.com/julien_c/status/2057084823097794772
Midjourney 创始人称使用 Google TPU 训练模型可能让研究落后一年
Midjourney 创始人 David Holz 表示,使用 Google TPU 来训练模型可能让他们的研究进度落后了大约一年。如果能回到过去,他会从一开始就尽量只用 Nvidia 卡。但他否认被 Google 骗了,表示可能是自己欺骗了自己,且许多最成功的模型都是在这些芯片上制作的。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2057064580178968663
- @DavidSHolz: https://x.com/DavidSHolz/status/2056898979745714243
Gemini 3.5 Flash 语音和任务代理基准测试表现分化
开发者 @kwindla 发布的语音和任务代理基准测试显示,Gemini 3.5 Flash 成为任务代理基准测试中的总体得分最高者,但在语音代理场景中所有 Gemini 3 模型都太慢无法良好工作。Claude Haiku 4.5 仍然是语音代理表现最好的模型,TTFT 低于 700 毫秒。Gemini 3.5 Flash 在高思考预算下表现优异,但实际成本比 GPT-5.4 和 Claude Sonnet 4.6 更高。基准测试还显示,低推理设置并不总是省钱,因为犯错更多需要更多 token 完成任务。
来源:
- @MaxForAI: https://x.com/MaxForAI/status/2056975071739339012
- @kwindla: https://x.com/kwindla/status/2056959360837030344
统计: 扫描时间线条数=480 命中的博主数=39 命中的推文总数=283 加权推文分=226 原创推文数=123 RT 推文数=51 抓取尝试次数=3 边界覆盖状态=tail_confidently_crossed_target_boundary