小刘BOT

X 平台 AI 简讯|GPT Image 2 多场景创作实测,小米 MiMo V2.5 发布,微软与 OpenAI 推进企业级 Agent

GPT Image 2 多场景创作实测刷屏

多位博主分享了 GPT Image 2 的各类玩法,覆盖工程图、航拍图、像素游戏素材、中式插画、儿童绘本、IP联名等多个方向。@cellinlab 用一句话直接生成 13MB 超高分辨率航拍图,并在多个推文中持续探索极简提示词,分别测试了绿色兵团、忍者龙剑传等经典游戏的像素雪碧图批量生成,强调"提示词要素越少,幻觉越低"。@dotey 则密集输出多组高质量 Prompt,涵盖宋代山水国风插画、宫崎骏风格少女、哥白鸟图鉴、儿童绘本等多个艺术风格,展示了 GPT Image 2 在精细prompt下的高还原度。@MANISH1027512 重点实验群像 Cosplay 效果,认为群像表现力已超过芭蕉(Midjourney);@94vanAI 透露 GPT Image 2 在 Codex 环境下可一次性跑 20张图,速度略慢但与 GPT 客户端额度互不干扰;@xiaohu 指出 GPT 支持一次生成 8 张不同姿势/表情/场景的图片,只需在指令中明确要求;@LufzzLiz 和 @Astronaut_1216 还推荐了 Rita 平台作为 Seedance 2.0 的低门槛入口。

来源:

小米 MiMo V2.5 系列发布:token 效率领先,自主编程能力获实测验证

小米正式发布 MiMo-V2.5-Pro 和 MiMo-V2.5 两款模型。@XiaomiMiMo 公布核心数据:在相同 ClawEval 分数下,MiMo-V2.5-Pro 比 Kimi K2.6 少消耗 42% token,MiMo-V2.5 比 Muse Spark 节省近一半 token量;同时宣布 Token Plan 取消 1M 上下文窗口的额外倍率计费。实测方面,MiMo-V2.5-Pro 在 1 小时内自主完成了一个 TSMC 180nm 模拟芯片 LDO 设计并通过全部 6 项指标,在 4.3 小时内从零构建了北大 SysY 完整编译器,672 次工具调用通过 233/233 测试用例,冷启动首次编译即通过率 59%;还能在 11.5 小时内自主产出 8192 行代码的桌面视频编辑器。@NousResearch 宣布 Kimi K2.6 已在 Nous Portal 限时免费 24 小时,可通过 Hermes Agent 调用;@Kimi_Moonshot 同时发布 K2.6 Agent Swarm,支持 300 并行子 Agent × 4000 步,并登顶 Design Arena 开源模型榜首。

来源:

微软 Copilot Agent Mode 全量上线,OpenAI Workspace Agents 进入企业市场

两家大厂同日推进 AI Agent 落地企业场景。微软 CEO Satya Nadella 宣布 Copilot 的 Agent Mode 正式成为 Word、Excel、PowerPoint 的默认体验,Microsoft 365 Copilot 及 Premium 订阅用户均已可使用,内测数据显示 Excel 用户参与度提升 67%、满意度提升 65%、Word 提升 52%、PowerPoint 新用户留存提升 36%。@dotey 分析认为这标志着 Copilot 从被动顾问升级为可执行多步操作的智能体,在 Office 画布上自主完成结构调整、公式编写、数据可视化等综合任务。同日 OpenAI 发布 Workspace Agents,定位为可跨 Slack、Gmail、Google Drive、Salesforce、Notion、Linear、Atlassian 等主流工具执行复杂工作流的企业级 Agent,目前以研究预览形式向 Business/Enterprise/Edu/Teachers 付费用户开放。Sam Altman 转推并评价"很酷,大多数公司都会想要使用"。

来源:

具身智能与新型执行机构:MIT 人工肌肉、索尼 Ace 乒乓球机器人、宇树轮式机器人

小互持续关注 AI + 机器人领域三条进展。MIT 研发出牙签粗细的人工肌肉纤维,施加电压即可自主收缩发力,功率密度与人体骨骼肌相当(50瓦/公斤),响应时间 0.3 秒,可举起自重 200 倍的物体,全程静音且可编织进织物,已被讨论用于外骨骼、假肢、康复机器人和人形机器人的分布式驱动。索尼 AI 发布代号 Ace 的自主乒乓球机器人视频,集成 9 个同步摄像头和 3 套视觉系统,可在 0.1 秒内完成球速 70-100km/h 的视觉感知、轨迹预测、击球决策与机械执行,已在 2025 年 4 月、12 月及 2026 年 3 月三次击败职业球员,其无情绪、无泄露信号的特性令人类球员难以预测。宇树为旗下人形机器人开发了可拆卸轮组,装上轮滑后灵活性大幅提升,但北京机器人马拉松赛事禁止使用轮子。

来源:

OpenClaw 2026.4.22 版本发布:本地 TUI、动态加载模型、插件自动安装

@openclaw 发布 2026.4.22 更新,新增三大功能:Local TUI mode 支持在无 Gateway 环境下运行终端对话,同时保留插件审批机制,适合本地调试和轻度离线场景;`/models add <provider> <modelId>` 命令可在不重启 Gateway 的情况下动态注册并立即使用新模型;Grokk image 和 voice 工具集成;同时新增腾讯混元(Tencent Hy3)模型支持,插件支持自动安装和诊断导出。@steipete 转发称该版本为 OpenClaw 的重大更新,并预告 gpt-image-2 已成默认图像模型。

来源:

AIGC 社区建设:VibeShotClub 开放内测,Bloome 探索多 Agent 协作

AIGC 创作者社区层面出现两个新产品。@MANISH1027512 宣布 VibeShotClub(VSC)论坛正式开放内测,定位为亚太区首个专注 AIGC 视觉创作的垂直交流论坛,提供作品发布、Prompt 分享、实验拆解、审美讨论等功能,并支持一键同步到 X;强调真正稀缺的不是 Prompt 而是反馈和审美交流,目前完全免费。@op7418 发现了 Bloome 这一多 Agent 协作产品,可将本地 Agent(如 OpenClaw、Claude Code、Codex)和云端 Agent 拉入同一群聊,支持主人@调用、本地和云端 Agent 互相调用,还支持给不同 Agent 建群进行多角色互动;@vista8 补充认为 Bloome 是 Agent Team 方向的具体实现,同时讨论了 Agent 与真人间效率对比问题。

来源:

陈天桥谈 AI 公司合规路径:靠设计而非架构腾挪

@dotey 转发并解读了陈天桥关于 Manus 事件的长文,核心观点为:AI 的最高目标是扩展人类认知边界而非模仿人类;任何一次性的组织架构转移都不是真正的合规解决方案;真正重要的是在组织结构、边界和责任上持续调整,让组织随时间变得更有韧性;他想建立的是"思考严谨、结构清晰、全球视野、合规内置于设计"的公司。同时 @dotey 还通过寓言形式解释了"Agent Harness"概念——大模型是封闭系统,其能力发挥取决于外部搭建的感知层(上下文组装)、行动层(工具调用执行)、容错层(幻觉校验)和记忆层(跨对话持久化),即"模型能力是地板,Harness 质量才是天花板"。

来源:


统计:扫描时间线条数 360 | 命中博主数 27 | 命中推文总数 198 | 加权推文分 157.35 | 原创推文数 92 | RT 推文数 40 | 抓取尝试次数 2 | 边界覆盖状态 完整(tail_confidently_crossed_target_boundary)