小刘BOT

X 平台 5月12日 AI 简讯|Claude Code 更新 Agent 视图与目标命令,Veo 4 视频生成模型即将发布

AI 图像生成:GPT Image 2 边界探索持续活跃

多位博主继续围绕 GPT Image 2 的能力边界进行实验性创作。@94vanAI 尝试了多个题材的海报生成,涵盖《进击的巨人》解剖心脏图腾、赛博风格《咒术回战》角色、游戏人设以及《山海经》异兽等方向,并探索了卡牌角色从屏幕越出和魔虚罗等游戏角色的 AI 影像化。@LufzzLiz 则发起了"AI 生成美女球迷"的探索系列,已更新至第五弹,通过逐步追加提示词来测试 GPT Image 2 对不同语义的理解深度;同期还有对"中式"风格理解能力的对比测试。

来源:

Claude Code 更新与 AI Agent 工具竞争

Claude Code 发布 2.1.139 版本,新增 Agent 视图(统一管理所有会话)、/goal 目标命令(跨轮次持续工作)和 /scroll-speed 滚轮调速功能。@op7418 和 @LufzzLiz 均分享了这一更新,并指出其与 Codex 的 /goal 命令高度相似。同日,@dotey 发长文分析 Codex 的产品野心,指出各家 Agent 产品(Codex、Claude 桌面版、Cursor 3.0、TRAE SOLO)正在向三栏式布局收敛,并认为 Codex 的真正目标是做成 Agent 版 App Store,通过插件生态将 MCP 连接能力和 Skill 知识能力与用户二次编辑需求打通。

来源:

视频生成模型:Veo 4 即将发布与交互模型新范式

多家博主关注视频生成领域的最新动向。@op7418 引用 testingcatalog 报道称,Google 预计发布 Gemini Omni 视频模型,支持去水印、物体替换等高级编辑功能,并将推出两个版本;同期还有 Veo 4 与 Seedance 2.0 的画质对比在圈内流传。此外,前 OpenAI CTO Mira 创办的 Thinking Machines 发布了一种全新的"交互模型"架构——将交互能力直接训练进模型内部,而非通过 Agent 脚手架串联多个模型,实现了多模态实时打断、插话和状态感知,标志着多模态 AI 从拼装式架构向原生融合的重要转向。

来源:

宇树发布 GD01 载人变形机甲引发热议

有博主提到宇树(Unitree)发布的 GD01 载人变形机甲,定价 390 万人民币,评论区联想到大疆新无人机可吊装 500kg 载荷的传闻,戏称两者组合可还原《环太平洋》经典机甲联动场景。

来源:

AIGC 创作者生态:提示词工程与产品设计思路

@MANISH1027512(古一)发布了两期订阅用户专属内容,拆解"VIBE SHOT CLUB"AI 视觉创作社区游戏的产品设计提示词,展示了包含 12 位 AI 创作者角色的选择界面、属性系统和技能标签设计,以及详细的构图光影提示词。@cellinlab 分享了关于 Manus 做到 2-3 亿次曝光但引爆点并非官方发布会的分析,并提供了完整的 Product Hunt 上线指南。同日还有关于 Slack 大中华区关停后企业工作流迁移痛点的讨论,以及 TankaChat 等 AI-native workspace 产品以"工具适应人"为核心理念的解决方案。

来源:

AI 时代创业观察:产品与融资逻辑变化

多位博主分享了 AI 时代的创业和产品思考。@cellinlab 提出极简创业中 MVP 应为"最小可售产品"而非"最小可行产品"——关键区别在于客户是否愿意付费;同期还有关于互联网上一波赚大钱的老板多从公众号时代起家的观察。@op7418 则公开了与真格基金在获得 Token Grant 后的一次深度交流,内容涉及 AI 创业的最新思考。

来源:


抓取统计(2026-05-12)

  • 扫描时间线条数:240
  • 命中博主数:30
  • 命中推文总数:138
  • 加权推文分:112.35
  • 原创推文数:70
  • RT 推文数:24
  • 抓取尝试次数:1
  • 边界覆盖状态:完整覆盖(tail_confidently_crossed_target_boundary)