X 平台 4月29日 AI 简讯｜DeepSeek识图模式速度引热议，GPT Image 2与Codex组合引爆创意应用

DeepSeek 识图模式速度引发热议

多位博主提到，DeepSeek 新上线的"识图模式"响应速度极快，用户上传图片后能"秒出"反推提示词，vista8 在实测后表示速度"快到不行"，且网页复刻还原度相当不错，已可投入前端开发使用。vista8 还引用 PKUCXK 的分享提到该功能已灰度推送，但对网页单独设置"识图模式"Tab 的交互设计提出了优化建议。另有测试表明，该模式的出图似乎不经过思考过程，"系统1凭感觉直出"。同时，vista8 分享了一个 API 工具可将 DeepSeek Web 对话能力转换为兼容 OpenAI、Claude 与 Gemini 的接口。

来源：

GPT Image 2 + Codex 成"王炸组合"，引发游戏与创意应用热潮

多位博主提到，cellinlab 发布了一条高互动量内容：仅用两段提示词，让 Codex 在出门吃牛肉面的时间内自动开发完成了 Web 版"完蛋！我被美女包围了"游戏，展示了 GPT Image 2 生成全景图直接驱动游戏场景的流程。cellinlab 还用数据说明"发一视频比发四格图更容易获得流量"，并分享了提示词与源码（均已开源）。此外，该组合也被用于鸡尾酒调酒教程图、装修效果图等各类创意设计图的生成。cellinlab 多次实测后总结：对 GPT Image 2 的挖掘是"无尽的"。

来源：

@cellinlab: https://x.com/cellinlab/status/2049493248784433547 | https://x.com/cellinlab/status/2049317447556378717 | https://x.com/cellinlab/status/2049460927121244510

OpenAI 与 AWS 扩大合作，GPT-5.5、Codex 及托管智能体登陆 Bedrock

有博主提到，dotey 转发并解读了 OpenAI 与 AWS 的合作公告：OpenAI 全线模型（含 GPT-5.5）、Codex 编程工具及 Bedrock Managed Agents 均以限量预览形式接入 Amazon Bedrock。企业客户可在熟悉的 AWS 环境中直接调用 OpenAI 模型，复用现有安全策略、合规流程和账单体系，Codex 费用可纳入 AWS 云消费承诺额度。dotey 还指出，Bedrock 此前已接入 Claude、Llama 等模型，OpenAI 的加入使其几乎集齐所有主流前沿模型。

来源：

@dotey: https://x.com/dotey/status/2049265362718351779

Ghostty 宣布离开 GitHub——18年老用户的"断舍离"

有博主提到，dotey 详细转发并注释了 Mitchell Hashimoto（GitHub 第 1299 号用户、HashiCorp 联合创始人、Vagrant 与 Terraform 缔造者）的声明：Ghostty 终端模拟器将从 GitHub 迁出。Hashimoto 透露，过去一个月他每天在日记本标记"GitHub 宕机影响工作"的日子，几乎每天都有 X；宣布当天 GitHub Actions 又有两小时无法做代码审查，"一个每天都会把你挡在外面几个小时的平台，已经不适合做严肃的开发工作了"。他强调该决定酝酿数月，与 4 月 27 日大规模 ElasticSearch 宕机仅为时间巧合，迁移目标供应商仍在洽谈中。

来源：

@dotey: https://x.com/dotey/status/2049219569445732851

Warp 终端宣布开源：AGPL 协议下的"AI 优先"协作实验

有博主提到，dotey 报道了 AI 终端工具 Warp（超 70 万开发者使用）正式开源客户端代码（AGPL），托管于 GitHub，OpenAI 为创始赞助商。Warp 同步上线了支持更多开源模型（包括 Kimi、MiniMax、Qwen）的更新、终端界面定制功能以及跨设备配置同步。dotey 特别指出此次开源的亮点：社区贡献流程本身是"AI 优先"的——Warp 自家云端 AI 平台 Oz 负责写代码、做规划、跑测试，人管方向、AI 干活。不过开源范围仅限客户端，服务端代码仍闭源。

来源：

@dotey: https://x.com/dotey/status/2049179379737960669

多智能体世界模型 88 页综述发布：视觉逼真度远超物理忠实度

有博主提到，dotey 转发并详细解读了港科大、新加坡国立、牛津等十余所高校联合发布的 88 页综述《Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond》。综述提出"能力等级 × 领域法则"二维框架，将智能体分为 L1 预测器、L2 模拟器（遵守领域规则）、L3 进化器（主动修正模型）三级，涵盖物理、数字、社会、科学四类领域。核心发现：视频生成模型物理一致性测试最高通过率仅 26.2%；LLM 社会模拟可复现舆论极化但存在系统性趋同偏差；A-Lab 用机械臂在 17 天内完成 353 次闭环实验合成 36 种化合物为 L3 较成熟案例。

来源：

@dotey: https://x.com/dotey/status/2049187740084731991

AI 垂类模型的"护城河"是否成立——垂类本质是递归迭代

多位博主讨论 AI 垂类工具或垂类数据能力的真正价值。有观点指出，Adobe 被 Claude Design 吊打即为垂类护城河未必成立的例证，"AGI 面前，不能用传统那套逻辑思考了"。cellinlab 在回复中进一步延伸：垂类本质上是人类在 n 次迭代中产出的 n+1，当 AI 掌握了 n 的 context 去"抽卡"，资源充足时到达 n+1 只是时间问题，且还可以并发——"递归，无尽的递归"。另一条讨论则指出：流量可以带来 attention，但是 attention 不是 trust。

来源：

@cellinlab: https://x.com/cellinlab/status/2049510851061932211 | https://x.com/cellinlab/status/2049516946123796833

其他值得关注的动态

有博主提到多个值得记录的单点动态。VibeVoice-ASR 实测方面：dotey 引用 Simon Willison 在 Mac 上的测试报告——微软开源的 9B 参数语音识别模型（Whisper + 说话人分离二合一），量化版在 128GB M5 Max MacBook 上转写 1 小时播客约 9 分钟，但 Prefill 阶段内存峰值达 61.5GB，64GB 以下机器无法运行量化版。也有测试反馈指出效果"没有说的那么强，而且慢"，本地运行效果最佳方案仍为 pyannote+qwenASR。GEO 专项论文方面：vista8 引用姚老师和张凯的合作论文（全球第二篇 GEO 专项论文），基于 602 条 Prompt、21143 条引用、23745 条 AI 抓取记录完成，用科学方法做 GEO。AI 终端 Skill 方面：vista8 分享了一个"提示词优化大师 Skill"（已获 6k+ Star），针对不同工具（Claude Code、Cursor、Midjourney 等）给出差异化提示词优化。Claude + Blender 连接器方面：cellinlab 介绍 Claude 可借助新版 Blender 连接器直接调试场景、构建工具或批量修改对象属性。AI 依赖风险方面：vista8 分享 OpenAI 25 研究员离职文章，提及创建正确评估方法有时比创建高分模型更有影响力，以及高度依赖 AI 会产生的心理依赖、无力感、自主性丧失三大问题。

来源：

@dotey: https://x.com/dotey/status/2049279099454292283 | https://x.com/dotey/status/2049285974622937260
@vista8: https://x.com/vista8/status/2049321467737960564 | https://x.com/vista8/status/2049414122404819018
@cellinlab: https://x.com/cellinlab/status/2049189681401925789
@vista8: https://x.com/vista8/status/2049161509931307313