DeepSeek 识图模式速度引发热议
多位博主提到,DeepSeek 新上线的"识图模式"响应速度极快,用户上传图片后能"秒出"反推提示词,vista8 在实测后表示速度"快到不行",且网页复刻还原度相当不错,已可投入前端开发使用。vista8 还引用 PKUCXK 的分享提到该功能已灰度推送,但对网页单独设置"识图模式"Tab 的交互设计提出了优化建议。另有测试表明,该模式的出图似乎不经过思考过程,"系统1凭感觉直出"。同时,vista8 分享了一个 API 工具可将 DeepSeek Web 对话能力转换为兼容 OpenAI、Claude 与 Gemini 的接口。
来源:
- @vista8: https://x.com/vista8/status/2049491607356080580 | https://x.com/vista8/status/2049485853995712994 | https://x.com/vista8/status/2049428185008464245
- @vista8: https://x.com/vista8/status/2049489225792532970
GPT Image 2 + Codex 成"王炸组合",引发游戏与创意应用热潮
多位博主提到,cellinlab 发布了一条高互动量内容:仅用两段提示词,让 Codex 在出门吃牛肉面的时间内自动开发完成了 Web 版"完蛋!我被美女包围了"游戏,展示了 GPT Image 2 生成全景图直接驱动游戏场景的流程。cellinlab 还用数据说明"发一视频比发四格图更容易获得流量",并分享了提示词与源码(均已开源)。此外,该组合也被用于鸡尾酒调酒教程图、装修效果图等各类创意设计图的生成。cellinlab 多次实测后总结:对 GPT Image 2 的挖掘是"无尽的"。
来源:
- @cellinlab: https://x.com/cellinlab/status/2049493248784433547 | https://x.com/cellinlab/status/2049317447556378717 | https://x.com/cellinlab/status/2049460927121244510
OpenAI 与 AWS 扩大合作,GPT-5.5、Codex 及托管智能体登陆 Bedrock
有博主提到,dotey 转发并解读了 OpenAI 与 AWS 的合作公告:OpenAI 全线模型(含 GPT-5.5)、Codex 编程工具及 Bedrock Managed Agents 均以限量预览形式接入 Amazon Bedrock。企业客户可在熟悉的 AWS 环境中直接调用 OpenAI 模型,复用现有安全策略、合规流程和账单体系,Codex 费用可纳入 AWS 云消费承诺额度。dotey 还指出,Bedrock 此前已接入 Claude、Llama 等模型,OpenAI 的加入使其几乎集齐所有主流前沿模型。
来源:
Ghostty 宣布离开 GitHub——18年老用户的"断舍离"
有博主提到,dotey 详细转发并注释了 Mitchell Hashimoto(GitHub 第 1299 号用户、HashiCorp 联合创始人、Vagrant 与 Terraform 缔造者)的声明:Ghostty 终端模拟器将从 GitHub 迁出。Hashimoto 透露,过去一个月他每天在日记本标记"GitHub 宕机影响工作"的日子,几乎每天都有 X;宣布当天 GitHub Actions 又有两小时无法做代码审查,"一个每天都会把你挡在外面几个小时的平台,已经不适合做严肃的开发工作了"。他强调该决定酝酿数月,与 4 月 27 日大规模 ElasticSearch 宕机仅为时间巧合,迁移目标供应商仍在洽谈中。
来源:
Warp 终端宣布开源:AGPL 协议下的"AI 优先"协作实验
有博主提到,dotey 报道了 AI 终端工具 Warp(超 70 万开发者使用)正式开源客户端代码(AGPL),托管于 GitHub,OpenAI 为创始赞助商。Warp 同步上线了支持更多开源模型(包括 Kimi、MiniMax、Qwen)的更新、终端界面定制功能以及跨设备配置同步。dotey 特别指出此次开源的亮点:社区贡献流程本身是"AI 优先"的——Warp 自家云端 AI 平台 Oz 负责写代码、做规划、跑测试,人管方向、AI 干活。不过开源范围仅限客户端,服务端代码仍闭源。
来源:
多智能体世界模型 88 页综述发布:视觉逼真度远超物理忠实度
有博主提到,dotey 转发并详细解读了港科大、新加坡国立、牛津等十余所高校联合发布的 88 页综述《Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond》。综述提出"能力等级 × 领域法则"二维框架,将智能体分为 L1 预测器、L2 模拟器(遵守领域规则)、L3 进化器(主动修正模型)三级,涵盖物理、数字、社会、科学四类领域。核心发现:视频生成模型物理一致性测试最高通过率仅 26.2%;LLM 社会模拟可复现舆论极化但存在系统性趋同偏差;A-Lab 用机械臂在 17 天内完成 353 次闭环实验合成 36 种化合物为 L3 较成熟案例。
来源:
AI 垂类模型的"护城河"是否成立——垂类本质是递归迭代
多位博主讨论 AI 垂类工具或垂类数据能力的真正价值。有观点指出,Adobe 被 Claude Design 吊打即为垂类护城河未必成立的例证,"AGI 面前,不能用传统那套逻辑思考了"。cellinlab 在回复中进一步延伸:垂类本质上是人类在 n 次迭代中产出的 n+1,当 AI 掌握了 n 的 context 去"抽卡",资源充足时到达 n+1 只是时间问题,且还可以并发——"递归,无尽的递归"。另一条讨论则指出:流量可以带来 attention,但是 attention 不是 trust。
来源:
- @cellinlab: https://x.com/cellinlab/status/2049510851061932211 | https://x.com/cellinlab/status/2049516946123796833
其他值得关注的动态
有博主提到多个值得记录的单点动态。VibeVoice-ASR 实测方面:dotey 引用 Simon Willison 在 Mac 上的测试报告——微软开源的 9B 参数语音识别模型(Whisper + 说话人分离二合一),量化版在 128GB M5 Max MacBook 上转写 1 小时播客约 9 分钟,但 Prefill 阶段内存峰值达 61.5GB,64GB 以下机器无法运行量化版。也有测试反馈指出效果"没有说的那么强,而且慢",本地运行效果最佳方案仍为 pyannote+qwenASR。GEO 专项论文方面:vista8 引用姚老师和张凯的合作论文(全球第二篇 GEO 专项论文),基于 602 条 Prompt、21143 条引用、23745 条 AI 抓取记录完成,用科学方法做 GEO。AI 终端 Skill 方面:vista8 分享了一个"提示词优化大师 Skill"(已获 6k+ Star),针对不同工具(Claude Code、Cursor、Midjourney 等)给出差异化提示词优化。Claude + Blender 连接器方面:cellinlab 介绍 Claude 可借助新版 Blender 连接器直接调试场景、构建工具或批量修改对象属性。AI 依赖风险方面:vista8 分享 OpenAI 25 研究员离职文章,提及创建正确评估方法有时比创建高分模型更有影响力,以及高度依赖 AI 会产生的心理依赖、无力感、自主性丧失三大问题。
来源:
- @dotey: https://x.com/dotey/status/2049279099454292283 | https://x.com/dotey/status/2049285974622937260
- @vista8: https://x.com/vista8/status/2049321467737960564 | https://x.com/vista8/status/2049414122404819018
- @cellinlab: https://x.com/cellinlab/status/2049189681401925789
- @vista8: https://x.com/vista8/status/2049161509931307313
统计:扫描时间线条数 360 | 命中博主数 33 | 命中推文总数 172 | 加权推文分 136.45 | 原创推文数 75 | RT 推文数 33 | 抓取尝试次数 2 | 边界覆盖状态 已完全覆盖