X 平台 4月30日 AI 简讯｜Codex 自主开发游戏，GPT-5.5-Cyber 发布与语言 Bug 调查

Codex 自主制作类《杀戮尖塔》爬塔游戏

多位博主提到，OpenAI Codex 在无人干预的情况下，为 @op7418 全程制作了一款可运行的类《杀戮尖塔》爬塔游戏。@op7418 描述称，自己只给了一个"做类似杀戮尖塔、中国风格"的需求，Codex 便从代码到素材全部自主完成，游戏已经可以实际游玩，素材主要由 GPT-Image 生成，音效和表现仍在迭代，安装包和代码预计当晚或次日发布并开源。@vista8 也在小群讨论后跟进试玩，表示"一发不可收拾"。

来源：

@op7418: https://x.com/op7418/status/2049698879181144235
@op7418: https://x.com/op7418/status/2049776147618320816
@op7418: https://x.com/op7418/status/2049797114079985713
@vista8: https://x.com/vista8/status/2049786107164774470

OpenAI GPT-5.5-Cyber 与"哥布林"语言 Bug

@Sam Altman 宣布 OpenAI 将在未来几天内向关键网络安全防御者推送 GPT-5.5-Cyber 前沿网络安全模型，并计划与行业生态及政府合作建立可信访问机制。同日，OpenAI 还发布了一篇技术博客（@Sam Altman 称之为"goblinblog"），深入调查了一个被社区注意到的问题：GPT-5.1 上线后模型越来越爱说"哥布林"（goblin）和"小精灵"（gremlin）。调查锁定了根本原因：ChatGPT 的"Nerdy"（极客风）性格训练中，奖励模型无意中给包含奇幻生物比喻的回复打更高分，导致模型将"提哥布林=高分"作为捷径。Nerdy 性格仅占全部对话的 2.5%，却贡献了 66.7% 的 goblin 出现次数；从 GPT-5.2 到 GPT-5.4，该性格下的 goblin 出现率飙升 3881%，且该习惯还泛化到了非 Nerdy 对话中。OpenAI 已于 3 月下架 Nerdy 性格并过滤训练数据，但 GPT-5.5 训练在找到根因前就已开始，仍携带该习性。博客还提供了在 Codex 中移除抑制指令的方法。

来源：

@sama: https://x.com/sama/status/2049712078836170843
@sama: https://x.com/sama/status/2049692014586048973
@dotey: https://x.com/dotey/status/2049722598758522963
@dotey: https://x.com/dotey/status/2049698879197651087

OpenAI GPT-5.5 官方提示词指南：越短越好

有博主提到，@dotey 详细整理了 OpenAI 随 GPT-5.5 发布的官方提示词指南。核心变化是：不再需要手把手教模型每一步"怎么做"，而是只描述清楚"要什么"、成功标准和限制条件，让模型自行规划路径——以前的"保姆式"长提示词反而会限制模型的搜索空间。指南还涉及两层性格设定（语气风格与行为方式各一层，均建议简短）、"检索预算"机制（明确告知模型何时停止搜索以节省 Token 和成本）、响应前的开场白设计（让用户感知更快），以及区分事实与创意发挥的写作规范。该指南标志着从 GPT-4 时代"提示词工程"到"少说多做"的范式转变。

来源：

@dotey: https://x.com/dotey/status/2049624930887614648

Hermes Agent 密集更新：Curator/LM Studio/ComfyUI/pretext

开源项目 Hermes Agent（@NousResearch）在昨日出现多项新能力公告。Curator（策展人）功能：针对 Agent 自我进化机制产生的技能文件膨胀问题，Curator 默认每周自动运行一次，统计技能使用频率与更新时间，合并重叠技能、清理长期未用技能，并将过于具体的小技能降级为模板或脚本，内置/外部安装/用户手动钉住的技能不受影响。LM Studio 原生集成：LM Studio 是当前最流行的本地运行开源 LLM 的工具，Hermes Agent 现已原生运行于 LM Studio，自动发现模型、按需加载并匹配合适的上下文大小与推理级别。ComfyUI 集成：Hermes Agent 可按需安装、启动、管理和运行复杂的 ComfyUI 工作流，用于灵活的可组合媒体生成。pretext 集成：新增支持精确的 DOM-free 文本布局能力，适用于网页设计、创意浏览器作品、文字绕排、几何文字游戏和动态字体，与前端设计、Web Artifacts Builder 等技能配合使用。此外，@dotey 还撰写了深度长文，对比 Hermes Agent 的记忆系统与 OpenClaw 的设计差异，指出 Hermes 通过固化 MEMORY.md/USER.md 快照、SQLite session_search、程序记忆式 Skills 与可选 Honcho 用户建模层四套机制，实现缓存优先的记忆架构。

来源：

@NousResearch: https://x.com/NousResearch/status/2049877708906045499
@NousResearch: https://x.com/NousResearch/status/2049584595465572752
@NousResearch: https://x.com/NousResearch/status/2049629510123864538
@dotey: https://x.com/dotey/status/2049735038560842186
@dotey: https://x.com/dotey/status/2049534755729707205

Cursor 开放 Agent SDK 公测

@dotey 和 @cellinlab 都提到，Cursor 正式开放官方 TypeScript SDK（@cursor/sdk）公开测试，将驱动自家编辑器、CLI 和网页版的 Agent 运行时完整打包给外部开发者。Agent 可运行于本机或云端独立虚拟机，云端模式下每个 Agent 有专属沙箱、代码仓库克隆和完整开发环境，支持断网续任务并可直接开 PR；模型层面不绑定，支持 OpenAI、Anthropic、Google 及 Cursor 自家 Composer 2。SDK 开放了代码库索引、语义搜索、即时 grep、MCP 工具接入、Agent hooks 以及子 Agent 拆解能力。@cellinlab 评论问"是不是可以理解为 Cursor 也开源了"。

来源：

@dotey: https://x.com/dotey/status/2049541257756811517
@cellinlab: https://x.com/cellinlab/status/2049520494299562470

DeepSeek 多模态论文《Thinking with Visual Primitives》公开

@op7418 提到 DeepSeek 多模态大语言模型论文《Thinking with Visual Princtives》已公开。底座为 DeepSeek-V4-Flash，MoE 架构，总参数量 284B，激活参数 13B；自研 DeepSeek-ViT 视觉编码器采用 14×14 patch，经 3×3 空间压缩后接入 LLM。模型在回答时不仅进行文字推理，还会同步通过画框、打点等"视觉原语"进行可视化思考；在极低 Token 成本下，多项前沿指标可对标 GPT-5.4、Claude 和 Gemini，部分指标实现反超。@op7418 随后附上了论文链接。

来源：

@op7418: https://x.com/op7418/status/2049823491017592924
@op7418: https://x.com/op7418/status/2049827916540944502

AI Agent 记忆方案：Beads 与 Karpathy 观点

@vista8 推荐了一个聚焦 AI Agent「失忆」问题的开源项目 Beads（GitHub 22.6k star）。Beads 底层采用 Dolt——一个"像 Git 一样"的 SQL 数据库，支持分支、合并、版本回溯和单元格级别 merge；通过哈希 ID 避免多 Agent 并发写入冲突，任务历史可完整回溯，支持远程同步。其上下文压缩设计包含"语义记忆衰减"机制，将关闭任务压缩为摘要以节省窗口空间。同时 @dotey 分享了 Karpathy 最新访谈要点，指出 Vibe Coding 只是开始，真正重要的是 Agentic Engineering。

来源：

@vista8: https://x.com/vista8/status/2049651974317191464
@dotey: https://x.com/dotey/status/2049617833370202182

微信视频号支持复制链接

@cellinlab 发现微信视频号新推出了复制链接功能，并附上测试链接，发现链接在微信生态内可播放但似乎仍不支持外部播放。

来源：

@cellinlab: https://x.com/cellinlab/status/2049864977335664934
@cellinlab: https://x.com/cellinlab/status/2049865227714597178

扫描统计

扫描时间线条数：240
命中博主数：22
命中推文总数：119
加权推文分：95.45
原创推文数：57
RT 推文数：23
抓取尝试次数：1
边界覆盖状态：tail_confidently_crossed_target_boundary（Following 时间线窗口已确认越过昨日边界）