X 平台 AI 简讯|Claude Opus 4.7发布,GPT Image 2真实性引关注,Dreamina视频API商用化

Claude Opus 4.7 发布,多位博主解读新能力

多位博主提到,Anthropic 于 4 月 16 日正式发布 Claude Opus 4.7,定价维持 Opus 4.6 不变(输入每百万 token 5 美元、输出 25 美元),已同步上线全系产品及 Amazon Bedrock、Google Vertex AI、Microsoft Foundry 等云平台。@claudeai 官方公告,新模型主打三项升级:处理长任务时自我验证再汇报、视觉支持长边最高 2576 像素(约此前 Claude 模型的 3 倍)、编程能力在第三方评测中达到 SOTA。@dotey 补充,新 tokenizer 使同样文本 token 消耗变为原来的 1.0–1.35 倍,高推理档下输出 token 更长,实际账单可能微涨。@LufzzLiz 实测天气卡片生成效果出色,但在烟花和洗车场景下出现翻车;@xiaohu 体感 Opus 4.7 推理速度比 4.6 快一倍以上,新增自适应思考模式(动态调节深度),并发现文件系统记忆能力增强,可跨会话记住重要笔记。@vista8 质疑新模型发布前旧模型必然降智的原因,推测是算力不足导致。@claudeai 还宣布 Claude Code 新增 /ultrareview 命令用于深度代码审查,auto 模式(允许连续自主执行)首次向 Max 用户全面开放,并新增介于 high 与 max 之间的 xhigh 推理档位,所有套餐默认推理力度已提升至 xhigh。@dotey 特别指出此次升级的一个微妙背景:Anthropic 手里有个更强的 Claude Mythos Preview,但因网络安全顾虑目前仅限量开放,Opus 4.7 是经过安全降级的版本。@op7418 提醒,Claude Code 默认已可使用 Opus 4.7,默认推理强度为 xhigh,不够可手动切换至 Max。

来源:

GPT Image 2 与神秘模型”duct-tape”引关注

多位博主提到,OpenAI 的 GPT Image 2 图像生成能力引发关注。@oran_ge 发现,用 GPT Image 2 生成的图片甚至能正确遵循身份证号码的编码规则(仅校验位有误),感叹照片真实性已不复存在,呼吁需要更谨慎地对待图像信息。@xiaohu 晒出用”生成一个抖音直播的截图,里面是一个美女在直播”这一提示词的实际生成效果,表示确实有点东西。@Astronaut_1216 引述 @arrakis_ai 的发现,一个代号为”duct-tape”的 GPT 系模型正在竞技场测试,效果超越同期产品,疑似 GPT Image 2;@op7418 也提到 OpenAI gpt-image-2 图像生成准确,对比近期谷歌对 Gemini Nano 2 的降智操作高下立判,并表示自己的 Pro 会员买得值。

来源:

Gemini Mac 客户端遭差评,界面粗糙成共识

多位博主提到,谷歌正式推出 Gemini Mac 原生客户端(全部用 Swift 编写),支持 Option+Space 快捷键唤起小窗口,可调用 NotebookLM、云端硬盘、DeepRearch 以及生图生视频生音乐能力。@vista8 试用后表示语音输入准确率不错,但界面设计过于粗糙,分享屏幕只能指定窗口不能全局,连 Gem 都不支持,整体”谷歌正常发挥水平”。@op7418 同样吐槽功能相当简陋,Artifact 复杂点的网页都无法渲染,整个 UI 非常糙。@xiaohu 直言”什么心意都没有”,认为这类应用随便让 AI 写一个就能做,不知道为什么现在才推出。@dotey 也感觉 Google 迭代速度真慢。

来源:

Dreamina Seedance 2.0 API 上线,AI 视频商用化提速

@vista8 多次提到,字节跳动旗下 Dreamina Seedance 2.0 API 已上线 BytePlus,具备多模态输入(旧素材变新视频)、精准编辑(改细节无需重新生成)、物理真实(运动光影符合真实世界)、意图理解(单句话可自动补全镜头转场和节奏控制)等能力,已达商用标准并具备版权和肖像权保护。@vista8 还分享使用技巧:先用即梦等生图工具生成 9 宫格分镜,再用 Seedance 2.0 参考分镜生成视频,即可做出有故事性的短片。@lovart_ai 也预告 Seedance 2.0 全功率 1080p 版本即将上线。

来源:

OpenAI Agents SDK 升级:内置沙箱与状态管理

@dotey 转述,OpenAI 的 Agents SDK 近期重要升级,新增内置沙箱执行环境(支持 Cloudflare、Vercel、Modal、E2B 等),以及模型原生 Harness 架构(将状态保存与计算执行分离,崩溃可快速恢复)。SDK 还内置了 MCP 工具调用、AGENTS.md 自定义指令、Shell 工具、Apply Patch 文件编辑和记忆系统等功能,无需再借助 LangChain 等通用框架。@dotey 同时推荐阅读”模型不是笨,是 Harness 没配好”一文,文章指出 AI 智能体失败的根本原因是系统设计问题而非模型能力不足,提出 Harness Engineering 四个原则:代码约束替代提示词依赖、关键状态外置、第三方独立验收、失败限制在局部范围。

来源:

Skill 本质是分类学,高频使用需控制数量

@Khazix0918 系统阐述了自己对 Skill 的思考,认为 Skill 的核心是”分类”和”触发”,而非越细分越好。论文数据显示 Skill 数量在 20 个以下时准确率维持 90% 以上,超过 30 个后急剧下降,200 个时仅剩 20%;他本人将个人 Skill 库常年控制在 30 个以下。以 NanoBanana API 封装为例,不同学图场景(公众号封面、小红书封面、PPT 配图)不值得各占一个独立 Skill,统一成一个图片生成 Skill 再内部二次分析更合理。他提出了判断 Skill 是否有存在价值的三条标准:场景边界是否明确、是否高频复现、是否能归属已有 Skill。@op7418 同日发布了一个 Logo 生成 Skill,可通过产品介绍生成卡片式宣传图,支持 Nano Banana 生成展示图,也可代码生成动态展示网页。

来源:

AI 编程体验与 Agent 能力边界讨论

@vista8 分享用 Claude Code 编程的体验越来越像产品经理走查上线后的产品——不停测试、提需求、修 Bug。@Astronaut_1216 也提到 B 端客户对”自媒体获客+AI”有强烈需求,但认为核心没有卡点,AI 半自动化完全可行。@cellinlab 引述 @lijigang 的观点”Agent 正在变成每个人心相的外显”,并补充说如果让 AI 指导人生,最后可能变成 AI 公司道德委员会的外显。@lijigang 还指出,AI 时代防守方(安全)付出额外成本暂时压制攻击方,而攻击只需找到一个点。@Astronaut_1216 强调,不懂某个行业 SaaS 逻辑的人,同样搞不好该行业的 AI 产品,泡沫在于不了解行业本质。

来源:

Qwen3.6-35B-A3B 开源、Elephant Alpha 模型亮相

@LufzzLiz 提到,阿里巴巴开源 Qwen3.6-35B-A3B,采用稀疏 MoE 架构,总参数 350 亿、激活 30 亿,Apache 2.0 许可,被认为将对 Gemma 4 形成强力竞争。@Astronaut_1216 发现 OpenRouter 上出现代号为 Elephant Alpha 的新模型(100B 参数、token 高效、定位即时型),适合代码补全、长文档处理、轻量 Agent 工作流,且目前免费,正在和 GPT6、Opus 4.7 打时间差。@LufzzLiz 还提到阿里云已支持 Hermes Agent。

来源:

Elon Musk 持续关注南非政策与 Starlink

有博主提到,Elon Musk 当日继续就南非政策发声,多次转发涉及南非种族法律、Starlink 被拒、政府撒谎等内容的帖子,并评论”南非法律 literally super racist”(简直是超级种族主义),称当前南非政府已实施了”Apartheid 2.0″。他同时转发了 SpaceX Starship Super Heavy V3 首次 33 台发动机静态点火、 Tesla Semi”hammer down”、Tesla 80 万公里行驶里程车辆、Grok 流量新纪录(单月超 3.26 亿访问)等内容。@vista8 在李广密的访谈摘要中对 xAI 的评价为”陷入摇摆的重资产玩家”,指出核心团队流失和战略摇摆,马斯克缺乏耐心、习惯短平快反馈,大模型需要长期沉淀,xAI 在多条路线间反复横跳。

来源:

Claude 降智与 Token 消耗问题

有博主提到,@aiwarts 整理了一份解决 Claude 降智和 Token 消耗过快的完整配置方案:通过在 ~/.claude/settings.json 中设置 effortLevel 为 high、CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING 为 1(关闭自适应思考)、MAX_THINKING_TOKENS 设为 31999 或更高、以及关闭 1M 上下文并启用 200K 自动压缩来缓解降智。他还特别提醒,之前为了不发送使用数据给 Anthropic 而设置的 CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1 会导致订阅用户的一小时上下文缓存被砍到只有五分钟,反而大亏。最佳实践是保持对话任务不变且距上条消息不超过一小时就不开新对话,可节省 4-6 万个 Token 的上下文加载开销。

来源:

其他动态

@NASA 宣布,用于 Artemis II 登月任务的移动发射平台正在滚回 Vehicle Assembly Building,准备 Artemis III 任务;Artemis II 宇航员在太空期间使用平板电脑和智能手机完成邮件收发等工作。@tim_cook 介绍苹果在环保方面的进展,产品中再生材料使用量达到历史最高。@bit_summit 确认第 10 届 bit summit 将于 2026 年 9 月 23–24 日举办。@cellinlab 分享个人发票代开经验,上海税务审核相对宽松,无需合同和公章。@oran_ge 提到正在用 Agent 帮助维权,对手是某大型银行,如果成功可拿回一万美金。@MANISH1027512 发布 AIGC 周刊 Vol.002+Vol.003 合刊公开版,分享 AI 摄影黄金小时光影与镜头光斑特效技巧。@NousResearch 宣布 Hermes Agent 正式支持 QQBot,众多用户晒出用 Hermes Agent 全自主完成复杂任务的案例。

来源:

抓取统计

  • 统计:扫描时间线条数 360 | 命中博主数 27 | 命中推文总数 158 | 加权推文分 127.25 | 原创推文数 69 | RT 推文数 28 | 抓取尝试次数 2 | 边界覆盖状态 完整覆盖(尾端置信跨过昨日边界)

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注