X 平台 AI 简讯|Seedance 2.0 API 全量开放,OpenAI Codex 实现桌面级智能操作,特斯拉公开机器人手部专利

Seedance 2.0 API 全量开放

多位博主提到,火山引擎于 4 月 17 日正式向企业和个人开发者开放 Seedance 2.0 API,国内通过方舟平台调用,海外通过 BytePlus 同步上线。@dotey 整理了具体定价(46 元/百万 token,约 1 元/秒视频),并指出该 API 支持文字、图片、音频、视频四种模态输入,配合人脸验证、肖像授权和万余个预置虚拟人像,可自动化串起整套 AI 视频创作流程;@vista8 阅读技术报告后指出音频是最大亮点(满意率 62% vs 竞品不足 10%),且中国戏曲、说唱等本地内容提升幅度显著;@op7418 提到 AI 短剧和长剧生态正在蓬勃发展,并介绍了 HeyGen HyperFrames CLI 可与 Seedance 2.0 联动实现零人工介入的科普视频生产流程;@cellinlab 同步了火山引擎在 AI 视频领域已成海外基建(Runway、Higgsfield、Freepik 等平台均接入)的观察。

来源:

OpenAI Codex 重大升级

@OpenAI 于 4 月 16 日发布了 Codex 的一次重磅升级,@sama 形容其”computer use 比我预期的更有用”,@dotey 整理了完整功能图谱:Codex 现可控制 Mac 上的多款应用程序并行操作、不会干扰用户当前工作;内置浏览器支持在页面上直接圈点批注并自动抓取 DOM 元素作为上下文;新增 90 多个插件(覆盖 JIRA、GitLab、CircleCI、微软全家桶等);具备记忆和自我排程功能,可跨时间持续推进长期任务;图像生成也集成进来(gpt-image-1.5)。@vista8 补充该产品迭代速度”左脚踩右脚飞升”;@op7418 认为 OpenAI 在桌面端产品力远超 Claude 桌面端;@LufzzLiz 实测后表示操作浏览器的流畅度”比 Claude 更好使”。

来源:

Claude Opus 4.7 使用体验与评测

@Astronaut_1216 分享感受:Opus 4.7 代码能力显著提升、内容创作几乎无需干涉,但 token 消耗量是前代的几何倍数,且输出变得”又臭又长”,默认设置下有翻车案例;@LufzzLiz 引用第三方 benchmark(”鹈鹕骑自行车”SVG 测试),指出本地运行的 Qwen3.6-35B-A3B 在该特定任务上优于 Opus 4.7;@AlchainHust 提到自研的「弗洛伊德.skill」可解决 Opus 4.7 默认设置下的”降智”问题,计划阅读量过 100k 后开源;@oran_ge 观察到 Opus 4.7 蒸馏了 Mythos 的网络攻击能力,但官方安全机制压制后影响了表达的”人情味”;@xiaohu 报告实测开启 Adaptive Thinking 后反而变笨,但推理速度大幅提升,同时确认该模型消耗的推理 token 是 4.6 的 1.35 倍,官方已为所有订阅者上调速率限制作为补偿。

来源:

Claude Design 上线与 GPT Image 2 测试

@AnthropicAI 发布了 Claude Design 工具,支持通过对话生成网页/App 原型和 PPT,可导出为 PDF/PPTX 或移交至 Claude Code 进行开发。@MANISH1027512 对 GPT Image 2 进行了多轮测试,指出其文字理解和角色设定生成能力强,但手指细节和动作迁移仍频繁出错;@94vanAI 提到人像生成在细节和光影上有所牺牲,整体游戏动漫类内容仍是 GPT 强项;@qq_liu45504 演示将整篇文章输入 GPT Image 2 后周边物料成本”趋近于 0″,并称人类迎来了 meme 图新神。

来源:

特斯拉 Optimus 第三代手部专利开放

@xiaohu 发现特斯拉于 4 月 17 日在 WIPO(世界知识产权组织)公开了 Optimus 第三代机器人手部的四份完整国际专利,涵盖前臂、腕部、关节和手部架构。关键细节包括:25 个线性执行器(23 控手、2 控腕)以同心环方式布置于前臂,手指具备 4 自由度(内收外展+屈伸)加腕部 2 自由度;执行器从手掌移至前臂以减轻手部惯量;手腕仅用 2 个电机实现原本需 4 个电机的两方向运动;采用腱绳驱动系统,每指配备 3 根控制缆绳。该分享被多位博主引用。

来源:

Nous Research 工具网关与 Hermes Agent 更新

@NousResearch 宣布 Tool Gateway 正式上线 Nous Portal,订阅用户可在一个账号下访问 300 多个模型以及网页抓取、浏览器自动化、图像生成、云端终端、文字转语音等工具,无需分别注册各服务的 API Key;集成了 @firecrawl、@browser_use、@modal 和 @fal 等合作伙伴。@LufzzLiz 同步了 Hermes Agent v0.10.0 更新,新增 Discord 按角色控制访问、钉钉扫码验证、微信原生 Markdown 渲染保留,以及上下文压缩优化(先去重再压缩,防抖+尾部保护)。

来源:

大脑预测理论与 AI Agent 范式转变

@vista8 翻译了一篇《自然》杂志的文章,提出大脑并非在”看见”世界而是在”猜测”世界、用感觉输入来验证猜测,这与训练大模型的核心逻辑高度相似——两者都在追求预测更准确、减少意外。@dotey 引述了 @hxiao 的观察:2026 年长周期 Agent 任务已分为两个明确阶段——第一阶段通过网络搜索/阅读将信息沉淀为本地文件,第二阶段让 Agent 挂载这些本地文件进行高频内循环迭代,不再依赖实时联网,原因在于速度(毫秒级读取 vs 秒级爬取)、确定性(本地文件不变 vs 网页易变)、一致性(同一知识库比对 vs 每次不同版本)和成本(干净文本 vs HTML 噪音)的显著差异。

来源:

Elon Musk 动态(转发为主)

昨日 @elonmusk 共发推 35 条,其中 21 条为转发,主要涉及:多次转发关于南非种族问题(@TheRabbitHole、@GuntherEagleman、@Real_RobN 等账号)的推文;转发 SpaceX Falcon Heavy 2028 年发射 Rosalind Franklin 火星车计划,并评论”火星目前是纯机器人的星球”;转推 Neuralink 帮助截瘫患者恢复运动功能的视频;转发了 Tesla FSD v14.3.1 在洛杉矶高峰无干预行驶 45 分钟的案例;以及 xAI GPU 出租给 Cursor 训练 Composer 2.5 的新闻(据 Business Insider 报道,xAI GPU 利用率仅约 11%,远低于行业 35-45% 的正常水平)。原创内容方面,Musk 提出”通过联邦政府发放全民高收入支票是应对 AI 失业的最佳方式”,并附视频称曾监督 Dragon 对接空间站所用的定制 LiDAR 研发。

来源:

个人创作与产品发布

@vista8 分享了生病期间开发的博客产品,支持前台实时编辑和 Chrome 插件/Obsidian/Skill 发布文章,计划打造为 AI 学习中心;@lijigang 让 Claude Code 写了一个 macOS 应用(置顶窗口展示当日三件待办,开源在 GitHub),并提出 A2A(Agent-to-Agent)和 H2A(Human-to-Agent)市场以及 HAAH(Human 与 Agent 共处)新空间的概念;@AlchainHust 反思了自己热爱对外分享(Marketing)但讨厌被要求证明自己(Sale)的性格特质,认为金钱回报只是 build-in-public 的副产品;@Astronaut_1216 透露正筹划与南京江宁 OPC 社区和一家 AI 独角兽联合举办 AI 实战工坊,带参与者用 Agent 完成自媒体内容获客全流程。

来源:

抓取统计(2026-04-17)

  • 扫描时间线条数:360
  • 命中博主数:25
  • 命中推文总数:197
  • 加权推文分:152.3
  • 原创推文数:82
  • RT 推文数:43
  • 抓取尝试次数:2
  • 边界覆盖状态:完整(tail_confidently_crossed_target_boundary)

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注