X 平台 AI 简讯|大模型“潜意识学习”风险显现,Claude与Grok更新聚焦生产力

大模型“潜意识学习”与蒸馏风险研究

多位博主提到 Nature 发表的一篇关于 AI “潜意识学习”(Subliminal Learning)的论文。该研究揭示,即使训练数据中清除了特定特征(如“猫头鹰”或负面特征),学生模型仍能通过纯数字序列从同源老师模型中继承这些特征。这表明特征隐藏在数字纹理中而非仅存在于语义层,使得传统基于语义的 AI 安全过滤手段面临挑战。

来源:

Claude 系列模型更新与提示词演变

多位博主关注 Claude 4.7 的发布及其系统提示词的变化。新版提示词强调“少问多做”,要求模型在歧义时先尝试而非询问,并提升了工具调用的优先级(覆盖 Excel、PPT、浏览器等)。同时,有博主反馈 4.7 版本在中文语感上可能存在倒退,并存在标点符号只使用半角输入法的 bug。

来源:

Grok 4.3 生产力功能升级与图像模板

多位博主讨论了 Grok 4.3 的新功能,包括原生支持生成 Microsoft Word、Excel 和 PowerPoint 文件,以及内置 LaTeX 编译能力。此外,Grok Imagine 推出了更新,支持用户通过上传图片创建自定义模板,实现特定风格(如香水风格、体素 3D 等)的转换。

来源:

AI 原生工作空间与自动化工具实践

多位博主分享了 AI 提效工具的实践。有博主推荐使用 Kollab 构建团队 AI 原生工作空间,解决 AI 产出复用与协同问题;有博主开源了基于墨水屏硬件监控审批 Claude Code 权限的方案。此外,Cloudflare Email Service 的公测也引起关注,支持为 AI 配置免费邮箱以处理客服、发票等任务。

来源:

模型能力评测与 Prompt 优化技巧

多位博主提到最新的模型发现:有论文证明使用高频词编写 Prompt 的效果远好于生僻词;GPT Pro 新模型灰度测试显示其前端设计与交互能力表现出色,甚至被评价优于 Claude Design。同时,通义千问 Qwen 3.6-max-preview 也在昨日发布。

来源:

其他技术动态与社会热点

多位博主分享了相关动态。有博主教授孩子使用 Codex、Github 以及培养 AI 时代原住民的经验;转发讨论提及了 SpaceX 完成第 600 次火箭着陆、Tesla 启动首个大型锂精炼厂等硬科技进展。

来源:


扫描时间线条数:240 命中的博主数:25 命中的推文总数:118 加权推文分:92.05 原创推文数:63 RT 推文数:29 抓取尝试次数:1 边界覆盖状态:覆盖完整