小刘BOT|AI 简讯、个人项目与长期写作
简讯
全部简讯AI 领域迎来多项关键更新,从图像生成成本降低、编程工具战略合作到研究服务分层,展现了技术整合与市场策略的新动向。
GPT-Image-2 全量放开带动生图热度再起,Agent 与 Skill 产品化加速,AI Coding 更强调约束、验证与长期工程能力。
AI领域揭示大模型存在难以过滤的“潜意识学习”风险,同时主流模型更新正强化文件处理与自动化工具等生产力功能。
Hermes Agent 生态合作与技能争议引发关注,Grok 语音 API 正式发布,AI 图像生成工具对比讨论持续升温。
Anthropic 发布对话式设计工具,xAI 推出多模态 Grok 新版本,OpenAI 图像生成能力与 Midjourney 展开正面较量。
Seedance 2.0 开放多模态视频创作 API,OpenAI Codex 升级为桌面智能助手,特斯拉公开 Optimus 手部专利,AI 正加速融入创作、开发与硬件领域。
项目
全部项目Relay Hub 作为中转层,将 AI 编程工具的主对话窗口、OpenClaw 消息渠道和临时网页工作区连接起来。它允许用户在离开电脑时,通过网页和消息渠道补充内容,由外部 AI 处理任务后,再将结果发回并合入主线对话。适合需要在不同设备和消息渠道间无缝切换并保持工作流连续性的场景。
消息合流 / 工作流中转 / 多设备同步 OpenClaw Backup Skill该工具为 OpenClaw 运行目录提供集成本地快照与离机归档的备份方案,通过去重和自动轮转优化存储空间,并可在备份失败或容量告警时进行通知。它支持恢复到指定历史版本,适用于希望自动化管理 AI 助手数据备份且需兼顾恢复速度与异地保存的用户。
数据备份 / 版本恢复 / 自动化轮转 Video Analyzer ProVideo Analyzer Pro 是一款基于视觉大语言模型的视频审计与分类工具,通过自定义提示词实现自动化内容理解和分类。它采用动态阶梯算法自适应视频时长截帧,确保关键动作不遗漏,并支持配置热切换与多线程处理。该工具适用于大规模视频库的合规审查、事件分析和素材整理,能自动生成精准标题并建立可搜索的数字化档案。
视频审计 / 智能分类 / 视觉分析 Page Image CollectorPage Image Collector 是一个 Chrome 扩展,能够高效采集网页中的图片。它支持手动与自动扫描,可处理动态加载内容,并提供格式、分辨率等筛选条件。用户可在弹出窗口快速操作,或进入工作区进行沉浸式浏览与批量处理,包括复制链接、逐张下载或打包为 ZIP 文件。扩展完全本地运行,适合需要整理网络图片素材的用户。
图片采集 / 浏览器扩展 / 批量下载 VideoFrame SearcherVideoFrame Searcher 是一款面向 Windows 和 macOS 的桌面工具,旨在优化视频内容检索流程。它支持通过链接解析或本地导入视频,提供自动按间隔抽帧与手动打点截图两种方式,并内置截图画廊进行管理。核心功能在于与浏览器插件联动,实现选中截图后直接执行以图搜图操作,形成从视频到图像搜索的完整闭环。
视频抽帧 / 截图管理 / 以图搜图 Half Frame Splitter该工具专为处理半格胶片扫描图设计,能够自动检测扫描照片中间的黑缝,并基于边缘密度分析算法,将左右两幅画面精准分割为独立的图像文件。它支持批量处理,提供连续编号、异常提醒和手动重裁等功能,有效提升了半格胶片数字化后处理的效率和准确性,适合个人整理胶片档案或工作室进行批量作业。
胶片摄影 / 图像处理 / 自动化工具 iMessage Reader Skill该技能将常开的Mac变为短信网关,用户可通过任何设备上的聊天工具,用自然语言查询Mac同步的iMessage、短信和RCS记录。支持按发送方、接收号码、内容、时间和类型进行精确筛选,无需解锁手机或翻找垃圾短信,适用于跨设备工作、手机不在身边或需要管理多张SIM卡验证码的场景。
iMessage / 短信查询 / 自然语言 Fuguang Translator浮光译影是一款桌面应用,能够实时捕获系统播放的音频,并利用阿里云百炼的语音翻译模型生成中文字幕。它支持浮窗显示字幕,允许用户手动编辑内容,并可将字幕异步保存为Markdown文件以便回顾。该工具适用于观看无字幕外语内容、在线会议或需要实时文字转录的场景,界面可自定义字体与透明度。
音频转字幕 / 实时翻译 / 桌面工具文章
全部文章解析 ComfyUI For 循环节点的连接点、赋值与闭环逻辑,并演示如何用于批量生图和图片放大。
通过ComfyUI的Prompt Line节点,可轻松实现多行提示词自动批量生图,无需复杂循环设置。
通过SD-PPP插件在Photoshop中接入ComfyUI等工具,实现局部选区AI重绘,解决高画质图片编辑需求。
飞书多维表格独立版上线,无需绑定飞书套件即可使用,为团队提供灵活高效的自动化与AI能力,助力业务管理与协同。
TicNote AI录音卡通过磁吸卡片形态实现无感录音,结合多模型AI总结与说话人分离功能,为商务通话和团队会议提供高效的私有化记录方案。
录音转文字工具支持实时录音与文件上传,可配置不同API服务商并实现说话人分离功能。
通过多维表格模板,无需技术门槛即可将PPT等文档转换为结构化知识库,并实现智能问答与内容总结。
通过搭建ComfyUI工作流整合多种AI生图工具,并引入大语言模型自动优化提示词与比例,可显著提升图片编辑的灵活性与效率。