分类：文章

长期文章、教程和个人写作。

如何用AI生成高质量公众号封面？一篇文章教会你

开门见山了，先把模板丢这里：

https://gcnax5pj3z0y.feishu.cn/base/EW9XbtXbcaoBANsaIAFcfc6FnDb?table=tblE2cjn0Aa0rJmi&view=vew5mIEGjA

使用方法你应该能从截图看出来，人工操作的部分就是录入文章标题并选择一种想要的风格，然后就是都是自动部分了，AI会根据你的输入内容输出用于生成封面的Prompt，而后再通过生成图片的字段捷径调用Seedream 3.0 图像生成模型（当然也可以直接复制Prompt发到即梦/豆包），生成最终的封面图片。

就像这样：

简单吧！

说完怎么用，再说说怎么搭。

把整个表格模板拆解一下，你会发现它背后的工作流非常简单。

一共两段核心Prompt。

第一部分负责生图Prompt生成：

请参考微信公众号文章标题[文章标题]，为它设计一张[风格]风格的封面图。你的设计方案应依次包含下列内容：

# 文字部分
封面图文字可结合文章标题进行提炼和演绎，确保信息传达清晰而鲜明突出，不必与文章标题完全相同。如非必要，不要在主副标题外添加其他文字信息。

## 主标题
- 列出主标题文字内容，如有多语言则逐一标明。
- 指出字体风格、样式（衬线/无衬线/手写/卡通等）、大小比例、颜色方案（纯色/渐变/金属质感等）。字体设计可根据海报设计风格参考下方风格库。
- 位置描述：可使用九宫格定位或时钟方位，并以百分比估测占画面宽度或高度的比例。

## 副标题
- 记录副标题内容及其字体特征、大小、颜色。
- 说明它与主标题的排版关系（上下错落、左右对齐、配色反差等），以及在画面中的空间位置。

## 其他文字信息
- 列举除主、副标题以外的所有文本。
- 为每条文字注明字体类型、排版方式（居左/居中/分栏等）、颜色搭配、相对于主副标题的层级或对比度。

# 封面背景
- 详细说明封面背景的图案、纹理或图像元素（如几何线条、风景、渐变叠加等）。
- 描述背景的主色、亮暗分布以及与主体文字信息的融合或对比关系。

# 文字装饰元素
- 请结合文章标题理解内容；根据你的理解描述围绕文字的装饰性元素（如下划线、边框、光效、阴影等）。
- 明确装饰元素在画面中的位置分布，并解释与文字主体的视觉关系（衬托、强调、引导等）。

# 布局与层次感 (Layout & Hierarchy)
- 概括整体构图方式（对称/非对称、留白、网格化布局等），以及各元素的前后顺序。
- 如果能看出视觉引导路线（观众先看到哪里，再看到哪里），请加以说明。

# 色彩与氛围 (Color & Mood)
- 提及主要和辅助色的搭配（互补、类似色、淡雅/鲜艳等），或有无特殊渐变、光影变化。
- 推测封面想呈现的整体情感或调性（庄重、浪漫、激昂、神秘等）。

# 设计或技术特点 (Design / Technical Features)
- 若可判断封面采用了摄影、3D渲染、数字绘画或特殊后期处理（如颗粒感、仿旧纹理、霓虹灯风格），请加以描述。

输出格式：请在一个自然段中依次输出以上要点，尽可能描述准确，语言简洁。只输出设计方案结果，不要添加小标题和格式说明，不要带有任何其他描述和解释性文字。注意，封面上的文字内容应该被括在双引号内，禁止虚构未出现的名称或时间等信息。

这一部分限定图片呈现形式，包含两条关键信息：

①引入了[文章标题]和[风格]的信息输入。

这样，最终输出的封面设计，就跟你的文章还有你想要的风格关联了起来。

②指定了画面上都应该包含什么元素，例如主标题、副标题、封面背景、文字装饰、色彩氛围等等。这些元素在一起，就组成了一张「大字报」形式的公众号封面。

如果你现在不想要公众号封面了，希望生成一张海报，需要修改的也就是这些元素。你可以把文字装饰修改成主体物体或者主体人物，这样就可以得到一张上面带有产品图或者模特图的海报。

例如，我在上面的元Prompt中添加这样短短一段：

# 主体人物- 带有科技感的美丽女性角色。

再次生成《通义App全面升级翻译能力》的生图提示词，选择3:4的图片比例进行生成，就得到了这样一张海报：

第二部分，则限定了生成图片的风格：

# 风格库

## 科技风
数字网格解构风格，深蓝色渐变背景配合代码流瀑布效果，矩阵式布局字间距精确计算，光栅网格组成笔画呈像素化切割，发光边缘效果数据流动感强烈，冷峻理性，未来科技美学高级感十足

## 赛博朋克风
霓虹灯管文字效果，紫红色与青蓝色对比强烈，城市剪影配合全息投影元素，文字呈故障艺术风格随机错位，扫描线干扰效果叠加噪点纹理，雨夜街头氛围浓厚，反乌托邦美学极具视觉冲击力

## 极简主义风
大面积留白营造呼吸感，黑白灰单色调精准控制，几何图形点线面构成，字体采用无衬线极细体精确对齐，负空间设计巧妙平衡，去除一切装饰性元素，理性克制，现代设计美学纯粹极致

## 复古蒸汽波风
粉紫色调配合日落渐变，古希腊雕塑与 80 年代电脑图形混搭，棕榈树剪影漂浮几何体，文字添加 VHS 磁带失真效果，像素化处理融合霓虹光晕，怀旧迷幻，后现代主义美学梦幻诡异

## 野兽派风
粗犷笔触肌理感强烈，高饱和度原色块大胆碰撞，手写体文字随性不规则排布，油漆飞溅喷溅效果自由奔放，撕裂拼贴元素打破常规构图，原始冲动，表现主义美学狂野不羁

## 新中式风
水墨晕染效果层次丰富，墨色浓淡虚实相生，传统纹样现代几何化重构，书法字体配合英文极简排版，留白意境深远烟雾缭绕，金箔点缀提升质感，东方禅意，当代东方美学优雅内敛

## 酸性设计风
荧光色系饱和度爆表，液态金属质感流动变形，3D 立体字母扭曲膨胀，渐变网格叠加迷幻纹理，镭射全息效果眩晕感强烈，融化滴落动态十足，超现实主义，后数字时代美学怪诞前卫

## 包豪斯风
三原色配合黑白灰理性配色，圆方三角基础几何严谨构成，网格系统精确控制版面，字体采用经典无衬线体模块化排列，功能主义设计去繁就简，工业美感强烈，现代主义美学经典永恒

## 孟菲斯风
明黄色、粉色、薄荷绿大胆组合，不规则几何图案随机散布，波点条纹格子元素混搭，3D 立体阴影错位叠加，字体倾斜旋转打破平衡，装饰性极强，后现代主义美学趣味盎然

前面关于通义App翻译升级的两张图片为什么风格如此一致呢？就是这部分在发挥作用了。

当我把图片风格指定为「科技风」，生成的图片都会遵循这段Prompt中定义的科技风的设定。

再放几张：

是吧？

而体现在表格中，为了便于快速生成，我们可以直接把风格设置为单选。

选什么风格，就生成什么风格。

并且，还可以设置一个小心机。

直接添加一个选项叫作「自行选择」。

当它被代入回第一部分的Prompt，就变成：

参考微信公众号文章标题[文章标题] ，为它设计一张[自行选择]风格的封面图。

这样就可以让AI根据文章标题，在风格库中自行选择合适的风格。

那么，如果在风格库中没有你想要的风格怎么办？

太简单了，直接在下面追加你想要的风格就行了。

不会写，也好说，那就让AI来写。

比如，我现在添加一个「可爱风」。

立刻就得到了一个「可爱风」的设定。

选择「可爱风」，生成一张：

嘿，还Callback了，因为刚才在第一部分Prompt里添加了一个科技感女生的主体人物，所以画面中出现了一个拿相机的女生。

怎么样，是不是很简单？

解锁你的封面自由吧！

2025年6月20日

实测Lovart，全球第一个专业设计类AI Agent有多强？

最近有个“规划 + 执行 + 交付” 一体的专业设计 Agent 在 X 上爆火，叫做Lovart。

它能实现的功能，就像 X 上 40w 粉丝的 AI 大 V Santiago Valdarrama 说的：

「我只写了一个提示词，5 分钟后，价值 5000 美元的设计海报就生成好了。」

让非设计专业的普通人，也能用嘴做图，设计出审美优秀的作品。

我所在的各种 AI 社群的朋友们这两天对 Lovart 的讨论热情也是十分高涨，一度一码难求。

不过我有幸拿到了邀请码。赶紧测试了一波，效果也属实惊艳到我。

今年真的可以说是 Agent 的一年，前段时间问世的 Manus、Genspark 等等 Agent 产品都是爆火，关于 AIAgent的讨论一浪高过一浪。

但是，在人们赞叹通用 Agent 展现出强大能力和潜力的同时，舆论中也会存在一些不一样的声音，出错几率大、执行时间长、花费成本高等等。总的来说，就是方向看得到，但技术还不够完备。东西是好东西，但离真正在生产上稳定地落地应用，还有那么一些距离。

以上是我这个月之前，对 2025 年 Agent 热潮的认知——直到上手了 Lovart。

贴一张群里刷到的朱啸虎大佬对 Lovart 的评价：

对垂直场景 AI Agent 的观点我十分认同。现在的 Agent 里，通用 Agent 虽然潜力很大，但在今天还是受到模型能力的制约；Dify/Coze 这类自搭工作流的 Agent，要么就过于私有化，只适用于搭建者，要么就过于表浅，对内行来说完全不够看。

作为设计垂直领域 Agent 的 Lovart，生态占位在两者之间，既没有把能力描绘得过于星辰大海，又在垂直领域有着深入却不拘束的思考。

此前也有一些所谓的行业 Agent 产品，简简单单接入几个 MCP 和行业知识库就急匆匆推出来了。但实际用下来就发现产品设计中只有理论性的逻辑可行性推导，却很少关注到用户真正的痛点。看起来很厉害，用下来不好用。

Lovart 的使用感受跟它们完全不一样，在使用过程中，我可以明显感知到它在帮我解决之前独立使用生图工具时让我觉得繁琐或者难受的点。比如在 LLM 和生图模型之间来回跳转调试 Prompt，比如 GPT-4o 生成了一张很满意的图片唯独几个文字出现乱码……

借用藏师傅@歸藏的 AI 工具箱的一张图，给大家展示一下它的基础功能。

我本人是从事广告营销行业，所以就整点典型的商业应用案例。

我们结合着实测案例，边做边说。

既然是「专业设计」Agent，咱们先来点专业又值钱的——品牌视觉设计。

一般企业找专业的设计公司，别说做一整套 VI 了，设计个 LOGO 可能就要花费几千到上万元不等。

我就先让 Lovart根据我的名字首字母 LQ，给我设计个有科技感的专属 LOGO。

Lovart 在任务执行过程中会自动调度 Claude、GPT、Gemini 等等大语言和 GPT-image-1、Flux.1、Imagen3 等等生图模型，还有可灵、Suno 这些视频与音乐生成模型，为了让任务涉及的所有模型协同顺畅，提高效果的稳定性，建议使用英文撰写 Prompt。但文章中为了便于大家理解，我就直接开启沉浸式翻译进行演示了。

可以看到，它在接到我的任务后，会先把任务进行拆解，进行一个整体的智能规划。

让我十分欣赏的一点是，Lovart 每次接到任务需求后，总是会先确保自己对任务需求足够理解。第一项分任务，永远是提炼出我的任务需求中的重点关键词，去展开了解相关的知识。比如这个案例中，它敏锐捕获了我的任务需求中「科技感」这个词，第一步先生成科技感视觉设计建议。

这一步真的很重要，而且很多人类设计师都做不到这一点。我见过太多初级设计，拿到活儿一秒钟都不想，抡起膀子就是干，干完人家说想要的不是这样的，跟运营吵吵一顿又回去返工。

这是 Lovart 基于我的名字首字母 LQ 和「科技感」这个关键词，生成的视觉设计建议：

我自己都没想到我的名字加上科技感，能有这么多解释。

然后，它基于前面规划出的四种风格，结合上面生成的视觉设计建议知识，调用 ChatGPT 生图，给我生成了四个 LOGO：

还不赖。

而且确实是有科技感在里面，并且带着科技感的同时衍生了四种不同的风格，比之前网上那些 AI 设计 LOGO 网站效果好不少。这就是第一步做背景知识拆解的好处。

这四个 LOGO 里面我真的挺喜欢第二个创意的。

但第二个的问题是元素有点过于复杂了，PCB 板上还加了电阻，R1、R2 字母标注得好像也不太对劲，这样实际应用起来就很受限。于是我引用了这张图片，向 Lovart 下达了进一步的要求：

基于电路板这个设计创建一个更简化版的 LOGO。

可以看到，这时候它调用了「图像分析器」拆解了这张图。这个能力倒不稀奇，就是调用了支持多模态识别的大模型，不过从拆解结果来看，内置的 Prompt 应该是基于设计场景专门调教过的，对小白选手比较友好。

之后的流程跟刚才一样，分步智能规划，第一步生成知识建议，第二步调用 ChatGPT 生图。

不得不说，第一步进行知识生成这个功能设计是真的好，大语言模型和生图模型的能力在同一个产品内有机结合，内置 Prompt 设计也很棒。

然后我得到了一个简化版 LOGO，可以跟上面的版本对比下，我觉得还不错：

我决定再给它上点难度，让它根据我的 LOGO，给我设计一套游戏装备品牌的 VI 出来。

依旧是先进行智能计划分解再执行。注意这里我没有引用生成的图片，它也能通过智能上下文分析判断出应该基于简化版的 LOGO 制作。

我真的很喜欢看它这个「知识」部分。

方案出的贼细致，直接拿去给设计师参考也足够了。

这一步其实有些瑕疵。

尤其是最后一张图，LOGO 的变体一致性没有保持好。

对于一套专业 VI 来说，GPT-image-1 模型输出的图片一致性还是不太够的。

真要落地使用，还是得再人工精校调整一下。

不过作为 demo 算是比较可用的了。

接下来，我又让它基于我这套 VI，给我的品牌设计了一些周边。

过程细节就不放了，最终结果是这样：

整体上我还是比较满意的。

这一整套流程下来，一个刚刚起步的创业者，可以在不花费太多预算的情况下，拿到一个看着 OK，用起来也马马虎虎够用的品牌视觉设计，我觉得还是挺不错的。

全自动视频生成也是一个非常有优势的 Agent 场景。

AI 视频制作是一个典型的多平台来回切换的工作流，通常我们制作 AI 视频的典型路径是在飞书写脚本和故事板，用 Midjourney 或者 Flux.1 生图，然后到可灵、Runway 这样的视频生成平台进行图生视频，最后再配音配乐。一顿乱串，手忙脚乱。

Lovart 的多模型调度能力很好地解决了这个问题，一句话的 Prompt，从脚本规划、图片生成、故事板创建、视频生成、音乐生成到最后的成品合并，能够直接搞定。小型商家或者企业简单的宣传需求，就可以由店长或运营人员独立完成，而不需要额外的外部支持。

例如，我作为一个珠宝商人，可以要求 Lovart 参考照片，为我的珍珠耳环制作一个配有 BGM 的宣传短视频。

跟生图的流程类似，Lovart 首先会结合我的要求（比如不要出现人物）调用大语言模型生成「故事知识」，其中包括场景和分镜头脚本。

之后就是根据分镜头脚本生成图片。

这里值得一提的是，生图过程中，它会自动根据 LLM 的分析匹配，在风格库中选取适合的 Lora 使用。

不过我这个任务有上传参考图，并且特别要求了不要包含人物，所以实际生成图片时使用的模型是 GPT-image-1，而没有使用 Flux.1，Lora 并没有生效。

你也可以同步要求它把这个脚本制作成一个像这样的故事板。

之后根据故事板的内容，调用 Suno AI 生成背景音乐，调用可灵 1.6 生成每一个镜头，最后将所有分镜头视频和 BGM 合并，得到完整的宣传片。

最终生成的视频如下所示：

高贵奢华的气质确实有拿捏到。

不过，虽然我认为全自动视频生成是一个非常有优势的 Agent 场景，但从目前 Lovart 的实测表现来看，这也是提升空间最大的一个场景。

值得肯定的是它的易用性够高，且方向十分正确，生成一段合格的成品 AI 视频的门槛大大降低。像我上面的示例一样的小型电商产品视频，其实足够小型商家投入商业应用了。但是一定程度上还是受限于当前大模型的能力，比如脚本不够有创意，分镜场景不够连贯等等。如果是要生成一段优秀的 AI 视频作品，从脚本到生成，依旧需要大量的人类介入调整。

但随着大模型能力的提升，未来可期。

再说说打工人日常场景的应用。

譬如说，现在我的老板让我发一篇小红书笔记，并给到我一份封面参考：

但是，主题需要改成求职指南。

于是，我就直接把这张图片发给 Lovart，告诉它：参考这张图片的风格，帮我设计一个求职指南的封面。

Lovart 依旧是先进行了图像分析，然后拆解执行步骤，根据求职智能的主题，设计了这张封面图的整体基调。

然后，通过 GPT-image-1 生成了封面结果。

细节：当主题从「防猝死」变为「求职」的时候，图中小人的表情和情绪氛围都进行了调整。

但是有一个问题，我们现在生成的这张图片的文案是中英文夹杂的。

而且，熟悉 GPT-4o 生图的朋友都应该有一个很难受的点：图片结果明明是满意的，但文案上就是有几处小瑕疵或者错别字。但偏偏图片生成的结果就是一整张图，没有办法修改。而 GPT-4o 的局部重绘又不好用，对文字的重绘尤其差。文字背景是白底还好，如果恰好在图片元素上，擦除重绘都很难。这就导致很多时候明明很满意的图片最终不得不放弃掉，重新生成。

N 久以前我就一直吐槽 GPT-4o 这个问题，表示它要是能分两个图层输出就好了。

没想到在 Lovart 实现了。

只需要选中图片按 Tab 键，输入「turn into editable text version」，就可以把图片的文本和图像图层分离。

并且文本是可以编辑的。

当然也可以像我的习惯一样。直接删掉文字获取底图，直接使用 PS 或即梦生成文字再进行合并。

几乎是 1:1 复刻，背景完美保留，文字自定义权交给自己。

这个真是太绝了，精准命中 GPT-4o 生图用户的痛点。

但据我观察，这功能的实现实际上还是进行了重绘，颜色和一些细节会有不同。不过不像 GPT-4o 自己重绘一样，难以保持一致性，有点像运用了类似 controlnet 一样的技术，应该是自研。

多模型 All in One 调度的 Agent 优势就在这里，直接在同一个窗口就把问题解决，不需要像从前那样在 LLM、闭源生图和 ComfyfUI 直接来回切换，效率提高了不少。

也可以直接在开头就要求生成可编辑的版本，例如像我这样：

「Create a Children’s Day (June 1st) themed poster with text and images,and provide me with an editable text version.」

获得一份完整海报的同时还获得了一份可编辑的版本。

直接通过 Lovart 就可以进行编辑。

另外 Lovart 在设计图输出上还有一个值得一提的强力优势，那就是支持批量输出，有点像之前豆包爆火的超级创意功能。

例如还是上面那个珠宝店的镇店之宝珍珠耳环，我准备为它办一个展览，展览的宣传海报就可以用 Lovart 生成。

直接来一把 10 连抽：

它会参考内置的海报数据库，按我的要求进行 10 张风格不同的输出。

10 张海报，每一张的风格都不相同：

其实对于常规的运营类场景来说，本身在创意设计层面的要求没有那么高，所以在这个层面上并不会比之前在多个 AI 工具之间来回切换的产出效果优秀太多。

但注意，如果是按照从前的流程，让我来完成这一类的封面或海报制作，我一般会借助大语言模型对话，或者批量处理的时候借助多维表格工具。如果出现文字瑕疵，则会通过多次抽卡来解决。Lovart 恰好就解决了这个问题：多模型 All in One 调度的优势和图文分离编辑的能力，再加上单次任务批量抽卡，会给效率带来极大提升。这对于日常运营工作来说，反而是比创意更大的杀手锏。

综合体验下来，Lovart 是一个相当值得体验的产品。

我能感受得出，他们团队对于设计领域的 AI 工作流和用户痛点是有深入研究和深度思考的，确实跟之前用过的一些带有技术迷恋味儿的「AI 改造世界」的产品不太一样。

或许扎进垂直领域，脚踏实地摸索 AI 应用，才是未来一段时间内 AI 产品的新出路。

2025年5月15日
AI世界的隐秘角落，投机与欺诈正在暗流涌动

录个视频，假装聊天，选一个高佣金产品挂上链接就能卖货赚钱，一天下来躺赚过万。

这个项目叫做「AI无人直播」。

虽然以我的眼力，到现在也没看出来它到底哪里AI了。

但无论如何，这个「AI项目」吸引到一大批人花钱来学，少则几百块，多则数万元。

争相被割的韭菜从某音、某红书，一路排到某频号。

甚至，这把镰刀已经从学生、宝妈群体伸向了AI爱好者。

他们检索各个AI相关的公众号加入交流群，进群后便@群内全体成员，随即展开广告三连。

比如我自己的群就中过招：

在其他群里我也陆续遇到多次类似情况，比如朋友@Simonlin的精神世界老师的群，还有@智东西的群等。

智东西的运营老师这样描述：

不只是换不同的号进群，我还发现他们的链接域名也在换，并且每个域名ICP备案的公司都不一样。

这就成功勾起了我一个天蝎座的好奇心，这究竟是一个多牛逼的课程，值得如此大费周章地采用这样拙劣的方式引流？卖这个课的投产真的能打正吗？

其实我隐隐约约有了答案，但还需要再确认一下。

于是我打开了ChatGPT，开启深度研究，把这几段链接不同的引流文案发给它，告诉它去调研一下这样打广告的意义是什么，以及它们背后的关系。

半个小时后，得到了DeepResearch结论：

果不其然——诈骗。

GPT根据相关上课链接，发现了来自多个维权投诉平台的案例：

当我点击其中一个投诉网站并以「AI」为关键词检索时，结果令人触目惊心：

大多数受害者被骗金额达四位数以上，受害渠道多种多样，诈骗者似乎已悄然在各大平台编织起一张庞大的网络。

根据受害者的描述，骗子的诈骗模式逐渐清晰：

通过各种渠道大规模引流受害者至私域直播间，以低投入高回报的赚钱方法、成功案例及”不赚钱全额退款”为噱头，有时甚至冒充直播平台官方人员，诱导受害者冲动购买高价课程。至于所谓的AI工具，不过是营销噱头，实际效用微乎其微。

而前文提到的几个不同域名 tengfacewx.com / shanhuclass.com / corallecture.cn，表面上是不同网站，备案公司主体也各异。但在AI深度分析下，还是挖出了它们之间存在的隐秘联系。

shanhuclass.com 和 corallecture.cn，虽备案信息分别在江西和湖南两地，但名称构成呈现呼应关系。class 和 lecture 两个英文词分别意为「课程」和「讲座」，可视为近义词；shanhu 和 coral 则分别是「珊瑚」一词的汉语拼音和英文翻译。这恰好对应了前述投诉网站受害人证词中频繁出现的私域直播平台——某瑚课堂（shanhuketang.com）。

而 tengfacewx.com 名称上看似无关，但细心的福尔摩GPT发现，某瑚课堂官网上的联系邮箱域名为 @tengface.com 。通过 tengface.com 的ICP备案信息反查，可发现 tengfacewx.com 正是该公司名下数十个域名之一。显然，它们之间存在关联。

我们不对某瑚课堂进行无依据的恶意揣测。从公开信息看，某瑚课堂是一个合法合规的具有技术服务商性质的SaaS平台，为教育机构提供直播/伪直播课程教学支持和一定程度的营销引流服务；从投诉平台信息看，受害者投诉的机构各不相同，也无证据表明某瑚课堂与这些机构存在直接关联。

但不可否认的是，该平台已被卷入诈骗课程灰产链条，滋生了诸多涉灰、涉诈行为。如果大家有报名知识付费课程的需求，建议对在该平台开设的相关课程提高警惕。同时，也呼吁某瑚课堂平台加强对入驻机构的审核与管理。

当我以「某瑚课堂」为关键词在消费者投诉平台进行检索时，发现涉及到的课程种类竟然还不少。不仅包括所谓「AI无人直播」，还有抖音开店、板绘上色、播音配音等多种项目。

深入研究这些五花八门的课程后发现，尽管它们涉及的领域完全不同，却又呈现出惊人的共性：低门槛，高收益。

无一例外地宣称零基础有手就能学，学成后立即能赚大钱，少则一单几百，多则日入过万。听完一场直播下来，你会发现你和躺赚暴富之间只差……把学费交了。机会不等人，名额就几个。脑袋一热，哪怕分期贷款也要搏一个机会。

于是，被骗了。

录个视频，假装聊天，选一个高佣金产品挂上链接就能卖货赚钱，一天下来躺赚过万。

这句话，在AI无人直播课的受害者视角看来，描述的是「我」、「方法」、「赚钱」三者之间的关系。

但我们切换到更高一层的视角来看。

佣金从哪来？

假设这笔佣金真的可以产生。那么它必然来自于无数普普通通的消费者，他们看了这场假直播，并且购买了主播随便挂上去的高佣产品。

躺赚从哪来？

来自于苦主的转嫁。

轻信无人直播带货躺赚骗局的人，不曾意识到他们要去欺骗一个个活生生的无辜消费者。

（*此处「无人直播」指本文所述受骗案例中的「无人直播」，一些电商平台语境下的无人直播和真人驱动的AI数字人互动跟上述骗局存在不同逻辑，特此说明，但此处不做展开）

投机和欺诈往往相伴相生。

前些天测试Qwen3，在弱智吧训练集里pick到这样一组问答：

问：为什么我买了一本《新型诈骗手法》两个月了还没收到货？

答：可能是你已经成为了这本书《新型诈骗手法》中的一个案例。

大智若愚。

弱智吧的含金量竟还在上升。

我还刷到一个很有意思的博主。

博主是个卖农产品的家庭主妇，分享自己学习直播带货的创业经历。

很努力，人也很实在。

她在视频中坦诚分享了一些自己学到的技巧细节，比如：

「边打包边往这个箱子里倒。」

视频评论区有许多与她同样在探索直播带货的朋友，被她的努力和真诚所感染，纷纷留言鼓励，互相打气。

但我必须要问出一个十分不合时宜的问题：

观看视频的这些人，换个场景，来到她的直播间，是否愿意购买她的产品呢？

相信大家心里都有答案。

所以，清醒点吧。

如果一个「直播带货」项目，一味关注「赚」和「躺」，却没有一丁点面向消费者的基本交付意识。无论它披上「AI」还是其他时髦科技的外衣，都不可能实现所谓躺着赚钱，日入过万。除非，这个项目的本质是诈骗。

没谁不想一夜暴富，人人都有投机之心。

认知之外的东西总是神秘性感却又与危险相伴。

在投机诱惑面前，真正难能可贵的是保持冷静思考和清醒判断。

踏踏实实拓展认知边界，永远是比走捷径更稳当的方案。

希望大家都能保持冷静清醒，不要被骗。

2025年5月13日
不知部署哪个版本？一文看懂Qwen3本地部署的配置要求

上篇文章我们在3个场景做了测试，Qwen3的小模型表现明显好于此前DeepSeek使用R1推理数据蒸馏的同规模模型：

Qwen3值不值得普通用户本地部署？3个落地场景，30道题，300条回答，10模型大混测，豆包AI打分！

这几天在公众号和知乎也一直有朋友问「XX配置能部署多少B的模型」、「能不能部署更高精度的量化模型」等等问题，今天我们就来聊聊这个。

在开始说显存占用之前，我们先要了解一些基础信息和概念。

模型规模

本次Qwen3系列开源模型一共发布了8个不同尺寸，尺寸越大，显存占用越高。

8个模型中有6个Dense（密集）模型，2个MoE（混合专家）模型。密集模型在推理过程中会激活所有参数，而 MoE 模型则采用稀疏激活策略，每次前向传递只激活一部分专家参数，在有限的计算预算下性能更高。

量化权重

量化是指降低模型权重的数值精度，以显著减少显存占用和存储空间并可能提高推理速度的技术。未量化的模型显存占用非常高，很难本地部署。

本地部署起来最方便的Ollama，提供了三种量化权重的Qwen3模型，分别是Q4_K_M（默认）、Q8_0和FP16。

KV缓存

KV缓存是大语言模型推理过程中的一个重要技术概念。简单来说，如果没有KV缓存，每生成一个新token，整个序列的注意力都要重新计算，一次生成过程的计算量将呈指数增长。而有了KV缓存，则只需要计算新token的向量再与缓存交互即可，大大减少了计算量。

KV缓存是让大语言模型实用化的关键技术，但也是显存消耗的主要来源之一。KV缓存的大小随上下文长度线性增长，上下文越长，显存占用越高。

Qwen3系列模型原生上下文长度32K，4B及以上尺寸可扩展至128K。但这个上下文长度对消费级显卡来说不太现实，一般高端显卡（24GB+）可能只能处理8K-16K的上下文。

了解了上面三个基本信息和概念，接下来就要说到显存了。

显存占用

本地部署运行大语言模型，显存占用的构成主要来源于三部分：模型权重（包括参数规模和量化）、KV缓存、激活值与开销。

模型权重就是存储/加载模型参数所需的空间，取决于模型的参数量和使用的数值精度（即量化级别）。例如，一个 140 亿参数的模型，如果使用 FP16（半精度浮点数，每个参数 2 字节）存储，大约需要 28GB 显存。

KV缓存与以序列长度（上下文长度）、批处理大小（Batch Size）、模型维度（层数、隐藏层大小）以及缓存精度（不必与模型权重精度相同，通常为FP16 精度）等多个因素密切相关，可以按照公式VRAMkvcache≈2×层数×隐藏层维度×序列长度×批处理大小×每个值的字节数进行估算，这里就不做展开了。

激活值与开销即推理过程中中间计算结果（激活值）以及运行框架（如 CUDA 核函数、驱动程序、操作系统等）自身占用的显存，一般也就1-2G左右。

对于Qwen3系列模型，可以直接查看下面这个表格，表格中上下文长度统一按照8K计算。

例如，部署Q4_K_M的Qwen3-32B模型，所需要的显存大概为约19.8G（模型权重）+约14G（8K上下文KV缓存）+约1~2G（开销），一共大约35.3G。

当然，提前防杠一下。在实际使用过程中，上下文是根据实际情况变化并逐渐累积的，并不是一开始就直接占用掉大概14G的空间，所以即便没有达到表格中写的总需求，也并不代表一点也不能用。

但是，如果你本地部署完大模型，刚开始执行一个简单小任务就是下面这种显存拉满的状态，那大概率可以判断它后面很难支持复杂任务，最好换成尺寸更小的模型或者低精度量化模型。

另外，对于混合专家模型，需要单独补充说明一下。在显存占用方面，它和密集模型并没有太大区别，装入显存时依旧需要为全部参数分配显存空间，但因为只有一部分参数被激活并参与实际计算，推理速度会比同等显存占用的密集模型快得多。装入显存时，看总参数量；运行速度时，看激活参数量。

消费级显卡兼容

典型的消费级显卡和模型的兼容可以查看下面这张图：

理论上，对于24G显存的高端显卡来说，跟Q4_K_M量化的Qwen3-30B-A3B在显存占用上十分契合。如果你使用3090/4090，可以优先测试一下这个模型。

从参数综合来看，不同配置对本地部署Qwen3模型的选择可以参考这张图：

不同尺寸&量化权重Qwen3实际测试

依旧是上篇文章的测试题目：Qwen3值不值得普通用户本地部署？3个落地场景，30道题，300条回答，10模型大混测，豆包AI打分！

补充了不同尺寸和量化权重的Qwen3模型，供大家参考。

（PS：非严谨测试，结果仅供参考；模型名称未标明精度的即为默认Q4_K_M。）

文案项目：

总结项目：

弱智吧项目：

综合打分：

这三个项目中，综合评分依旧是全量DeepSeek-V3（硅基流动API）最高；因为加入了0.6B小模型，上篇测试中综合评分最低的GLM-4-Flash提升到倒数第三，但0.6B模型跟其他模型的差距并没有预想那么大；中间模型各位可自行参考。

测试详细内容见：https://ilovezhiwai.feishu.cn/wiki/TboCwTXPVi4vQqkHucuc7Dq4nkI

结合这几个我自己相对高频场景下的测试结果和理论数据，我个人最终会倾向选择Qwen3-14B (Q8_0)。

如何本地部署

关于本地部署的方案，个人依旧建议通过Ollama进行本地部署，操作起来十分快捷方便。部署教程就不在这里展开了，操作步骤可以参考之前这篇部署DeepSeek蒸馏模型的文章：

如何通Ollama本地部署DeepSeek蒸馏模型？小白看这一篇就够了

如果不喜欢使用Open-WebUI，也可以换成CherryStudio或者Chatbox等，只要内网IP和端口地址填写正确即可。

假期结束，开工愉快~

2025年5月5日
Qwen3值不值得普通用户本地部署？3个落地场景，30道题，300条回答，10模型大混测，豆包AI打分！
前几天阿里发布了Qwen3，这所有消息里，最吸引我的一条是：

Qwen3-4B可追平上代开源超大杯Qwen2.5-72B

没错，作为一个单纯的使用者，我对这次Qwen3的小模更感兴趣。

Qwen3-235B-A22B虽然说性能也强，登顶全球开源榜首，瑞思拜，但我本地部署不了呀。要说直接线上用，对最近集齐了GPT、Claude、Gemini御三家+Cursor会员的我来说，吸引力也不大。

而小模性能的提升，意味着个人本地部署可行性的提升。能本地部署就意味着数据离线私有化和无限量的tokens，成功勾起了本4090用户的兴趣。

但这得有个前提：Qwen3小模的性能真的够看。

老读者应该记得，之前DeepSeek个人本地部署成风的时候，我是唱反调的：

醒醒！你本地部署的DeepSeek-R1，它不是R1

因为首先DeepSeek蒸馏的那几个模型它确实不是DeepSeek，其次能部署到消费级显卡上的几个模型表现是真的挺一般，相比之下还不如用API呢。

所以，进入今天的主题，咱们看看Qwen3的小模到底咋样。

首先声明：我这次的测试场景比较主观，并不是严肃测评。相关的评分是由AI（Doubao-1.5-thinking-pro）给出，娱乐一下。

场景方面，我基于自己的使用场景选了三个，我觉得应该不小比例的普通工作党跟我的场景近似：
1. 对于带有一定目的性的文案的审查和修改。
测试题目是用了10条存在问题的淘宝好评文案。
2. 对内容的总结和理解。

测试题目是在网上随机选取的10篇文章。
3. 基本问答下的逻辑和计算能力。

测试题目是在弱智吧训练集中随机选取的10个问题（带答案）。

参与测试的大模型一共10个：
- 6个是我通过Ollama在本机部署的，分别是：
qwen3:8b、qwen3:14b、qwen3:32b、qwen3:30b-a3b、deepseek-r1:8b、deepseek-r1:32b
– 4个是线上API接入，分别是：

QwQ-32B、GLM-4-Flash、DeepSeek-V3、Grok-3

裁判是Doubao-1.5-thinking-pro：
- 前两个场景，它会站在上帝视角，浏览所有选手回答后进行打分
- 弱智吧测试题，会根据标准答案进行打分
测试环境，本来准备使用CherryStudio，但后来发现回答同一个问题时模型之间会相互抄作业，所以最后还是使用了多维表格。

正好最后的完整测试题目和选手回答也方便放出来。

下面是正式的测试结果。

各10题，平均分就是求和分值除以10。

第一卷文案分析和修改：

得分：

Qwen3确实表现不俗，第一卷就被32B拿了榜首。

之前DeepSeek蒸馏的两个模型——我说的也没骗人吧——排名比较靠后。

免费调用的GLM-4-Flash遗憾垫底。但为它说句公道话，你很难找到跟它一样免费不限量且高并发的API了。

第二卷文章总结和感悟：

得分：

QWQ-32B拔得头筹。

DeepSeek-V3稳居第二。

上一场第一名Qwen3:32B本次名列第三。

DeepSeek蒸馏的32B（其实蒸馏的也是千问），上升到第四，8B仍然落后。

GLM-4-Flash依旧陪跑。

第三卷弱智吧答题考试：

得分：

DeepSeek-V3依旧强悍（本次使用的是0324版本）。

Qwen3:14B这次怒拿第二名，32B第三，也是优等生。

DeepSeek蒸馏8B遗憾垫底，32B倒数第三。

GLM-4-Flash在弱智吧上扳回一城，保住了颜面。

最终测试结果：

DeepSeek-V3第一名。

Qwen3:32B第二名。

QWQ-32B出乎我的意料拿到第三名。

Qwen3:30B-A3B本来我寄予厚望，不过在这几项测试上意外爆冷。

如果根据这个结果，90及以上显卡的朋友本地部署建议选择Qwen3:32B，稍差一些的14B也是不错的选择，8B也会强过之前的DeepSeek蒸馏版本。

以上完整测试问题和结果可查看链接：

https://ilovezhiwai.feishu.cn/wiki/HThDwnX0FiyTIakyDe9c2z99nef?from=from_copylink

再次重申：本测试既不科学也不严谨，仅供逗乐。请不要在严肃领域使用本次测试结论。

祝大家五一假期愉快！
2025年5月1日
AI复盘2025京东美团外卖大战，喂饭式吃瓜指日可待！
声明：本文所有事件分析均为AI生成，不代表本人观点。

最近高频使用Deep Research，不由感慨这玩意儿真是太好用了。

尤其是Gemini和OpenAI两家的Deep Research，调研结果又准又新，动不动就狂吐上万字报告，读起来都很爽。

捣鼓出来一个一键吃瓜的新玩法，今天分享给大家。

先看演示吧：

网页纯享版（带动效）：

https://w13adr6n04.app.yourware.so

万字报告纯享版：https://fh5k77901t.feishu.cn/docx/HZ9AdR8suo0VaUxi7a5cZ4eknQb

怎么样？

我觉得还挺酷的。

事件的背景、关键节点时间线、争执方论点与事实核查、行为分析、影响与启示，通通梳理出来。

你可以直接使用我这个Prompt模板：
```
# 热点事件复盘分析提示模板
```
Deep Research工具还是优先推荐Gemini和OpenAI两家。

两家效果都很好，但风格上有些许差别。

根据我个人的使用经验，

Gemini的Deep Research模型升级到2.5 Pro以后明显得到加强，面对OpenAI完全有一战之力。而且背靠Google，它的引用来源又新又多，往往上来就是大几十上百的信息来源，还都比较准。尤其是调研相对公开、来源丰富的信息时，调研结果的整体逻辑性甚至要高过OpenAI。而且它喜欢用表格输出，可读性高。

OpenAI的Deep Research参考信息源通常都不会有Gemini那么多，一版就是小几十个。但o3模型能力还是要更强一些的，执行研究任务时，o3的推理在牵引整个搜索方向。并且在处理搜索结果时，模型会去串联推导不同搜索结果之间的关系，而不是完全依赖搜索得到的结论。所以在调研相对小众、信息来源比较少的东西时，OpenAI的Deep Research效果往往更好，但有时会有明显的幻觉，需要注意一下。

如果没有这两家的会员，也可以使用Grok的DeeperSearch等等。

得到调研报告后，可以生成个漂亮的网页来展示它。

不得不说，藏师傅@歸藏的AI工具箱这套提示词的含金量还在提升：
```
帮我将上面这份报告生成一个 HTML 动态网页，尤其要重点展现事件时间轴，具体要求是：
```
把上面的提示词连同你得到的调研报告一起，发送给一个编码能力比较强的AI，静待结果即可。

这里可用的AI不少。

但首推还是Claude 3.7 Sonnet，归纳总结能力和审美全部在线：

Gemini 2.5 Pro的表现也还不错：

DeepSeek V3也马马虎虎：

扣子空间的页面设计也算过得去，但模型的分析理解能力或者长文本的支持上可能稍弱一筹，会出现幻觉数据，需要更多的人工调整：

最后，让AI继续编写代码帮你把HTML页面转换成图片，或者直接使用现成的Cloudconvert等工具把页面转换成图片，就可以po去任何你喜欢的地方了。

玩的愉快~
2025年4月24日

用这个方案，一键模仿70%的海报和投流素材图，而且几乎0成本

之前发过GPT-4o文生图生成小红书封面：GPT-4o再加上这张表，让AI自动生成小红书封面图

接收到一些使用过的朋友的反馈和需求，主要集中在下面这3条：

①ChatGPT订阅有门槛，而且有点小贵，有没有更快捷更便宜甚至免费的方案？
②我已经有一张参考图了，能不能参考我喜欢的这种图片来生成新图片？
③我想单独修改画面上的某些元素或文字，有没有办法让我更方便地进行精细化修改和调整？

今天这个新表格，就来解决这三个问题：

https://ilovezhiwai.feishu.cn/wiki/LR6HwJvVriAps5kK3ILcC9JjnSp?from=from_copylink

使用它，你可以简单地进行无指向性参考出图：

也可以模仿例图的创意，根据这张图：

生成这张图：

还可以大幅度魔改，根据这张图：

做出这张图：

使用方法

准备工作

使用我的模板创建表格后，请先进行两项准备工作。

①启用工作流和自动化
之前小红书封面的表格有一些朋友卡住，无法正常生成Prompt，就是因为没有开启工作流。
飞书多维表格在使用模板创建新表格后，所有启用的工作流和自动化会自动转化为关闭状态，需要手动开启。
工作流操作十分简单，如下图所示，开启工作流开关即可。

跟前面小红书封面的表格不同的是，这次我们有一个按钮自动化，它不是工作流，所以不在左侧列表，而是需要在自动化中心开启，如下图所示。

②申请和替换API
自定义AI的字段捷径只支持直接填写API KEY，再加上确实有些学习比较慢的朋友还是需要些时间来掌握AI字段捷径的使用，所以我在模板里保留了自己的API KEY的接入点，它暂时依旧是生效的。但为了防止被滥用，我对这个接入点的并发性能和额度做了一些限制；而且随着模板使用人数越来越多，tokens消耗也在变大，目前每天小几十万的tokens没有多少成本，但如果用的人更多的话，我也不保证这个API KEY一直可以生效。所以还是建议能够自己配置API的朋友换成自己的API，一方面是性能上不会有限制，另一方面也把额度留给在配置上确实有困难的朋友。注册火山方舟后，平台会直接赠送一些免费额度。
直接双击字段名称就可以进行修改，获取API的方法可以看我这篇文章中火山方舟的部分：DeepSeek服务器总繁忙怎么办？不愿稍后，不如试试通过API续命你的聊天儿

另外，如果你反推图片比较多，当多维表格赠送的图片理解模型调用次数用完后，也是需要你到火山开通视觉模型并绑定账号的。
按下图操作，可以找到官方教程。

正式使用

打开表格后可以看到有这些字段：

①请在原海报的位置粘贴或直接上传你要进行参考的海报或图片。

②AI字段捷径会自动运作，生成反推Prompt，并提取出其中的文字文案和主体形象。

③在修改区手动调整文案的文字，并提出对画面细节和风格的修改要求。

④点击开始修改按钮，右侧修改字段中会自动生成可用来进行生图的Prompt。

⑤最后，复制这个Prompt到即梦/豆包平台进行生图。这两个平台每天都有数十次的免费生图次数。

我在模板中留了15个全流程的实操案例，你也可以参考它们进行操作。

案例演示

接下来我们跑几个实际的案例。

演示案例一

例如，这是一张优酸乳的原版海报。

我们把它上传到「原海报」的位置。
然后AI字段捷径自动运行，提取出其中的文案：

海报上的文案部分如下：- 主标题：“0糖0脂无腹担”- 副标题：“拿捏00后的快乐”- 品牌标志：“优酸乳”- 宣传语：“快乐不肥宅”- 产品信息：“New”- 产品名称：“乳汽”- 产品描述：“牛乳+汽水 健康碳酸喝乳汽”

这些文案被提取出来后，会自动写入到黄色「修改文案」部分。
然后我们可以在「修改文案」部分直接对文案进行编辑。
例如，我不喜欢海报上这个「NEW」的标签，我就在这段文案中，把「NEW」删掉。

同时，海报中的主体形象也被标识了出来，有：

前景的年轻女性和乳汽产品、背景的蓝色天空、白云以及绿色和黄色的几何图形

这些都是画面中比重较高，也是我们可以进行修改的元素。
比如，我想对女孩手里的乳汽产品进行强调，我只要「易拉罐」版本的。

点击「开始修改」按钮，我们就得到了生图Prompt：

这是一张优酸乳乳汽产品的推广海报，整体设计风格为现代简约且充满活力，主要色调为蓝色、绿色和黄色，形成鲜明的对比，营造出青春、健康的氛围。背景由蓝色的天空、白云以及绿色和黄色的几何图形构成，亮暗分布合理，与主体视觉信息形成良好的融合与衬托关系。主标题为“0糖0脂无腹担”，字体为无衬线体，字体较大，颜色为白色，位于画面左上方，约占画面宽度的三分之一。副标题是“拿捏00后的快乐”，字体同样为无衬线体，字体相对较小，颜色为白色，位于主标题右侧，呈弧形排列。其他文字信息有：“优酸乳”品牌标志在画面左上角；“快乐不肥宅”在画面右下角，字体为无衬线体，绿色；“乳汽”多次出现在产品罐身和包装上，字体为无衬线体，绿色；“牛乳+汽水 健康碳酸喝乳汽”在画面底部，字体为无衬线体，白色。这些文字排版方式多为居中或与产品位置相配合，层级清晰，与主副标题形成对比和补充。前景元素主要是一位面带笑容的年轻女性，她手持一罐乳汽产品举在头顶，人物形象清晰、自然，占据画面中央偏下位置，是视觉的焦点。此外还有乳汽的产品形象，位于画面底部，展示了不同包装样式。人物和产品与背景和文字的层级关系明确，人物和产品在前，背景和文字在后，相互衬托。整体布局采用非对称构图，元素分布错落有致，视觉引导路线从左上角的品牌标志开始，到主标题、人物、产品，最后到右下角的宣传语，自然流畅。色彩上以蓝色、绿色和黄色为主，搭配白色，色彩鲜艳明亮，呈现出欢快、轻松的氛围。从设计特点来看，海报采用了摄影与图形设计相结合的方式，目标受众主要是年轻群体，旨在突出产品健康、快乐的形象。

复制到即梦中，生成图片：
「NEW」的标签被成功去掉，女孩手里的饮料也改成了易拉罐版本。

还没完。
对比原来的海报发现，原海报女孩身后的绿色图案其实是一个数字「0」，在这张海报中，它应该是呼应0糖0脂的。
我们使用的豆包图片理解模型没有成功理解到这一点。但我觉得这个数字「0」十分有创意，我想保留它。
怎么办？很简单。
我们再回到「其他修改要求」中，进行补充。
明确告诉AI，女孩身后要有一个数字0的图案，象征0糖0脂0负担，并且黄色和绿色的几何图形有点丑了，我不想要。

再点击按钮，重新生成Prompt。
现在得到新的Prompt：

这是一张优酸乳乳汽产品的推广海报，整体设计风格为现代简约且充满活力，主要色调为蓝色、白色和橙色，形成鲜明对比，营造出青春、健康的氛围。背景由渐变的蓝色天空和立体白云构成，亮暗分布合理，与主体视觉信息形成良好的衬托关系。主标题为“0糖0脂无腹担”，字体为无衬线粗体，字号最大层级，纯白色，以15度倾斜排列在画面顶部中央区域。副标题“拿捏00后的快乐”采用半透明磨砂质感字体，无衬线细体，白色，环绕排列在主标题下方形成视觉组合。品牌标志“优酸乳”使用标准字库版本，白色描边样式，位于画面左上角。宣传语“快乐不肥宅”使用立体气泡字体，亮橙色，位于画面右下角波浪形底板上；“牛乳+汽水 健康碳酸喝乳汽”采用无衬线细体，白色，横向排列在画面底部边缘。前景元素由三部分组成：核心视觉是占据画面中央的年轻女性，手持易拉罐版乳汽产品举至脸颊侧，人物身后浮现半透明的霓虹光效数字0图案；第二层为四组不同口味的易拉罐产品阵列，以30度倾角悬浮在人物脚部周围；第三层为飞溅的乳白色汽泡动态轨迹，环绕主体人物形成视觉动线。整体布局采用中心放射式构图，视觉引导路线从顶部主标题开始，沿数字0的光效弧线聚焦到人物面部，最终通过汽泡轨迹指向右下角宣传语。色彩系统以蓝白渐变为基底，搭配高饱和橙色作为强调色，数字0图案采用霓虹蓝外发光效果，易拉罐瓶身保留品牌标志性的绿色系渐变设计。

生成图片是这样的：

控制文案+控制元素+用嘴改图。

演示案例二

假设现在阿里云是我们的客户，我们要在某流量平台为它进行信息流投放宣传。
这个平台的图片广告位是一个3:4比例的展示位，但是现在我们只有一张接近方形的矩形素材图，设计师又没空给我们重做。

怎么办？别着急。
我们把现在有的这张图上传到表格「原海报」的位置。AI自动反推出Prompt：

海报主题为阿里云的产品推广活动，整体设计风格具有科技感，主要色调为蓝色系，呈现出冷色调的渐变效果。背景是淡蓝色的渐变，带有一些柔和的曲线纹理，亮暗分布均匀，与主体视觉信息融合自然。主标题文字为“金秋上云 超值优选”，字体为无衬线字体，较为粗壮，颜色为黑色，在画面的左上方，大约占画面宽度的三分之一。副标题没有明显体现。其他文字信息有“云服务器ECS 99元/年，新老同享”“轻量服务器82元/年，流量放心用”“域名注册1元起，百元建站”，字体为无衬线字体，排版居左，颜色为黑色和橙色，橙色用于突出价格信息，层级低于主标题。前景元素有阿里云的Logo，位于画面左上角，还有一些科技感的3D立体图标，如服务器模型、地球、芯片等，分布在画面右侧和中间，形状立体，大小不一，风格具有科技感，无特效，与背景和文字的层级关系清晰，图标在文字的上层。整体布局为非对称式，元素的前后顺序为前景图标、文字、背景。视觉引导路线是先看到左上角的Logo和主标题，然后目光会被右侧的图标吸引，最后关注到下方的详细价格信息。色彩上以蓝色为主，辅助色为橙色和黑色，蓝色营造出科技感和冷静的氛围，橙色突出价格优势。设计上采用了3D渲染技术，目标受众可能是有云服务需求的企业和个人，信息传达目的是突出阿里云产品在金秋时节的优惠力度和产品优势。

我们直接复制这个Prompt来到即梦，选择3:4的目标比例：

3:4的图片就这样生成了：

选择其中比较好的一张，我发现即梦的生成结果在品牌LOGO部分还是有明显瑕疵的。
但这点问题完全不打紧，找到右下方工具中的「消除笔」，我们把错误的部分涂掉。

再重新生成一遍：

现在瑕疵部分就消除了：

接下来，只要随便找一个图片编辑工具把阿里云的LOGO加到左上角就可以了。当然，如果要修改也是完全没有问题的。
比如，我们可以把它改成腾讯云：

LOGO依旧是按刚才的方法处理一遍。

PS：如果你真的是处在一个服务客户的场景的话，无论如何，哪怕AI生成的结果看起来跟真实的很像，我都建议你把LOGO、商品这些有严格规范的东西重新处理一遍，替换成准确的素材。这是对客户负责，也是对自己负责。

演示案例三

这是本文的题图：

虽然被我改的有点面目全非，但它的原版其实是……《只狼：影逝二度》：

上传原图进行反推，Prompt我就不粘贴了，同步还得到了文案和海报主体形象：

在最终的新图里，实际上文案、角色和画风都发生了变化。
文案最简单，我们直接在「修改文案」中，把主副标题修改为：

主标题：一键仿图副标题：文案修改 细节精调

其他的修改，就放在「其他修改要求」里。
首先，这个燃烧的古日式建筑我希望保留，所以可以写道：

图片日式古建筑环境元素不变

画风我希望变成巨人的风格。
如果我们现在用的生图模型是GPT-4o，其实直接指名就是最优的选择。
但我们现在使用的模型是即梦3.0，它在理解上确实跟GPT-4o有所差距。
于是就可以这样：

整体画风改成进击的巨人动画的画风（请描述一下这种画风）

请AI在提示词中具体描述一下目标动画的画风。
AI也确实给到了反馈：

以鲜明的线条、强烈的光影对比和富有张力的画面表现为主。

接下来人物，要求AI把只狼的武士形象，替换成兵长的形象：

原本的武士形象替换为动画中利威尔兵长的形象，武器为手持双刀，背上不用背刀

上面几条内容拼起来，就是「其他修改要求」。
然后，点击按钮，我们得到最终的生图Prompt：

这是一张宣传海报。整体设计风格偏向进击的巨人动画画风，以鲜明的线条、强烈的光影对比和富有张力的画面表现为主。主要色调为暗色调中带有暖色调的火光对比。海报背景是一座古日式建筑，建筑被烈火包围，营造出紧张而危险的氛围，背景主色为暗沉的灰黑色调，火光处较亮。主标题为“一键仿图”，字体为大写的具有进击的巨人动画字体风格，较为粗壮，颜色为白色，位于画面上方中间位置，约占画面宽度的三分之一；副标题是“文案修改 细节精调”，字体同样为进击的巨人动画字体风格，但稍细，颜色为金色，位于主标题下方，与主标题上下对齐。前景元素是进击的巨人中利威尔兵长的背影，他身着类似调查兵团服饰，双手持双刀，站在画面中央，占据画面较大比例，人物边缘有火光的衬托，使其更为突出，与背景建筑和火光形成层级关系，人物在前，背景在后。整体构图为非对称式，视觉引导路线是先看到画面中央的主角，再向上看到主副标题，最后注意到背景的建筑和火光。主要颜色为暗沉的黑灰与明亮的火光橙黄，辅助色为白色和金色的文字颜色，营造出神秘、紧张且充满战斗气息的氛围。海报采用类似进击的巨人动画的绘画风格，画面富有冲击力，目标受众为喜欢动漫风格及相关题材的人群，旨在突出独特的视觉风格与紧张氛围。

而后，生成图片：

到这里，你应该已经理解这张仿图表格的运作逻辑了。
如果还想看更多的案例，可以直接打开表格查看我留在表格里的其他案例。

Prompt

图片反推的Prompt我也放在这里，感兴趣的朋友可以自行取用或进行二次调优。
这套Prompt最早是去年我用ComfyUI工作流做FLUX.1海报反推时写的，后来经过Claude和o1的优化，现在是第3个版本。
默认可输出中英双语描述，且结构更加自然语言化，符合现在新生图模型的风格。我觉得已经达到比较可用的状态了，分享给大家：

请对我提供的海报进行深度分析与描述，并输出两个版本：第一部分为「中文描述」，第二部分为「英文描述」。两个版本需自成段落、内容相对应但不混排。请尽量详细描述海报的所有视觉要素和文字信息，使后续生图模型能够最大程度地还原海报。请至少包括下列维度：1. 海报主题 (Poster Theme)   - 说明海报的主旨或活动类型（如音乐会、电影宣传、公益募捐、产品推广等）。   - 指明整体设计风格（复古、极简、科技、手绘、巴洛克等），并描述主要色调（冷暖对比、渐变、互补色搭配等）。2. 背景 (Background)   - 详细说明海报背景的图案、纹理或图像元素（如几何线条、风景、渐变叠加等）。   - 描述背景的主色、亮暗分布以及与主体视觉信息的融合或对比关系。3. 主标题 (Main Title)   - 列出主标题文字内容，如有多语言则逐一标明。   - 指出字体样式（衬线/无衬线/手写/卡通等）、大小比例、颜色方案（纯色/渐变/金属质感等）。   - 位置描述：可使用九宫格定位或时钟方位，并估测占画面宽度或高度的比例。4. 副标题 (Sub Title)   - 记录副标题内容及其字体特征、大小、颜色。   - 说明它与主标题的排版关系（上下错落、左右对齐、配色反差等），以及在画面中的空间位置。5. 其他文字信息 (Other Text Elements)   - 列举除主、副标题以外的所有文本（如日期、地点、宣传标语、嘉宾名单、赞助商等）。   - 为每条文字注明字体类型、排版方式（居左/居中/分栏等）、颜色搭配、相对于主副标题的层级或对比度。6. 前景元素或主体图像 (Foreground Elements / Key Visuals)   - 说明海报中的主要视觉图案、插画、人物或品牌Logo等；描述其形状、大小、风格特征、是否有特效（阴影、半透明叠加等）。   - 明确它们在画面中的位置（如画面左下/右上/中央），并解释与背景或文字的层级关系（遮挡、融合、发光衬托等）。7. 布局与层次感 (Layout & Hierarchy)   - 概括整体构图方式（对称/非对称、留白、网格化布局等），以及各元素的前后顺序。   - 如果能看出视觉引导路线（观众先看到哪里，再看到哪里），请加以说明。8. 色彩与氛围 (Color & Mood)   - 提及主要和辅助色的搭配（互补、类似色、淡雅/鲜艳等），或有无特殊渐变、光影变化。   - 推测海报想呈现的整体情感或调性（庄重、浪漫、激昂、神秘等）。9. 设计或技术特点 (Design / Technical Features)   - 若可判断海报采用了摄影、3D渲染、数字绘画或特殊后期处理（如颗粒感、仿旧纹理、霓虹灯风格），请加以描述。   - 对可能的目标受众或信息传达目的，进行简要说明（如“吸引年轻群体”“突出品牌前卫形象”等）。输出格式：1) 中文版本：用连贯段落描述以上要点，依序或结合叙述均可，具体而详尽。2) 英文版本：与中文内容相对应但不混杂，段落独立，用英文重述相同的分析维度与要点。请确保这两个版本各自完整，不要在描述后附带总结或结语，只需完成上述分析即可。

Enjoy。

2025年4月11日

国产免费DeepResearch：智谱「AutoGLM 沉思」到底怎么样？用AI深度调研知乎14年商业发展历程后我发现…
先说结论

AutoGLM 沉思版整体上还是比较可用的。

可圈可点之处不少：它能够自动搜寻大量网络内容，并从中摘录有效信息。同时由于具备一定的RPA能力，可以自动操作和浏览网页，它相比其他的DeepResearch产品，能够访问更多的不对外开放API的优质信源，例如知乎、小红书等等。并且，得益于多模态理解能力，它还能直接以读屏的形式，理解图片信息和难以提取的文字信息。

但测试下来，跟SOTA产品仍然有差距。优质信源的引入和筛选仍然需要加强，Web搜索的操作逻辑稍显稚嫩，结果呈现上深度不足，并容易发生遗漏。

实际使用时，可以把它作为重要参考，但不建议直接套用。

以下以一个实际任务案例，跟OpenAI的DeepResearch做一下对比：

调研任务：「知乎」商业分析

刚好最近知乎发布了2024年第四季度财报，首次实现了单季度全面盈利。我们就以「知乎」这家公司14年来的商业发展历程分析，作为调研任务的主题。

Prompt
```
请以专业商业分析师的身份，对知乎公司自成立至今（约14年间）的发展历程进行全面调研分析。请将分析分为上市前和上市后两个主要阶段，详细说明以下内容：## 基础信息- 知乎成立时间、创始人及初始定位- 公司IPO时间、估值及上市地点## 上市前发展（按年份）- 每年主要业务重点及模式转变- 关键产品迭代及功能上线- 重要融资事件及投资方- 用户规模变化及关键增长节点- 商业化策略演进## 上市后发展（按年份或季度）- 季度/年度财务状况（营收、利润/亏损、现金流）- 主要收入来源及占比变化- 业务重心调整及战略转型- 市值变化及投资者反应- 重大人事变动（包括裁员事件）## 对外投资与并购活动- 列出知乎历年来的主要对外投资项目与金额- 分析知乎的投资战略及逻辑演变- 投资领域分布及与核心业务的协同性- 主要收购案例分析及整合效果- 评估投资活动对知乎整体业务的影响## 关键转折点分析- 列出知乎历史上5-7个最重要的战略转折点- 分析每次转折的背景、决策原因及结果- 评估转折对公司长期发展的影响## 核心竞争力变化- 分析知乎核心竞争力如何随时间演变- 与主要竞争对手的差异化策略比较请确保分析客观、数据准确，引用可靠来源。如有条件，可添加关键财务指标图表以增强分析的直观性。最终分析应呈现知乎公司14年间的完整商业发展脉络，特别关注其商业模式演变及盈利能力变化。
```
OpenAI的调研结果

#### 基础信息

知乎成立于2010年，由前《南都周刊》记者周源等联合创立。网站名称取意“你知道吗？”，初期定位为高端问答社区，采用邀请制注册，聚集互联网、投资、学术等领域的专家分享专业知识。2011年1月正式上线后，李开复的创新工场等给予天使投资，知乎以“小圈子高质量内容”起步。在创立之初的两年里，知乎坚持邀请制运营，仅有200位种子用户（包括李开复、王兴等业内知名人士），为社区奠定了优质讨论氛围。

十年后，知乎踏上资本市场。2021年3月26日，知乎在纽约证券交易所挂牌上市，股票代码「ZH」，发行价每股ADS 9.5美元，募资约5.22亿美元。IPO时知乎估值约为53亿美元。上市一年后，知乎于2022年4月22日在香港联交所主板双重主要上市（股票代码：2390），发行价上限51.8港元，早期投资人如创新工场、启明创投等出售老股套现。需要指出，知乎在美股和港股均保持上市地位，并未退市或转板。在上市之际，知乎累计注册用户已突破2亿，人们将其视作“中国最大的在线问答社区”。

#### 上市前发展（2010–2020）

知乎自成立至IPO前经历了社区冷启动、用户爆发增长、商业化摸索等阶段，每年都有重要的业务进展和策略变化。
- • 2010年 – 周源开始筹备知乎项目。8月，受到问答网站Quora启发，周源与张亮等伙伴在北京创立知乎。同年12月，知乎产品进入小范围内测。创始团队仅十余人，包括CEO周源、CTO李申申、COO黄继新等。知乎早期采取邀请注册制度，以保证社区讨论质量。
- • 2011年 – 1月26日知乎正式上线运营。上线后专注产品打磨：3月获得创新工场董事长李开复数百万人民币天使投资和启明创投A轮融资；4月推出私信功能，5月上线“发现”模块，实时展示过去24小时赞同数最高的回答；7月接入新浪微博，用户可通过微博私信邀请回答；9月发布iPhone客户端，拓展移动端渠道。年底前，知乎完善了黑名单、话题广场、回答排序筛选等功能，增强社区体验。这一年知乎用户不足万人的精英圈层，但社区氛围专业友好，获得VC持续关注。
- • 2012年 – 2月知乎开放图片上传功能，丰富回答表现力；同时试验推出“知乎阅读”栏目，供未注册用户浏览知乎精选内容，开始向外输出优质回答。4月，对个人主页大幅改版，提升用户内容展示和社交关注功能。此阶段知乎仍坚持邀请制，注册用户增长到约40万，社区积累了大量高赞回答和行业专家。融资方面，知乎于1月获得启明创投数百万美元A轮投资，继续专注产品和用户口碑。
- • 2013年 – 知乎迎来第一次重大转折。【3月】正式取消邀请注册，全面向公众开放用户注册。开放当年用户呈爆发式增长：短短9个月注册用户从40万跃升至400万。大批新用户涌入使知乎由小众走向大众。5月知乎上线独立App“知乎日报”，由运营团队每日整合热门问答，以新闻资讯形式推送。7月18日推出“知乎专栏”功能，支持用户发表长文，拓展内容形式。社区规模扩大后，对品牌IP建设更重视，12月举办吉祥物征集大赛，最终确定北极狐“刘看山”为官方吉祥物。这一年知乎顺利完成数千万美元B轮融资（赛富亚洲基金领投，启明创投跟投），为日后商业化奠定资金基础。
- • 2014年 – 社区运营从粗放增长转向精细管理。4月，知乎对话题编辑权限作出限制，要求用户有一定赞同数积累方可编辑话题，维护内容质量。同时将官方吉祥物刘看山拟人化，用于品牌形象传播。知乎开始探索内容变现：4月14日首次发行「知乎盐系列」电子书，将优秀回答结集出版，作为知识付费的早期尝试。6月，知乎获得2200万美元B轮融资（赛富和启明联合投资）。这一年知乎注册用户数突破千万量级，社区内容体量和知名度快速提升，但商业模式仍在探索中。
- • 2015年 – 1月知乎上线“社区服务中心”用于用户反馈及服务支持。同月遭遇历史上最严重的DDoS攻击，所幸迅速恢复。社区层面出现诚信危机：6月一位拥有5万粉丝的知乎大V“童瑶”被曝在知乎诈捐15万元，引发讨论并于次年1月自首。知乎一方面加强社区诚信建设，另一方面继续引入战略伙伴：11月完成5500万美元C轮融资，由腾讯领投、搜狗跟投。融资发布时，周源亲自在知乎站内撰文官宣此消息，体现出社区运营与公司动态的深度融合。C轮后知乎与搜狗达成合作，将知乎优质问答内容接入搜狗搜索结果，提高内容曝光和导流。截至2015年末，知乎用户数已达1700万（官方未公开，当年媒体推算），商业化压力渐显。
- • 2016年 – 知乎在商业化道路上迈出关键一步。年初与腾讯微信团队合作开发公众号侵权投诉入口，以法律手段打击抄袭知乎内容的行为，保护内容版权。同时知乎开始尝试多元产品线：1月25日上线首档自制视频节目《职人介绍所》，探索短视频内容；4月1日发布付费问答应用“值乎”，允许用户付费向答主提问，标志知乎首次尝试付费知识问答；5月14日推出重量级付费产品“知乎Live”，用户可付费参与实时线上分享和问答。知乎Live一经推出即获得热烈反响，大量知名答主开设Live分享专业经验，实现知识变现。当年知乎举办的Live超过1000场，累计参与人次破百万（官方数据），成为知乎重要的营收来源之一。11月知乎全站切换为HTTPS协议，提升数据安全和隐私保护。融资方面，知乎于年初启动D轮融资，由知名投资人徐新旗下今日资本领投1亿美元，腾讯、搜狗、启明等老股东悉数跟投。徐新评价知乎：“投资基本在一天内谈定，一周内签约，钱很快到账”，显示出资本市场对知乎模式的高度认可。2016年可以看作知乎商业化元年：广告业务也在这一年开始试水，知乎从单纯社区运营进入“社区 + 广告 + 知识付费”的复合模式。
- • 2017年 – 社区和商业双线发展。1月知乎正式宣布完成D轮融资交割。8月，知乎成立共产党支部委员会，加强内部治理。同期知乎App上线类似“朋友圈”功能的“想法”模块，支持用户发布短内容动态。此举被视为知乎向社交媒体属性延伸，旨在提高用户黏性和日活。2017年知乎月活跃用户（MAU）约6800万，同比增长超过40%。然而社区的快速膨胀也带来内容争议：当年摩拜单车创始人因知乎上一些爆料帖将知乎诉至法院，要求停止侵权并索赔声誉损失。这一事件凸显知乎在内容审核上的挑战。知乎回应称已建立“内容安全委员会”并加强审核流程，平衡言论自由与法律合规。当年知乎在产品、用户和收入上均有不俗增长，但也开始直面大型社区常见的治理难题。
- • 2018年 – 政策监管成为关键词。3月，北京网信办通报知乎因管理不严传播违法信息，被各大应用商店下架整改7天。整改期间知乎全面清理敏感内容，一些高关注度用户被封号，引发用户讨论。据报道，导火索可能是一条涉及“两会”和修宪问题的提问，触及政治高压线。此次事件是知乎创立以来首次因为内容问题被处罚，下架风波促使知乎大幅强化内容审核机制，设立严格社区规范，对政治敏感、违法违规话题零容忍。这次监管风波短期内抑制了知乎的用户增长，但从长期看促使知乎构筑内容合规的底线能力。6月起，知乎进一步清理低俗或违法内容，甚至几乎清空与LGBT相关的讨论，引发部分用户质疑。在强监管环境下，知乎管理层积极与主管部门沟通。3月CEO周源受邀参加中央统战部组织的网络人士研讨班，与官方建立良性互动。在内容风波之外，知乎当年继续融资“补血”——8月宣布完成E轮融资2.7亿美元，投后估值约24亿美元。本轮融资由快手、腾讯等投资方参与，使知乎与短视频、社交巨头结盟。当年底有传闻称知乎进行大规模裁员，知乎官方予以否认。不过可以肯定的是，经历2018年的风波后，知乎对于内容风险有了更深刻认识，内部开始强调“生态第一，合规为本”，社区氛围也出现一定转变，从早年的理性专业逐渐增加了娱乐化、生活化内容，以迎合更广泛用户群体。
- • 2019年 – 商业化探索加速。这一年知乎没有再发生重大监管事件，专注于产品迭代和收入增长。8月知乎完成史上最大一笔融资：F轮融资4.34亿美元，由快手领投、百度跟投。此时知乎估值约达到35亿美元。快手作为短视频头部玩家入股知乎，体现出知乎内容生态对业界的战略价值。一方面知乎与快手在流量和内容上展开合作（如邀请快手创作者入驻知乎进行科普答题等），另一方面百度也通过战略投资加强与知乎的内容联盟——百度搜索结果开始大量嵌入知乎优质回答，知乎成为百度获取高质量UGC内容的重要来源。融资之外，知乎在付费业务上推陈出新：“盐选会员”付费订阅体系于2019年正式推出。盐选会员为用户提供包括知乎电子书、私家课、付费Live回看等增值内容服务，旨在将高黏性用户转化为订阅收入。会员推出后发展迅速，2019年底知乎付费会员数即突破200万，验证了用户愿意为优质内容付费的需求。此外，知乎当年还尝试社区电商变现，例如低调上线男性兴趣社区“CHAO”推广消费内容，但反响一般。用户数据方面，知乎宣布累计注册用户数突破2.2亿，月活跃用户数约0.48亿（QuestMobile数据）。可以说，2019年的知乎已经成长为综合性内容平台，告别了“小而美”，走上流量规模化和多元变现的道路。
- • 2020年 – 营收大幅增长，商业模式日趋清晰。据招股书披露，知乎2020年实现营业收入13.52亿元人民币，同比增长101.8%。广告、电商和教育等多元业务共同驱动增长。当年知乎主要收入构成为：广告8.43亿元，占比62.4%；付费会员3.2亿元，占比23.7%；内容商务解决方案1.36亿元，占比10.0%；其余（在线教育、电商等）0.53亿元，占比3.9%。可见广告仍是最大收入来源，但会员和知识服务的比重已接近四成，知乎收入结构较之前单一依赖广告更为均衡。用户方面，2020年知乎月活用户增长约42.7%，达到6850万。疫情期间在线内容消费需求提升，加之知乎在专业医疗、科普等领域内容的沉淀，吸引了大批新用户。社区话题更加多元，涵盖科技、职场、教育、生活等方方面面，知乎进一步“破圈”。这一年知乎还推出面向企业客户的“知+”内容商务解决方案，帮助品牌在知乎上以问答、文章等形式进行原生营销。同时，知乎涉足在线职业教育和电商导购，全年相关收入达5263万元，占营收3.9%。比如知乎与部分教育机构合作销售课程，开设“好物推荐”讨论专区引导电商转化等，都进行了尝试。可以说，2020年的知乎在商业化上形成了广告、会员、内容营销、教育/电商“四轮驱动”的雏形。尽管当年仍净亏损约5.18亿元，但亏损额较2019年减少近一半，亏损率大幅收窄，盈利曙光初现。这也为知乎随后启动IPO提供了信心和数据支撑。
#### 上市后发展（2021–2025）

进入上市公司阶段后，知乎面临资本市场的业绩要求，其业务重点逐步从单纯追求用户增长，转向兼顾增长与盈利。以下按年份/季度概述知乎上市后的发展轨迹，包括财务指标、业务策略、市场反应和组织变化等：

图：2019–2024年知乎营收与净利润走势（单位：亿元人民币，负值表示亏损）。可以看出知乎营收在2019–2021年高速增长，但净利润持续为负；2022年起增速放缓，公司刻意控制亏损并于2024年Q4首次实现单季盈利。
- • 2021年：高速增长与持续亏损并存。知乎于3月登陆纽交所上市，当年财务数据显示业绩规模翻番。全年营收29.59亿元，同比增长118.9%；其中Q4单季营收10.19亿元，同比增长96.1%。驱动营收暴增的主要因素是用户和付费业务的同步增长。2021年Q4知乎平均月活跃用户数达到1.03亿，同比增长36.4%；平均月付费会员数达610万，同比增长102%。用户增长一方面来自于知乎在下沉市场的渗透，另一方面得益于知乎加大了市场投放和品牌宣传力度。2021年知乎邀请知名演员出演广告片“每一个人的知乎”，并冠名科幻春晚等活动，大幅提升了品牌知名度和用户获取。然而，快速扩张也带来成本高企：知乎2021年全年净亏损达12.99亿元（较2020年扩大约一倍），主要由于上市相关一次性费用、研发投入增加以及市场营销费用大幅提升所致。毛利率为52.5%，略有下降。收入结构方面发生积极变化——全年非广告业务收入占比提升至61%，首次超过广告收入。会员订阅、知乎Live、电子书、内容营销等多引擎业务发力，实现了广告与付费收入“双轮驱动”。这一年知乎在产品形态上也有重要升级，即大力推进内容的“视频化”。知乎鼓励答主以视频回答问题，上线视频创作者激励计划，并推出视频专区和算法推荐，提高视频内容权重。管理层希望抓住短视频浪潮，让知乎从图文社区升级为综合多媒体社区，以吸引年轻用户和新的广告主。到了年底，知乎日活用户增速虽有所放缓，但整体社区生态更丰富，“视频+图文”并存的内容格局基本形成。监管与舆论方面，2021年末知乎再遇内容合规挑战：12月20日北京市网信办通报知乎存在法律违规信息，责令限期整改，并指导暂时关闭知乎的评论功能。知乎对此迅速响应，表示“将深刻吸取教训，严格落实整改要求”，并在整改期间自行暂停相关功能。评论区关闭一周多，引发部分用户不满甚至“出走”他坛。这一事件表明知乎虽上市，但仍需严守内容红线。总体看，2021年知乎实现了规模的跨越式增长和商业化结构优化，但距离盈利仍有明显距离。投资者关注的焦点在于：知乎能否在保持增长的同时有效控制亏损、平衡用户体验与商业变现。
- • 2022年：增速放缓，开源节流寻求转型。2022年外部环境发生明显变化：一方面宏观经济和广告市场低迷，互联网行业普遍进入“降速提效”阶段；另一方面，中概股普遍承压，知乎美股股价一路下行（2022年4月一度跌至2美元出头，相比IPO价跌去逾75%）。在此背景下，知乎管理层调整战略，主动放缓扩张步伐，更多关注提升运营效率、降低亏损。财报显示知乎2022年全年营收36.05亿元，同比增长21.8%，增速较上年大幅放缓（不足上年的一半）。其中Q4营收11.14亿元，同比增长仅9.3%。用户规模趋于饱和：2022年Q4平均月活跃用户1.007亿，同比微降2.5%。MAU增长停滞一方面由于2021年基数陡增，另一方面也与知乎减少市场投放、加强内容规范有关。尽管总用户不涨，但付费用户逆势上扬：2022年Q4月度付费会员数达1300万，同比增长112.5%。这说明知乎核心忠实用户愿意为优质内容买单，会员业务成为公司重要支柱。当年会员收入同比翻番至约8亿元（估算，2021年约4亿元）。“盐选会员”提供的独家文章、电子书和Live回放等吸引了大批知识付费用户。与此同时，广告业务承压明显。受到整体广告主预算收紧以及抖音、小红书等分流影响，知乎2022年广告收入出现下滑。Q4广告收入2.747亿元，同比大降27%。不少品牌削减了知乎投放或转向效果类广告，这对知乎以往依赖的大客户广告形成冲击。为弥补广告下滑，知乎寄望于“内容商务解决方案”等2B业务变现，但现实并不理想：Q4内容商业解决方案收入2.98亿元，同比下滑19%。企业客户在2022年也缩减了内容营销预算。这促使知乎进一步寻找新收入增长点。当年知乎确定了“职业教育”作为第二增长曲线，陆续投资和推出多项教育业务：6月知乎App上线“学习”频道，免费提供职业课程导流；12月正式发布“知乎知学堂”职教品牌，包括App和网站。此外，知乎近年少有的几笔对外投资均投向职业教育领域：8月投资品职教育（会计职称培训）、10月入股趴趴教育（留学考试培训），2022年10月更收购掌上园丁（教师考试培训，“一起考教师”APP）。这一系列组合拳表明知乎看好职教赛道，以投资、自营、联合运营多种方式布局（详见后文“对外投资与并购”部分）。在成本控制方面，知乎开始收紧费用支出，尤其是减少非核心业务投入。年初，知乎传出大幅裁撤视频团队的消息：知乎副总裁、短视频业务负责人蔡林离职，视频运营团队裁员约40人，约占团队60%。据报道，知乎日活跃用户（DAU）增长未达预期是砍视频业务的主要原因。管理层痛定思痛，承认与抖音正面竞争短视频并非知乎所长，遂将资源聚焦于更有变现前景的领域（如职业教育）。此外，公司还进行了人员优化和市场费用缩减，全年运营支出明显降低。这些举措对亏损控制卓有成效：2022年知乎净亏损约7.5亿元人民币（非官方数据估计），较2021年的13亿元大幅收窄。Q4净亏损1.795亿元，同比减少53.2%；经调整后的净亏损1.341亿元，亏损率同比收窄12个百分点。可以说，2022年知乎完成了从“高歌猛进抢用户”到“降本增效求生存”的战略转折。当年双重主要上市（美港两地）的身份也给知乎带来更大资本压力，投资人开始要求其证明盈利潜力。知乎管理层回应这一压力的办法是：牺牲部分增速换取盈利改善。虽然营收增速下滑、股价仍低迷，但知乎在这一年练好了内功，为下一步转型奠定基础。
- • 2023年：发力职业教育，降本增效接近盈亏平衡。进入2023年，知乎明确提出全年目标是“盈亏平衡”。公司在保持核心业务稳健的同时，大举推进职业教育，成为这一年的业务亮点。财务方面，据中国证券报报道知乎2023年全年收入约42亿元，较2022年增长约16%。增长主要来自上半年，到了下半年由于公司压降市场费用，营收出现同比下降。以第三季度为例，知乎总收入8.45亿元，同比下降17.3%；这是知乎作为上市公司首次出现收入负增长，源于公司大幅缩减费用投放所致。但盈利指标显著改善：Q3净亏损仅900万元，同比收窄96.8%，创造上市以来最小单季亏损纪录。经营费用的大幅压缩是主因——2023年Q3知乎总运营支出6.24亿元，同比削减30.5%。全年来看，知乎销售和营销费用降幅尤其明显，公司放弃了许多投放活动，以换取财务健康。与此同时，毛利率从2022年的约50%提高到2023年的60%以上，显示提效取得成效。管理层在内部多次强调“可持续增长”，不再一味追求用户规模而忽视盈利。知乎创始人周源在2023年12月的公司内部会上表示：“2024年公司的目标是盈利性增长”。在此思路下，知乎宁可短期营收承压，也要实现盈亏平衡，给投资者一个交代。事实证明这一策略是成功的：2023年全年知乎净亏损约0.84亿元，同比收窄近80%（上年约7.5亿元）。其中Q4单季亏损约0.1亿，相比上年同期的1.03亿亏损大幅缩小。值得一提的是，知乎于2023年第四季度成功扭亏为盈（详见下文2024年Q4财报），标志其正式跨越盈亏平衡点。业务层面，2023年知乎将相当精力投入到职业教育产品的打造上。年初发布“知学计划”，深化与第三方教育机构的合作模式，从最初的平台导流升级为在课程共创、用户运营等方面深度合作。1月举办首届“知乎教育大会”，宣布将职业教育品牌“知乎知学堂”独立运营，加码自营课程研发。知乎知学堂定位于为年轻职场人提供职业技能培训和考试辅导，依托知乎社区海量职场问答数据和行业专家资源，推出一系列特色功能。例如2023年国考报名季，知乎上“考公（公务员考试）”相关问题数环比增长210%，浏览量增长50%。知乎知学堂顺势推出智能择岗、AI刷题和智能批改作业等工具，利用大模型技术提升备考效率。教育业务的快速成长带来可观收入回报：2023年前三季度知乎职业教育收入已达1.45亿元，同比增长85.6%，占总营收的14%。上半年职教收入2.5亿元，同比激增194%。职业教育俨然成为知乎继付费会员之后新的业绩增长点。与此同时，知乎付费会员业务继续稳健扩张：2023年Q3知乎付费会员收入4.69亿元，仍是最大的营收板块，占比约46%。会员渗透率（付费用户占MAU比例）超过10%，在中文互联网社区中位居前列。广告业务则处于低位徘徊状态，2023年广告收入相比高峰期已减少很多，仅为营收次要部分。取而代之的是会员订阅+职业教育双引擎驱动知乎商业模式转型。2023年知乎在新品类上的探索也极为谨慎，几乎没有再做社区领域的无关扩张，而是围绕知识付费主业深耕。这一年知乎股价跌至历史最低0.65美元/股（2023年11月），市值一度不足5亿美元。市场虽认可知乎减亏表现，但对其未来增长点仍持观望态度。不过随着盈利拐点出现，知乎的投资价值正在重新受到关注。组织变动方面，知乎引入新的CFO王晗等职业经理人，加强资本市场沟通。公司员工数相比高峰期略有减少，据脉脉爆料公司2023年末又进行了一轮“小范围优化”，总体士气保持稳定。总的来看，2023年知乎通过控制成本和培育新业务，终于走出了“一亏再亏”的怪圈，证明了自身造血能力。这为其在2024年及以后实现健康成长奠定了基础。
- • 2024年Q1–Q1 2025：成功扭亏，稳中求变。2024年是知乎上市后的第四年，公司经营进入收获期。根据知乎发布的2024年全年业绩公告，知乎全年营收36亿元，同比下降14.5%。营收下滑是管理层主动调整的结果，通过压缩低利润的业务换取盈利改善。2024年净亏损仅1.69亿元，同比收窄79.9%；按非美国通用会计准则（Non-GAAP）计算，全年调整后净亏损不到1亿元。尤其值得瞩目的是，知乎在2024年第四季度首次实现全面盈利：该季收入8.6亿元，净利润8640万元，而上年同期亏损1.031亿元。经调整净利润9710万元，经营利润2310万元，各项盈利数据均超出市场预期。知乎上市近四年来首次单季盈利，标志着其商业模式经过多轮打磨已跑通。知乎管理层在财报电话会上表示：“我们在首个利润转正的季度就实现了两位数的净利率（调整后净利率约11%）”。这相较国际UGC社交平台25%~40%的常态利润率仍有距离，但知乎终于证明了自身可以盈利，极大提振了投资人信心。受财报利好影响，知乎美股股价在2025年一季度累计上涨超过30%。公司同时宣布将启动股票回购计划，以回馈长期股东（相关细节媒体有报道，此处略）。展望未来，知乎管理层一方面强调不会放松成本管控，确保业务稳健；另一方面也提出要把握AI浪潮带来的历史性机遇。CFO王晗在2025年初表示：“鉴于AI对知乎是历史性机遇，公司账上现金充裕，2025年或考虑在AI领域加大投入，哪怕全年保持小幅亏损状态”。这番表态意味着知乎在2024年尝到盈利甜头后，并不急于每季度都盈利，更重视长期竞争力塑造。预计2025年知乎将在人工智能与知乎内容结合上发力，包括利用知乎十多年沉淀的海量中文问答数据训练大模型、推出智能问答助手等（例如已有报道的“知海图AI”功能）。总之，知乎在盈利拐点出现后，将进入“保持盈亏平衡 – 定向投入扩机会”的动态平衡期。截至2025年第一季度，知乎月活用户稳定在亿级水平，付费会员留存率良好，公司现金流充沛无债务负担，可以从容应对下一阶段的创新和竞争挑战。
#### 对外投资与并购

知乎在上市前后进行了几笔与主业高相关的投资/收购行动，主要集中于职业教育领域。下面列出知乎重要的对外投资与并购事件：

表：知乎对外投资/并购职业教育领域一览。知乎很少进行主业以外的投资动作，职教成为例外重点布局方向。2021年以来连续出手财会、留学、教资等培训赛道，显示其在该领域“势在必得”。

投资逻辑与领域演变：知乎涉足职业教育领域的动因在于，职业教育市场空间大且与知乎问答社区有天然协同。“所有人的问题归根结底都是教育问题”——周源多年前的思考如今成为知乎战略。知乎注意到社区中充满了考研、公考、职业技能等相关问答，用户有强烈的学习提升需求。据弗若斯特沙利文报告，中国非学历职业教育培训市场2026年预计达1102亿元，2019–2026年复合增速21.4%，是一块诱人的“大蛋糕”。然而，这一行业长期分散且良莠不齐，缺乏龙头平台。知乎看中了市场痛点与自身优势的契合：知乎拥有1亿+知识导向用户和丰富的专业答主资源，如果能将社区流量转化为教育服务，并提高行业信息透明度，就有机会在众多职教玩家中胜出。基于此，知乎自2019年起即尝试以联合运营方式与外部职教机构合作卖课，逐渐积累经验。2021年后，知乎更是少见地频频向教育垂直公司投资入股，这与知乎一贯保守的投资风格形成鲜明对比。选择的标的方面，知乎从财经财会（品职教育）到语言考试（趴趴教育）再到公职考编（掌上园丁），布局领域越来越广，几乎涵盖年轻人职业成长的重要环节。投资步骤也从参股小比例到直接收购整合，体现出知乎决心搭建完整的职教业务版图。截至2023年底，知乎已构筑起“考研 – 留学考试 – 职业资格 – 公务员/教师招录”多方向的课程体系，通过自营、合作、并购等手段夯实“第二增长曲线”。

协同性分析：知乎在职业教育上的频频出手，与其主业协同效应显著。首先，流量协同：知乎拥有大量有学习需求的年轻用户。例如，“考研”“国考”等话题在知乎有高关注度（相关问题浏览量动辄数千万），将这些精准流量导入知乎自营或合作的课程，可极大降低获客成本，提高转化率。知乎提供了App内的“学习”专区入口，把社区问答场景自然连接到课程购买场景。其次，内容协同：知乎社区本身沉淀了海量优质答案，可作为教育内容的补充和卖点。例如财经类培训可引用知乎优秀答主的实战经验答问、英语培训可结合知乎留学海归分享的心得。知乎还可以邀请平台上的KOL答主参与课程授课或直播，实现社区内容与课程产品的联动。第三，品牌协同：知乎品牌与知识、可信赖紧密关联，这为其进入教育领域提供了良好背书。很多用户愿意相信“知乎出品”的课程质量，这种信任是其他纯培训机构所不具备的。最后，知乎的AI技术投入也可反哺职教业务——利用大数据和模型为学员提供智能刷题、岗位匹配等服务，提升教学体验。当然，协同不代表没有挑战。整合风险在收购掌上园丁时就显现，知乎需要将一个外部团队文化、系统并入自身，确保服务质量一致。所幸目前来看知乎知学堂的产品口碑较好，整合相对顺利（例如“一起考教师”在知乎学习平台上顺利上线，用户反馈积极）。知乎在试点几次成功合作后，逐步摸索出一套模型，将联合运营模式升级为更深入的共建运营，甚至选择优质标的直接并购，充分掌控课程品质和服务。相比之下，知乎过去在社区电商上的尝试（如男性种草社区“CHAO”）由于协同不足已悄然下线。这一正一反的对比，更凸显出知乎选择职业教育赛道是深思熟虑的，确实找到了与主业高契合度的变现突破口。

成功与失败案例：从目前进展看，知乎在职业教育领域的投入已经初见成效，可视为阶段性成功的案例。2023年前三季度知乎职教业务收入达1.45亿元，占比升至14%。知乎知学堂品牌也快速打响，2024年初独立运营后发布多款AI功能，亮相即获得市场关注。当然，这条路也走过一些弯路。比如早期知乎与第三方机构联合卖课时，由于用户转化链路长、服务不一致，实际效果一般。知乎认识到仅做导流平台很难产生口碑，2023年调整为深度参与运营甚至自营开发课程。这意味着投入增加，但对用户体验的掌控力增强，复购率和口碑也相应提高。另一个潜在风险是教育监管：近年来教育培训监管政策多变（如“双减”政策影响K12领域），尽管知乎侧重成人职教相对政策宽松，但也需关注职业教育可能的政策要求。不过整体而言，知乎在对外投资并购上的选择十分克制和聚焦，目前所有已知投资都服务于知识付费主业，没有出现跨界收购导致管理分散的情况。这种谨慎策略也降低了重大失败的可能性。综上，知乎的对外投资布局与主业协同度高，通过成功整合教育资源，不仅开辟了新的营收渠道，也进一步强化了知乎作为“知识服务平台”的定位，对整体业务形成正向反馈。

#### 关键战略转折点

在知乎发展史上，有若干里程碑式的战略转折事件，对公司中长期走向产生了深远影响。本文梳理出其中5–7个重大转折点，阐述每个转折发生的背景、原因和结果，并分析其长期影响。

1. 2013年开放注册：从精英社区走向大众平台。知乎创立最初两年坚持邀请制，小范围运营确保了内容质量，但也限制了用户增长。到2013年初，知乎注册用户仅40万左右。创始团队意识到要构建商业模式，需要更大规模的用户基础和流量支撑。同时，竞争对手百度知道等大众问答平台已经积累了海量用户和内容，知乎若继续封闭可能丧失窗口期。在此背景下，知乎于2013年3月取消邀请制，向公众开放注册。开放注册后用户呈指数级增长，不到一年突破400万，随后几年持续攀升。这一转折的结果是知乎从小众走向主流，迅速“破圈”成为中文互联网知名内容社区。长期影响有两面：一方面，巨量新用户的涌入为知乎后续商业化提供了基础——没有2013年的用户爆发，就没有知乎之后的广告和会员收入。另一方面，用户构成的变化也冲击了早期精英化氛围，社区开始出现娱乐化、低质内容，老用户纷纷感叹“知乎不再纯粹”。知乎后来不得不通过引入赞同/反对机制、等级权限等办法提升内容筛选，以适应更大众的社区。总体而言，2013年开放注册是知乎发展道路上最重要的转折点之一：它奠定了知乎成为国内最大知识社区的地位，也让知乎从此要面对“大社区”的治理挑战。 2. 2016年商业化起步：探索盈利模式，从单一社区运营转向“社区+业务”双线发展。成立六年后，知乎虽然拥有数千万用户和良好口碑，但一直未找到清晰的盈利模式，这也曾让投资人产生疑虑。2016年前后正值中国互联网“知识付费元年”，得到、喜马拉雅等知识服务平台兴起。知乎管理层意识到，继续忽视商业化将错失良机甚至危及公司生存（毕竟融资总要有回报）。2016年知乎展开了一系列商业化尝试，标志战略重点的重大转折：一是上线广告服务，尝试信息流原生广告和品牌专栏等，开始将流量变现。虽然知乎当时广告规模不大，但这意味着知乎从理想主义走向务实，开始承担营收压力。二是推出付费产品“值乎”和“知乎Live”。值乎作为付费问答的尝试，让用户直接为优质回答掏钱；知乎Live则抓住用户愿意付费听专家分享的需求，在知识服务市场一炮打响。例如，一场知名医生的Live“癌症防治课”吸引上万用户付费听讲，创下数十万元收入，这在过去是难以想象的。商业化起步的结果是知乎当年首次获得可观收入，实现从“零营收”到“千万级营收”的突破，也证明了用户愿意为知识付费这一商业逻辑。然而，商业化也带来了与用户体验的冲突：部分老用户不满知乎出现广告和软文，觉得社区“变味”。周源在接受采访时坦言，每当有人问知乎如何赚钱，他内心很烦，但又不得不去探索赚钱之道。他曾戏言“做了个商业化的东西，不就赚钱了吗”，这句调侃后来被证明并不轻松——商业化如同一把双刃剑，高悬在知乎头顶。尽管挑战存在，2016年的商业化转折无疑为知乎打开了增长新空间，使其不再只是“烧钱换用户”的模式，而是迈向“造血循环”。长期看，如果没有2016年勇敢地摸索广告和知识付费，知乎可能难以支撑到后来的IPO。 3. 2018年内容监管风波：合规与自由的博弈，社区运营策略调整。2018年3月，知乎因平台上出现违法违规信息被主管部门约谈，下架整改7天。这次事件对知乎影响深远，可谓发展中的一次被动转折。发生背景在于知乎用户规模扩大后，言论内容变得更难管控，一些敏感政治话题和不当言论引起监管注意。强监管政策下，任何内容平台都必须强化审核，否则面临关停风险。知乎在这次风波中迅速做出改变：大规模自查清理违规内容，严格实行内容审核标准，对敏感领域（政治、意识形态等）贴身紧盯。整改期间知乎甚至暂停了部分功能，可见决心之大。转折结果是知乎成功通过整改恢复上架，避免了一次生死危机，同时也失去了一部分追求言论自由的用户。一些用户发现知乎上政治类提问几乎绝迹，某些热门时事问题会被迅速删除，这与过去相对宽松的讨论氛围截然不同。知乎因此被调侃为“编乎”，认为其对官方过于迎合。但从企业生存角度看，这是不得不做的妥协。长期影响在于知乎探索出一条“审慎运营”的道路：在中国政策环境下，宁可损失部分讨论自由，也要保全社区大局。知乎此后设立内容风控团队，投入技术力量过滤非法内容，定期向网信办报告整改。可以说，2018年监管事件让知乎完成了从“野蛮生长”到“合规运营”的转折。在强监管新常态下，知乎得以安全存续并继续增长，这是用户和投资人都乐于看到的。但另一方面，此举也使知乎社区调性发生改变，娱乐化、生活化内容比重上升，而公共话题、尖锐讨论减少。一些核心用户和答主流失，整体内容深度一度被诟病下滑。这种变化在短期内削弱了知乎的差异化优势。不过随着时间推移，知乎通过专业认证、机构号入驻等方式重新增强了内容专业性（如2023年推出的“蓝V职业身份认证”），逐步找回了一些严肃讨论的空间。综上，2018年内容合规转折是知乎发展中一个阵痛期，但浴火重生后知乎的抗风险能力和规范化水平都上了一个台阶，也为其后来的上市扫清了政策障碍。 4. 2021年赴美上市：拥抱资本市场，进入发展新纪元。知乎经过十年成长，终于在2021年踏上IPO征程。选择在美股上市的背景是，彼时中概股整体估值尚可，且知乎连续多年亏损，需要大量资金支持长期运营和新业务拓展。IPO的原因很明确：为公司募集发展资金、为早期投资人提供退出渠道、提升品牌形象和公信力。知乎于3月成功在纽交所挂牌，成为“中文第一问答股”。上市首日市值约53亿美元，腾讯、创新工场等股东账面浮盈可观。上市带来的直接结果是知乎一次性募得逾5亿美元资金，极大缓解了资金压力。这笔资金知乎主要用于加大技术投入、内容生态建设以及新业务孵化（如职业教育）等。在随后的2021–2022年，知乎依托上市融资扩张团队，研发了算法推荐、直播、AI识别等底层技术，加强了社区基础设施。此外，IPO提升了知乎品牌知名度，带来了更多商业合作机会，许多大客户更愿意与上市公司知乎展开广告和内容共创合作。可以说，上市使知乎真正进入“资本+产业”双轮驱动的发展新阶段。长期影响来看，上市既是机遇也是挑战。机遇在于知乎站上更大舞台，融资渠道拓宽（后续还能发行债券、增发等），同时公司治理逐步与国际接轨，更加透明规范。然而，挑战在于上市公司要季度披露业绩，知乎从此暴露在聚光灯下，增长和盈利压力前所未有。尤其在中概股低潮和自身亏损扩大的情况下（知乎上市后股价一度破发大跌，引发质疑），管理层必须向股东证明商业模式的可持续性。这种压力实际上催生了知乎2022年以后降本增效、聚焦主业的战略转变。综上，2021年上市是知乎发展史上里程碑式的转折，使其完成从VC投资驱动向公众股东监督下运作的蜕变。周源在上市时感慨“知乎十一年终于迎来高光时刻，但商业难题仍待解答”。可以预见，上市带来的规范治理、品牌效应将在未来长期利好知乎，而来自资本的高要求也将倒逼知乎不断创新和自我进化。 5. 2022–2023年战略收缩与转型：聚焦高价值业务，走上盈利道路。经历上市后的高速扩张和2021年的巨额亏损，知乎在2022年开始了一次主动的战略转折。这次转折的特征不是大举进攻某新领域，而是收缩战线、提质增效。背景是宏观经济下行和公司股价低迷，要求知乎必须改变“亏损换增长”的模式。于是知乎管理层果断采取了多项措施：砍掉或弱化与核心问答主业协同不大的业务（如短视频娱乐内容），集中资源发展付费会员和职业教育两大高毛利业务。这意味着知乎放弃与抖音在短内容上竞争，转而强化自身知识付费的护城河。例如裁撤大部分视频团队人员，将内容创作激励预算更多倾斜给高质量的图文和课程创作者。同时，在职业教育领域大手笔投入，通过投资并购迅速补全课程产品线，力争2–3年内打造出一个能够盈利的教育子品牌。知乎还在内部发起“深蓝”项目，对运营、市场、人力等部门进行效率审查，以减少冗余和内耗。一系列收缩动作在2022年下半年至2023年初密集落地，短期效果明显：知乎2023年Q3运营费用同比减少30%、净亏损几近收平。可以说知乎终于找到了“花小钱办大事”的感觉，不再像过去那样烧钱买增长。这一转折结果是知乎在2023年底前成功实现首次季度盈利，证明了降本增效策略的正确性。更重要的是，公司内部的战略共识更加清晰——知乎将长期聚焦核心社区和知识服务，不再盲目多元化。曾经寄予厚望却不奏效的支线业务可以果断止损，资源要用在真正擅长和有前景的方向上。长期影响方面，这次转型让知乎组织更加精简高效、业务结构更健康，也让投资者对知乎的信心有所恢复（股价在2023年四季度止跌回升就是证明）。不过战略收缩并非没有代价：知乎MAU增长几乎停滞，两年以来一直维持在1亿上下，市场占有率没有明显提升。竞争格局方面，知乎主动放弃了短视频领域的用户争夺，就意味着未来获取Z世代新用户可能更依赖于其他方式（如通过专业课程吸引）。总的来看，2022–2023年的战略调整是知乎“长痛不如短痛”的明智选择，为公司打开了一条通往盈利的现实路径。这个转折也意味着知乎进入成熟运营阶段，从此告别粗放式增长，步入精耕细作的新常态。 6. 2024年扭亏为盈：验证商业模式，实现关键突破。经过前述一系列调整，知乎终于在2024年第四季度实现了首次整体盈利。这标志着知乎长达13年的“盈利难题”找到答案，堪称战略转折中的里程碑事件。盈利的重要背景是知乎多年积累的内容生态和用户忠诚度，经过货币化手段的持续优化，终于释放出利润。其直接原因在于：一方面收入结构更健康——2024年会员订阅和职业教育收入占比已超过一半，整体毛利率提升；另一方面成本费用得到严控，销售和市场费用占比降至历史低位。结果就是在营收同比下降的情况下，知乎仍能够盈利，这体现出商业模式的强韧性。首盈对知乎的中长期发展意义重大：首先，证明了知乎可以像B站那样由亏转盈，打破了外界“知乎赚不到钱”的质疑。盈利能力一旦得到验证，资本市场对知乎的认知将发生积极改变，公司估值有望修复。其次，有了利润，知乎就有更多战略选择权。它可以选择投入更多资金做长期项目（如AI研发），而不必担心失血过多；也可以酌情回馈股东，促进股价良性表现，从而通过股权激励绑定和吸引优秀人才。盈利还意味着知乎内部考核导向的转变——从单纯追求KPI增长到更加平衡地考虑投入产出比，这有助于打造更理性的企业文化。最后，盈利让知乎在激烈的互联网存量竞争中占据有利位置。很多社区类产品因无法盈利而被迫关停或卖身，而知乎挺到了盈利，就拥有了更多独立发展的底气。当然，首次盈利只是开始，如何稳固并扩大盈利是下一个课题。知乎高管清醒地认识到，行业领先的净利率尚未达成，还有大量提升空间。因此盈利拐点的长期影响还取决于知乎能否持续创新和扩大利润来源，而不只是通过省钱来盈利。总而言之，2024年扭亏为盈是知乎发展史上的一个辉煌转折点，标志其商业模式走向成熟，也预示着未来将进入盈利增长的新阶段。周源在这一刻也终于可以松一口气——“诞生十四年的老牌社区，终于迈过盈亏平衡点”。

(以上列举的战略转折点中，第1、2、4、5、6点属于知乎主动决策造成的改变，第3点（内容监管）属于外部因素推动的被动改变。但无论哪种，这些事件共同塑造了知乎今天的模样。知乎从小众到大众、从理想到现实、从扩张到收敛、从亏损到盈利，每一步转折都伴随阵痛与抉择，也为长期发展奠定基础。展望未来，知乎还将面对新的转折与挑战，例如如何应对AI对问答模式的冲击等，这需要管理层审时度势，延续过去在关键节点的决断力和执行力。)

#### 核心竞争力变化及竞品对比

知乎自2010年创立至今，其核心竞争力（Core Competence）随着内外环境演变而不断发展调整。在不同阶段，知乎的核心能力重点和与主要竞品的差异化路径如下：
- • 初创期核心竞争力：高质量问答社区氛围。知乎早期（2010–2012年）凭借邀请制汇聚了一批各领域的专家、意见领袖，形成了高质量内容供给的壁垒。彼时国内其他平台如百度知道、天涯问答等虽然用户量大，但回答良莠不齐、灌水严重。知乎通过严格的准入和社区规范，打造出“小而精”的问答社区，被誉为“知识分子的网络家园”。这一时期知乎核心竞争力在于：内容质量和社区文化。用户将知乎视为获取可信专业答案的首选，愿意在知乎进行深入探讨交流。这种良好社区氛围也吸引更多专家加入，形成正向循环。与之对比，百度知道走的是全民问答路线，缺乏有效激励优质回答的机制，大量回答为复制粘贴或营销内容，用户体验远不如知乎。新浪微博当时也曾尝试问答产品（如向明星付费提问），但微博更擅长热点传播，对系统性知识分享不在行，因此未能构成对知乎的威胁。在2013年开放注册前，知乎的差异化路径非常清晰：坚持精英社区定位，不追求用户数量而追求质量和深度。这一策略让知乎在专业人群中建立了口碑，也为后来扩张奠定品牌基础。
- • 高速成长期核心竞争力：规模与质量并重的内容生态。2013年开放注册后，知乎用户量飙升，一个迫切的问题是如何在扩大规模的同时维护内容质量。知乎的应对是推出一系列社区自治和内容分发机制：如赞同/反对投票系统、优秀回答上首页、话题专家机制、盐值积分等，激励用户产出优质内容并对低质内容进行压制。同时知乎引入“大V答主”概念，主动邀请各行业知名人士入驻回答，塑造标杆内容（例如著名医生、律师、教授等在知乎详尽解答专业问题）。这种“社区+平台”并举模式，使知乎在用户暴增后仍保持了较高的内容水准。核心竞争力逐渐从单一的精英氛围转变为大规模UGC内容管理能力。知乎能够在上亿级别的回答中，通过算法和人工结合，筛选出高质量内容推荐给用户，这种内容分发与运营能力是当时其他问答产品不具备的。比如百度知道由于没有社区互动和激励，回答质量随着规模扩大进一步下降，口碑每况愈下；豆瓣等社区虽然也有问答讨论区，但缺乏知乎这种结构化问答体系，内容沉淀和检索都不如知乎方便。因此，在2013–2017年的快速成长阶段，知乎的差异化体现在：既拥有数量庞大的活跃用户，又通过精细化运营保持了内容质量和社区黏性。这使知乎在中文知识社区领域一骑绝尘，用户心智中形成“专业问答就上知乎”的观念。
- • 商业化探索期核心竞争力：多元内容生产与变现能力。随着2016年起知乎大举商业化，其核心竞争力内涵也出现新元素。除了继续提供优质问答内容，知乎开始打造创作者生态，通过付费机制留住优秀答主。知乎Live、付费咨询、电子书分成、盐选专栏稿费等，为内容生产者提供了收益渠道，吸引了一批职业创作者和机构入驻（如“知乎大学”引进专业讲师）。这时知乎的竞争力不仅在内容质量，还在于平台对内容生产者的吸引力。相比而言，微博和微信公众平台也在争夺内容创作者，但微博偏重热点和短内容，微信公众号虽然有变现（赞赏、广告）但缺少社区互动氛围。知乎则兼具二者优势：既提供社区交流土壤，又有成熟的商业变现体系，逐步成为内容创作者尤其是知识类创作者的聚集地。2018年知乎推出“海盐计划”扶持优秀回答者，并在社区内建立创作者中心，这些举措进一步稳固了知乎内容供应链。与竞品差异化方面，2016年前后今日头条推出了问答产品“悟空问答”，试图用现金激励抢占市场，但悟空问答上的内容多为低质营销，被网友戏称为“脑残问答”，最终在2018年折戟被并入头条号体系。悟空问答的失败反衬出知乎的成功：知乎不仅靠钱激励，更靠社区文化和品牌吸引创作者，形成良性循环的内容生态。这是知乎在商业化初期的核心竞争力所在，即平衡商业利益与社区价值的能力，使得用户、创作者、广告主三方都能从中获益。
- • 调整转型期核心竞争力：深耕知识付费，差异化定位专业社区。进入2020年代，尤其经历监管和市场洗礼后，知乎愈发强调自身在专业内容领域的深度。当前知乎的核心竞争力可以概括为：全方位的知识内容服务能力。一方面，知乎积累了全网最大的中文问答知识库（截至2021年底累计内容4.2亿条问答），在搜索引擎和内容分发平台上具有无可替代的优势。用户遇到疑难问题，搜索往往出现知乎答案；许多媒体文章也引用知乎答主观点作为专业意见来源，这证明知乎内容的权威性和长尾覆盖能力极强。这种内容资产本身就是知乎的护城河。另一方面，知乎通过付费会员、职业教育等打造了知识服务闭环，成为国内少数能提供从免费问答浏览到深度课程学习的一站式平台。举例来说，一个用户在知乎看了自由讨论的职业规划问答后，可以直接购买知乎知学堂的相关课程系统学习。这种服务链条是百度、微博等平台所不具备的。百度的强项在检索，但自身没有深入的社区运营和课程产品；微博善于传播实时信息，但缺乏体系化知识沉淀，不可能做职业培训。小红书近年也开始涉及知识分享（如职场心得、学习经验），但总体上仍以生活方式和购物分享为主，内容以短图文和视频为主，深度和系统性不足，难以满足用户深度求知需求。而知乎坚持以图文问答+讨论为核心，辅以视频、音频等媒介，既保留了系统知识传播所需的文本精度，又在一定程度上兼顾了多媒体表达。尤其知乎的问答格式使内容高度结构化，有明确的问题索引和答案排序，用户在这里更容易获得有针对性的高质量解答。相比之下，B站（哔哩哔哩）虽然也崛起了一批知识UP主，但B站的视频内容往往时长较长、检索不便，而且B站社区偏娱乐化，用户来B站主要目标是休闲放松，顺便获得知识是附带收获；去知乎则是明确带着问题寻求答案，用户心智模式不同。B站和知乎在知识领域有一些重叠，但定位差异明显：B站重视“知识的娱乐表达”，知乎追求“娱乐之外的知识深度”。双方都在向对方领域渗透——知乎增加视频、B站增加专栏文章和问答互动——但各自核心用户群和品牌调性仍有显著区别。
- • 与主要竞品差异化路径总结：
- • 核心能力的演进与当前定位：综合来看，知乎的核心竞争力已从早期“高质量问答内容”扩展为如今的“知识内容全链条服务”。它既包括优质UGC内容的生产与筛选能力，也包括付费内容/IP的打造和变现能力，还有社区运营和用户信任这一无形资产。知乎的品牌在用户心目中依然意味着“有问题，上知乎找答案”，这种认知就是知乎最大的护城河之一。当下，知乎通过职业身份认证（小蓝标）等举措聚拢各行业专业人士，巩固其在专业领域的内容优势；通过AI技术探索提高内容生产和匹配效率（如开发AI助手帮助提问者梳理问题，帮助答主生成草稿等），以保持在新技术时代的竞争力。相较竞品，知乎最大的差异化价值在于其沉淀的问答知识库和认真严谨的社区文化，这是短时间内其他平台难以复制的。可以说，知乎经历了用户爆炸增长考验、商业化转型阵痛和市场竞争压力后，依然牢牢占据着中文知识问答领域的王者地位。而它与百度、微博、小红书、B站等各主要竞品之间，也形成了各自鲜明的差异化路径：百度侧重搜索入口、微博主打社交实时、小红书深耕生活消费、B站称雄二次元视频，而知乎则坚守在理性知识分享的赛道上持续发力，并通过商业模式创新证明了这条赛道的价值。展望未来，知乎的核心竞争力还将随着技术和用户需求变化继续演进，但可以预见，“专业、有用的中文知识库”这一定位将始终是知乎安身立命之本，也是其与竞品竞争中最大的胜算所在。
#### 参考资料：

一共33个源：

AutoGLM 沉思版的调研结果

#### 基础信息

知乎（原名"知乎"），是中国领先的在线问答社区和知识分享平台，由周源于2011年1月26日正式创立。周源，1980年12月18日出生于贵州贵阳，本科毕业于成都理工大学，研究生毕业于东南大学，获软件工程专业硕士学位[10]。在创立知乎之前，周源曾在上海担任程序员，后来在北京担任记者，有着丰富的互联网和媒体行业经验[11]。

知乎的初始定位是为用户提供高质量的知识分享平台，其slogan为"有问题，上知乎"。平台采用邀请制注册方式，初期用户规模较小，主要集中在互联网行业[45]。

###### 公司IPO时间、估值及上市地点

知乎于2021年3月26日在纽约证券交易所上市，证券代码为"ZH"。IPO发行价定为每股ADS（美国存托证券）9.5美元，募集资金共计8.5亿美元（全额行使超额配售权后）[74]。在上市前，知乎已经完成了8轮融资，总融资额约9.2亿美元[25]。

#### 上市前发展（2011-2021）

2011年：封闭期起步

2011年1月26日，知乎正式上线，采用邀请制注册方式，早期用户包括李开复、马化腾、王兴、王小川、徐小平等互联网行业知名人士[30]。这一时期，知乎定位为"互联网"驱动的平台，用户规模在十万级[45]。

知乎的初始模式借鉴了美国问答平台Quora，但加入了中国特色的元素。平台以高质量的问答内容为核心，鼓励用户分享知识和见解，形成了独特的社区文化[17]。

2013-2014年：开放初期扩张

2013年，知乎开始开放注册，用户数由40万迅速增长至400万[45]。2014年10月28日，知乎迎来了第1000万注册用户，标志着平台进入快速发展阶段[45]。

这一时期，知乎的业务重点是扩大用户规模和优化内容质量，逐步从封闭的互联网圈子扩展到更广泛的领域。知乎开始尝试引入商业化元素，2014年开启了以广告投放为主的营收模式[26]。

2015-2017年：开放期爆发

2015年，知乎获得腾讯领投的5500万美元C轮融资，用户量突破5000万[45]。同年，知乎开始拓展知识付费业务，先后上线"值乎"（付费问答）、"知乎Live"等产品[40]。

2017年9月，知乎注册用户数破亿，获得今日资本领投的1亿美元D轮融资[45]。这一时期，知乎的商业化战略更加多元化，知识付费成为重要收入来源。

2018-2019年：智能社区阶段

2018年，知乎的商业化进一步走向多元。4月，知乎上线电子书产品"知乎读书会"；6月，推出付费会员打包服务"知乎大学"[47]。2018年，知乎注册用户量达1.6亿，回答数突破1亿[45]。

2019年8月，知乎完成F轮融资，总额4.34亿美元，由快手领投、百度跟投，腾讯和今日资本原有投资方继续跟投[79]。这是知乎迄今为止最大的一轮融资，也是中文互联网文化和娱乐领域金额最大的融资之一[91]。

###### 融资历程与估值

知乎从2011年1月至2019年8月，共进行了从天使轮到F轮的8轮融资，合计募资约9.2亿美元[25]。以下是知乎的主要融资事件：

天使轮：2011年，获得创新工厂的天使投资

A轮：2012年，获得启明创投近千万美元投资

B轮：2014年6月，获得赛富基金和启明创投的2200万美元投资

C轮：2015年9月，获得腾讯和搜狗的5500万美元投资，估值约50亿人民币

D轮：2017年1月，获得今日资本的1亿美元投资

E轮：2018年7月，获得3亿美元投资，估值接近25亿美元

F轮：2019年8月，获得4.34亿美元投资

###### 用户规模变化

知乎的用户规模经历了快速增长，从2011年的十万级用户，到2014年的1000万用户，再到2017年的1亿用户，最后到2019年的1.6亿用户[45]。截至2019年6月，知乎用户规模达2.8亿[45]。

知乎的用户主要为知识型中产阶级，年轻人群体占比大，主要分布在沿海发达地区，80%以上用户为本科及以上学历[45]。这些高质量的用户为知乎的内容质量和商业化提供了坚实基础。

###### 核心产品迭代

知乎的核心产品经历了多次迭代和功能上线：

早期产品：2011年上线时，知乎采用纯文字版，2012年春季才添加图片功能[53]

知识付费产品：2016年，推出"值乎"（付费问答）、"知乎Live"、"知乎书店"等产品[40]

付费会员服务：2018年，推出"知乎大学"付费会员打包服务[47]

电子书产品：2018年4月，上线"知乎读书会"电子书产品[47]

AI技术应用：2018年，开始在内容推荐和社区管理中应用AI技术

###### 商业化策略演进

知乎的商业化策略经历了三个主要阶段：

广告模式：2014年开启以广告投放为主的营收模式[26]

知识付费：2016年起，逐步拓展知识付费业务，包括"值乎"、"知乎Live"等产品[40]

多元商业化：2018年，商业化进一步走向多元，推出"知乎读书会"、"知乎大学"等产品[47]

#### 上市后发展（2021至今）

###### 融资表现与市值变化

知乎于2021年3月26日在纽约证券交易所上市，发行价为每股ADS 9.5美元，募集资金共计8.5亿美元。上市首日，知乎股价表现不佳，开盘后跌超20%，收盘跌11.16%至8.44美元，总市值47.18亿美元[3]。

不计绿鞋超配，知乎IPO融资约5.2亿美元，估值53亿美元，较上次融资后估值增长逾50%[8]。上市后，知乎的市值经历了波动，但总体上保持在一定水平。

###### 财务状况分析

根据知乎2022年的年度报告数据：

收入：知乎的收入主要来自广告、付费会员、商业内容解决方案和其他服务

亏损：知乎仍然处于亏损状态，但亏损率有所收窄

现金流：知乎的经营活动现金流有所改善，显示出更好的财务健康状况

2022年，知乎的收入结构发生了显著变化，商业内容解决方案收入占比提升，成为重要的收入来源。同时，付费会员收入也在稳步增长。

###### 业务重心调整

上市后，知乎的业务重心经历了多次调整：

内容生态建设：知乎加大了对内容生态的投入，推出"海盐计划"等措施提升内容质量

AI技术应用：2023年，知乎在AI技术领域加大投入，推出AI相关产品和服务

国际化战略：知乎开始探索国际化市场，尝试将成功模式复制到全球

商业化升级：知乎进一步优化商业化策略，提升商业内容解决方案的质量和效果

###### 重大人事变动

知乎在上市后经历了几次重要的人事变动：

管理团队调整：部分高管职位进行了调整，以适应公司发展的新阶段

裁员事件：2023年，知乎进行了小规模的裁员，主要集中在某些业务部门

###### AI时代的转型

2023年，随着AI技术的快速发展，知乎也开始了在AI领域的布局：

AI产品推出：知乎推出了基于AI技术的新产品和服务

内容质量提升：利用AI技术提升内容质量，减少低质量内容

用户体验优化：通过AI技术优化用户推荐和内容展示，提升用户体验

#### 对外投资与并购活动

###### 主要对外投资项目

知乎在上市前已经进行了多轮融资，但对外投资和并购活动相对较少。主要的投资活动集中在内容生态和相关领域的布局。

###### 投资战略及逻辑演变

知乎的投资战略主要围绕以下几方面：

内容生态建设：投资于优质内容创作者和内容平台

技术升级：投资于AI技术和数据分析等领域

国际化扩张：尝试通过投资和合作拓展国际市场

###### 评估投资活动的影响

知乎的投资活动对公司整体业务产生了积极影响：

内容质量提升：通过投资优质内容创作者，提升了平台内容质量

技术能力增强：通过在AI和技术领域的投资，增强了公司的技术实力

国际化布局：为未来的国际化扩张奠定了基础

#### 关键转折点分析

知乎发展过程中有以下几个重要的战略转折点：

从封闭到开放：2013年，知乎从邀请制注册转向开放注册，用户规模迅速扩大

知识付费探索：2016年，知乎开始探索知识付费模式，推出"值乎"、"知乎Live"等产品

商业化多元化：2018年，知乎推出"知乎大学"等多元化商业化产品，丰富收入来源

上市融资：2021年，知乎在纽交所上市，获得大量资金支持，为未来发展奠定基础

AI技术布局：2023年，知乎在AI技术领域进行布局，适应行业发展趋势

#### 核心竞争力变化

###### 初期竞争力

在初期，知乎的核心竞争力主要体现在：

高质量内容：通过邀请制和优质用户，保证了内容的质量

社区文化：形成了独特的社区文化和讨论氛围

知名用户：吸引了大量互联网行业知名人士，增强了平台影响力

###### 上市后竞争力

上市后，知乎的核心竞争力发生了变化：

技术驱动：更加注重技术驱动，特别是在AI领域的布局

内容生态：构建了更加完善的内容生态体系

商业化能力：提升了商业化能力和收入多元化水平

用户规模：用户规模进一步扩大，覆盖更广泛的群体

#### 与主要竞争对手的差异化

知乎与主要竞争对手的差异化策略比较：

#### 结论

知乎从2011年创立至今，已经走过了14年的发展历程。从最初的封闭问答社区，到上市前的知识分享平台，再到上市后的多元化内容社区，知乎经历了多次战略转型和业务调整。通过不断优化内容质量、提升用户体验、拓展商业化渠道，知乎成功地从一个小型互联网社区发展成为一个拥有数亿用户的大型内容平台。

在AI技术快速发展的背景下，知乎正在积极布局AI领域，为未来发展奠定基础。尽管上市后面临一些挑战，但知乎仍然保持了较强的市场竞争力和增长潜力。未来，知乎将继续优化内容生态，提升商业化能力，为用户提供更加优质的知识分享平台。

#### 参考文献

评委Claude进行评估

Prompt
```
我这里有两份关于知乎的调研报告，请帮我对比一下它们的调研调研结论（包括细节）中有哪些矛盾冲突的地方。这是报告A：AutoGLM沉思版这是报告B：OPENAI版并附B生成的图表。
```
评委发言

从两份调研报告来看，存在多处矛盾冲突的内容，主要集中在以下方面： 1. 基础信息矛盾 创立时间：报告A称知乎于"2011年1月26日正式创立"，报告B则称"知乎成立于2010年"，2010年8月在北京创立，12月进入内测，2011年1月26日"正式上线" 创始团队：报告A仅提到周源一人作为创始人，而报告B提到"周源与张亮等伙伴在北京创立知乎"，创始团队包括"CEO周源、CTO李申申、COO黄继新等" 2. IPO融资与上市信息矛盾 IPO募集资金：报告A称"募集资金共计8.5亿美元（全额行使超额配售权后）"，而报告B称"募资约5.22亿美元" 港股上市：报告A完全未提及知乎在香港二次上市的重要事件，而报告B详细记录了"知乎于2022年4月22日在香港联交所主板双重主要上市（股票代码：2390）" 3. 财务状况矛盾 当前盈亏状态：报告A称"知乎仍然处于亏损状态，但亏损率有所收窄"，而报告B明确指出"知乎在2024年第四季度首次实现全面盈利：该季收入8.6亿元，净利润8640万元" 财务数据详细程度：报告A提供的财务数据极其有限，仅笼统提及收入来源；报告B则提供了2020-2024年完整的营收和亏损数据 4. 战略重点与业务布局矛盾 核心业务发展：报告A强调"2023年，知乎在AI技术领域加大投入"；而报告B则突出"知乎确定了'职业教育'作为第二增长曲线"，详细描述了知乎在职业教育领域的布局业务调整：报告A简略提到"知乎的业务重心经历了多次调整"；报告B则详细描述了2022-2023年知乎主动"收缩战线、提质增效"，"砍掉或弱化与核心问答主业协同不大的业务" 5. 对外投资与并购矛盾 投资活动：报告A称"知乎的对外投资和并购活动相对较少"，未列举具体案例；报告B却详细列出了知乎对品职教育、趴趴教育、掌上园丁等职业教育公司的投资并购 6. 关键战略转折点矛盾 内容监管事件：报告A完全未提及2018年的内容监管风波；报告B将其视为重要转折点："2018年3月，知乎因平台上出现违法违规信息被主管部门约谈，下架整改7天" 盈利转折点：报告A未提及知乎已实现盈利的重大突破；报告B将"2024年扭亏为盈"列为关键战略转折点 7. 上市后发展轨迹矛盾 业务调整：报告A对上市后知乎业务调整描述模糊；报告B详细记录了2022年知乎"大幅裁撤视频团队"和市场费用缩减等战略收缩举措报告时效性：报告B涵盖至"2025年第一季度"的情况，而报告A仅模糊提及"至今"，且未包含2024年的关键变化 8. 核心竞争力分析矛盾 竞争对手比较：报告A仅简略提及小红书、B站、微信公众号；报告B则详细分析了与百度、微博、小红书、B站的差异化竞争策略竞争力演变：报告A的竞争力分析较为静态；报告B则详细剖析了知乎从"高质量问答社区氛围"到"知识内容全链条服务"的竞争力演进过程这些矛盾冲突表明，报告B在多数方面提供了更加详细、更新的信息，特别是关于上市后发展、战略转型和财务状况等关键方面，而报告A在很多重要事件上存在遗漏或简略处理。

总结时间

首先，两份报告在调研到的数据上结果是一致的，都没有出现错误。

这里需要解释一下的是Claude指出的问题2：IPO募集资金的数额不一致。

AutoGLM提到的募集资金共计8.5亿美元，数据来自第一财经，原文在8.5亿美元后有括号标注（全额行使超额配售权后）。同时AutoGLM紧接着也提到了“不计绿鞋超配，知乎IPO融资约5.2亿美元”，这个数据跟OpenAI调研到的5.22亿美元数字一致。

至于当时是否超配，这个问题我完全不知道，于是求助了场外吃瓜观众Grok和DeepSeek。

Grok回复

DeepSeek回复

两位场外援助分别进行了深入研究，得到一致结论，知乎在纽交所上市时，承销商确实行驶了超额配售权。这说明OpenAI的DeepResearch没能调研到当时超配的情况。AutoGLM加分。

但这也是AutoGLM唯一的一次加分了。

同样是IPO部分，一个很关键的信息，知乎在港股的第二次上市，被AutoGLM完全遗漏。

以及，除此之外的7条，AutoGLM的调研结果均不及OpenAI详细，尤其是Prompt明确要求的财报数据，作为公开数据，AutoGLM并没有调研到，也是比较失分的。并且AutoGLM的调研结果时效性不佳，在进行联网搜索的前提下，时间上只调研到2023年，在它的调研报告里，知乎还是持续亏损状态。

在深入研究的综合实力上，还是跟OpenAI有明显的差距。 值得一提的是，OpenAI的信源虽然只有33个，但大多来自财经媒体和行业报告。

而AutoGLM，查看了90多个信源，但其中有大量UCG内容，占比最高的信息来源是知乎，很多都是小号发布的信息搬运。

并不是说知乎的UGC内容不好，但首先正式媒体和UGC内容的配比值得优化；其次这类财经新闻通稿并非知乎上的专业答主通常活跃的领域，搜索结果绝大多数都会是水号和营销号搬运，也没有真正利用到知乎平台上的优质语料，这点值得AutoGLM再思考思考。

由于AutoGLM运行的时候会操作浏览器，所以一些不能通过API访问/需要登录的社媒类网站（包括知乎）的搜索操作过程是暴露给用户的。

观看它的操作，首先值得肯定的一点，是它能够使用按时间排序、按高赞排序、只查看文章这些功能，以提高准确率。但是，在搜索习惯上真的还是有待提升的。AutoGLM的搜索习惯是极早期搜索引擎的使用方式，生搬硬套这种搜索方式到内容社区，只能得到大量不相关的答案。

不过，AutoGLM在信息筛选上是过关的，这些无关信息并没有出现在最终的报告中。但搜索习惯还是值得优化，一来节省tokens，二来优化后的单次研究结果可能回会更有深度。

AutoGLM虽然距离SOTA还有差距，但胜在免费大碗，还能自动执行浏览器操作，相信聪明人已经找到了它的用武之地。而且现在的AutoGLM沉思版，跟之前的牛牛相比已经有了巨大提升，相信随着继续迭代和优化，会变得越来越好用。
2025年4月5日
如何看待 GPT-4o 出现后，ComfyUI 等一众工作流软件会被淘汰的言论？

知乎上看到这个问题。GPT-4o生图火了以后，一会儿有人说PS被取代，一会儿有人说ComfyUI被取代。

这种言论其实跟Manus淘汰Coze是一个意思。

大模型随着能力增强，一定会内化workflow的能力，内化prompt的效果，这是明眼人都能看得出来的事情。

workflow的核心在哪？

workflow的核心就在于编织确定性。

什么节点、插件，都不是核心的东西，当大模型代码的能力足够强，它自己就能够开发出那些东西来。

workflow在大模型面前，提供的就是确定性。

大模型的输出的其实是什么？

是概率。

当你让大模型画一片天空，哪怕你想要的就是一片晴天的蓝天，但大模型的输出结果不一定是100%蓝天。

因为晚上天是黑的，傍晚天是红的，下雨天是灰的，这些可能性固有存在。所以你顶多抽卡得到蓝天次数最多，不能保证100%。

复杂的任务更是这样，各种可能性交织在一起，你根本没法确保大模型对同一任务处理的结果就是100%。

而很多时候，不能确定的事情，就没法用于生产环境。

我跟同事说，做表格的时候，能用公式的，尽量不要用AI字段做，就是这个道理。

甚至更节省能源，更环保。

workflow也是这个道理。

通过workflow，可以规划好，先做这个，再做那个，先加载checkpoint，后加载lora，它就能确保没有错。

比如说，你要做面部重绘，那你的工作流一定是先把脸抠出来，再进行重绘，哪怕你是一个节点把这两个功能包了，它也是先把脸抠出来再重绘。这样才是面部重绘，对吧？不然你不就重绘全图了吗？

巧了，GPT-4o就是全图重绘。

我发给过GPT-4o这样一张图片，从百度搜到的：

我让它把这个女孩的纹身去掉，它发回来这样一张图。

纹身确实是去掉了。

但不是「这个女孩」。

仔细看两张图对比，重绘的真的非常非常像。

但不光女孩的人换了。

桌上的包变成帽子，手里的多边形玻璃杯变成了圆杯，脚上的鞋也换了，手的姿势和坐姿也变了，窗帘的纹理也变了……

整张图完全是另一张图。

确定性在哪里？

如果这个女孩是我的客户，她就是付费让我帮她去掉纹身，那她拿到这种图会买单吗？

再举个例子。

小罗伯特·唐尼官宣出演毁灭博士的时候戴了个面具，

这是他和面具的合影：

我现在想去掉这个面具，用ComfyUI工作流做：

抠出mask，然后，去掉了。

面具去掉了，其他东西都没有变。

现在换成4o来做：

变得细节更丰富了，更有质感了，甚至人都年轻了，好棒棒。

但你仔细看，眼睛颜色变了，手放下去了，袍子变成了卫衣，脖子上这玩意儿像个听诊器。

这个图，依旧能看出来是小罗伯特唐尼，你拿去发Twitter发朋友圈都没有问题，但唯独不能正经用。穿个卫衣，你说他是钢铁侠都行，但不能说他是毁灭博士。

所以，workflow带来的是什么？是让你能够指哪打哪。

要改A就改A，不要给我乱动B、C、D，哪怕只是概率，也不行。

再回到Manus和Coze，也是一样。

辛辛苦苦搭的工作流，AI能自己自动完成了。有没有？有。

但Manus不出错吗？当然不是，出错的案例比比皆是。

只要AI自己还独立完成不了足够复杂的任务，就需要人为给它设计workflow，先怎么样，再怎么样，提高它的任务准确率。

当然，不可以否认的是，大模型真的在内化很多能力。

比如说prompt。

最早ChatGPT刚出来的时候，给模型定义一个角色，你是XXX领域的专家，通常很有效。

有没有角色定义，结果差异很大。

使用结构化的提示词，效果就很好。

所以当时大家都认为提示词很重要，是一门学问，将来Prompt Engineer会成为一个普遍的社会岗位。

但后来就不一样了，很多模型哪怕没有角色定义，效果也不错。为什么呢？因为大模型厂家也不傻，发现这个prompt效果拔群，我直接训练进模型里面让它自己判断应该作为什么角色好不就好了？

再后来更是有了推理模型。

当DeepSeek-R1爆火的时候，大家发现，我原来不用跟大模型说那么一大堆复杂的结构化提示词，它也能给我不错效果的回答。我不用成为Prompt Engineer，好像也能愉快使用AI。

当然prompt依旧重要，好的prompt效果依旧跟随口问两句的prompt在效果上有很大的差异。但至少，简单的任务，真的不再需要有专门的提示词工程师写prompt了。AI能够自己进行思考，理解用户的意图，并做出最合适的回答。

Prompt Engineer也不会消失，但由于简单的任务不再需要，所以门槛一定更高了，需要的能力也更高了，也不再会那么普遍。

再重复一遍，大模型正在内化很多现在以外挂的形式挂在它身上的能力。

因为科技在进步，而不是退步。

AI最终将通往AGI，这也是大家都知道的目标。

那个需要workflow来消弭的不确定性会变得越来越小，这是一个毫无疑问的推论。

大模型本身的能力在成长，挤压的就是这一部分空间。

4o现在不支持局部重绘，可能很快就会支持。

AI去年还不能生成中文，现在生成的不也挺好的么。

但你要说淘汰掉workflow，那还为时过早。

如果以AGI为100%，那没达到AGI，自然就不是100%。

也就还是需要手搓的workflow的存在。

学肯定不白学，一个很重要的事情就是不要搞非此即彼，淘汰了什么远远没有接收并结合了什么新事物更重要。

2025年4月3日
GPT-4o再加上这张表，让AI自动生成小红书封面图
不是我沉迷AI忘记更新，而是AI真的玩不完，根本玩不完。

GPT-4o的多模态生图已经上线三天多，每天都有新玩法，用嘴改图的花活层出不穷。我都没忍过一天，当天晚上下班回家就开了GPT Plus。

出了两张图试了下，用的是最朴素的提示词，效果却直接惊为天人。

一秒换产品⬇️

男生变女生，男装换女装⬇️

后两天各种惊艳的玩法更是就没停过。

所以不是我不更新，而是实在没啥好写的了，学都学不过来。

直到我突然发现，大家好像都在玩图生图。

以图生图首先得有张图或者有多张图，门槛要高一些，并且生成速度也比文生图慢一点。

而我，作为一个财富不得自由的打工仔博主，我得事生产呀，我还得让搞出来的东西门槛够低好给别人也能用。

于是又拉起了老伙计多维表格，整了这么一套文生图搓小红书封面的模板：

https://ilovezhiwai.feishu.cn/wiki/XO7BwzedJi2PspkQKxCcxRBnnUw?table=ldxlY7sLPeUzd7ai

可以实现图文和文字两种形式封面的生成：

使用起来非常简单。

先说图文封面。

前三列为填写区，其中「笔记主题」字段为必填，「补充信息/要求」与「风格预设」均可置空。但填写后两项，可以更好地实现画面元素和风格的控制，具体可以参考表格中提前做好的示例。

填写区信息填写完毕后，等待AI生成相应提示词。

生成完毕后，直接复制Prompt Ctrl+C字段内容，发送到ChatGPT 4o进行生图即可。

通过灵活配置，可以得到适应多种场景、不同风格的封面。

比如，你是一个摄影博主：

旅行博主：

金融博主：

资讯评论博主：

知识和教育博主：

逗乐子博主：

甚至，卖课博主：

文字封面的使用方式大体相同。

前四列为填写区，跟图文封面一样，「笔记主题」为必填，其他三项可选填。但「风格类型」和「背景预设」内置变化较多，建议选上。

之后的操作跟前面图文类笔记相同。

通过这个表格，可以得到以文字为主体风格的封面：

一些tips：

1.理论上可以支持通过API调用在多维表格内直接完成生图动作。

我API没钱了就没测试，但在工作流中放了一个通过硅基流动调用可图生图的模板，感兴趣可以调整测试。具体方法可参考这篇文章第9条：一些飞书多维表格的AI使用经验分享

2.图文表格中的风格预设有可能失效，例如最早的版本我是做了「荒木JOJO」和「新海诚动画」风格预设的，但现在均已失效。

通过模板创建表格后，你可以直接对字段编辑，删除或增添新的选项。

3.虽然GPT-4o在文字生成上有极大提升，但任务复杂时依旧会出现明显瑕疵。海报文案与Prompt字数都不建议过多。

经过我的测试，比较建议的使用的Prompt生成模型为Doubao-1.5-256K（32K的Prompt稍长），在画面描绘和Prompt长度上较为均衡。为了输出稳定，本表格默认使用的AI模型即是Doubao-1.5-256K模型，各位可自行体验效果。

另外自选服务商API字段捷径依旧是老问题，创建模板时API Key不会重置，依旧会持续消耗我填入的API。所以恳请有API和会注册火山账号的朋友，使用模版后先把「生图提示词」字段的API替换为自己的API。

实在不会注册账号的朋友也没有关系，现在依旧可以继续使用我的API。但我不保证它可以长期生效，如果成本过高，我有可能会作废掉这个Key，敬请谅解。

4.除了默认的豆包模型外，在两个子表的隐藏字段中，我都保留了DeepSeek-V3版本的提示词生成。

虽然以目前GPT-4o的图片生成能力，使用这个版本的直出成功率比较低。但文案和画面丰富度上会明显比豆包256K更好。继续经过Photoshop手动处理、深度对话调整或生成透明图层合并等操作后，依旧可以比较可用。

放一些V3版本提示词直出的效果：

图文⬇️

文字⬇️

文字封面稳定性天然比图文稍好，现在表格内的演示结果示例中，每个笔记主题的中文结果均为1个豆包+1个V3。

可以看到，V3生成的提示词文案和画面丰富度都要更好一些。

另外4o的英文文字输出通常比中文稳定，如果你在英文场景使用，也可以考虑默认使用V3。

两个同提示词翻译成英文后的生成效果对比：

5.如果需要对默认的文案生成要求和视觉样式进行调整，可找到名称为Prompt的公式字段，进行调整。

方便大家修改和调整，提示词我也一并在这里放出来。

主要是图文和文字两个核心Prompt。

这两个Prompt实际上大部分也来自于AI的分析，人工仅进行了少量微调。

作为相关从业人员，咳咳，我直接到小红书聚光平台后台download了一批高阅读率的封面，交给AI进行分析。然后总结了大部分的文案和画面元素相关的Prompt。

跟AI玩家在垂直行业搞偷鸡取巧，然后跑到同行面前耍AI，犯贱哲学XD

以下Prompt：

图文类：
```
请根据我提供的主题"{主题}"，生成一个用于AI绘图的详细prompt，帮助创建一张小红书风格的高点击率封面图。
```
文字类：
```
请创建一张高点击率的小红书封面图片，主题是：[主题]。
```
（其中「风格类型」和「背景预设」做多了套设计，跟随表格的选项变化，再由公式进行拼接，不同风格和背景的具体设定可查看表格中的公式。）

玩的愉快~
2025年3月29日