Stable Diffusion 3

定位与概览

公司/地区：Stability AI / 美国
模态：图像生成（开源）
关键词：可控性强、私有化、社区生态

能力维度

维度	强度	说明
文本	弱	主要用于提示词理解
编码	无	与编程无直接关系
图形	强	可控性高，适合定制
视觉	弱	非视觉理解模型

优势

开源生态完善，可私有化部署。
可通过 LoRA/ControlNet 等方式强化可控性。

局限

开箱即用质量可能不如闭源商用模型。
需要工程化与算力支持。

典型应用

私有化图像生成、风格定制。
电商、品牌视觉的规模化生产。

价格与获取方式

开源可自部署；商用平台按调用计费。
具体价格以官方渠道为准。

对比与备注

追求审美风格：对比 Midjourney。
追求文本一致性：对比 DALL·E 3。