打印

[原创] MacOS从零部署Stable Diffusion之三:选择哪个UI

0

MacOS从零部署Stable Diffusion之三:选择哪个UI

折腾了几天,完善WebUI的同步,也尝试了几个其它软件,回顾一下大致过程吧。
1.几天的折腾之一:N次部署Stable Diffusion WebUI
安装了一些必要的插件,例如汉化、提示词、线稿姿态(controlnet)等。折腾了几天,各种报错,各种解决,经历几次删除重头部署,终于折腾出一版没有报错的。
最终经验,按Github.com上readme安装部署最正确。
1.1插件清单如下图:

1.2插件功能说明如下:
1.2.1. a1111-sd-webui-tagcomplete功能:在提示词(Prompt)输入框中提供自动补全功能,支持从预设标签库中快速选择标签(如艺术家风格、常用关键词等),提升输入效率。
典型用途:避免手动输入错误,快速调用复杂标签。
1.2.2. adetailer功能:自动修复生成图像中的人脸或手部细节,通过二次检测和重绘优化局部质量(类似“高清修复”但针对特定区域)。
典型用途:修复低分辨率下的人脸扭曲或手部畸形。
1.2.3. multidiffusion-upscaler-for-automatic1111功能:基于多分辨率扩散算法的超分辨率插件,可分块处理大图并保持细节,避免显存不足。典型用途:高清放大生成图像(尤其适合风景、建筑等复杂场景)。
1.2.4. sd-dynamic-thresholding功能:动态调整生成过程中的去噪阈值,平衡图像多样性和稳定性,避免过拟合或模糊。典型用途:解决高 CFG Scale 值下的过度锐化或色彩失真问题。
1.2.5. sd-extension-system-info功能:在 WebUI 中显示系统信息(如显存占用、GPU 温度、Python 版本等),方便监控运行状态。典型用途:调试性能问题或优化资源分配。
1.2.6. sd-webui-animatediff功能:生成动态动画(GIF/视频),通过逐帧扩散实现连贯运动效果。
典型用途:制作 AI 动画短片或动态表情包。
1.2.7. sd-webui-controlnet功能:通过额外输入(如线稿、深度图、人体姿态)精确控制生成内容的结构和构图。典型用途:保留原图骨架的二次创作、姿势复刻等。
1.2.8. sd-webui-infinite-image-browsing功能:增强 WebUI 的图库管理功能,支持无限滚动预览、标签筛选、批量操作等。典型用途:整理大量生成结果,快速定位历史作品。
1.2.9. sd-webui-lora-block-weight功能:精细化调整 LoRA 模型对不同网络层的影响权重,优化风格融合效果。典型用途:解决 LoRA 模型过强或过弱导致的风格失衡问题。
1.2.10. sd-webui-model-prompter功能:根据选定的模型自动推荐相关提示词(如触发词、风格标签),简化提示工程。典型用途:快速适配新下载的模型,避免无效提示。

2.几天的折腾之二:尝试可以Mac上运行的其它方案
除了原生部署SDWebUI,还安装了Stability Matrix、Mochi Diffusion 和ComfyUI 三款 Stable Diffusion 软件,从功能定位、用户体验、适用场景等角度对比了一下:
2.1. Stability Matrix
定位:一站式 Stable Diffusion 管理工具(非生成工具本身)。
核心功能:统一管理多个 Stable Diffusion 发行版(如 Automatic1111、ComfyUI、SD.Next 等),支持一键安装/切换。
内置模型下载工具(类似 CivitAI 助手),支持自动更新依赖和扩展。
提供简洁的 WebUI 入口,适合多版本切换需求的用户。
优点:
✅ 降低多版本 SD 的配置复杂度,适合同时使用多个工具的用户。
✅ 集成模型库,避免手动下载的麻烦。
✅ 跨平台支持(Windows/Linux/macOS)。
缺点:
❌ 本身不提供图像生成功能,依赖其他后端(如 Automatic1111)。
❌ 对新手而言,仍需理解不同发行版的区别。
适用场景:
需要同时使用多个 Stable Diffusion 发行版的进阶用户。
希望简化模型管理和版本切换的玩家。
总结:实际没有这么好用,各种运行错误,修正困难,个人PASS掉。

2.2. Mochi Diffusion
定位:轻量级原生 macOS 应用(专为 Apple 生态优化)。
核心功能:完全本地运行的 Stable Diffusion 生成工具,支持 Core ML 加速(Apple Silicon 优化)。简洁的原生 UI,类似 MidJourney 的交互体验,适合快速生成。
优点:
✅ 针对 macOS 深度优化,性能高效(尤其 M1/M2 芯片)。
✅ 开箱即用,无需命令行或复杂配置。
✅ 支持私有化部署,数据完全本地。
缺点:
❌ 仅限 macOS,平台封闭。
❌ 功能较基础,缺少高级控制(如 LoRA 插件、复杂工作流)。
适用场景:macOS 用户追求简单、高效的本地生成工具。
不需要复杂自定义,偏好“傻瓜式”操作的用户。
总结:功能超简单,玩具哈,个人PASS掉。

2.3. ComfyUI
定位:模块化、可编程的 Stable Diffusion 工作流工具。
核心功能:基于节点(Node)的图形化界面,可自由构建生成流程(如分步控制、条件分支)。支持复杂操作:多模型串联、自定义脚本、LoRA 动态加载等。轻量高效,适合批量生成和研究用途。
优点:
✅ 高度灵活,适合定制化需求(如动画生成、实验性研究)。
✅ 资源占用低,生成速度较快(无冗余 UI 渲染)。
✅ 社区活跃,有大量自定义节点扩展(如 WAS 节点包)。
缺点:
❌ 学习曲线陡峭,需理解节点逻辑。
❌ 缺乏直观的预设,新手可能难以入手。
适用场景:开发者、技术爱好者或需要精细控制生成流程的用户。追求极限性能或特殊工作流(如视频生成、AI 绘画自动化)。
总结:未来的趋势,前期学习困难,工作流逻辑清晰,容易分享,方便获取他人的工作流,可以照猫画虎的快速学习。个人选择,未来就用它啦。


选择建议
​新手入门:先用Fooocus(没装,不确定)培养兴趣,再过渡到 ​WebUI。
​精准控制:​WebUI   ControlNet 是当前最佳组合。
​极客/开发者:直接学 ComfyUI,未来趋势更强。
​Mac/低配用户:选择优化工具(如 ​Mochi Diffusion 或云端方案)。


未来计划深入学习ComfyUI,慢慢分享一下个人学习经历吧。
附件: 您所在的用户组无法下载或查看附件
本帖最近评分记录
  • purecafe 金币 +30 感谢分享,论坛有您更精彩! 2025-5-7 07:49

TOP

当前时区 GMT+8, 现在时间是 2025-5-26 06:41