圖像任你生！自建 Stable Diffusion WebUI 圖像生成平台

- 廣告 -

圖像生成是近月 AIGC 其中一個熱門課題，很多人都會利用 Discord 或者網上提供的服務，不過要不是要輪候，就是要付費，有時候更會有「內容限制」，玩起來不夠爽。其實只要您有一部遊戲電腦，要在家中自建圖像生成平台不是甚麼難事！

本文要介紹的是其中一款受歡迎圖像生成引擎 Stable Diffusion（SD）的網頁版介面 AUTOMATIC 1111 Stable Diffusion WebUI（WebUI）的安裝步驟，完成後大家可以在網上下載生成不同風格圖像的模型和修改模組（Embedding、LoRA 等），隨意無限量生成圖像。

在家中電腦生成圖像，需要安裝的程式包括：

- 廣告 -

git
Python 3.10.x
AUTOMATIC 1111 Stable Diffusion WebUI
圖像生成模型

以下將會介紹備有 NVIDIA 顯示卡的圖像生成平台架設步驟，當然，AMD Radeon 顯示卡一樣可以架設圖像生成平台。本篇教學以配備 AMD Ryzen 9 5900HX CPU、NVIDIA RTX 3080 獨顯和 32GB DDR4 RAM 的 Lenovo Legion 7 電競筆電來安裝，OS 為 Windows 11 22H2。

電腦最低要求

記憶體：16GB 或以上
顯示卡：NVIDIA GTX 7xx，最少 2GB VRAM（AMD Radeon 顯示卡亦可）
操作系統：Windows 7/8/10/11+、Mac M1/M2 或 Linux
儲存空間：10GB 或以上（包括模型）

第一部：安裝 git

git 是軟件版本管理工具，在安裝和日後維護 WebUI 都經常被調用。安裝時除了指定 Notepad 作為預設編輯器、實驗性功能全部不安裝之外，其他的設定只要選用預設值即可。

git 下載網址：按此

第二部：安裝 Python 3.10.x

Python 是 SD 的執行環境，但要注意雖然 Python 3.11 經已推出一段時間，不過 WebUI 主要根據 Python 3.10 來設定，以其他版本來安裝會在執行時出現這個那個無法安裝的問題。如果不想有麻煩的話，最好是安裝 Python 3.10.x 版本。

撰文時 Python 3.10 最新的版本是 3.10.10，安裝時要注意在第一個畫面勾選「Add python.exe to PATH」，將 Python 安裝在執行路徑上，否則 WebUI 在執行期間可能會出現找不到 Python 的情況。其他就以預設值安裝即可。

- 廣告 -

Python 3.10.x 下載網址：按此

第三部：安裝 CUDA 工具箱

下載 CUDA 工具箱網址：按此

第四部：安裝 Stable Diffusion WebUI

WebUI 是 SD 的網頁操作介面，免除手動輸入指令的麻煩，而且安裝模型、模組的方法簡單，只要把檔案拷貝到指定目錄內即可。日後想深入研究如自行訓練模型、LoRA，以至 OpenPose 自訂動作等都可以在這個介面搞定。

Step 1. 先在電腦裡找個有 10GB 空間的地方，開設一個名為「Stable Diffusion」的文件夾集中收藏有關 SD 的檔案（名字任意）；

Step 2. 在搜尋列輸入「cmd」找尋命令列工具，並開啟它；

Step 3. 用指令移動到剛開設的文件夾位置；

Step 4. 輸入以下指令：「git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git」，就會從 GitHub 下載 WebUI 到當前文件夾；

第五部：按系統規格設定 Stable Diffusion WebUI

接著的設定要視乎您所用的顯示記憶體 VRAM 數量來調整圖像生成時所耗用的資源。

Step 1. 在搜尋列輸入「dxdiag」找尋 DirectX 除錯工具並開啟它；

Step 2. 等一會，就會顯示電腦的規格資料，當中「Display 2」一頁就會列出顯示卡的規格，「Display Memory」就是 VRAM 數量；

知道 VRAM 有多少之後，就按情況來選擇以下啟動參數：

2GB 或以下 VRAM：--lowvram
2-6GB：--medvram
6GB 以上 VRAM：不需要額外參數

由於 RTX 3080 筆電版有 16GB VRAM，非常夠用，所以我們加入更多額外指令來提升畫質：

--xformers：加速推算
--precision full：評估時所用的精度
--no-half：不要切換模型至 16-bit 單精度浮點數
--autolaunch：程式啟動後立即開啟 WebUI 網頁

決定啟動參數之後，就要用 Notepad 來開啟 WebUI 文件夾裡的「webui-user.bat」檔案，然後將參數添加到「set COMMANDLINE_ARGS=」之後儲存起來即可。

第六部：下載模型

接下來只要下載喜歡的模型，放在指定文件夾裡即可生成圖像。以下是一些著名的模型，大家大可以先下載來試試看，往後再在網上找尋其他模型來玩。

Stable Diffusion 2.1: v2-1_768-ema-pruned.safetensors
Anything v4.5: anything-v4.5-pruned.safetensors、anything-v4.0.vae.pt
Realistic Vision V1.3: realisticVisionV13_v13.safetensors

（備註：安裝 Anything 時要注意可以同時下載一個用來微調容貌和眼睛的 VAE（變量自動編碼器）anything-v4.0.vae.pt，把它改名為 anything-v4.5.vae.pt 與 anything-v4.5-pruned.safetensors 放在一起即可。）

以上下載的都是模型，只要把它們搬到 WebUI 文件夾下面，「models\Stable-diffusion」文件夾即可。當中有些模型的文件名稱會加入「-pruned」字樣的，表示那是經過清理的版本，檔案會較小。使用前應將檔名中「-pruned」的部分刪除。

除了以上模型之外，大家還可以到 Hugging Face 和 CivitAI 這些著名模型庫裡找尋更多模型。

第七部：生成圖像

到這裡 WebUI 圖像生成平台已經可以使用，大家只要雙擊第四部中修改過的 webui-user.bat 檔，就會打開一個命令列視窗，那就是 WebUI 的本體。

首次執行時，會安裝一系列必要的模組。由於我們在啟動參數加入了 –autolaunch，所以完成後期安裝和啟動後，就會自動開啟 WebUI 網頁供大家使用。大家要記住命令列視窗才是程式的本體，所有進度和錯誤都會在那裡列出，網頁只是操作介面。如果操作時覺得程式呆了，就應該查看命令列視窗。

介面說明

當前選用的模型
正向提示，是您希望圖中「有」的元素
反向提示，是您希望圖中「沒有」的元素
取樣方法，對產生的圖像細節有很大影響
取樣次數，愈大愈精密，但也愈耗資源。可以由 28 開始，RTX 40 系列顯示卡生成大型圖像時可用到 100。
修正面部問題
修正高解像度圖像可能出現古怪情景
決定 AI 有多遵從您的提示生成圖片，愈低愈「亂來有驚喜」。最高不可以大於 15。
種子值，生成圖像的隨機值。即使模型和所有參數相同，這個數不同所產生的圖像都會有很大差別。相對地，如果所使用模型、參數以至種子值都一樣，生成的圖像的變化就會很少。右邊的骰子是將種子值設為隨機（-1），而綠色循環標誌就可以重用上一張圖片的種子值，方便鎖定感到滿意的圖片加以微調。

首次使用時大家大可到 CivitAI 參考一下網友貼上的參考圖片，當中如果右下角有「i」字標誌，就可以點擊它查看當中的參數作參考。要留意是圖像尺寸也會對生成的影像有重大影響，參考別人生成的圖片時別忘留意圖像的尺寸。

SD 博大精深，網上還有大量模型和修飾模組等。這篇教學只簡單介紹了自建圖像生成平台的方法，只是一個起步點，日後有機會再跟大家討論更多 SD 的技巧。

- 廣告 -

圖像任你生！自建 Stable Diffusion WebUI 圖像生成平台

電腦最低要求

第一部：安裝 git

第二部：安裝 Python 3.10.x

第三部：安裝 CUDA 工具箱

第四部：安裝 Stable Diffusion WebUI

第五部：按系統規格設定 Stable Diffusion WebUI

第六部：下載模型

第七部：生成圖像

介面說明

Related Articles

大裁員真正原因？Microsoft 35% 新產品靠 AI 寫 Code

傳 Apple 與 Samsung 簽訂協議　開始生產摺疊式 iPhone 屏幕

Google Chrome 霸主地位岌岌可危 OpenAI 瀏覽器或未來數周登場

叻過大學研究生　xAI 正式發布 Grok 4 極速登頂最強 AI

Recent Articles

【場料】回到 Y2K　Razer 主流產品變透明

【場料】港版 vivo X Fold5 最快今月現身　惟定價可能跟海外版？

【場料】外置顯示卡有福了　oculink + USB4 擴充埠登場

1.5 億用戶 10 億次收看　Netflix 成全球最大動畫平台

最新影片