n8n 教學 (四)：建立 n8n 工作流塞爆向量資料庫

發布日期：2025年5月

理論準備完畢，現在是動手實作的時刻！本章節是系列教學的核心，我們將整合前幾章的成果，從無到有建立一個完整的 n8n 工作流。這個工作流會自動讀取指定的資料，透過 Gemini API 將其轉換為向量 (Embeddings)，最後存入我們在 Supabase 中建立的向量資料庫。讓我們開始吧！

重要提醒： 如果您的 API key 綁定在免費方案 (free tier) 且未啟用帳單，則 Gemini 經手的資料就有可能被作為訓練用，如有機敏資訊，並且一定要使用 Gemini 的話，請務必升級至付費方案，或使用地端 LLM，亦或是公司提供的 API。

回到 n8n 點選 Create Workflow 建立第一個工作流，並完成基本設定。

我們將建立一個表單，讓使用者可以上傳 PDF 檔案作為觸發。

點選 "Add first step"，搜尋並選擇 "n8n Form"，事件為 "On new n8n Form event"。
將 "Form Title" 輸入「檔案選擇」。
點擊 "Add Form Element"，並進行以下設定：
- Field Name: inputFiles (注意大小寫)
- Element Type: File
- Multiple Files: 關閉 (撥到左邊)
- Accepted File Types: pdf

上傳檔案後，我們需要從中提取純文字內容。

為了避免重複寫入，我們可以在寫入新資料前，先刪除同檔名的舊資料。

在 "Filters (String)" 欄位貼上以下表達式，並啟用 "Expression"：

metadata->>fileName=like.{{ $('On form submission').item.json.inputFile.filename }}

這是最關鍵的一步，我們會將文字轉換為向量並存入資料庫。

在 "Delete a row" 節點後 (如果有的話，否則在 "Extract from File" 後) 新增 "Supabase Vector Store" 節點，操作選擇 "Add documents to vector store"。
選擇或建立您的 Supabase 憑證。
"Table Name" 選擇 nhi_drug_768，"Query Name" 改為 match_nhi_drug_768。
設定 Embedding Model:
- 點擊節點左下的 "鬚鬚"，選擇 "Embeddings Google Gemini"。
- 選擇或建立您的 Gemini API Key 憑證。
- Model 選擇 models/text-embedding-004。
設定 Data Loader:
- 點擊節點右下角的 "鬚鬚"，選擇 "Default Data Loader"。
- 點擊 "Add Option" -> "Metadata"。
- 點擊 "Add property"，Name 輸入 fileName，Value 貼上表達式 {{ $('On form submission').item.json.inputFile.filename }}。
設定 Text Splitter:
- 點擊右下角鬚鬚的 "+"，選擇 "Recursive Character Text Splitter"。
- 將 "Chunk Size" 改為 200。

一切就緒！讓我們來執行工作流並驗證結果。

恭喜您！您已經成功建立並執行了第一個結合 AI 的 n8n 自動化工作流。在本章中，我們學會了：

現在您已經掌握了將資料 "存入" 向量資料庫的技巧。在最後一篇教學中，我們將探討如何 "取出" 這些資料，讓 AI 參考向量資料庫的內容來回答問題，完成一個簡易的 RAG (Retrieval-Augmented Generation) 應用。