這一年來,我的重點其實都是圍繞著 AI 打轉,我沒有直接去研究模型跟訓練,而是都在拿捏怎樣在我的服務內善用 AI..
RAG 是其中一個案例,搞懂它後我才體會到,RAG 不是個 “技術”,它更像是個 design pattern,一個讓 LLM 能根據事實回答問題的設計模式。這也是我這個 session 想談的主題。
因此,重點有兩大部分:
-
如何在你的應用程式中善用 prompt 來解決問題? 既然都用 “軟體” 了,該下好 prompt 的應該是 developer, 而不是 user .. 我覺得這是 RAG 的基礎,因此我的場次會花一半的時間談這主題
-
另一半,才是資料的檢索跟應用,這部分有很多固定的模式了,包含文件的擷取、分段、向量化等等,這些已經很固定的模式也成熟到有獨立的服務來負責,我只要呼叫 API 就好,這東西就是我想介紹的 kernel-memory, 來自 microsoft 的 open source project, 這是我第二個想談的主題
既然都在談設計模式了,搞懂 RAG 背後怎麼一回事,而也有 kernel-memory 這樣的服務幫你把煩人的事情都解決掉,那你還需要從頭開始寫 code 嗎? 其實這很多餘,如果你環境允許 (例如是內部用,可以接受 no code platform),在這些平台上串接 API 來達成 RAG 的效果則是絕配。最後我會用 dify 這個平台,用一個完整的案例把整個過程串起來,當作這個 session 的總結
很久沒有講這種純開發技巧的 session 了,希望這次能順利完成 demo。這次我的場次安排在 12/14 早上的第一場,歡迎大家來捧場 :D