什麼是LLM與RAG - 如何設計結合Agent的可靠ＡＩ知識庫 - Cupoy

Chap1: 什麼是LLM，LLM為什麼需要RAG LLM (Large Language Model) 大型語言模型是基於深度學習實現的自然語言模型，因為使用大量的參數來計算，所以加上大型的前綴...

Chap1: 什麼是LLM，LLM為什麼需要RAG LLM (Large Language Model) 大型語言模型是基於深度學習實現的自然語言模型，因為使用大量的參數來計算，所以加上大型的前綴。他的主要作用包括自然語言領域的分類、摘要、翻譯、問答、情感分析、文本生成等等，可以處理廣泛的自然語言任務。知名的應用包括 ChatGPT Gamma(簡報AI生成器) 台灣大哥大智能客服 (台灣大嚐鮮) Microsoft Copilot 程式碼與文本生產力工具引述Andrej Karpathy(OpenAI 共同創辦人、知名AI科學家)的貼文原文大型語言模型（LLM）創造了一個全新的抽象層和職業。到目前為止，我將這個角色稱為「提示工程師」，但我同意這名稱有些誤導。這不僅僅是提示，還涉及許多膠水代碼和基礎架構。也許「AI 工程師」這個稱呼還算可用，但它把一個過於具體的概念變得過於廣泛。機器學習（ML）的人通常從頭開始訓練算法/網絡，這些網路通常是規模較小的模型。由於其系統負荷繁重的工作，大型語言模型的訓練正變得與傳統機器學習不同，並分化出一種新型角色，專注於在超級電腦上進行大規模的Transformer 訓練。從數量上來看，AI工程師的數量可能會顯著多於ML工程師或LLM工程師。在這個角色中，即使從未訓練過任何東西，也能取得很大的成功。我對「軟體 1.0/2.0」的框架不完全理解。軟體 3.0（在我看來大約是 LLM 的提示操作）很有趣，因為提示是人類設計的「代碼」，但以英文表達，並由一個 LLM 來解釋（而 LLM 本身就是軟體 2.0 的產物）。AI 工程師同時在三種範式中進行編程，這有點讓人頭暈 😵‍💫 什麼是RAG? RAG是用來調整大型語言模型輸出的方式之一可以把RAG當成LLM可以參考的一本筆記本。透過RAG知識庫的參考當我們跟GPT或其他LLM交談時，提高回答的表現。