logo
Loading...

什麼是LLM與RAG - 如何設計結合Agent的可靠AI知識庫 - Cupoy

Chap1: 什麼是LLM,LLM為什麼需要RAG LLM (Large Language Model) 大型語言模型 是基於深度學習實現的自然語言模型,因為使用大量的參數來計算,所以加上大型的前綴...

Chap1: 什麼是LLM,LLM為什麼需要RAG LLM (Large Language Model) 大型語言模型 是基於深度學習實現的自然語言模型,因為使用大量的參數來計算,所以加上大型的前綴。他的主要作用包括自然語言領域的分類、摘要、翻譯、問答、情感分析、文本生成等等,可以處理廣泛的自然語言任務。 知名的應用包括 ChatGPT Gamma(簡報AI生成器) 台灣大哥大智能客服 (台灣大嚐鮮) Microsoft Copilot 程式碼與文本生產力工具 引述Andrej Karpathy(OpenAI 共同創辦人、知名AI科學家)的貼文原文 大型語言模型(LLM)創造了一個全新的抽象層和職業。 到目前為止,我將這個角色稱為「提示工程師」,但我同意這名稱有些誤導。這不僅僅是提示,還涉及許多膠水代碼和基礎架構。也許「AI 工程師」這個稱呼還算可用,但它把一個過於具體的概念變得過於廣泛。 機器學習(ML)的人通常從頭開始訓練算法/網絡,這些網路通常是規模較小的模型。 由於其系統負荷繁重的工作,大型語言模型的訓練正變得與傳統機器學習不同,並分化出一種新型角色,專注於在超級電腦上進行大規模的Transformer 訓練。 從數量上來看,AI工程師的數量可能會顯著多於ML工程師或LLM工程師。在這個角色中,即使從未訓練過任何東西,也能取得很大的成功。 我對「軟體 1.0/2.0」的框架不完全理解。軟體 3.0(在我看來大約是 LLM 的提示操作)很有趣,因為提示是人類設計的「代碼」,但以英文表達,並由一個 LLM 來解釋(而 LLM 本身就是軟體 2.0 的產物)。AI 工程師同時在三種範式中進行編程,這有點讓人頭暈 😵‍💫 什麼是RAG? RAG是用來調整大型語言模型輸出的方式之一 可以把RAG當成LLM可以參考的一本筆記本。 透過RAG知識庫的參考當我們跟GPT或其他LLM交談時,提高回答的表現。