91麻豆国产免费观看_国产成人精品一区二区免费_久久99免费视频_天天干天天操天天摸

首頁 > 知識技能 > 知識技能 > RAG智能體:開啟信息處理與知識探索的革命之旅!

RAG智能體:開啟信息處理與知識探索的革命之旅!

發布時間:2024-05-05 21:33:29來源: 15210273549

ChatGPT、Midjourney等生成式人工智能(GenAI)在文本生成、文本到圖像生成等任務中表現出令人印象深刻的性能。然而,生成模型也不能避免其固有的局限性,包括產生幻覺的傾向,在數學能力弱,而且缺乏可解釋性。因此,提高他們能力的一個可行辦法是讓他們能夠與外部世界互動,以不同的形式和方式獲取知識,從而提高所生成內容的事實性和合理性。

檢索增強生成(Retrieval-Augmented Generation, RAG)技術研究旨在提供更有依據、更依賴事實的信息來幫助解決生成式AI的幻覺傾向、專業力弱等固有缺陷。RAG最新科研綜述可以參考:面向AI內容生成的檢索增強生成(RAG)技術全面綜述:背景、基礎、進階、應用、展望。

檢索增強生成智能體(Agentic RAG)的核心是將智能和自主性注入到RAG框架中。這就像是給一個普通的RAG系統進行了重大升級,將其轉變為一個能夠自主決策并采取行動以實現特定目標的自主智能體。本文幫助理解RAG智能體方法并了解它如何徹底改變我們處理信息的方式。


作者:張長旺,圖源:旺知識

作為對照,您可以參考我們以前的相關文章來了解經典RAG系統的特性和特點:

高級檢索增強生成技術(RAG)全面指南:原理、分塊、編碼、索引、微調、Agent、展望
檢索增強生成技術(RAG)深度優化指南:原理、挑戰、措施、展望
1 - RAG智能體特性特點

 

上下文至上:傳統RAG實現的最大局限之一是它們無法真正理解并考慮更廣泛的對話上下文。而RAG智能體則被設計成具有上下文感知能力。它們可以把握對話的微妙之處,考慮歷史,并相應地調整行為。這意味著更連貫和相關的回應,就像智能體真正參與了一場自然對話一樣。

 

智能檢索策略:RAG系統過去依賴靜態規則進行檢索,RAG智能體比規則那聰明多了。它們采用智能檢索策略,動態評估用戶的查詢、可用工具(數據來源)和上下文線索,以確定最合適的檢索行動。就像有一個知道在哪里找到你需要的信息的私人助手一樣。

 

多智能體協作:復雜的查詢通常涉及多個文檔或數據源,在RAG智能體的世界里,我們有多智能體協作的能力。想象一下有多個專門的智能體,每個智能體都是自己領域或數據源的專家,共同合作并綜合他們的發現,為用戶提供全面的回應。就像有一組專家一起解決你最棘手的問題一樣。

 

智能推理:RAG智能體不僅擅長檢索信息;它們還配備了遠遠超越簡單檢索和生成的推理能力。這些智能體可以對檢索到的數據進行評估、校正和質量檢查,確保用戶收到的輸出是準確可靠的。不再擔心獲取到可疑信息了!

 

生成后驗證:RAG智能體可以進行生成后的檢查。它們可以驗證生成內容的真實性,甚至運行多次生成并為用戶選擇最佳結果。

 

適應性與學習:RAG智能體架構可以設計成包含學習機制,使智能體能夠隨著時間的推移適應和改進其性能。這就像有一個系統,你使用得越多,它就越聰明、越高效!

 

2 - RAG智能體參考架構

 

好了,現在我們已經對RAG智能體的基本原理有了很好的理解,讓我們深入探討一下使整個系統運行的參考架構。


在這個架構的核心,我們有RAG智能體——智能指揮官,負責接收用戶查詢并決定適當的行動方針。把它想象成交響樂團的指揮,協調所有不同的樂器(工具)以創造和諧的表演。

 

現在,這個智能體并不孤單。它配備了一套工具,每個工具都與特定的一組文檔或數據源相關聯。這些工具就像是專門的智能體或函數,可以從各自的數據源中檢索、處理和生成信息。

 

例如,假設你有工具1,負責訪問和處理財務報表,以及工具2,處理客戶數據。RAG智能體可以根據你的查詢動態選擇和組合這些工具,使其能夠從多個來源合成信息,為你提供全面的回應。

 

檢索的信息來自于自定義文檔和數據源。這些信息可以是結構化的或非結構化的,包括數據庫、知識庫、文本文檔和多媒體內容等。它們是工具處理的原材料。

 

現在,假設你向智能體提出了一個涉及多個領域或數據源的復雜問題:RAG智能體規劃整個過程,確定使用哪些工具,從相關的數據源檢索相關信息,并生成針對你查詢的最終回應。

 

在整個過程中,智能體利用智能推理、上下文感知和生成后驗證技術,確保你收到的輸出不僅準確,而且符合你的需求。

 

當然,這只是參考架構的簡化表示。在現實世界中,RAG智能體的實現可能涉及其他組件,例如語言模型、知識庫和其他支持系統,具體取決于特定的用例和需求。

 

3 - RAG智能體開發實例

 

我們這里實現一個RAG智能體的實例(arXiv文章檢索智能體)來具體說明RAG智能體的開發實現。

 

3.1 開發架構

這里RAG智能體的開發架構是為每份文檔設置一個文檔智能體,每個文檔智能體都能在自己的文檔中進行問題解答和總結。然后建立一個頂級智能體(元智能體),管理所有低級文檔智能體。


3.2 開發技術棧

Langchain: 更具體地說是 LCEL:開發 LLM 應用程序的協調框架
OpenAI: 提供大語言模型(LLM)服務
FAISS-cpu: 向量存儲

3.3 數據源

在這里,我們將利用ArxivLoader來檢索發表在arXiv上的文章的元數據。

3.4 代碼實現

安裝所需的依賴項:

!pip install -qU langchain langchain_openai langgraph arxiv duckduckgo-search
!pip install -qU faiss-cpu pymupdf
設置環境變量:

from google.colab import userdata
from uuid import uuid4
import os
#
os.environ['OPENAI_API_KEY'] = userdata.get('OPENAI_API_KEY')
os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_PROJECT"] = f"AIE1 - LangGraph - {uuid4().hex[0:8]}"
os.environ["LANGCHAIN_API_KEY"] =  userdata.get('LANGCHAIN_API_KEY')

知識技能更多>>

寧德時代參投新公司,哪吒汽車轉經銷商,極氪007GT等新車型來襲 預計2026年發布 新款保時捷Cayenne Coupe諜照曝光 豐田皇冠威爾法墨金版上市,91.9萬起售,配置升級能否打動你? 2025款奧迪Q2L降價上市,配置微調,售價17.18-21萬元 智能網聯與快速充電技術齊亮相2025武漢新能源汽車技術及充電樁展會揭示新能源車新趨勢 領克900首發:SPA Evo架構旗艦SUV,能否撼動大型SUV市場? 法拉第未來FX首款原型車諜照曝光,網友:魏牌高山換了個模具? 搭載高通驍龍數字底盤 零跑B10或售13萬起 等等再出手 四款國產SUV來襲 比亞迪唐L、領克900領銜 推薦奢享版 2025款名爵MG7購車指南 大眾牽手小鵬,合力打造超20000個自營充電終端 嵐圖汽車首發LFC超級后驅技術,既防眩暈,又抗甩尾! 這三款車企車型為何遇冷? 增長29%!蘇州金龍2024年銷售額超百億 從燃油到新能源,這個品牌為何從沒有能力天花板? 2025誰是下一家盈利的新勢力汽車車企? 730馬力!Brabus爆改AMG CLC 63 SE 零百加速3.3秒 速騰換殼 捷達VA7量產下線 預售12萬元起 22.48萬起 北京BJ40魔核電驅版開啟預售 配增程系統/綜合續航1200km 彰顯中國品牌實力 比亞迪海豹拿下日本年度風云車大獎 降價6000美元 2025款美版豐田bZ4X上市 配置小幅升級 有望明年上半年上市 奧迪Q6L e-tron投產 A6 e-tron隨后跟進 2.9秒破百 BRABUS爆改AMG GT 63 Coupe 動力大幅升級 最高降價8.5萬元 Jeep牧馬人4xe價格調整 49.99萬元起 名爵MG ES5昆明亮相,首批車主交車,最低僅售9.99萬元起! 海馬汽車攜多項專利亮相2024海南國際知識產權交易大會 余承東攜手“四界”領導人亮相央視,揭秘鴻蒙智行背后的故事 當地售價916.9萬起!極石ROX 01正式亮相俄羅斯市場 Momenta獲德國TÜV萊茵ISO 26262 ASIL D功能安全產品認證 蓋世汽車榮獲“AUTOSAR中國中心年度特別貢獻獎”