C114通信網(wǎng)  |  通信人家園

人工智能
2024/11/28 13:53

GPT-4o系列AI模型加持,微軟LlamaParse文檔解析能力全面升級

IT之家  故淵

微軟于 11 月 26 日發(fā)布博文,宣布在其 LlamaParse 中集成 Azure OpenAI 端點,利用 GPT-4o 系列模型,增強(qiáng)提取非結(jié)構(gòu)化數(shù)據(jù)和解析多模態(tài)文檔,并無縫銜接 Azure AI Search 向量數(shù)據(jù)庫,構(gòu)建完整的檢索增強(qiáng)生成(RAG)工作流程。

LlamaParse 簡介

微軟 LlamaParse 是一個專為生成式人工智能(GenAI)設(shè)計的文檔解析器,其主要目標(biāo)是解析和清理各種文檔數(shù)據(jù),在傳遞給下游大型語言模型 (LLM) 之前,確保數(shù)據(jù)質(zhì)量。

新增 Azure OpenAI 端點(endpoints)

微軟 LlamaParse 在本次集成后,可以讓用戶調(diào)用 Azure OpenAI 的 GPT-4o 系列模型,提取非結(jié)構(gòu)化數(shù)據(jù)和文檔轉(zhuǎn)換。此次集成充分發(fā)揮了雙方優(yōu)勢,LlamaParse 負(fù)責(zé)高效解析,Azure OpenAI 則提供強(qiáng)大的語言模型能力,最終實現(xiàn)更精準(zhǔn)、更智能的文檔處理。

援引該媒體報道,附上本次更新內(nèi)容如下:

直接連接到 Azure OpenAI 的 GPT-4o 和 GPT-4o-mini 等模型

LlamaParse 中的多模態(tài)文檔解析,通過 Azure OpenAI 的多模態(tài)支持

LLM 優(yōu)化的輸出,用于增強(qiáng)檢索和語義搜索

通過 LlamaIndex 無縫攝取到 Azure AI Search 的向量存儲庫中

企業(yè)級安全性和合規(guī)性,適用于敏感工作負(fù)載

用戶可以利用 LlamaCloud、Azure AI Search 和 Azure OpenAI 構(gòu)建一個完整的 RAG 工作流程,具體步驟包括:

解析與豐富: 使用 LlamaParse Premium 和 Azure OpenAI 進(jìn)行高級文檔提取,生成 Markdown、LaTeX 和 Mermaid 圖表等多種格式的 LLM 優(yōu)化輸出。

分塊和嵌入: 使用 Azure AI Search 作為向量存儲,并利用 Azure AI 模型目錄中的嵌入模型,對解析后的內(nèi)容進(jìn)行分塊、嵌入和索引。

搜索與生成: 利用 Azure AI Search 的查詢重寫和語義重新排序功能,提升檢索質(zhì)量。最終,通過 Llamaindex 編排 Azure AI Search 和 Azure OpenAI,構(gòu)建生成式 AI 應(yīng)用。

給作者點贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141