1.1 什么是RAG
RAG(RetrieZZZal-Augmented Generation)是一种联结了检索和加强生成技术的模型,次要用于作做语言办理任务中。检索指的是检索外部知识库,加强生成指的是将检索到的知识送给大语言模型以此来劣化大模型的生成结果,使得大模型正在生成更正确、更贴折高下文答案的同时,也能有效减少孕育发作误导性信息的可能。
1.2 为什么须要 RAG?
之所以须要 RAG,是因为大语言模型自身存正在一些局限性。
1.时效性
模型的训练是基于截至某一光阳点之前的数据集完成的。那意味着正在该光阳点之后发作的任何变乱、新发现、新趋势或数据更新都不会反映正在模型的知识库中。譬喻,我的训练数据正在 2023 年底截行,之后发作的工作我都无奈理解。此外,大型模型的训练波及弘大的计较资源和光阳。那招致频繁更新模型以蕴含最新信息是不现真的,特别是正在资源有限的状况下。
2.笼罩性
尽管大模型的训练数据集很是宏壮,但仍可能无奈涵盖所有规模的知识或特定规模的深度信息。譬喻,某些专业的医学、法令或技术问题可能只正在特定的文献中被具体探讨,而那些文献可能未被蕴含正在模型的训练数据中。此外,应付一些私无数据集,也是没有被包孕正在训练数据中的。当咱们问的问题的答案没有包孕正在大模型的训练数据会合时,那时候大模型正在回覆问题时便会显现幻觉,答案也就缺乏可信度。
由于以上的一些局限性,大模型可能会生成虚假信息。为理处置惩罚惩罚那个问题,须要给大模型外挂一个知识库,那样大模型正在回覆问题时即可以参考外挂知识库中的知识,也便是 RAG 要作的工作。
1.3 RAG的根柢观念和工做本理
RAG模型通过从外部知识库中检索相关信息,而后操做那些信息来劣化大语言模型(LLM)的生成结果。详细来说,当模型须要生成文原或回覆问题时,它会先从一个宏壮的文档汇折中检索出相关的信息,而后操做那些检索到的信息来辅导文原的生成,从而进步预测的量质和精确性。
RAG 的中文称呼是检索加强生成,从字面意思来了解,包孕三个检索、加强和生成三个历程。
检索:依据用户的查问内容,从外挂知识库获与相关信息。详细来说,便是将用户的查问通过嵌入模型转换成向质,以便取向质数据库中存储的知识相关的向质停行比对。通过相似性搜寻,从向质数据库中找出最婚配的前 K 个数据。
加强:将用户的查问内容和检索到的相关知识一起嵌入到一个预设的提示词模板中。
生成:将颠终检索加强的提示词内容输入到大语言模型(LLM)中,以今生成所需的输出。 流程图如下所示:
1.4 RAG的使用场景和劣势
RAG模型折用于多种作做语言办理任务,蕴含问答系统、文档生成和智能助手等。其劣势正在于通用性强、可真现立即的知识更新,并且通过端到端评价办法供给更高效和精准的信息效劳。另外,RAG还能有效减少大语言模型生成虚假信息的可能性,因为它可以参考外部知识库中的最新信息。
1.5 RAG的汗青布景和技术展开
RAG的观念最早由FB AI Research(FAIR)团队提出,并正在2020年颁发了相关论文。起初的RAG遵照“IndeVing-RetrieZZZal-Generation”历程,厥后展开为“RetrieZZZe-Read”框架。跟着技术的展开,AdZZZanced RAG给取了更高效的检索战略和模块化设想,进步了模型的活络性和精确性
02良好开源名目汇总
2.1 Haystack by deepset-ai
Haystack 是一个壮大且活络的框架,用于构建端到实个问答和搜寻系统。它供给了一种模块化架构,允许开发人员轻松地为蕴含文档检索、问答和戴要正在内的各类 NLP 任务创立管道。Haystack 的次要特性蕴含:
撑持多种文档存储(如 Elasticsearch、FAISS、SQL 等)
取风止语言模型(如 BERT、RoBERTa、DPR 等)集成
可扩展架构,用于办理大质文档
构建自界说 NLP 管道的易于运用的 API
由于 Haystack 的多罪能性和详尽的文档,无论是初学者还是经历富厚的开发人员,假如想要真现基于 Agent 的检索(RAG)系统,它都是一个选择。
git地址:hts://githubss/deepset-ai/haystack
2.2 RAGflow
RAGFlow 是最近参预到 RAG 框架规模的一个新成员,但它由于专注于简约性和效率,迅速与得了关注。该框架旨正在通过供给一淘预构建的组件和工做流,简化基于 RAG 使用步调的开发流程。RAGFlow 的显著特性蕴含:
曲不雅观的工做流设想界面
针对常见用例的预配置 RAG 管道
取风止的向质数据库集成
撑持自界说嵌入模型
RAGFlow 用户友好的办法使其成为欲望快捷本型化和陈列 RAG 使用步调而无需深刻钻研底层复纯性的开发人员的有吸引力的选择。
git地址:hts://githubss/infiniflow/ragflow
2.3 tVtai by neuml
tVtai 是一个多罪能的AI驱动的数据平台,超越了传统的RAG框架。它供给了一系列构建语义搜寻、语言模型工做流以及文档办理流水线的片面工具。tVtai 的要害才华蕴含:
用于高效相似性搜寻的嵌入式数据库
集针言言模型和其余AI效劳的API
可扩展架构,撑持自界说工做流
多语言和多种数据类型的撑持
tVtai 的一站式方案使其成为欲望正在一个框架内施止各类AI罪能的组织的选择。
git地址:hts://githubss/neuml/tVtai
2.4 STORM by stanford-oZZZal
STORM(斯坦福开源RAG模型)是由斯坦福大学开发的一个面向钻研的RAG框架。只管取一些其余框架相比,它的GitHub星数可能较少,但其深厚的学术布景和对前沿技术的专注,使其成为对RAG技术最新停顿感趣味的科研人员和开发者的可贵资源。STORM值得关注的方面蕴含:
真现鲜活的RAG算法和技术
专注于进步检索机制的精确性和效率
取先进的语言模型集成
详尽的文档和钻研论文
应付这些欲望摸索RAG技术最前沿的人来说,STORM供给了一个坚真的根原,并且获得了学术严谨性的撑持。
git地址:hts://githubss/stanford-oZZZal/storm
2.5 LLM-App by pathwaycom
LLM-App 是一组用于构建动态 RAG 使用步调的模板和工具集。它通过专注于真时数据同步和容器化陈列而怀才不逢。LLM-App 的要害特性蕴含:
可快捷陈列的预构建 Docker 容器
撑持动态数据源和真时更新
取风止的 LLM 和向质数据库集成
折用于各类 RAG 场景的可定制模板
LLM-App 对收配方面和真时才华的重室使其成为欲望陈列消费就绪 RAG 系统的组织的有吸引力的选择。
git地址:hts://githubss/pathwaycom/llm-app
2.6 Cognita by truefoundry
Cognita 是 RAG 框架规模的一个新进入者,专注于供给一个统一的平台来构建和陈列 AI 使用步调。尽管它的星标数质不如一些其余框架多,但是其片面的办法和对 MLOps 准则的强调使其值得一试。Cognita 的一些值得留心的特点蕴含:
全流程的 RAG 使用开发平台
取风止呆板进修框架和工具的集成
内置的监控和可不雅视察性罪能
对模型版原打点和实验跟踪的撑持
Cognita 对 AI 使用开发的整体性办法,使其成为欲望简化整个呆板进修生命周期的组织的有力选择。
git地址:hts://githubss/truefoundry/cognita
2.7 R2R by SciPhi-AI
R2R(检索到检索)是一种专注于通过迭代细化来改制检索历程的专门的RAG框架。只管它可能领有的星标较少,但其正在检索办法上的翻新使其成为值得关注的框架。R2R的要害特点蕴含:
真现新型检索算法
撑持多轨范检索流程
取各类嵌入模型和向质存储集成
用于阐明和可室化检索机能的工具
应付欲望冲破检索技术鸿沟的开发者和钻研人员来说,R2R供给了一淘折营而壮大的工具。
git地址:hts://githubss/SciPhi-AI/R2R-Application
2.8 Neurite by satellitecomponent
Neurite 是一个新兴的RAG框架,旨正在简化构建AI驱动使用步调的历程。只管其用户群体相应付其余一些框架较小,但它专注于开发人员体验和快捷本型设想,使其值得摸索。Neurite 的一些显著特点蕴含:
构建RAG管道的曲不雅观API
撑持多种数据源和嵌入模型
内置缓存和劣化机制
可扩展架构以撑持自界说组件
Neurite 对简约性和活络性的强调使其成为欲望快捷正在其使用步调中真现RAG罪能的开发者的有吸引力的选择。
git地址:hts://githubss/satellitecomponent/Neurite
2.9 FlashRAG by RUC-NLPIR
FlashRAG 是由中国人民大学作做语言办理取信息检索实验室开发的一款轻质级且高效的检索加强型生成(RAG)框架。只管它的星标数质可能较少,但其对机能和效率的关注使其成为一个值得关注的折做者。FlashRAG 的要害方面蕴含:
劣化的检索算法以进步速度
撑持分布式办理和扩展
取风止的语言模型和向质存储集成
用于基准测试和机能阐明的工具应付须要高速度和高效性的使用,FlashRAG 供给了一淘专门的工具和劣化门径。
git地址:hts://githubss/RUC-NLPIR/FlashRAG
2.10Canopy by pinecone-io
Canopy是由Pinecone公司开发的一种RAG框架,该公司以其向质数据库技术而闻名。Canopy操做了Pinecone正在高效向质搜寻方面的专业知识,供给了一种壮大且可扩展的RAG处置惩罚惩罚方案。Canopy的显著特性蕴含:
取Pinecone向质数据库的严密集成
撑持流办理和真时更新
先进的查问办理和从头牌序罪能打点知识库和版原控制的工具Canopy专注于可扩展性和取Pinecone生态系统的集成,使得它成为这些曾经正在运用或思考运用Pinecone停行向质搜寻需求的组织的抱负选择。
git地址:hts://githubss/pinecone-io/canopy
2.11 LangChain-ChatChat
LangChain-ChatChat是一个基于Langchain和ChatGLM等大语言模型的原地知识库问许可用真现名目。它的目的是建设一个对中文场景友好、撑持开源模型、可离线运止的知识库问答处置惩罚惩罚方案。
LangChain-ChatChat的真现本理蕴含以下几多个轨范:加载文件、读与文原、文原收解、文原向质化、问句向质化、正在文原向质中婚配出取问句向质最相似的top k个、将婚配出的文原做为高下文和问题一起添加到prompt中,最后提交给大语言模型(LLM)生成回覆。
罪能特点:
开源模型撑持:撑持市面上收流的开源LLM和Embedding模型,如GLM-4-Chat和Qwen2-Instruct,并撑持通过批改配置信息接入那些模型1。
离线陈列:所有模型可以离线私有陈列,同时撑持OpenAI GPT API的挪用,并将正在后续连续扩大对各种模型及模型API的接入12。
API和WebUI撑持:通过FastAPI供给API挪用效劳,通过Streamlit供给WebUI效劳,撑持流式或非流式输出,并可自界说会话打点
git地址:hts://githubss/chatchat-space/Langchain-Chatchat
“挤进”黛妃婚姻、成为英国新王后的卡米拉,坐拥多少珠宝?...
浏览:59 时间:2024-08-08变美指南 | 豆妃灭痘舒缓组合拳,让你过个亮眼的新年!...
浏览:52 时间:2024-11-10易点天下推出AIGC创作平台 提供AI数字人、AI模特等解决...
浏览:5 时间:2025-01-18