Vespa.ai:构建高效AI搜索与推荐系统的开源平台
Vespa.ai 是一个开源的AI搜索与推荐平台,专注于处理大规模数据,提供高效的搜索、推荐和个性化服务。它支持向量搜索、文本搜索和结构化数据处理,结合机器学习模型实现实时推理。Vespa 能处理亿级数据,响应速度...
NodeRAG:基于异构图的精准信息检索与生成工具
NodeRAG 是一个开源的检索增强生成(RAG)系统,托管在 GitHub,由 Terry-Xu-666 开发。它通过异构图结构优化信息检索与生成,显著提升检索精准度和上下文相关性。NodeRAG 支持本地部署,提供用户友好的界面和可.....
Morphik Core:处理多模态数据的开源 RAG 平台
Morphik Core 是一个开源项目,由 morphik-org 团队开发,托管在 GitHub 上。它以前叫 DataBridge Core,现在更名为 Morphik Core。这个工具是为 AI 应用设计的数据库,能处理文本、图片...
Rankify:支持信息检索与重排序的Python工具包
Rankify 是由奥地利因斯布鲁克大学数据科学小组开发的开源 Python 工具包。它专注于信息检索、重排序和检索增强生成(RAG),提供了一个统一的框架。工具包内置 40 个预检索基准数据集,支持 7 种检索技术和 24 ...
HippoRAG:基于长时记忆的多跳知识检索框架
HippoRAG 是俄亥俄州立大学 OSU-NLP 小组开发的一个开源框架,灵感来源于人类长时记忆机制。它结合检索增强生成(RAG)、知识图谱和个性化 PageRank 技术,帮助大语言模型(LLM)从外部文档中持续整合知识。Hippo.....
LettuceDetect:检测RAG系统幻觉的高效工具
LettuceDetect 是 KRLabsOrg 开发的一个轻量级开源工具,专门用于检测检索增强生成(RAG)系统中生成的幻觉内容。它通过对比上下文、问题和回答,识别回答中不受上下文支持的部分,帮助开发者提升 RAG 系统的准确...
dsRAG:用于处理非结构化数据和复杂查询的检索引擎
dsRAG是一款高性能检索引擎,专门用于处理非结构化数据的复杂查询。它在处理密集文本(如财务报告、法律文件和学术论文)中的挑战性查询时表现尤为出色。dsRAG采用了三种关键方法来提高性能:语义分段、上下文自...
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建
VideoRAG是一个专为处理和理解超长上下文视频而设计的检索增强生成框架。该工具结合了图驱动的文本知识基础和分层多模态上下文编码,能够在单个NVIDIA RTX 3090 GPU上高效处理数百小时的视频内容。VideoRAG通过动...
PRAG:提升问答系统性能的参数化检索增强生成工具
PRAG(Parametric Retrieval-Augmented Generation)是一个创新的检索增强生成工具,旨在通过将外部知识直接嵌入大语言模型(LLM)的参数空间,提升生成效果。该工具克服了传统上下文检索增强生成方法的局限...
ColiVara:基于视觉嵌入的文档存储与检索服务
ColiVara 是一个基于视觉嵌入技术的文档存储和检索服务。它无需光学字符识别(OCR)或文本提取,避免了表格破损或图像丢失的问题。ColiVara 支持超过100种文件格式,包括 PDF、DOCX、PPTX 等,能够自动截取网页截...
Deeptrain:将视频内容转换为大模型可检索信息
Deeptrain是一个专注于AI视频处理的平台,通过其先进的技术,支持超过200种语言模型,能够有效地将视频内容整合到各种AI应用中。用户可以直接通过提供视频URL进行模型训练,无需下载视频。Deeptrain提供了从视频...
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调
UltraRAG是由清华大学THUNLP组、东北大学NEUIR组、Modelbest.Inc和9#AISoft团队联合提出的RAG(检索增强生成)系统解决方案。该框架基于敏捷部署和模块化构建,提供了自动化的数据构建、模型微调和推理评估技术体...
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具
Fast GraphRAG 是由 Circlemind AI 开发的一款开源工具,旨在通过知识图谱和 PageRank 算法实现高效、精确的检索增强生成(RAG)。该工具能够智能适应用户的使用场景、数据和查询需求,提供可解释、低成本且高效....
Ragas:评估RAG召回QA准确率与答案相关性
Ragas是一个专门用于评估和优化检索增强生成(RAG)系统的工具。它通过分析查询、检索上下文和生成答案之间的关系,提供了一套全面的评估指标。这些指标包括忠实度、答案相关性、上下文相关性、上下文召回率和上...
Orama:高性能全文本和向量搜索引擎
Orama 是一个开源的高性能搜索引擎,完全用 TypeScript 编写,支持全文本搜索、向量搜索和混合搜索。Orama 旨在在任何 JavaScript 运行时环境中工作,提供快速、可靠的搜索功能。它的设计目标是轻量级(小于2KB).....
XRAG:优化检索增强生成系统的可视化评估工具
XRAG(eXamining the Core)是一个专为评估高级检索增强生成(RAG)系统的基础组件而设计的基准框架。通过剖析和分析每个核心模块,XRAG提供了不同配置和组件如何影响RAG系统整体性能的见解。该框架支持多种检索...
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块
MiniRAG是一个极其简单的检索增强生成(RAG)框架,旨在通过异构图索引和轻量级拓扑增强检索,使小模型也能实现良好的RAG性能。该项目由香港大学数据科学实验室(HKUDS)开发,主要解决小语言模型(SLM)在现有RA...
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略
Cognita 是由 TrueFoundry 开发的一个开源框架,旨在简化基于 RAG(Retrieval-Augmented Generation)的应用开发。该框架提供了一个结构化的、模块化的解决方案,可以轻松将 RAG 技术从原型阶段...
Vanna:利用RAG技术将文本生成精准SQL查询
Vanna是一个MIT许可的开源Python框架,专注于通过RAG(检索增强生成)技术生成SQL查询。用户可以通过训练RAG模型,将其应用于自己的数据,然后提出问题,Vanna会返回相应的SQL查询。这些查询可以自动在数据库中运...