Featured image of post 多模态文档智能解析利器:全方位提升信息检索与理解能力 | 开源日报 No.745

多模态文档智能解析利器:全方位提升信息检索与理解能力 | 开源日报 No.745

RAG-Anything 是一个开源的多模态检索增强生成框架,旨在处理现代文档中的多种内容形式,如文本、图像、表格和数学公式。它支持多种文档格式,提供端到端的处理流程,具备图像和表格分析模块,能够构建跨模态知识图谱,增强理解能力。该框架还支持灵活的内容解析和混合智能检索,采用分阶段算法架构,扩展传统的 RAG 方法以实现复杂信息的融合与推理。

HKUDS/RAG-Anything

Github Repo Stars License: `MIT` Language: `Unknown`

cover

RAG-Anything 是一个集成的多模态检索增强生成(RAG)框架,专为处理包含文本、图像、表格和数学公式等多种内容形式的现代文档而设计。

  • 提供端到端的多模态处理流程,从文档导入解析到智能查询应答
  • 支持 PDF、Office 文件及图片等各种通用文档格式
  • 配备专门模块分析图像、表格和数学方程式等异构内容
  • 构建跨模态知识图谱,实现实体自动提取与关系发现,提升理解能力
  • 具备灵活适应性,可通过不同模式进行内容解析或直接注入预处理数据列表
  • 实现混合智能检索,结合文本与视觉信息进行上下文感知搜索
  • 采用分阶段算法架构,有效扩展传统 RAG 以支持复杂多样的信息融合与推理

joolfe/postman-to-openapi

Github Repo Stars License: `MIT` Language: `Unknown`

cover

postman-to-openapi 是一个将 Postman 集合转换为 OpenAPI 规范的工具。

  • 支持将 Postman Collection v2.1/v2.0 转换为 OpenAPI v3.
  • 提供库和命令行界面两种使用方式,方便集成到不同的开发环境中。
  • 使用简单,通过 npm 或 yarn 安装,支持异步和 Promise 风格调用。
  • 具备清晰的文档说明,包括功能、用法及帮助信息。

xverse-ai/XVERSE-13B

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

demo-picture-of-XVERSE-13B

XVERSE-13B 是由 XVERSE Technology Inc. 开发的多语言大语言模型。

  • 支持超过 40 种语言,具备优秀的中英双语表现。
  • 最大支持 256K 上下文窗口长度,适合长序列对话和文献总结等任务。
  • 使用高质量、多样化的数据集进行训练,总计 3.2 万亿 token,提高了模型能力和稳定性。
  • 采用主流 Decoder-only Transformer 结构,实现高效推理与应用场景广泛。
  • 提供开源、免费可商用的解决方案,并支持在消费级显卡上运行。

bacen/pilotord-kit-onboarding

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

cover

pilotord-kit-onboarding 是一个用于参与 Real Digital 试点的文档和配置文件集合。

  • 提供参与 Real Digital 试点所需的信息
  • 包含智能合约示例,如 Real Tokenizado 和公共债券的代币化
  • 涉及隐私保护技术,如 Anonymous Zether、Starlight 和 Rayls
  • 文档将根据参与者反馈进行补充和完善

Azure/azure-search-vector-samples

Github Repo Stars License: `MIT` Language: `Unknown`

cover

azure-search-vector-samples 是一个用于展示 Azure AI Search 中向量搜索功能的代码示例库。

  • 提供 Python、C#、REST 和 JavaScript 的代码示例
  • 支持向量索引和查询,已广泛可用
  • 包含集成数据分块和嵌入的公共预览功能
  • 展示了多种框架和技术在向量搜索中的应用
  • 适用于不同编程语言的控制台应用程序演示
Licensed under CC BY-NC-SA 4.0