HKUDS/RAG-Anything
RAG-Anything 是一个集成的多模态检索增强生成(RAG)框架,专为处理包含文本、图像、表格和数学公式等多种内容形式的现代文档而设计。
- 提供端到端的多模态处理流程,从文档导入解析到智能查询应答
- 支持 PDF、Office 文件及图片等各种通用文档格式
- 配备专门模块分析图像、表格和数学方程式等异构内容
- 构建跨模态知识图谱,实现实体自动提取与关系发现,提升理解能力
- 具备灵活适应性,可通过不同模式进行内容解析或直接注入预处理数据列表
- 实现混合智能检索,结合文本与视觉信息进行上下文感知搜索
- 采用分阶段算法架构,有效扩展传统 RAG 以支持复杂多样的信息融合与推理
joolfe/postman-to-openapi
postman-to-openapi 是一个将 Postman 集合转换为 OpenAPI 规范的工具。
- 支持将 Postman Collection v2.1/v2.0 转换为 OpenAPI v3.
- 提供库和命令行界面两种使用方式,方便集成到不同的开发环境中。
- 使用简单,通过 npm 或 yarn 安装,支持异步和 Promise 风格调用。
- 具备清晰的文档说明,包括功能、用法及帮助信息。
xverse-ai/XVERSE-13B
XVERSE-13B 是由 XVERSE Technology Inc. 开发的多语言大语言模型。
- 支持超过 40 种语言,具备优秀的中英双语表现。
- 最大支持 256K 上下文窗口长度,适合长序列对话和文献总结等任务。
- 使用高质量、多样化的数据集进行训练,总计 3.2 万亿 token,提高了模型能力和稳定性。
- 采用主流 Decoder-only Transformer 结构,实现高效推理与应用场景广泛。
- 提供开源、免费可商用的解决方案,并支持在消费级显卡上运行。
bacen/pilotord-kit-onboarding
pilotord-kit-onboarding 是一个用于参与 Real Digital 试点的文档和配置文件集合。
- 提供参与 Real Digital 试点所需的信息
- 包含智能合约示例,如 Real Tokenizado 和公共债券的代币化
- 涉及隐私保护技术,如 Anonymous Zether、Starlight 和 Rayls
- 文档将根据参与者反馈进行补充和完善
Azure/azure-search-vector-samples
azure-search-vector-samples 是一个用于展示 Azure AI Search 中向量搜索功能的代码示例库。
- 提供 Python、C#、REST 和 JavaScript 的代码示例
- 支持向量索引和查询,已广泛可用
- 包含集成数据分块和嵌入的公共预览功能
- 展示了多种框架和技术在向量搜索中的应用
- 适用于不同编程语言的控制台应用程序演示