MinerU 是一个高效、多功能的开源数据提取工具,支持从 PDF、网页和电子书等多种格式中提取高质量数据。其核心功能包括强大的表格识别、多语言 OCR 支持 (84 种语言)、优化内存使用以降低硬件要求,并提供快速部署和在线演示。该项目旨在解决从各种文档中高效、准确地提取数据的问题。
`mind-map` 是一个基于 Web 的思维导图工具,采用插件化架构,支持多种结构图、高度自定义样式、丰富的节点内容格式、拖拽操作、画布缩放,以及多种导入导出格式,具备协同编辑和演示模式功能。
Flowise 是一个开源工具,提供拖放式用户界面,用于快速构建和部署自定义大语言模型 (LLM) 流程。它支持多种部署选项,包括 AWS、Azure 和本地自托管,并包含 Node.js 后端和 React 前端,支持 API 文档自动生成,通过环境变量配置实例设置,提高灵活性。
AI-Scientist 是一个开源项目,旨在实现完全自动化的科学发现。它提供全面的系统支持,允许基础模型 (如大型语言模型) 独立进行科学研究。项目包含多个模板,涵盖 NanoGPT、2D 扩散和 Grokking 等领域,便于生成创意和实验。用户还可以运行基于 LLM 生成论文的实验,并获取评审反馈。
NotionNext 是一个使用 NextJS 和 Notion API 构建的静态博客系统,支持多种部署方案,无需服务器即可轻松搭建网站。
Streamer-Sales 是一个能够根据给定的商品特点从激发用户购买意愿角度出发进行商品解说的卖货主播大模型。
Solidity 是一个开源的高级编程语言,专为在以太坊平台上开发和部署智能合约而设计,具有静态类型和面向合约的特性。该项目由以太坊基金会支持,提供丰富的文档和示例,确保去中心化执行,并定期更新以引入新特性和修复漏洞。
XPipe 是一个开源的 shell 连接中心和远程文件管理器,支持多种连接方式如 SSH、Docker 和 Kubernetes,集成常用命令行工具,提供强大的文件管理和终端会话功能,支持灵活的脚本系统,且数据安全存储在本地加密库中。
RAG_Techniques 是一个开源资源库,展示先进的检索增强生成 (RAG) 系统技术,提供全面的文档和实施指南,旨在帮助开发者有效应用这些技术,并定期更新以保持内容的前沿性。
Kubespray 是一个开源工具,用于在多种云平台和裸金属环境中部署生产就绪的 Kubernetes 集群,支持高可用性配置和多种网络插件,兼容大多数流行的 Linux 发行版,并包含持续集成测试以确保稳定性和可靠性。