Featured image of post 高效文档提取利器 :84 语种 OCR 识别 | 开源日报 No.558

高效文档提取利器 :84 语种 OCR 识别 | 开源日报 No.558

MinerU 是一个高效、多功能的开源数据提取工具,支持从 PDF、网页和电子书等多种格式中提取高质量数据。其核心功能包括强大的表格识别、多语言 OCR 支持 (84 种语言)、优化内存使用以降低硬件要求,并提供快速部署和在线演示。该项目旨在解决从各种文档中高效、准确地提取数据的问题。

Featured image of post 拖放式构建 LLM 流程:跨平台灵活部署 | 开源日报 No.556

拖放式构建 LLM 流程:跨平台灵活部署 | 开源日报 No.556

Flowise 是一个开源工具,提供拖放式用户界面,用于快速构建和部署自定义大语言模型 (LLM) 流程。它支持多种部署选项,包括 AWS、Azure 和本地自托管,并包含 Node.js 后端和 React 前端,支持 API 文档自动生成,通过环境变量配置实例设置,提高灵活性。

Featured image of post AI 科研引擎:全自动科学发现与论文创作 | 开源日报 No.555

AI 科研引擎:全自动科学发现与论文创作 | 开源日报 No.555

AI-Scientist 是一个开源项目,旨在实现完全自动化的科学发现。它提供全面的系统支持,允许基础模型 (如大型语言模型) 独立进行科学研究。项目包含多个模板,涵盖 NanoGPT、2D 扩散和 Grokking 等领域,便于生成创意和实验。用户还可以运行基于 LLM 生成论文的实验,并获取评审反馈。