Featured image of post OCRmyPDF:轻松复制 PDF 文本 | 开源日报 No.522

OCRmyPDF:轻松复制 PDF 文本 | 开源日报 No.522

OCRmyPDF 是一个开源工具,旨在为扫描的 PDF 文件添加可搜索的 OCR 文本层,支持生成 PDF/A 文件,保持图像分辨率,优化文件大小,并可在多个 CPU 核心上并行处理,使用 Tesseract OCR 引擎支持多语言识别,确保用户数据的私密性。

Featured image of post 美观且一致的开源矢量图标库 | 开源日报 No.521

美观且一致的开源矢量图标库 | 开源日报 No.521

Lucide 是一个开源的图标工具包,源自 Feather Icons,提供超过 1000 个矢量图标,旨在简化设计师和开发者在项目中整合图标的过程。它提供多种官方软件包,完全免费,适用于商业和个人用途,采用 ISC 许可证。

Featured image of post deepseek 开源:统一的多模态理解和生成模型 | 开源日报 No.516

deepseek 开源:统一的多模态理解和生成模型 | 开源日报 No.516

Janus 是一个开源的统一多模态理解和生成模型系列,支持多模态数据的理解与生成,提升文本到图像的指令跟随能力。它采用解耦视觉编码,增强了框架的灵活性和有效性。Janus-Pro 和 JanusFlow 提供了更先进的功能,显著提升视觉生成质量,成为下一代统一多模态模型的有力候选。