Featured image of post OCRmyPDF:轻松复制 PDF 文本 | 开源日报 No.522

OCRmyPDF:轻松复制 PDF 文本 | 开源日报 No.522

OCRmyPDF 是一个开源工具,旨在为扫描的 PDF 文件添加可搜索的 OCR 文本层,支持生成 PDF/A 文件,保持图像分辨率,优化文件大小,并可在多个 CPU 核心上并行处理,使用 Tesseract OCR 引擎支持多语言识别,确保用户数据的私密性。

monasticacademy/httptap

Github Repo Stars License: `MIT` Language: `Unknown`

demo-picture-of-httptap

httptap 是一个用于查看任何 Linux 程序发出的 HTTP/HTTPS 请求的工具。

  • 可以通过运行 httptap -- <command> 来捕获和显示 HTTP 请求。
  • 不需要 root 权限或设置守护进程,使用简单方便。
  • 生成的可执行文件是静态 Go 二进制文件,无需依赖其他库。
  • 当前仅支持 Linux 系统,利用了特定于 Linux 的系统调用。

Soulter/AstrBot

Github Repo Stars License: `AGPL-3.0` Language: `Unknown`

demo-picture-of-AstrBot

AstrBot 是一个易上手的多平台 LLM 聊天机器人及开发框架。

  • 支持多种大语言模型,包括 OpenAI、Google Gemini 和本地部署模型。
  • 可接入多个消息平台,如 QQ、微信和 Telegram,后续将支持更多平台。
  • 原生支持 Agent 功能,如代码执行器和自然语言待办事项。
  • 深度优化的插件机制,便于扩展功能并简化开发过程。
  • 提供可视化管理面板,降低配置难度并集成 Web Chat。
  • 高稳定性与模块化设计,基于事件总线架构实现低耦合。

folke/snacks.nvim

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

cover

snacks.nvim 是一组为 Neovim 提供的质量提升插件集合。

  • 包含超过 45 种缓动函数的高效动画
  • 支持处理大文件
  • 删除缓冲区时不影响窗口布局
  • 美观的声明式仪表板
  • 调试时提供漂亮的检查和回溯功能
  • 聚焦于活动范围,其他部分变暗以提高专注度
  • 文件浏览器(伪装成选择器)
  • Git 工具集成
  • 在浏览器中打开当前文件、分支、提交或仓库链接
  • 更好的 Vim 输入界面

ocrmypdf/OCRmyPDF

Github Repo Stars License: `MPL-2.0` Language: `Unknown`

demo-picture-of-OCRmyPDF

OCRmyPDF 是一个为扫描的 PDF 文件添加 OCR 文本层的工具,使其可以被搜索或复制粘贴。

  • 生成可搜索的 PDF/A 文件
  • 精确地将 OCR 文本放置在图像下方,方便复制/粘贴
  • 保持原始嵌入图像的分辨率不变
  • 在可能情况下,以“无损”操作插入 OCR 信息,不干扰其他内容
  • 优化 PDF 图像,通常生成比输入文件更小的文件
  • 可根据需要进行去歪和清理图像后再执行 OCR
  • 验证输入和输出文件
  • 分配工作到所有可用 CPU 核心
  • 使用 Tesseract OCR 引擎识别超过 100 种语言
  • 保持用户私密数据安全

adrianhajdin/ai_saas_app

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

demo-picture-of-ai_saas_app

ai_saas_app 是一个构建真实的人工智能软件即服务应用程序,具备支付和积分系统,可以作为副业或商业创意。

  • 提供安全的用户认证和授权功能
  • 支持社区图像展示与便捷导航
  • 具备先进的图像搜索功能,快速准确地查找内容或对象
  • 实现旧照片修复、颜色替换、对象移除等多种 AI 图像处理能力
  • 用户可以下载和分享经过 AI 处理后的图片,并查看详细信息
  • 管理转换记录,包括删除和更新操作
  • 积分系统允许用户购买或赚取用于图像转换的积分
  • 响应式 UI/UX 设计,确保在各种设备上的无缝体验
Licensed under CC BY-NC-SA 4.0