OCRmyPDF：轻松复制 PDF 文本 | 开源日报 No.522

OCRmyPDF：轻松复制 PDF 文本 | 开源日报 No.522

OCRmyPDF 是一个开源工具，旨在为扫描的 PDF 文件添加可搜索的 OCR 文本层，支持生成 PDF/A 文件，保持图像分辨率，优化文件大小，并可在多个 CPU 核心上并行处理，使用 Tesseract OCR 引擎支持多语言识别，确保用户数据的私密性。

monasticacademy/httptap

Github Repo Stars License: `MIT` Language: `Unknown`

demo-picture-of-httptap

httptap 是一个用于查看任何 Linux 程序发出的 HTTP/HTTPS 请求的工具。

可以通过运行 httptap -- <command> 来捕获和显示 HTTP 请求。
不需要 root 权限或设置守护进程，使用简单方便。
生成的可执行文件是静态 Go 二进制文件，无需依赖其他库。
当前仅支持 Linux 系统，利用了特定于 Linux 的系统调用。

Soulter/AstrBot

Github Repo Stars License: `AGPL-3.0` Language: `Unknown`

demo-picture-of-AstrBot

AstrBot 是一个易上手的多平台 LLM 聊天机器人及开发框架。

支持多种大语言模型，包括 OpenAI、Google Gemini 和本地部署模型。
可接入多个消息平台，如 QQ、微信和 Telegram，后续将支持更多平台。
原生支持 Agent 功能，如代码执行器和自然语言待办事项。
深度优化的插件机制，便于扩展功能并简化开发过程。
提供可视化管理面板，降低配置难度并集成 Web Chat。
高稳定性与模块化设计，基于事件总线架构实现低耦合。

folke/snacks.nvim

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

cover

snacks.nvim 是一组为 Neovim 提供的质量提升插件集合。

包含超过 45 种缓动函数的高效动画
支持处理大文件
删除缓冲区时不影响窗口布局
美观的声明式仪表板
调试时提供漂亮的检查和回溯功能
聚焦于活动范围，其他部分变暗以提高专注度
文件浏览器（伪装成选择器）
Git 工具集成
在浏览器中打开当前文件、分支、提交或仓库链接
更好的 Vim 输入界面

ocrmypdf/OCRmyPDF

Github Repo Stars License: `MPL-2.0` Language: `Unknown`

demo-picture-of-OCRmyPDF

OCRmyPDF 是一个为扫描的 PDF 文件添加 OCR 文本层的工具，使其可以被搜索或复制粘贴。

生成可搜索的 PDF/A 文件
精确地将 OCR 文本放置在图像下方，方便复制/粘贴
保持原始嵌入图像的分辨率不变
在可能情况下，以“无损”操作插入 OCR 信息，不干扰其他内容
优化 PDF 图像，通常生成比输入文件更小的文件
可根据需要进行去歪和清理图像后再执行 OCR
验证输入和输出文件
分配工作到所有可用 CPU 核心
使用 Tesseract OCR 引擎识别超过 100 种语言
保持用户私密数据安全

adrianhajdin/ai_saas_app

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

demo-picture-of-ai_saas_app

ai_saas_app 是一个构建真实的人工智能软件即服务应用程序，具备支付和积分系统，可以作为副业或商业创意。

提供安全的用户认证和授权功能
支持社区图像展示与便捷导航
具备先进的图像搜索功能，快速准确地查找内容或对象
实现旧照片修复、颜色替换、对象移除等多种 AI 图像处理能力
用户可以下载和分享经过 AI 处理后的图片，并查看详细信息
管理转换记录，包括删除和更新操作
积分系统允许用户购买或赚取用于图像转换的积分
响应式 UI/UX 设计，确保在各种设备上的无缝体验