Featured image of post 纯 JavaScript 实现的 OCR 库:支持超过 100 种语言 | 开源日报 No.715

纯 JavaScript 实现的 OCR 库:支持超过 100 种语言 | 开源日报 No.715

tesseract.js 是一个基于 JavaScript 的光学字符识别 (OCR) 库,支持超过 100 种语言,能够从图像和视频中提取文本。它使用 WebAssembly 封装了 Tesseract OCR 引擎,适用于浏览器和 Node.js,安装简便,且通过 CDN 或 npm/yarn 轻松获取,显著减小了文件大小,提升了运行速度和内存效率。

naptha/tesseract.js

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

demo-picture-of-tesseract.js

tesseract.js 是一个纯 JavaScript 的光学字符识别(OCR)库,支持超过 100 种语言。

  • 支持从图像和视频中提取文本
  • 使用 WebAssembly 封装了 Tesseract OCR 引擎
  • 可在浏览器和 Node.js 环境中运行
  • 安装简单,通过 CDN 或 npm/yarn 轻松获取
  • 显著减小文件大小,提高首次使用时的运行速度与内存效率

datastax/jvector

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

demo-picture-of-jvector

JVector 是一个先进的嵌入式向量搜索引擎。

  • 提供近似最近邻搜索(ANN),在高维数据中更高效。
  • 基于图的索引结构,支持增量构建和更新。
  • 采用两次查询设计,减少内存使用并降低延迟,同时保持准确性。
  • 能够处理超出内存大小的索引,提高了单个索引中的对数搜索效率。

daveshap/ACE_Framework

Github Repo Stars License: `MIT` Language: `Unknown`

demo-picture-of-ACE_Framework

ACE_Framework 是一个完全本地化且开源的自主智能体框架。

  • 100% 开源,确保最大程度的可访问性和民主化。
  • 完全依赖本地硬件,无需云服务或 SaaS 提供商。
  • 鼓励实验和数据生成,以便不断改进框架功能。
  • 避免供应商锁定,支持多种模型与技术的灵活使用。
  • 采用任务约束的方法,专注于可实现的小目标。

omerbt/TokenFlow

Github Repo Stars License: `MIT` Language: `Unknown`

demo-picture-of-TokenFlow

TokenFlow 是一个基于预训练文本到图像扩散模型的框架,旨在实现一致的视频编辑,无需进一步训练或微调。

  • 利用文本驱动的方法生成高质量视频,符合目标文本描述
  • 保持输入视频的空间布局和动态特征
  • 通过传播扩散特征确保编辑后视频的一致性
  • 与任何现成的图像编辑方法兼容使用
  • 在多种真实世界的视频上展示了最先进的编辑效果

bluesky-social/atproto

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

cover

atproto 是由 Bluesky 创建的社交网络技术。

  • 提供 AT 协议的参考实现,使用 TypeScript 编写
  • 包含多个 TypeScript 包,如 API 客户端库、共享代码和加密功能
  • 支持个人数据服务器(PDS)和应用视图实现
  • 兼容性测试数据可用于其他协议实现验证规范遵循情况
  • 提供开发者快速入门指南,包括依赖管理和构建命令
Licensed under CC BY-NC-SA 4.0