纯 JavaScript 实现的 OCR 库：支持超过 100 种语言 | 开源日报 No.715

纯 JavaScript 实现的 OCR 库：支持超过 100 种语言 | 开源日报 No.715

tesseract.js 是一个基于 JavaScript 的光学字符识别 (OCR) 库，支持超过 100 种语言，能够从图像和视频中提取文本。它使用 WebAssembly 封装了 Tesseract OCR 引擎，适用于浏览器和 Node.js，安装简便，且通过 CDN 或 npm/yarn 轻松获取，显著减小了文件大小，提升了运行速度和内存效率。

naptha/tesseract.js

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

demo-picture-of-tesseract.js

tesseract.js 是一个纯 JavaScript 的光学字符识别（OCR）库，支持超过 100 种语言。

支持从图像和视频中提取文本
使用 WebAssembly 封装了 Tesseract OCR 引擎
可在浏览器和 Node.js 环境中运行
安装简单，通过 CDN 或 npm/yarn 轻松获取
显著减小文件大小，提高首次使用时的运行速度与内存效率

datastax/jvector

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

demo-picture-of-jvector

JVector 是一个先进的嵌入式向量搜索引擎。

提供近似最近邻搜索（ANN），在高维数据中更高效。
基于图的索引结构，支持增量构建和更新。
采用两次查询设计，减少内存使用并降低延迟，同时保持准确性。
能够处理超出内存大小的索引，提高了单个索引中的对数搜索效率。

daveshap/ACE_Framework

Github Repo Stars License: `MIT` Language: `Unknown`

demo-picture-of-ACE_Framework

ACE_Framework 是一个完全本地化且开源的自主智能体框架。

100% 开源，确保最大程度的可访问性和民主化。
完全依赖本地硬件，无需云服务或 SaaS 提供商。
鼓励实验和数据生成，以便不断改进框架功能。
避免供应商锁定，支持多种模型与技术的灵活使用。
采用任务约束的方法，专注于可实现的小目标。

omerbt/TokenFlow

Github Repo Stars License: `MIT` Language: `Unknown`

demo-picture-of-TokenFlow

TokenFlow 是一个基于预训练文本到图像扩散模型的框架，旨在实现一致的视频编辑，无需进一步训练或微调。

利用文本驱动的方法生成高质量视频，符合目标文本描述
保持输入视频的空间布局和动态特征
通过传播扩散特征确保编辑后视频的一致性
与任何现成的图像编辑方法兼容使用
在多种真实世界的视频上展示了最先进的编辑效果

bluesky-social/atproto

atproto 是由 Bluesky 创建的社交网络技术。

提供 AT 协议的参考实现，使用 TypeScript 编写
包含多个 TypeScript 包，如 API 客户端库、共享代码和加密功能
支持个人数据服务器（PDS）和应用视图实现
兼容性测试数据可用于其他协议实现验证规范遵循情况
提供开发者快速入门指南，包括依赖管理和构建命令