naptha/tesseract.js
tesseract.js 是一个纯 JavaScript 的光学字符识别(OCR)库,支持超过 100 种语言。
- 支持从图像和视频中提取文本
- 使用 WebAssembly 封装了 Tesseract OCR 引擎
- 可在浏览器和 Node.js 环境中运行
- 安装简单,通过 CDN 或 npm/yarn 轻松获取
- 显著减小文件大小,提高首次使用时的运行速度与内存效率
datastax/jvector
JVector 是一个先进的嵌入式向量搜索引擎。
- 提供近似最近邻搜索(ANN),在高维数据中更高效。
- 基于图的索引结构,支持增量构建和更新。
- 采用两次查询设计,减少内存使用并降低延迟,同时保持准确性。
- 能够处理超出内存大小的索引,提高了单个索引中的对数搜索效率。
daveshap/ACE_Framework
ACE_Framework 是一个完全本地化且开源的自主智能体框架。
- 100% 开源,确保最大程度的可访问性和民主化。
- 完全依赖本地硬件,无需云服务或 SaaS 提供商。
- 鼓励实验和数据生成,以便不断改进框架功能。
- 避免供应商锁定,支持多种模型与技术的灵活使用。
- 采用任务约束的方法,专注于可实现的小目标。
omerbt/TokenFlow
TokenFlow 是一个基于预训练文本到图像扩散模型的框架,旨在实现一致的视频编辑,无需进一步训练或微调。
- 利用文本驱动的方法生成高质量视频,符合目标文本描述
- 保持输入视频的空间布局和动态特征
- 通过传播扩散特征确保编辑后视频的一致性
- 与任何现成的图像编辑方法兼容使用
- 在多种真实世界的视频上展示了最先进的编辑效果
bluesky-social/atproto
atproto 是由 Bluesky 创建的社交网络技术。
- 提供 AT 协议的参考实现,使用 TypeScript 编写
- 包含多个 TypeScript 包,如 API 客户端库、共享代码和加密功能
- 支持个人数据服务器(PDS)和应用视图实现
- 兼容性测试数据可用于其他协议实现验证规范遵循情况
- 提供开发者快速入门指南,包括依赖管理和构建命令