TTS 是一个开源的深度学习工具包,专注于文本到语音生成,支持 16 种语言,提供高性能的语音模型和模型训练工具,具备多种声码器和说话人编码器,确保合成质量,具有高效的训练能力和模块化的代码结构,便于扩展和创新。
Bark 是一个开源的文本到音频生成模型,基于变换器架构,支持多语言自动识别,能够生成真实的语音及多种音频内容,包括音乐和音效,甚至非言语交流。该项目提供预训练模型,支持商业和研究用途,且在性能上在 GPU 和 CPU 上均有显著的速度提升。
Expo 是一个开源平台,允许开发者使用 React 创建跨平台的原生应用,支持 Android、iOS 和 Web。其核心优势包括一次编写代码即可在多个平台上部署、提供与传统原生应用相媲美的用户体验,以及丰富的文档和工具支持,帮助开发者轻松构建和部署应用。
Project-Ideas-And-Resources 是一个为开发者提供分阶段编程实践项目的开源创意库,按难度分为初学者、中级和高级三类,每个项目包含目标说明、用户故事和增强模块,并提供配套技术栈支持,覆盖从游戏到机器学习等多种场景需求。
Preact 是一个轻量级的 React 替代品,体积仅为 3kB,提供与 React 相似的现代 API,支持 ES6 类、hooks 和函数组件,兼容性强,具备 JSX、虚拟 DOM、热模块替换和服务器端渲染等功能,适用于所有现代浏览器和 IE11,具备高效的渲染算法和异步渲染支持。
overseas-website-note 是一个分享海外网站开发经验的开源项目,重点提供跨境业务全流程指南,包括公司注册、支付系统对接 (如 Stripe)、法律合规等实战经验,帮助开发者实现网站出海。
tesseract.js 是一个基于 JavaScript 的光学字符识别 (OCR) 库,支持超过 100 种语言,能够从图像和视频中提取文本。它使用 WebAssembly 封装了 Tesseract OCR 引擎,适用于浏览器和 Node.js,安装简便,且通过 CDN 或 npm/yarn 轻松获取,显著减小了文件大小,提升了运行速度和内存效率。
WebAgent 是阿里巴巴 Tongyi Lab 开发的智能网页代理系统,包含 WebWalker、WebDancer 和 WebSailor 三大核心模型,专注于复杂信息检索任务。其核心优势在于 WebSailor 的强大推理能力、创新的数据合成与高难度问答基准训练,WebDancer 结合 ReAct 框架与多阶段训练提升泛化能力。系统支持多代理协作与大规模数据,能自动化执行长时间多步骤信息获取,且在多项基准测试中表现优异,显著缩小与商业闭源系统的差距。
Jitsi Meet 是一个开源的视频会议平台,支持独立使用或嵌入网页,提供安全、简单、可扩展的视频会议解决方案,兼容主流浏览器和移动设备,具备高清音视频、互动功能、内置聊天、投票和虚拟背景设置,支持自建实例和企业级云服务,方便集成和管理。
Bytebot 是一个自托管的 AI 桌面代理,运行在容器化的 Linux 环境中,能够通过自然语言命令自动执行计算机任务。它提供完整的虚拟桌面,支持多种应用,文件管理,文档处理,密码管理,实时桌面视图,任务控制的 REST API 和网页界面,便于用户监控和干预任务执行。该项目的核心在于实现复杂的自动化工作流,提升用户的工作效率。