Featured image of post 开源文本转语音模型:实现个性化与情感表达的新高度 | 开源日报 No.742

开源文本转语音模型:实现个性化与情感表达的新高度 | 开源日报 No.742

Chatterbox 是由 Resemble AI 开发的开源文本转语音 (TTS) 模型,具备生产级性能,采用 0.5B 参数的 Llama 骨干网络,支持零样本文本转语音和情感夸张控制,基于 50 万小时清洗数据训练,输出稳定且信息丰富。它内置 PerTh 水印技术,确保音频的责任使用,性能优于多个领先的闭源系统,且提供简单的安装和调用接口,当前支持英语合成。

resemble-ai/chatterbox

Github Repo Stars License: `MIT` Language: `Unknown`

cover

chatterbox 是一个由 Resemble AI 开发的先进开源文本转语音(TTS)模型,具备生产级别性能。

  • 采用 0.5B 参数的 Llama 骨干网络,支持零样本(zeroshot)文本转语音
  • 支持情感夸张控制,使生成声音更具表现力和个性化
  • 基于 50 万小时清洗数据训练,输出稳定且对齐信息丰富
  • 内置 PerTh 水印技术,可在生成音频中嵌入不可察觉且抗编辑的神经水印以保障责任使用
  • 性能优于 ElevenLabs 等领先闭源系统,在多项侧比测试中表现出色
  • 提供简单易用的安装和调用接口,并支持通过示例脚本实现声音转换功能
  • 当前仅支持英语合成

JayZeeDesign/researcher-gpt

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

cover

researcher-gpt 是一个旨在帮助研究人员和学者进行文献综述、数据分析和写作的智能助手。

  • 提供自动化的文献检索与整理功能
  • 支持自然语言处理,能够理解并生成学术文本
  • 集成多种数据分析工具,方便用户进行深入研究
  • 具备友好的用户界面,提高使用体验

lchen001/LLMDrift

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

demo-picture-of-LLMDrift

LLMDrift 是一个旨在研究大型语言模型(如 GPT-4 和 GPT-3.5)行为随时间变化的开源项目。

  • 提供多样化的数据集和生成结果,帮助理解 LLM 服务的漂移现象。
  • 允许用户通过 Google Colab Notebook 重现性能变化,无需 API 密钥。
  • 提供 Python 系统以获取特定数据集的 LLM 生成内容,但需要 OPENAI API 密钥。
  • 包含详细的数据记录,包括模型、查询参数、参考答案及生成答案等信息,便于深入分析。

liu673cn/box

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

cover

box 是一个自用的资源收集工具,主要用于整理和访问互联网流传的各种资源。

  • 提供香港代理链接以便于访问
  • 包含详细的 DNS 设置指导,帮助用户解决网络问题
  • 汇聚丰富多样的 emoji 表情,适合动植物爱好者使用

sadmann7/netflx-web

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

demo-picture-of-netflx-web

netflx-web 是一个开源的 Netflix 克隆项目,使用 Next.js 13 的新应用路由、服务器组件、tRPC 等技术构建。

  • 使用 NextAuth.js 进行身份验证
  • 通过 Stripe 实现订阅功能
  • 支持用户个人资料创建,结合 rsc、tRPC 和 Prisma
  • 提供个人资料的 PIN 验证功能
Licensed under CC BY-NC-SA 4.0