GuijiAI/HeyGem.ai
HeyGem.ai 是一个开源的数字人克隆智能代理和插件,旨在为用户提供简单易用的数字人技术解决方案。
- 无需复杂部署,初学者也能轻松上手
- 支持本地部署和快速克隆 API 服务
- 提供国际化界面(英语)
- 允许全球免费商业使用(特定条件下需签署商业授权协议)
- 社区支持与专业技术响应团队相结合
- 高度自定义能力,可根据需求修改代码
krillinai/KrillinAI
KrillinAI 是一款基于大模型的专业视频翻译和配音工具,提供一键式全流程部署,能够生成适合多个平台的视频内容。
- 一键启动工作流,简化操作
- 支持视频下载和本地文件上传
- 高精度字幕识别与智能分段
- 段落级专业翻译确保一致性
- 领域特定词汇的一键替换功能
- 提供配音及声音克隆选项
- 自动格式调整以适应横屏/竖屏布局
Akkudoktor-EOS/EOS
EOS 是一个能源优化系统,旨在优化电池、热泵和家庭设备的能量分配与使用。
- 提供基于可再生能源的综合解决方案,用于模拟和优化能源系统。
- 包含光伏系统、电池存储、负载管理等功能,以实现能量流动和成本的预测与优化。
- 具备动态优化能力,以最大化能效并最小化成本。
- 支持多种操作系统,包括 Linux、Windows 和 macOS。
- 提供默认配置文件,并允许用户自定义配置以满足特定需求。
camenduru/text-to-video-synthesis-colab
text-to-video-synthesis-colab 是一个用于将文本转换为视频的开源项目。
- 支持多种模型,包括 zeroscope 和 Potat 等,提供丰富的视频生成选项。
- 提供 Colab 环境,方便用户快速上手,无需复杂配置。
- 包含水印去除功能,提高生成视频的质量和美观性。
- 提供详细教程与示例,帮助用户理解如何使用该工具。
lucidrains/soundstorm-pytorch
soundstorm-pytorch 是一个基于 Pytorch 实现的 SoundStorm,旨在高效并行生成音频。
- 应用 MaskGiT 算法处理来自 Soundstream 的残差向量量化代码
- 采用适合音频领域的 Conformer 变换器架构
- 提供简单强大的训练解决方案,支持快速模型训练和生成
- 支持直接在原始音频上进行训练,并可与其他模型集成使用