Featured image of post 音乐去除人声神器:精准分离,专业之选 | 开源日报 No.282

音乐去除人声神器:精准分离,专业之选 | 开源日报 No.282

ultimatevocalremovergui 是一个使用深度神经网络的人声去除器的图形用户界面,具有先进的源分离模型,可以从音频文件中去除人声。该项目的核心开发者训练了所有提供的模型,除了 Demucs v3 和 v4 4-stem 模型。该软件可以在 Windows 和 MacOS 系统上安装和运行,无需预先安装任何依赖项,软件包含了 UVR 接口、Python、PyTorch 等必要组件。

Anjok07/ultimatevocalremovergui

Github Repo Stars License: Language:

demo-picture-of-ultimatevocalremovergui

ultimatevocalremovergui 是一个使用深度神经网络的人声去除器的图形用户界面。 该项目提供了以下主要功能、关键特性和核心优势:

  • 使用最先进的源分离模型来从音频文件中去除人声
  • UVR 的核心开发者训练了所有在此软件包中提供的模型(除了 Demucs v3 和 v4 4-stem 模型)
  • 可以在 Windows 和 MacOS 系统上安装和运行
  • 不需要预先安装任何依赖项,软件包含 UVR 接口、Python、PyTorch 等必要组件

NVIDIA/warp

Github Repo Stars License: Language:

cover

warp 是一个用于高性能 GPU 模拟和图形处理的 Python 框架。 该项目主要功能、关键特性、核心优势包括:

  • 将常规的 Python 函数 JIT 编译成可在 CPU 或 GPU 上运行的高效内核代码
  • 适用于空间计算,提供丰富的原语,方便编写物理模拟、感知、机器人技术和几何处理程序
  • 内置微分功能,可与 PyTorch 和 JAX 等框架一起用作机器学习流水线中的一部分
  • 支持 CUDA-capable NVIDIA GPU,并提供了安装指南和示例代码以及 USD 文件生成等功能。

pymc-devs/pymc

Github Repo Stars License: Language:

cover

pymc 是一个用于在 Python 中进行贝叶斯建模和概率编程的工具。 该项目主要功能、关键特性、核心优势包括:

  • 直观的模型规范语法,易于使用
  • 强大的采样算法,支持复杂模型拟合
  • 变分推断:快速近似后验估计以及针对大数据集的小批量变分推断
  • 依赖 PyTensor 提供计算优化和动态 C 或 JAX 编译等功能
  • 透明地支持缺失值插补等操作

NVIDIA/TensorRT

Github Repo Stars License: Language:

cover

TensorRT 是 NVIDIA GPU 上进行高性能深度学习推断的 SDK。

  • 包含 TensorRT 插件和 ONNX 解析器的开源软件组件
  • 提供示例应用程序,演示了 TensorRT 平台的使用和功能
  • 支持预构建的 TensorRT Python 包,方便安装
  • 提供了构建所需的先决条件,并提供容器化构建选项

argmaxinc/WhisperKit

Github Repo Stars License: Language:

demo-picture-of-WhisperKit

WhisperKit 是一个用于 iOS 和 macOS 应用程序的 Swift 本地语音识别工具。

  • 使用 OpenAI 的 Whisper 语音识别模型
  • 集成了苹果的 CoreML 框架,可在 Apple 设备上进行高效、本地推理
  • 可以通过 Swift Package Manager 轻松集成到 Swift 项目中
  • 支持快速示例和模型选择功能
  • 提供了生成自定义模型和使用 Swift CLI 进行测试与调试的能力
Licensed under CC BY-NC-SA 4.0