Featured image of post 让照片开口说话!基于音频生成动画 | 开源日报 No.253

让照片开口说话!基于音频生成动画 | 开源日报 No.253

SadTalker 是一个基于音频驱动的单幅图像对话头像动画生成项目。它可以将单幅人像图像与音频结合,生成逼真的视频对话头像。

langchain-ai/langgraph

Github Repo Stars License: Language:

cover

langgraph 是一个构建语言代理图的库。 该项目的核心问题是构建具有状态的多参与者应用程序,利用 LLMs 构建,建立在 LangChain 之上。

  • 使用 LangChain 表达语言来协调多个链 (或者参与者) 在多个计算步骤中以循环方式进行计算。
  • 受 Pregel 和 Apache Beam 的启发。
  • 提供了一个类似于 NetworkX 的接口。
  • 主要用于将循环添加到 LLM 应用程序中。
  • 不仅仅针对有向无环图 (DAG) 的工作流程进行了优化。

meta-llama/codellama

Github Repo Stars License: Language:

cover

codellama 是 CodeLlama 模型的推理代码。

  • 提供了基于 Llama 2 的大型语言模型,具有开放模型中最先进的性能。
  • 支持填充功能、大输入上下文和 0-shot 指令跟随能力。
  • 提供多种不同应用场景的版本:基础模型(Code Llama)、Python 特化版本(Code Llama - Python)和指令跟随模型(Code Llama - Instruct),分别拥有 7B、13B 和 34B 参数。
  • 所有模型都是在 16k 标记序列上训练,并且在最多 100k 标记输入时显示出改进。

esphome/esphome

Github Repo Stars License: Language:

cover

esphome 是一个通过简单但强大的配置文件控制您的 ESP8266/ESP32 的系统,并通过家庭自动化系统远程控制它们的工具。

  • 通过简单的配置文件进行 ESP8266/ESP32 控制
  • 可以远程控制设备
  • 与家庭自动化系统集成

OpenTalker/SadTalker

Github Repo Stars License: Language:

demo-picture-of-SadTalker

SadTalker 是一个基于音频驱动的单幅图像对话头像动画生成项目。它可以将单幅人像图像与音频结合,生成逼真的视频对话头像。该项目的主要功能和核心优势包括:

  • 支持单幅图像加音频生成对话头像视频。
  • 通过 Discord 整合,用户可以免费使用,也可以通过发送文件或文本提示生成高质量视频。
  • 提供稳定的扩散 WebUI 扩展,支持全图模式。
  • 不断更新版本,增加新特性,修复 Bug,优化性能。
  • 提供了详细的安装教程和社区教程,覆盖多种操作系统。
  • 支持模型下载脚本,提供预训练模型,同时提供离线模型供用户选择。

Asabeneh/30-Days-Of-React

Github Repo Stars License: Language:

demo-picture-of-30-Days-Of-React

30-Days-Of-React 是一个逐步指南,帮助你在 30 天内学习 React。 这个项目的主要功能、关键特性和核心优势包括:

  • 逐步指南,每天学习不同的 React 主题
  • 提供视频教程以辅助学习
  • 需要 HTML、CSS 和 JavaScript 中级水平技能
  • 可以通过 Fork 该仓库来创建自己的副本进行工作
Licensed under CC BY-NC-SA 4.0