Featured image of post AI 绘画百宝箱:无限创意任你挑 | 开源专题 No.67

AI 绘画百宝箱:无限创意任你挑 | 开源专题 No.67

想要探索图像生成的奥秘?这里有各种创新项目,从实时交互到高分辨率图像生成,满足你的各种需求!

cumulo-autumn/StreamDiffusion

Github Repo Stars License: Language:

demo-picture-of-StreamDiffusion

StreamDiffusion 是一个创新的扩散管道,旨在实现实时交互式生成。它针对当前基于扩散的图像生成技术引入了显著的性能增强。 其主要功能和核心优势包括:

  • Stream Batch:通过高效的批处理操作进行流畅数据处理。
  • 无残差分类器指导:改进了最小化计算冗余度的指导机制。
  • 随机相似性过滤器:通过先进的过滤技术提高 GPU 利用率效率。
  • IO 队列:有效管理输入和输出操作以实现更顺畅执行。
  • KV-Caches 预计算:为加速处理优化缓存策略
  • 模型加速工具:利用各种工具进行模型优化和性能提升。

damo-vilab/AnyDoor

Github Repo Stars License: Language:

demo-picture-of-AnyDoor

AnyDoor 是一个零-shot 的对象级别的图像定制项目。 其核心优势和关键特性包括:

  • 提供了在线演示 HuggingFace 支持
  • 可扩展训练数据并发布更强大的模型,作为下游区域生成任务基础模型
  • 释放针对虚拟试穿、人脸交换、文本与标志转移等下游任务设计的具体模型
  • 支持单个图像和数据集 (VITON-HD 测试) 进行推断,并提供相应结果输出路径
  • 提供 Gradio 本地演示界面

PRIS-CV/DemoFusion

Github Repo Stars License: Language:

demo-picture-of-DemoFusion

DemoFusion 是一个开源项目,旨在通过推进高分辨率图像生成的前沿,并保持对广泛受众的可访问性,来使高分辨率 GenAI 民主化。该框架无缝扩展了开源 GenAI 模型,采用渐进式放大、跳过残差和扩张抽样机制实现更高分辨率的图像生成。 其核心优势包括:

  • 支持多种集成演示 (HuggingFace Space、Colab、Replicate)
  • 具有调整参数灵活性
  • 提供本地 Gradio 演示功能

leap-ai/headshots-starter

Github Repo Stars License: Language:

demo-picture-of-headshots-starter

Headshot AI 是一个开源项目,它使用人工智能在几分钟内生成专业的头像照片。

  • 使用 Leap AI 进行 AI 模型训练
  • 通过 Supabase 实现数据库管理与身份验证
  • 支持向用户发送邮件通知完成头像生成任务 (可选)
  • 基于 Tailwind CSS 的 Shadcn 样式设计
  • 集成 Stripe 支付系统以便对用户按信用额度计费 (可选) 此外,Headshot AI 还可以轻松适配到其他领域中,并支持诸如 AI 角色扮演卡通形象、宠物肖像、产品展示图等不同类型的应用场景。

comfyanonymous/ComfyUI

Github Repo Stars License: Language:

demo-picture-of-ComfyUI

这个项目是 ComfyUI,它提供了一个图形化界面和后端来设计和执行复杂的稳定扩散工作流程。

  • 节点/图表/流程图接口用于实验并创建复杂的稳定扩散工作
  • 全面支持不同版本的 Stable Diffusion
  • 异步队列系统
  • 部分更新工作流,只重新执行发生变化的部分
  • 命令行选项:在低 VRAM GPU 上自动启用使其能够正常运转
Licensed under CC BY-NC-SA 4.0