基于丹摩智算部署可图(Kolors)

Kolors 是快手 Kolors 团队开发的基于潜在扩散的大规模文本到图像生成模型。Kolors 经过数十亿个文本图像对的训练，在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面比开源和专有模型表现出显着优势。此外，Kolors 支持中英文输入，在理解和生成中文内容方面表现出强大的性能。

XXJ不会写代码

688人浏览 · 2024-09-25 17:13:09

XXJ不会写代码 · 2024-09-25 17:13:09 发布

🍑个人主页：Jupiter. 🚀 所属专栏：Linux从入门到进阶 欢迎大家点赞收藏评论😊

在这里插入图片描述

`丹摩智算平台简介`

丹摩智算是一个专为AI开发设计的云计算平台，具备强大的并行计算能力和灵活的资源调度系统。该平台通过高性能GPU集群和分布式计算架构，为AI开发者和企业提供大规模的计算支持。丹摩智算不仅支持多种主流的AI框架，如TensorFlow、PyTorch等，还提供了简化的开发环境和自动化调度工具，极大地提高了开发效率和资源利用率。

算力支持平台：丹摩智算
官网：https://www.damodel.com/home
帮助文档：https://doc.damodel.com/

一、Kolors 简介

介绍

Kolors 是快手 Kolors 团队开发的基于潜在扩散的大规模文本到图像生成模型。 Kolors 经过数十亿个文本图像对的训练，在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面比开源和专有模型表现出显着优势。此外，Kolors 支持中英文输入，在理解和生成中文内容方面表现出强大的性能。

技术背景

Kolors模型是在Stable Diffusion框架的基础上进一步研发的，这一框架本身就在文本到图像生成领域具有显著优势。通过引入潜在扩散模型，Kolors能够在保证图像质量的同时，更好地捕捉文本描述的细节和意图。

部署与使用

为了使用Kolors进行文本到图像生成，用户需要准备适当的环境和依赖项，包括Python 3.8或更高版本、PyTorch 1.13.1或更高版本、Transformers 4.26.1或更高版本等。此外，为了提升模型加速性能，推荐使用CUDA 11.7或更新版本。在部署过程中，用户可以通过Anaconda管理Python环境，并创建独立的虚拟环境来避免依赖冲突。完成环境搭建后，用户可以下载Kolors库和相关依赖项，并通过命令行生成图像。

前提条件

Python 3.8 或更新版本
PyTorch 1.13.1 或更新版本
Transformers 4.26.1 或更新版本
推荐：CUDA 11.7 或更新版本

二、DAMODEL 平台创建适配机器

按照实际要求选择对应配置即可，按照 Kolors 要求选择对应版本。

1.1、实例创建

在这里插入图片描述
进入创建页面后，首先在实例配置中首先选择付费类型为按量付费，其次选择单卡启动，然后选择需求的 GPU 型号，本次实验可以选择选择：按量付费--GPU 数量 1--NVIDIA-GeForc-RTX-4090，该配置为 60GB 内存，24GB 的显存。

在这里插入图片描述
继续往下翻，配置数据硬盘的大小，每个实例默认附带了 50GB 的数据硬盘，本次创建可以就选择默认大小 50GB，可以看到，平台提供了一些基础镜像供快速启动，镜像中安装了对应的基础环境和框架，这里选择 PyTorch1.13.1 的框架启动，也可以选择 PyTorch2.1.2 版本启动。

点击创建密钥对，输入自定义的名称，创建好密钥对后，选择刚刚创建好的密钥对，并点击立即创建，等待一段时间后即可启动成功！

在这里插入图片描述

三、服务部署

安装 Anaconda

# 下载安装脚本
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh


# 安装 Anaconda
bash Miniconda3-latest-Linux-x86_64.sh

将 Anaconda 目录加入环境变量
vim ~/.bashrc
export PATH=$PATH:/root/miniconda3/condabin

# 重新加载环境变量
source ~/.bashrc

在这里插入图片描述

Kolors 库下载

apt-get install git-lfs
git clone https://github.com/Kwai-Kolors/Kolors
cd Kolors

在这里插入图片描述

创建虚拟环境并安装依赖项

conda create --name kolors python=3.8
conda init bash
source ~/.bashrc
conda activate kolors
pip install -r requirements.txt
python3 setup.py install
git lfs clone https://huggingface.co/Kwai-Kolors/Kolors weights/Kolors

在这里插入图片描述

生成图片

python3 scripts/sample.py "一个在星空下奔跑的女孩“
# The image will be saved to "scripts/outputs/sample_test.jpg"

在这里插入图片描述

尧米AI

尧米是由西云算力与CSDN联合运营的AI算力和模型开源社区品牌，为基于DaModel智算平台的AI应用企业和泛AI开发者提供技术交流与成果转化平台。

更多推荐

【AI落地应用实战】HivisionIDPhotos AI证件照制作实践指南

尧米AI

DAMODEL丹摩｜【AI落地应用实战】文本生成语音Parler-TTS + DAMODEL复现指南

尧米AI

丹摩征文活动 | SD3+ComfyUI实战：图像部署效率翻倍，简易步骤对抗复杂流程！

1 SD3与ComfyUI背景 Stable Diffusion 3（SD3）是Stability AI推出的一款颠覆性的开源模型，专注于将文本转换为高质量图像。凭借其在图像质量、文本生成、复杂指令理解及资源效率上的卓越表现，SD3为用户提供了全新的体验。 SD3的Medium版本是其一大亮点，此版本拥有20亿个参数，设计紧凑，能够在普通的个人电脑和笔记本上流畅运行，为广大用户带来了便利。这使得任