专业的编程技术博客社区

网站首页 > 博客文章 正文

每天一个AI姬,Pytorch2.1+CUDA118,AI绘画效率提升50%~70%

baijin 2024-09-01 12:59:20 博客文章 7 ℃ 0 评论

最近,Stable Diffusion 的研究者们都在研究如何升级到 Pytorch2.1+CUDA118,因为,根据Pytorch 官方最近的说法,2.1版本的 Pytorch 要比上一个版本运行快40%左右。

为了稳妥起见,用户最好不要选择直接升级,而是选择重新安装一份基于Pytorch2.1+CUDA118 的 Stable Diffusion。

经过实测,Pytorch2.1+CUDA118 的新版本,确实要比上个版本快 40~60%,而且,Pytorch2.1 还自带了优化指令,比第三方的 Xformers 还要快。

从上面两张图我们可以明显地看到,新版本的绘图速度明显要比旧版本高出近50%左右。

——注:测试显卡为 RTX2070S 8G。

值得一提的是,升级到 Pytorch2.1 之后,用户基本就不再需要另外安装 Xformers 显存优化库了。因为,Pytorch2.1执行运算的时候,CPU占用已经高达80%以上了。所以,即使用户继续安装最新的 Xformers,提升也只有2%~4%左右。而且,安装新版 Xformers 的过程相当繁琐,还需要用户自行编译。

最后,Pytorch2.1 提供了两个优化指令代码,可加载在 webui-user.bat 文件中,说明如下:

--opt-sdp-attention

——速度比使用 xformer 更快,属于非确定性优化,不能百分之百复现原图。

--opt-sdp-no-mem-attention

——速度比使用 xformer 更快,略慢于 --opt-sdp-attention,属于确定性优化,可以精确复现原图。

添加以上命令(二选一)之后,Stable Diffusion 的运行速度还可以再增加20%以上。



在所有参数相同的情况下,三者的对比情况如下:

Pytorch1.13.1 + CUDA117 + Xformers 版本,运行平均值大约 = 2.07 it/s,出图时间 = 24s

Pytorch2.1+CUDA118 新版本,运行平均值大约 = 3.09 it/s,出图时间 = 14s

Pytorch2.1+CUDA118(-opt-sdp),运行最高峰值可达 5.28 it/s,出图时间 = 11s

根据以上实测,推荐 Stable Diffusion WebUI AI绘图用户(根据自身情况)尽快升级或全新安装基于 Pytorch2.1+CUDA118 的新版本。

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表