最近,Stable Diffusion 的研究者们都在研究如何升级到 Pytorch2.1+CUDA118,因为,根据Pytorch 官方最近的说法,2.1版本的 Pytorch 要比上一个版本运行快40%左右。
为了稳妥起见,用户最好不要选择直接升级,而是选择重新安装一份基于Pytorch2.1+CUDA118 的 Stable Diffusion。
经过实测,Pytorch2.1+CUDA118 的新版本,确实要比上个版本快 40~60%,而且,Pytorch2.1 还自带了优化指令,比第三方的 Xformers 还要快。
从上面两张图我们可以明显地看到,新版本的绘图速度明显要比旧版本高出近50%左右。
——注:测试显卡为 RTX2070S 8G。
值得一提的是,升级到 Pytorch2.1 之后,用户基本就不再需要另外安装 Xformers 显存优化库了。因为,Pytorch2.1执行运算的时候,CPU占用已经高达80%以上了。所以,即使用户继续安装最新的 Xformers,提升也只有2%~4%左右。而且,安装新版 Xformers 的过程相当繁琐,还需要用户自行编译。
最后,Pytorch2.1 提供了两个优化指令代码,可加载在 webui-user.bat 文件中,说明如下:
--opt-sdp-attention
——速度比使用 xformer 更快,属于非确定性优化,不能百分之百复现原图。
--opt-sdp-no-mem-attention
——速度比使用 xformer 更快,略慢于 --opt-sdp-attention,属于确定性优化,可以精确复现原图。
添加以上命令(二选一)之后,Stable Diffusion 的运行速度还可以再增加20%以上。
在所有参数相同的情况下,三者的对比情况如下:
Pytorch1.13.1 + CUDA117 + Xformers 版本,运行平均值大约 = 2.07 it/s,出图时间 = 24s
Pytorch2.1+CUDA118 新版本,运行平均值大约 = 3.09 it/s,出图时间 = 14s
Pytorch2.1+CUDA118(-opt-sdp),运行最高峰值可达 5.28 it/s,出图时间 = 11s
根据以上实测,推荐 Stable Diffusion WebUI AI绘图用户(根据自身情况)尽快升级或全新安装基于 Pytorch2.1+CUDA118 的新版本。
本文暂时没有评论,来添加一个吧(●'◡'●)