1秒出图,全球最快的开源Stable Diffusion出炉
机器之心发布
机器之心编辑部
OneFlow 将 Stable Diffusion 的推理性能推向了一个全新的 SOTA。
第一辆汽车诞生之初,时速只有 16 公里,甚至不如马车跑得快,很长一段时间,汽车尴尬地像一种“很酷的玩具”。人工智能作图的出现也是如此。
AI 作图一开始的 “风格化” 本身就为 “玩” 而生,大家普遍兴致勃勃地尝试头像生成、磨皮,但很快就失去兴趣。直到扩散模型的降临,才给 AI 作图带来质变,让人们看到了 “AI 转成生产力” 的曙光:画家、设计师不用绞尽脑汁思考色彩、构图,只要告诉 Diffusion 模型想要什么,就能言出法随般地生成高质量图片。
然而,与汽车一样,如果扩散模型生成图片时“马力不足”,那就没法摆脱玩具的标签,成为人类手中真正的生产工具。
起初,AI 作图需要几天,再缩减到几十分钟,再到几分钟,出图时间在不断加速,问题是,究竟快到什么程度,才会在专业的美术从业者甚至普通大众之间普及开来?
显然,现在还无法给出具体答案。即便如此,可以确定的是 AI 作图在技术和速度上的突破,很可能已经接近甚至超过阈值,因为这一次,OneFlow 带来了字面意义上 “一秒出图” 的 Stable Diffusion 模型。
OneFlow Stable Diffusion 使用地址:https://github.com/Oneflow-Inc/diffusers/wiki/How-to-Run-OneFlow-Stable-DiffusionOneFlow 地址:https://github.com/Oneflow-Inc/oneflow/比快更快,OneFlow 一马当先
下面的图表分别展示了在 A100 (PCIe 40GB / SXM 80GB)、RTX 2080 和 T4 不同类型的 GPU 硬件上,分别使用 PyTorch, TensorRT, AITemplate 和 OneFlow 四种深度学习框架或者编译器,对 Stable Diffusion 进行推理时的性能表现。
对于 A100 显卡,无论是 PCIe 40GB 的配置还是 SXM 80GB 的配置,OneFlow 的性能可以在目前的最优性能之上继续提升 15% 以上。
特别是在 SXM 80GB A100 上,OneFlow 首次让 Stable Diffusion 的推理速度达到了 50it/s 以上,首次把生成一张图片需要采样 50 轮的时间降到 1 秒以内,是当之无愧的性能之王。
在 T4 推理卡上,由于 AITemplate 暂不支持 Stable Diffsuion,相比于目前 SOTA 性能的 TensorRT,OneFlow 的性能是它的 1.5 倍。
而在 RTX2080 上,TensorRT 在编译 Stable Diffsuion 时会 OOM ,相比于目前 SOTA 性能的 PyTorch,OneFlow 的性能是它的 2.25 倍。
综上,在各种硬件以及更多框架的对比中,OneFlow 都将 Stable Diffusion 的推理性能推向了一个全新的 SOTA。
生成图片展示
利用 OneFlow 版的 Stable Diffusion,你可以把天马行空的想法很快转化成艺术图片,譬如:
以假乱真的阳光、沙滩和椰树:
仓鼠救火员、长兔耳朵的狗子:
在火星上吃火锅:
未来异世界 AI:
集齐 OneFlow 七龙珠:
上述图片均基于 OneFlow 版 Stable Diffusion 生成。如果你一时没有好的 idea,可以在 lexica 上参考一下广大网友的创意,不仅有生成图片还提供了对应的描述文字。
无缝兼容 PyTorch 生态,实现一键模型迁移
想体验 OneFlow Stable Diffusion?只需要修改三行代码,你就可以将 HuggingFace 中的 PyTorch Stable Diffusion 模型改为 OneFlow 模型,分别是将 import torch 改为 import oneflow as torch 和将 StableDiffusionPipeline 改为 OneFlowStableDiffusionPipeline:
之所以能这么轻松迁移模型,是因为 OneFlow Stable Diffusion 有两个出色的特性:
OneFlowStableDiffusionPipeline.from_pretrained 能够直接使用 PyTorch 权重。OneFlow 本身的 API 也是和 PyTorch 对齐的,因此 import oneflow as torch 之后,torch.autocast、torch.float16 等表达式完全不需要修改。上述特性使得 OneFlow 兼容了 PyTorch 的生态,这不仅在 OneFlow 对 Stable Diffusion 的迁移中发挥了作用,也大大加速了 OneFlow 用户迁移其它许多模型,比如在和 torchvision 对标的 flowvision 中,许多模型只需通过在 torchvision 模型文件中加入 import oneflow as torch 即可得到。
此外,OneFlow 还提供全局 “mock torch” 功能,在命令行运行 eval $(oneflow-mock-torch) 就可以让接下来运行的所有 Python 脚本里的 import torch 都自动指向 oneflow。
使用 OneFlow 运行 Stable Diffusion
在 docker 中使用 OneFlow 运行 StableDiffusion 模型生成图片:
docker run --rm -it \ --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 \ -v ${HF_HOME}:${HF_HOME} \ -v ${PWD}:${PWD} \ -w ${PWD} \ -e HF_HOME=${HF_HOME} \ -e HUGGING_FACE_HUB_TOKEN=${HUGGING_FACE_HUB_TOKEN} \ oneflowinc/oneflow-sd:cu112 \ python3 /demos/oneflow-t2i.py # --prompt "a photo of an astronaut riding a horse on mars"
更详尽的使用方法请参考:https://github.com/Oneflow-Inc/diffusers/wiki/How-to-Run-OneFlow-Stable-Diffusion
后续工作
后续 OneFlow 团队将积极推动 OneFlow 的 diffusers(https://github.com/Oneflow-Inc/diffusers.git) 和 transformers(https://github.com/Oneflow-Inc/transformers.git) 的 fork 仓库内容合并到 huggingface 上游的的对应仓库。这也是 OneFlow 首次以 transformers/diffusers 的后端的形式开发模型,欢迎各位开发者朋友在 GitHub 上反馈意见。
值得一提的是,在优化和加速 Stable Diffusion 模型的过程中使用了 OneFlow 自研编译器,不仅让 PyTorch 前端搭建的 Stable Diffusion 在 NVIDIA GPU 上跑得更快,而且也可以让这样的模型在国产 AI 芯片和 GPU 上跑得更快,这些将在之后的文章中揭秘技术细节。
大家都在看
-
你敢信?全球加速最快的三台车都是中国品牌 小米第二 【CNMO科技消息】“高性能”“超跑”这些词对中国车企来说曾经可望而不可及,但随着新能源时代的到来,一切都变了。据CNMO了解,目前全球加速最快的三台车都是中国品牌,刚亮相不久的“性能怪兽”小米SU7 Ultra量产 ... 世界最快11-09
-
世界上最快的10台摩托车,第一名比飞机还快,你的目标是哪一台? 世界上最快的10台摩托车,你都听过几个?排第一名的摩托更是比战斗机还要快,甚至被禁止在公路上驾驶,下面就带你一起盘点一下。第十名:本田火刃 CBR 1000 RR-R这款本田摩托车以其精湛的工程和卓越的性能而闻名。它 ... 世界最快11-07
-
0.305秒!全球最快!一睹为快 每年进博会,“高精尖”展品集聚的技术装备展区都备受关注。今年,近7万平方米的展区里,聚焦科技、工业、环保三大主题,来自34个国家和地区的350家企业参展。 总台央视记者 熊婧:技术装备展区,作为进博会最“重” ... 世界最快11-07
-
美国的全球最快侦察机,速度超过三马赫的飞鸟,中国也造出来了 众所周知,SR-71 “黑鸟”侦察机在很长一段时间里是全世界公认的最快最强的军用飞机。这款传奇飞机的最大飞行高度可达三万米,最大飞行速度高达 3.5 马赫,黑鸟,就是军用飞机的顶点,成为侦察机的答案。“黑鸟”在 ... 世界最快11-06
-
世界上“倒退”最快的国家:从全球第六到一贫如洗,仅用5年时间 提起非洲想到的会是什么,贫穷,饥饿。然而却有一个国家与众不同,它曾被看作是非洲的希望,更是一个即将完成工业化的准发达国家。然而没想到,在五年的时间里,它却直接从准发达国家变成了一个相对贫困的国家。在20 ... 世界最快11-01
-
创造了历史如今却被人遗忘,世界最快客机,为什么退出历史舞台 “协和”客机是世界上为数不多的商用超音速客机。巡航时,“协和”飞机可以达到2马赫的飞行速度,最大速度2.2马赫(2,330公里/小时),相比传统飞机,“协和”横跨大洋的时间只需一半,“协和”飞机为乘客提供了无与 ... 世界最快10-19
-
全球最快的10台高速列车,第一名更比飞机还快 在这个快节奏的时代,速度似乎成了衡量一切的标准,无论是生活还是工作,我们都希望能在最短的时间内达到目的地,说到速度,很多人第一时间可能会想到飞机,你有没有想过,现在也有一些列车,它们的速度不仅能与飞机 ... 世界最快10-17
-
世界最快轰炸机,只能携带14枚原子弹,60年代产物依旧无人能敌 美国曾经建造出很多让世界称奇的武器,其中就包括在 20 世纪 60 年代打造的世界上速度最快的轰炸机:女武神轰炸机。说说女武神轰炸机的一些情况!1. 这个型号的轰炸机远超过现在服役的轰炸机,能携带 14 枚原子弹, ... 世界最快10-08
-
世界倒退最快的国家:从全球第六到一贫如洗,只用了短短五年! 提到非洲,人们脑海中可能会浮现出炎热贫瘠、环境萧条等印象,但是,在最南端曾有一个国家,曾依靠自身发展跻身过发达国家行列。其工业水平之先进、资源储备之丰富,堪称冠绝非洲无国能及,它就是被誉为彩虹之国的南 ... 世界最快09-21
-
世界五大最快飞机排名,第一7分钟从上海飞北京,歼20能排第几? 2001年,南海上空发生了一场震惊世界的撞机事件,当时,美军侦察机擅自闯入中国领空,王伟奉命驾驶战机81192进行拦截。然而,彼时中国战机在技术和装备上落后于美军,王伟尽管凭借高超的飞行技巧努力驱离敌机,但不 ... 世界最快09-19
相关文章
- 世界最快轰炸机,只能携带14枚原子弹,60年代产物依旧无人能敌
- 乌克兰造出世界最快无人机,时速325超大疆数倍?中国能应付吗?
- 世界倒退最快的国家:从全球第六到一贫如洗,只用了短短五年!
- 世界五大最快飞机排名,第一7分钟从上海飞北京,歼20能排第几?
- 全球速度最快的5大飞机排行!中国歼20能够排第几呢?
- 你知道世界上最快的防弹车是哪辆吗?
- 世界最快直升机,最快时速超过500千米时,美国都被比了下去
- 1小时52秒!史上最快马拉松基普乔格全马十连冠
- 比GPU性价比高百倍!Cerebras推出AI推理服务,号称“全球最快”
- 中国十年污染防治攻坚:空气质量改善速度全球最快
- 世界上生长最快的动物
- 当今最快速度!世界百米飞人排名
- 1678公里/小时,世界上最快的汽车
- 10 辆曾荣膺世界最快汽车称号的汽车
- 世界最快显微镜问世,首次观察到电子运动
- 世界上跑得最快的人——尤塞恩·博尔特
- 世界上奔跑速度最快的动物都有哪些吗
- 魔兽世界:怀旧服盗贼赚钱的两个方法,黑下收益不比厄运低
- 世界最慢的动物,唯有交配时最快,50%死在拉粑粑的途中
- 潘展乐惊天逆转拿金牌:美媒直言世界最快, 欧媒高呼疯狂的统治力
热门阅读
-
世界上最快的快艇,非捷豹莫属。 07-14
-
世界最快的个人潜艇,数秒潜入100米 09-29
-
世界上跑的最快的男孩,100米仅用时13.48秒 04-26
-
世界上速度最快的火箭车,每小时达到1600公里 04-26
-
世界上飞行最快的鸟,灵活的军舰鸟 04-26