让华为恐怖的——商汤科技!全球最优秀的平台AI绘画——“秒画”

发布者:贴牌人生 2024-5-19 20:16

上一篇主要详解商汤日日新大模型——数字人 ,日日新大模型产品会有多篇,如果大家有兴趣的可以看下文章尾部,也可以及时关注下我哟!我会把链接放在文末。

今天会给大家详解下商汤的AI产品“秒画”。

01

什么是“秒画”?

商汤的秒画(SenseMirage)是商汤科技推出的一款生成式AI产品。10亿参数+的商汤自研文生图生成模型(5.0支持图生图),是利用商汤自主研发的大模型和强大的计算能力,能够快速生成高质量的图像。相信大家应该是理解秒画是类似于GPT4的多模态图生图功能。

秒画现在已经更新到Artist v0.5.0版本,而且还支持英文字符生成,在引号中输入所需英文文本尝试,如"happy birthday";我给大家链接,大家可以去体验下。每天有10次免费使用机会。商汤秒画SenseMirage – AI作画,有手就行!还是免费的!(sensetime.com)

具体来说,秒画可以实现以下功能:

图像生成:用户可以输入文字描述,秒画能够根据描述生成相应的图像。比如,用户输入“一个金色的太阳”,秒画就能生成一幅描绘金色太阳的图像。图像编辑:秒画还能对已有的图像进行编辑和优化。用户可以上传一张图片,然后输入一些修改指令,秒画就能根据指令对图片进行调整。图像转换秒画还能将一张图片转换成另一种风格的图像。比如,用户可以上传一张照片,然后选择“卡通化”风格,秒画就能将照片转换成卡通风格的图像。

模型特点

商汤的秒画以其卓越的图像生成能力,满足了用户对各类视觉作品的追求。无论是逼真的摄影作品、充满想象力的艺术创作,还是探索未来的科幻场景,都能够依据用户的要求,呈现出逼真的光影效果和细腻的细节。

自研的作画模型在文生图(Text-to-Image)方面的表现尤为出色。在强大的推理性能支持下,单张显卡只需2秒钟就能生成一幅512x512分辨率的图像。

秒画算法

hierarchical inference experts, mixture of token experts, image quality-aware distributed training, texture-guided cross-attention learning等

02

TO——C消费端应用

结合商汤自研的绘画模型或开源模型,用户可以个性化地定制属于自己的LoRA模型,从而创造出独一无二的视觉作品。这个功能是GPT-4没有的,商汤做到了

秒画的这一特性打破了专业AI模型训练的壁垒,让不具备深厚技术背景的用户也能够根据自己的喜好来训练和优化AI模型。这种自定义的LoRA模型能够捕捉到用户的个性化需求,生成符合个人风格和想象力的图像内容。

为什么亚洲最好的秒画平台是商汤?(没有之一)

上个月商汤的刘宇在发布会上提到开源的stable Diffusion模型是不适合亚洲市场的需求的,主要是因为它见过的亚洲人服装和模特数据不够多,所以用这个模型训练出来的效果很不好,而且需要投入大量的数据和成本来改进。

因为商汤的日日新大模型见过足够多的数据,并且模型大小优化得都很好时,B端商家可以使用秒画平台作为基础模型进行微调,这样就可以用更少的数据得到更精准的特定领域(垂类)模型。

因为秒画平台是一个“平台”级的产品,用户是不仅可以在平台上使用现成的文生图模型,还可以自己训练模型。关键是用户根本是不需要在自己的电脑上部署任何环境,这大大降低了使用门槛。

商汤的秒画平台还提供了一个特殊的推理优化服务。你将开源模型导入平台后,平台会自动采用秒画底层的模型编译技术来加速推理过程。比如,一个在本地显卡上需要10秒才能生成的图片,通过秒画平台加速技术,只需要2秒就可以生成,这个速度我就不解释了。

当时商汤的刘总是通过一个例子来说明普通人如何使用秒画平台。只要你选定模型,然后拖拽20张港风照片到平台上,几分钟之内就可以训练出一个能生成港风照片的大模型。这个过程中,用户不需要编写代码,不需要进行数据清洗等复杂工作,只需要简单地选择和拖拽就可以得到想要的结果。看到这里,大家应该是相信商汤的秒画为什么是亚洲第一。

下一篇我会继续详解日日新大模型。有兴趣的可以关注我哟!

大家都在看