刷屏WAIC,加速生成式AI落地终端,高通亮出诸多“黑科技”
智东西
作者 | 云鹏
编辑 | 漠影
今年科技圈最火热的话题,非生成式AI莫属,而生成式AI发展迭代的速度之快,也令人惊叹。
从GPT-3.5到GPT-4.0,从多模态交互融入到插件的支持,而曾经只能跑在云端的AI大模型,也开始在智能终端设备中落地。
没错,今天拥有数十亿、上百亿参数的AI大模型已经可以直接在你的手机上运行了。注意,是完全本地化运行,只依赖手机本身的算力。
这听起来似乎还有些遥远,但就在上周召开的上海WAIC上,我们已经看到搭载高通第二代骁龙8芯片的安卓手机直接运行参数规模超过10亿的Stable Diffusion,且只需要15秒左右就可以出图,而参数规模超过15亿的ControlNet也成功在手机终端上实现了本地化运行。
搭载骁龙芯片的手机运行Stable Diffusion,15秒左右出图,来源:高通
在WAIC上,我们还能看到各类生成式AI应用已经可以被越来越多的普通消费者通过身边的智能设备接触到。
AI正迎来大爆发时期,就像此前电视、互联网和智能手机的问世,而这种爆发对算力以及计算架构都提出了新的需求。AI训练和推理的成本显著提升,计算架构需要不断演进并满足生成式AI日益增长的处理和性能需求。
在移动芯片巨头高通看来,未来生成式AI的发展必然会是云端与终端侧的“混合”模式。
在这样的大背景下,以智能手机为代表的各类智能终端产品很快就会迎来AI体验的变革,生成式AI无疑将席卷整个智能硬件赛道。
如何实现大模型在端侧的落地?如何实现端侧和云端的高效协同?如何设计出更高效的“混合AI”架构?面向生成式AI革新终端体验的大趋势,从芯片到软件到算法再到生态,高通已经提前布局,成为端侧AI体验变革的核心推动者之一。面向生成式AI的未来,高通已经提前给出了自己的答案。
一、“混合AI”未来已至,手机跑大模型成为现实
生成式AI在终端侧的落地,与我们每一个人的生活密切相关,一项技术从实验室中走到商用,再到面向消费市场大范围落地,必然需要有一个落地的平台,各类智能终端设备无疑扮演着这样的角色。
从去年底到今年年中,短短不到一年,生成式AI及相关产品应用如雨后春笋般成长。据统计,目前已有3000多个可用的生成式AI应用和特性出现。
但这些应用受限于背后大模型的复杂度和庞大规模,绝大部分都只能在云端运行,前不久ChatGPT推出了iOS版本,但该应用的任务处理仍然是基于云端的。
究其原因,AI大模型的推理成本会随着日活用户数量及其使用频率的增长而显著增加。云端推理的高成本,让生成式AI的规模化扩展陷入瓶颈。
在这样的大趋势下,高通日前发布了《混合AI是AI的未来》技术白皮书,提出了混合AI架构的概念。“混合”,就意味着云端要和手机、PC、XR头显、汽车这些终端设备协同工作,而不是单打独斗。
在今年WAIC上,高通公司高级副总裁兼AI负责人Ziad Asghar就提到,为实现生成式AI的规模化扩展,AI处理的重心正在向边缘转移。
高通技术公司产品管理高级副总裁兼AI负责人Ziad-Asghar,来源:高通
因此AI能否真正在终端侧应用落地,并与云端进行高效协同,就显得至关重要。
从此次WAIC上的一系列演示和获奖成果来看,高通在AI落地智能终端方面显然是走得更快的一家科技巨头,尤其是在其强项的智能手机赛道中,高通已经展示了多个“全球首次”。
可以说,手机跑大模型,已经逐渐走入现实。
Stable Diffusion是我们很熟悉的一个文本到图像生成式AI模型,其参数超过10亿,而在WAIC上,一部搭载高通第二代骁龙8移动平台的智能手机已经可以直接本地运行Stable Diffusion,并且在15秒内生成一张512×512像素的图像。
从现场实际演示来看,其时延已经可以做到和云端相当,且由于是完全本地化运行,用户输入的文本也完全不受限制。
据了解,这背后,高通采用了全栈AI优化的方式,通过量化、编译和硬件加速进行优化,最终实现了这一用例。值得一提的是,高通已经这一能力扩展到了搭载骁龙芯片的PC产品上。
除此之外,高通还演示了ControlNet这一图像到图像生成式AI模型在智能手机上的运行,该模型的参数量更是达到了15亿。
在演示中,ControlNet通过跨模型架构、AI软件和神经网络硬件加速器的全栈式AI优化,在12秒的时间内完成了16步推理,最终完成了AI图像生成,整个过程不需要访问任何云端。
在手机上本地化运行15亿参数的图像到图像模型ControlNet,来源:高通
一方面,高通在WAIC上的展示让我们看到生成式AI落地终端,已经成为现实,另一方面,我们也能看到高通在终端AI领域的实力。因为目前高通是全球唯一一个能够实现在智能手机本地运行大模型的厂商。
高通Ziad Asghar在大会上还做了进一步展望,他说,未来拥有100亿或更大规模参数的生成式AI模型也会在终端上运行,推动生成式AI的普及。
二、背靠数十亿终端,从软硬件到生态,构建全栈式AI能力
WAIC上的一系列成果,让我们看到了高通在终端AI领域已经走在了行业前列,而在这背后,高通已经在终端AI相关硬件、软件、生态等方面储备了诸多产品和技术,形成了自己的全栈式AI能力,这也是高通在AI时代核心的秘密武器之一。
在前文提到的各种智能手机运行AI大模型的案例中,我们经常看到“全栈式AI”这个词,高通的这项能力也是其对于AI产业的核心价值所在。
首先在硬件层面,芯片层的AI运算处理能力是AI落地终端的必要条件,目前高通AI引擎是高通在硬件领域的杀手锏之一。
就在此次WAIC上,第二代骁龙8移动平台中的高通AI引擎获得了2023世界人工智能大会SAIL奖(卓越人工智能引领者奖),这也侧面证明了高通在AI硬件技术方面的能力。
第二代骁龙8移动平台的高通AI引擎荣获SAIL奖,来源:高通
根据高通官方实验数据,搭载高通AI引擎的智能手机,其解决方案的能效与竞品相比大约有2倍左右的优势,以更低功耗提供过硬的终端侧AI性能是高通AI引擎的一大强项。
第二代骁龙8的AI能效与竞品相比较,来源:高通
具体来看,高通AI引擎采用了异构计算架构,其中的Hexagon处理器、Adreno GPU和Kryo CPU这三个模块都对终端侧运行AI应用进行了针对性优化。
Hexagon处理器使用了专用的供电系统,按照工作负载适配功率,从而提升系统能效比。此外,Hexagon处理器支持微切片推理和INT4硬件加速,可以在AI处理方面实现更高性能、更低的能耗和内存占用。
目前生成式AI领域大量应用到Transformer模型,而Hexagon处理器可以对Transformer进行加速,提升生成式AI中一些关键机制的推理速度,根据高通实验数据,在使用MobileBERT的特定用例中,AI性能可以提升4.35倍。
正如前文所说,既然是“全栈”,就要软硬技术都过关。
在软件能力方面,高通AI软件栈可以说是高通所有相关AI软件产品的“集大成”方案, 借助高通AI软件栈,开发者只需要创建一次AI模型,就可以实现跨不同产品的部署。
高通AI软件栈,来源:高通
此外,高通AI软件栈支持TensorFlow、PyTorch、ONNX和Keras等主流AI框架以及对应的runtime,集成了面向Android、Linux和Windows不同版本的高通神经网络处理SDK。
值得注意的是,高通一直专注于AI模型效率研究,从而提升AI模型运行的能效和性能,这对于生成式AI的应用和扩展是至关重要的。
高通通过量化、压缩、条件计算、神经网络架构搜索和编译,在不牺牲太多精度的前提下对AI模型进行了缩减。在量化方面,高通将FP32模型量化压缩到INT4模型,实现了64倍内存和计算能效提升。
在生成式AI领域,像常见的GPT、Bloom以及LLaMA这样基于Transformer的大语言模型通常会受到内存的限制,根据高通实验数据,借助量化感知训练以及更加深入的量化研究,不少生成式 AI 模型可以量化至INT4模型,与INT8相比,性能提升约为90%,能效提升在60%左右。
我们表面上看到的是数十亿参数的大模型轻松地跑在了手机上,但实际上这背后高通在提升AI模型效率方面的研究发挥着关键作用。
高通全球副总裁兼高通AI研究负责人侯纪磊博士在WAIC上特别提到,能效是高通AI解决方案的核心优势之一,以极低功耗提供出色的终端侧AI性能,赋能AI用例,是他们要做的。
高通技术公司全球副总裁兼高通AI研究负责人侯纪磊博士,来源:高通
最后,在硬件、软件之外,高通在全球化规模以及生态建设方面的优势也成为其推动生成式AI落地终端的关键动力。
目前搭载高通AI引擎产品出货量已经超过20亿个,根据市研机构Counterpoint数据统计,搭载骁龙和高通平台的已上市用户终端数量规模在数十亿台。市研机构TechInsights预测,未来高通会以超过40%的市场份额保持AI智能手机处理器出货量第一,超过苹果公司的25%以及联发科的24%。
此外,搭载骁龙平台的已发布XR终端已经超过65款,其中Meta、PICO等头部厂商的旗舰产品均采用的是高通芯片。
可以看到,高通的AI能力已经深入数十亿边缘终端设备,形成跨智能手机、汽车、XR、PC以及企业级AI等现有市场和新兴领域的终端AI生态系统。
凭借在软硬件技术实力、全球化规模和生态系统赋能方面的优势,高通正在推动生成式AI加速落地终端。
正如侯纪磊博士在WAIC上所说到的,凭借一系列基础研究,以及跨AI应用、模型、硬件与软件的全栈终端侧AI优化,高通一直处于终端侧AI解决方案的前沿。
三、深耕AI研究十五年,推动技术从实验室走到消费者手中
科技产业发展的每个时代,都有行业的引领者,通过技术创新带动行业的发展,例如PC时代的微软、英特尔、智能手机时代的苹果,而在生成式AI的新浪潮中,各路玩家仍在寻找自己的定位,产业格局仍充满变量。
能够把握住生成式AI的浪潮,精准利用优势产品和技术切入赛道,对于每家科技公司来说都不是一件容易的事。在WAIC展示的各类生成式AI落地智能手机的用例背后,高通其实在AI前沿技术研究领域已经深耕多年,甚至在生成式AI领域,也已提前多年进行了前瞻性探索。这些研究对于推动AI与移动通信产业的融合发展发挥着关键作用。
从2007年高通骁龙平台搭载首个Hexagon处理器至今,高通深耕AI研发已超过15年。
高通近15年来AI研究重要节点,来源:高通
从2015年的骁龙820集成了首个专门面向移动平台的高通AI引擎,到2019年骁龙865开始扩展终端侧AI用例,多年来高通一直在推动终端侧AI技术的迭代,让感知、推理和行为等核心能力在终端上落地。
此外,多年来高通的重要AI研究也在影响着行业,推动高能效AI的研究和发展,加速AI在终端侧的落地应用。
从高通历年发布的AI研究论文来看,高通在计算机视觉、无线和射频传感、能源效率、机器学习、音视频和语言处理、数据压缩模型生成、个性化与联邦学习、强化学习、AI编译器和算法等AI前沿基础理论研究领域均有不少研究成果发布。
高通AI研究主要涉及领域,来源:高通
比如在今年的CVPR上,高通展示了全球首个在移动设备上通过神经编解码器对1080P视频进行编码和解码的演示。根据实际演示视频,在搭载高通芯片的智能手机上,神经编解码器进行视频解码的速度已经达到了35FPS左右。
在手机上进行的1080P神经网络视频编码,来源:高通
与此同时,高通在前沿算法和模型开发领域一直持续迭代自己的技术,比如具备自主学习能力的FrameExit模型、应用在移动终端上的量化技术和创新的编译器栈等。
高通利用INT4模型在终端侧实现了全球首个实时超级分辨率任务处理,与INT8相比,INT4模型的性能和能效提高了1.5倍到2倍。
可以说,十五年来高通在AI领域的深厚积累,已经成为今天他们发力生成式AI、推进混合AI发展的关键技术底蕴。
高通的身影一直活跃在AI技术前沿研究领域,一面连接学术界、产业界,推动着技术的发展,一面连接消费者,完善技术落地产品的体验,高通无疑已经成为“混合AI时代”加速生成式AI落地终端的核心推动者。
结语:生成式AI加速落地终端,AI产业涌现新变量
今天,生成式AI对各行各业产生深刻影响,几乎所有科技公司,都已卷入生成式AI的浪潮。
终端AI应用的深度广度都在加速扩张,云端和终端协同工作的混合AI将成为生成式AI体验的底层保障。百亿甚至千亿规模参数大模型落地终端,也将在不久的将来成为现实。
在未来端云结合的混合AI时代,能够提供全套解决方案的玩家必然会成为产业关注的焦点, 作为底层技术和生态构建者的高通,正成为产业中不可或缺的一环。端侧AI的应用正在迎来一次“进化”,而高通正在为这次革命按下加速键。
大家都在看
-
最新消息 12月21日凌晨5点前, “德阳造”获“世界之最”科技成果 编辑丨核桃您的点赞关注是我最大的动力!今天是12月21日,星期六,今日精彩要闻有:1、“德阳造”获“世界之最”科技成果认定中国重型机械工业协会发布2024年重型机械“世界之最”科技成果认定结果,国机重装研制的1 ... 科技之最12-21
-
东菱振动项目获“重型机械世界之最科技成果”认定 近日,根据中国重型机械工业协会发布的《2024年重型机械世界之最科技成果认定结果的公告》,苏高新股份下属东菱振动自主研制的“1000kN电动振动试验台”被认定为“世界单体推力最大的电动振动试验台(1000kN)”。此次 ... 科技之最12-19
-
地球之最科技篇:世界上最早的自行车 1791年,法国人西夫拉克用木头制造出一辆由横梁连接着的、前后有两个轮子的“木马轮”。1816年,德国人德莱斯在这种木马轮上加了车座和车把,这样在行进过程中便可以改变方向。不久,这种最原始的自行车便在欧洲的上 ... 科技之最12-16
-
“德阳造”获“世界之最”科技成果认定 【来源:德阳日报】近日,中国重型机械工业协会发布2024年重型机械“世界之最”科技成果认定结果,国机重装研制的13.5米直径圆筒形炼钢烟气电除尘器被认定为“世界最大直径圆筒形炼钢烟气电除尘器”。该除尘装备可确 ... 科技之最12-16
-
中国六大黑科技,个个领先全球,厉害了我的国 中国六大黑科技,个个领先全球,世界为之震撼,国人为之自豪,为我的国点赞。一,华为5G技木:在5G相关技术上,BBC报道称:全球最大的通讯设备制造商华为公司,乃全球5G领先的科技公司,然而这一技术西方国家已落后 ... 科技之最12-15
-
华为Mate XT领衔!2024年十大爆款手机:个个都凶残 2024年,AI硬科技创新大年。“不卷参数卷应用”成AI行业共识。一边,硬件狂叠AI的buff,AI硬件爆发,手机、PC、家电、汽车、清洁、家居、耳机、相机、存储等行业争相妙用AI;另一边,AI深入改造软件,文小言、豆包等 ... 科技之最12-14
-
重型机械“世界之最”科技成果公布 国机重装上榜 中新网四川新闻12月13日电 (李永辉)近日,中国重型机械工业协会发布了2024年重型机械“世界之最”科技成果认定结果,国机重装研制的13.5米直径圆筒形炼钢烟气电除尘器被认定为“世界最大直径圆筒形炼钢烟气电除尘器 ... 科技之最12-14
-
一夜暴涨8120亿,美国巨头量子芯片划时代突破,中国进展令我意外 谷歌最近发布了一款名为“Willow”的量子计算芯片,通过这款芯片,谷歌实现了计算性能和纠错能力上的重大突破,划时代的进展。这款芯片最新发布后,谷歌市值瞬间上涨8120亿元,吸引全球科技界的目光。报告中提到,该 ... 科技之最12-13
-
2024年十大划时代科技产品盘点:AI,AI,还是AI! 2024年,AI硬科技创新大年。“不卷参数卷应用”成AI行业共识。一边,硬件狂叠AI的buff,AI硬件爆发,手机、PC、家电、汽车、清洁、家居、耳机、相机、存储等行业争相妙用AI;另一边,AI深入改造软件,文小言、豆包等 ... 科技之最12-13
-
世界最大调水工程藏着哪些“科技密码”? 自古以来,我国的基本水情一直是夏汛冬枯、北缺南丰,水资源时空分布极不均衡。怎么打破这个困境?一项“世纪工程”——南水北调应运而生。南水北调是优化我国水资源配置、保障国家水安全的重大战略性基础设施,也是 ... 科技之最12-12
相关文章
- 精工科技为何火出圈?公司董事长解密背后的新质生产力
- 官方认定!中信智造新添两项“世界之最科技成果”
- 精工科技为何能火出圈?董事长接受专访,解密背后的新质生产力
- 江门中微子实验领先美国5年,中国院士:做第一最重要,老二啥也不是
- “有史以来最具标志性的100项科技发明”是一份您将为之奋斗名单
- 其实,科学也可以很有趣
- 7个惊人的科学事实,一个比一个不可思议
- 钱学森:民族脊梁,科技之光,照亮前行的路
- 科学之城闪耀人才之光
- 最早的宫城、最早的青铜兵器……二里头诞生了10个“中国之最”
- 科学史上最经典的大力出奇迹,莫过于用“土法制冷”挑战绝对零度
- “格美”致资兴受灾十个之最
- 这类化学实验走红!科学之美并非遥不可及
- 快手科技:科技向善,逐梦星河
- 全球最先进导弹大赏:军事科技的璀璨星光
- 肃然起敬,中国近代最德高望重的老中医,堪称国之瑰宝
- 山东博物馆馆长解锁最薄处仅0.2毫米的“黑科技” :4000年前地球文明最精致之作
- 世界上最名贵的珠宝,每一件都价值连城
- 华为Mate70,科技巅峰之作,究竟有多先进?
- 探秘奢华之巅:世界上最豪华的游艇,堪称行走的宫殿
热门阅读
-
万事胜意不能乱说的原因?告诉你万事胜意该对谁说 12-09
-
科威特第纳尔为什么那么值钱?比美元值钱的货币盘点 12-22
-
撕心裂肺十大催泪情歌,10首哭到崩溃的歌曲 12-24
-
不敢公布马航真实原因,内幕曝光简直太惊人! 12-25
-
陈百强什么原因怎么走的,陈百强85事件是什么 01-05
-
麻将公式一定要背下来,麻将手气背转运小妙招 01-19