比GPU性价比高百倍!Cerebras推出AI推理服务,号称“全球最快”
编译 | Vendii
编辑 | 漠影
智东西8月28日消息,AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference,号称“全球最快”。该服务已经在云端上线。
据官网介绍,该推理服务在保证精度的同时,速度比英伟达的服务快20倍;其处理器内存带宽是英伟达的7000倍,而价格仅为GPU的1/5,性价比提高了100倍。Cerebras Inference还提供多个服务层次,包括免费、开发者和企业级,满足从小规模开发到大规模企业部署的不同需求。
用户可直接在官网上的交互界面进行体验,也可调用API。
体验地址:https://inference.cerebras.ai/
Cerebras Systems成立于2016年,团队由计算机架构师、计算机科学家、深度学习研究人员和各种工程师组成。该公司以其创新的晶圆级芯片(Wafer Scale Engine, WSE)而闻名,这些芯片专为AI计算而设计,具有巨大的尺寸和性能。
这家芯片独角兽曾经得到多个知名投资者的支持,其中包括OpenAI联合创始人Sam Altman、AMD前CTO Fred Weber等。截至2021年11月,该公司完成了2.5亿美元的F轮融资,估值达到40亿美元。
一、性价比远超英伟达:速度快20倍,价格仅为1/5
AI推理指的是在训练好一个AI模型之后,使用这个模型对新的数据进行预测或决策的过程。AI推理的性能和效率对于实时应用至关重要,例如自动驾驶汽车、实时翻译或在线客服聊天机器人等。Cerebras Inference(以下称作“Cerebras推理服务”)便是一个专注于AI推理的服务,以支持这些对实时性要求极高的应用场景。
Cerebras推理服务由Cerebras CS-3系统及其第三代晶圆级芯片(WSE-3)提供支持。WSE-3于3月发布,基于2021年推出的WSE-2芯片进行了改进。WSE-3内存带宽高达21PB/s,是英伟达H100 GPU的7000倍。这种超高的内存带宽可以大幅减少数据传输时间,提高模型推理的速度和效率。
据官网介绍,Cerebras推理服务针对Llama 3.1 8B模型每秒提供1800个tokens,每百万tokens的价格为10美分;针对Llama 3.1 70B模型每秒提供450个tokens,每百万tokens的价格为60美分。速度比基于英伟达GPU的超大规模云解决方案快20倍。
▲Cerebras推理服务与其他服务在Llama 3.1 8B上的速度比较。单位:tokens/秒/用户。(图源:Cerebras官网)
▲Cerebras推理服务与其他服务在Llama 3.1 70B上的速度比较。单位:tokens/秒/用户。(图源:Cerebras官网)
此外,Cerebras推理服务在整个推理过程中始终保持在16位精度域内,确保在提升速度的同时不会牺牲模型的精度。大语言模型质量评估公司Artificial Analysis的联合创始人兼CEO Micah Hill-Smith谈道,他的团队已经验证了Llama 3.1 8B和Llama 3.1 70B模型在Cerebras推理服务上运行的质量评估结果:与Meta官方版本的原生16位精度一致。
跟据官网,该服务运行Llama3.1的速度比基于英伟达GPU的解决方案快20倍,而提供服务的芯片WSE-3价格仅为GPU的1/5,相当于AI推理工作负载的性价比提高了100倍。
“在Artificial Analysis的AI推理基准测试中,Cerebras推理服务已经领先。Cerebras推理服务的速度比基于GPU的解决方案快一个数量级,打破了测试的纪录。”Micah Hill-Smith说,“凭借推动超高的性能速度和具有竞争力的定价,Cerebras推理服务对具有实时或高容量需求的AI应用开发者特别具有吸引力。”
二、清晰的分级访问制度,用户可免费体验
Cerebras推理服务根据用户需求和使用情况,提供了分级制度,分为三个层级:
1、免费层级:这一层级为所有登录用户提供免费的API访问权限以及相对宽松的使用限制。用户可以在这个层级中体验,无需支付费用。
2、开发者层级:这一层级专为灵活的无服务器部署设计,为用户提供一个API端点。相比于市场上的大多数方案,其成本要低得多。对于Llama 3.1 8B和Llama 3.1 70B模型,每百万tokens的价格分别是10美分和60美分。未来,Cerebras计划持续推出对更多模型的支持。
3、企业层级:这一层级提供经过微调的模型、定制的服务级别协议和专门的支持。它适合需要持续的工作负载。企业可以通过Cerebras管理的私有云或在企业的本地部署访问Cerebras推理服务。可按需求定价。
Cerebras推理服务的这种分级制度旨在满足从小规模开发到大规模企业部署的不同需求。
三、推动多方战略合作,构建AI开发一条龙服务
在推动AI开发的战略合作伙伴关系中,Cerebras Systems正与一系列行业领导者合作,共同构建AI应用的未来生态。这些公司在各自的领域内提供关键技术和服务,比如,Docker旨在利用容器化技术使AI应用部署更加便捷和一致,LangChain为语言模型应用提供快速开发框架,Weights&Biases打造了供AI开发者训练和微调模型的MLOps平台……
“LiveKit很高兴能与Cerebras合作,帮助开发者构建下一代多模态AI应用。结合Cerebras的计算能力和模型以及LiveKit的全球边缘网络,所开发的语音和视频AI应用将实现超低延迟并更接近人类特征。”LiveKit公司的CEO兼联合创始人Russell D’sa说道,该公司专注于构建和扩展语音和视频应用程序。
AI搜索引擎创企Perplexity的CTO兼联合创始人Denis Yarats认为,Cerebras推理服务可以帮助AI搜索引擎在用户交互方面实现突破,从而提高用户参与度。
结语:AI计算战事升温,高效推理成焦点
根据国际数据公司(IDC)的研究,AI推理芯片在2020年已经占据了中国数据中心市场的50%以上份额,并预计到2025年,这一比例将增长至60.8%。据英伟达2024财年数据中心的业绩会纪要,其公司该年度有超过40%的收入来自AI推理业务。可见,AI推理不仅在当前市场中占有相当比例,而且预计在未来几年将继续保持增长势头。
Cerebras凭借其超快的推理速度、优异的性价比和独特的硬件设计,将赋予开发者构建下一代AI应用的能力,这些应用将涉及复杂、多步骤的实时处理任务。
然而,在生态系统的成熟度、模型支持的广泛性以及市场认知度方面,英伟达仍然占据优势。相比于Cerebra,英伟达拥有更大的用户群体和更丰富的开发者工具和支持。此外,虽然Cerebras支持主流模型(如Llama 3.1),但英伟达的GPU支持的深度学习框架和模型范围更广。对于已经深度集成在英伟达生态系统中的用户,Cerebras可能在模型支持的广度和灵活性方面略显不足。
大家都在看
-
你敢信?全球加速最快的三台车都是中国品牌 小米第二 【CNMO科技消息】“高性能”“超跑”这些词对中国车企来说曾经可望而不可及,但随着新能源时代的到来,一切都变了。据CNMO了解,目前全球加速最快的三台车都是中国品牌,刚亮相不久的“性能怪兽”小米SU7 Ultra量产 ... 世界最快11-09
-
世界上最快的10台摩托车,第一名比飞机还快,你的目标是哪一台? 世界上最快的10台摩托车,你都听过几个?排第一名的摩托更是比战斗机还要快,甚至被禁止在公路上驾驶,下面就带你一起盘点一下。第十名:本田火刃 CBR 1000 RR-R这款本田摩托车以其精湛的工程和卓越的性能而闻名。它 ... 世界最快11-07
-
0.305秒!全球最快!一睹为快 每年进博会,“高精尖”展品集聚的技术装备展区都备受关注。今年,近7万平方米的展区里,聚焦科技、工业、环保三大主题,来自34个国家和地区的350家企业参展。 总台央视记者 熊婧:技术装备展区,作为进博会最“重” ... 世界最快11-07
-
美国的全球最快侦察机,速度超过三马赫的飞鸟,中国也造出来了 众所周知,SR-71 “黑鸟”侦察机在很长一段时间里是全世界公认的最快最强的军用飞机。这款传奇飞机的最大飞行高度可达三万米,最大飞行速度高达 3.5 马赫,黑鸟,就是军用飞机的顶点,成为侦察机的答案。“黑鸟”在 ... 世界最快11-06
-
世界上“倒退”最快的国家:从全球第六到一贫如洗,仅用5年时间 提起非洲想到的会是什么,贫穷,饥饿。然而却有一个国家与众不同,它曾被看作是非洲的希望,更是一个即将完成工业化的准发达国家。然而没想到,在五年的时间里,它却直接从准发达国家变成了一个相对贫困的国家。在20 ... 世界最快11-01
-
创造了历史如今却被人遗忘,世界最快客机,为什么退出历史舞台 “协和”客机是世界上为数不多的商用超音速客机。巡航时,“协和”飞机可以达到2马赫的飞行速度,最大速度2.2马赫(2,330公里/小时),相比传统飞机,“协和”横跨大洋的时间只需一半,“协和”飞机为乘客提供了无与 ... 世界最快10-19
-
全球最快的10台高速列车,第一名更比飞机还快 在这个快节奏的时代,速度似乎成了衡量一切的标准,无论是生活还是工作,我们都希望能在最短的时间内达到目的地,说到速度,很多人第一时间可能会想到飞机,你有没有想过,现在也有一些列车,它们的速度不仅能与飞机 ... 世界最快10-17
-
世界最快轰炸机,只能携带14枚原子弹,60年代产物依旧无人能敌 美国曾经建造出很多让世界称奇的武器,其中就包括在 20 世纪 60 年代打造的世界上速度最快的轰炸机:女武神轰炸机。说说女武神轰炸机的一些情况!1. 这个型号的轰炸机远超过现在服役的轰炸机,能携带 14 枚原子弹, ... 世界最快10-08
-
世界倒退最快的国家:从全球第六到一贫如洗,只用了短短五年! 提到非洲,人们脑海中可能会浮现出炎热贫瘠、环境萧条等印象,但是,在最南端曾有一个国家,曾依靠自身发展跻身过发达国家行列。其工业水平之先进、资源储备之丰富,堪称冠绝非洲无国能及,它就是被誉为彩虹之国的南 ... 世界最快09-21
-
世界五大最快飞机排名,第一7分钟从上海飞北京,歼20能排第几? 2001年,南海上空发生了一场震惊世界的撞机事件,当时,美军侦察机擅自闯入中国领空,王伟奉命驾驶战机81192进行拦截。然而,彼时中国战机在技术和装备上落后于美军,王伟尽管凭借高超的飞行技巧努力驱离敌机,但不 ... 世界最快09-19
相关文章
- 世界最快轰炸机,只能携带14枚原子弹,60年代产物依旧无人能敌
- 乌克兰造出世界最快无人机,时速325超大疆数倍?中国能应付吗?
- 世界倒退最快的国家:从全球第六到一贫如洗,只用了短短五年!
- 世界五大最快飞机排名,第一7分钟从上海飞北京,歼20能排第几?
- 全球速度最快的5大飞机排行!中国歼20能够排第几呢?
- 你知道世界上最快的防弹车是哪辆吗?
- 世界最快直升机,最快时速超过500千米时,美国都被比了下去
- 1小时52秒!史上最快马拉松基普乔格全马十连冠
- 比GPU性价比高百倍!Cerebras推出AI推理服务,号称“全球最快”
- 中国十年污染防治攻坚:空气质量改善速度全球最快
- 世界上生长最快的动物
- 当今最快速度!世界百米飞人排名
- 1678公里/小时,世界上最快的汽车
- 10 辆曾荣膺世界最快汽车称号的汽车
- 世界最快显微镜问世,首次观察到电子运动
- 世界上跑得最快的人——尤塞恩·博尔特
- 世界上奔跑速度最快的动物都有哪些吗
- 魔兽世界:怀旧服盗贼赚钱的两个方法,黑下收益不比厄运低
- 世界最慢的动物,唯有交配时最快,50%死在拉粑粑的途中
- 潘展乐惊天逆转拿金牌:美媒直言世界最快, 欧媒高呼疯狂的统治力
热门阅读
-
世界上最快的快艇,非捷豹莫属。 07-14
-
世界最快的个人潜艇,数秒潜入100米 09-29
-
世界上跑的最快的男孩,100米仅用时13.48秒 04-26
-
世界上速度最快的火箭车,每小时达到1600公里 04-26
-
世界上飞行最快的鸟,灵活的军舰鸟 04-26