比GPT-4快18倍,世界最快大模型Groq快速证伪?
今天讨论了一天的groq,结论就是同样完成LLaMA 70b 模型推理,采用 int8 量化,运行三年的话,Groq 需要的硬件采购成本是576卡1144 万美元,运营成本是 76.2 万美元或更高。H100的硬件采购成本是 8卡30 万美元,运营成本是 7.2 万美元或略低。
为什么需要576张,有海外大神专门算过,另一位技术大牛也做了类似的计算,groq没有显存仅仅靠SOC SRAM,假设有230MB的SRAM , 运行一个INT8的 llama-70B=70GB/0.23GB = 305张卡,考虑到SRAM利用率等各种问题,预计需要320张卡,每个服务器智能插入8张卡,分摊成本每张卡不低于2500$(卡0元计算),也就是服务器40台+交换机, 大概150万美元可以运行llama-70B。如果换成A100的8卡,大概INT8能够做到100token/s.,也就是120万人民币投入。
结论就是,Groq看起来效果惊人,但一算TCO,根本不具有经济性...那个效果吓人的视频,揣测下,是不计成本的堆卡堆出来的。诚然这个架构有其特点,比如NV大佬提到的针对bs1做了优化,的确在小batch size尤其是bs1显示出了优势,但可能也就在小模型、本地或者线上定制化推理服务能有限场景,一旦到了云端大规模集群推理,就不可用了,尤其是GPU或者大厂ASIC被充分优化、且利用率又比较高的场景。
这个路子是否成立都是个问号,groq还有个前辈graphcoe,其sram是groq的2.5倍,现在公司生意都快没了(除了前两天融资)...最致命的问题是,这种架构仅存只有SRAM(没错,这是短板...先不管你股票咋炒的)。
目前的计算架构存储层级是这样的,register file->SRAM->HBM->DDR->NAND->不常用的数据还可以offload到Disk,从左到右速度和和带宽都在降低,比如access SRAM 带宽认为约等于无限 一次ACCESS 2ns delay (先进工艺下),Acess HBM可能是几个micro second,Access NAND是milli second量级。但从左到右单bit的成本在依次降低。
说白了,最左边,无限快,但你用不起,往右边,贼便宜,但不够快。而目前LLM大家天天念叨的内存墙瓶颈,尤其是推理只做一次前向计算所有的参数要遍历一遍,因此需要
1)存的足够大;
2)读取也要足够快。
结论:LLM需要的存储要在成本可控的前提下,在速度和容量之间做一个折中和平衡。因此才有了HBM的大规模应用,这是产业的选择(最早是AMD),综合考虑了量产难度、成本、速度、工程实现性等等。下一步最多如大家讨论的HBM4与逻辑堆叠或者chiplet,但你说换掉HBM?步子迈太大了...不管存内计算近存计算存内处理,一旦到了工程实现性、良率就不吱声,再考虑经济性就歇菜。
我会在 公众号:海涵财经 每天更新最新的华为概念、创新减肥药、数字经济、ChatGPT、AI算力、CPO/硅光芯片、大数据、6G卫星、数据要素、医疗新基建、一体化压铸、 汽车智能化,激光雷达,HUD,车规芯片,空气悬挂、L3级智能驾驶、PET铜箔,纳电池,800V高压,光伏HJT、TOPCON、钙钛矿、光伏XBC、BIPV、IGBT芯片、碳化硅SIC、CTP/CTC/CTB电池、4680电池、工业母机、海风柔直高压、新能源车高压快充、高镍三元、碳纤维、PET铝箔、PET铜箔、空气源热泵、新材料、中药创新药、中药配方颗粒、乡村振兴、锂矿、钒液流电池、钠离子电池、分布式储能、集中式储能、抗原检测等最新题材热点挖掘,未来属于高预期差的结构性市场,把握核心赛道以及个股的内在价值逻辑预期差才是根本所在。
— END —
先赞后看,养成习惯
免责声明:图片、数据来源于网络,转载仅用做交流学习,如有版权问题请联系作者删除
大家都在看
-
你敢信?全球加速最快的三台车都是中国品牌 小米第二 【CNMO科技消息】“高性能”“超跑”这些词对中国车企来说曾经可望而不可及,但随着新能源时代的到来,一切都变了。据CNMO了解,目前全球加速最快的三台车都是中国品牌,刚亮相不久的“性能怪兽”小米SU7 Ultra量产 ... 世界最快11-09
-
世界上最快的10台摩托车,第一名比飞机还快,你的目标是哪一台? 世界上最快的10台摩托车,你都听过几个?排第一名的摩托更是比战斗机还要快,甚至被禁止在公路上驾驶,下面就带你一起盘点一下。第十名:本田火刃 CBR 1000 RR-R这款本田摩托车以其精湛的工程和卓越的性能而闻名。它 ... 世界最快11-07
-
0.305秒!全球最快!一睹为快 每年进博会,“高精尖”展品集聚的技术装备展区都备受关注。今年,近7万平方米的展区里,聚焦科技、工业、环保三大主题,来自34个国家和地区的350家企业参展。 总台央视记者 熊婧:技术装备展区,作为进博会最“重” ... 世界最快11-07
-
美国的全球最快侦察机,速度超过三马赫的飞鸟,中国也造出来了 众所周知,SR-71 “黑鸟”侦察机在很长一段时间里是全世界公认的最快最强的军用飞机。这款传奇飞机的最大飞行高度可达三万米,最大飞行速度高达 3.5 马赫,黑鸟,就是军用飞机的顶点,成为侦察机的答案。“黑鸟”在 ... 世界最快11-06
-
世界上“倒退”最快的国家:从全球第六到一贫如洗,仅用5年时间 提起非洲想到的会是什么,贫穷,饥饿。然而却有一个国家与众不同,它曾被看作是非洲的希望,更是一个即将完成工业化的准发达国家。然而没想到,在五年的时间里,它却直接从准发达国家变成了一个相对贫困的国家。在20 ... 世界最快11-01
-
创造了历史如今却被人遗忘,世界最快客机,为什么退出历史舞台 “协和”客机是世界上为数不多的商用超音速客机。巡航时,“协和”飞机可以达到2马赫的飞行速度,最大速度2.2马赫(2,330公里/小时),相比传统飞机,“协和”横跨大洋的时间只需一半,“协和”飞机为乘客提供了无与 ... 世界最快10-19
-
全球最快的10台高速列车,第一名更比飞机还快 在这个快节奏的时代,速度似乎成了衡量一切的标准,无论是生活还是工作,我们都希望能在最短的时间内达到目的地,说到速度,很多人第一时间可能会想到飞机,你有没有想过,现在也有一些列车,它们的速度不仅能与飞机 ... 世界最快10-17
-
世界最快轰炸机,只能携带14枚原子弹,60年代产物依旧无人能敌 美国曾经建造出很多让世界称奇的武器,其中就包括在 20 世纪 60 年代打造的世界上速度最快的轰炸机:女武神轰炸机。说说女武神轰炸机的一些情况!1. 这个型号的轰炸机远超过现在服役的轰炸机,能携带 14 枚原子弹, ... 世界最快10-08
-
世界倒退最快的国家:从全球第六到一贫如洗,只用了短短五年! 提到非洲,人们脑海中可能会浮现出炎热贫瘠、环境萧条等印象,但是,在最南端曾有一个国家,曾依靠自身发展跻身过发达国家行列。其工业水平之先进、资源储备之丰富,堪称冠绝非洲无国能及,它就是被誉为彩虹之国的南 ... 世界最快09-21
-
世界五大最快飞机排名,第一7分钟从上海飞北京,歼20能排第几? 2001年,南海上空发生了一场震惊世界的撞机事件,当时,美军侦察机擅自闯入中国领空,王伟奉命驾驶战机81192进行拦截。然而,彼时中国战机在技术和装备上落后于美军,王伟尽管凭借高超的飞行技巧努力驱离敌机,但不 ... 世界最快09-19
相关文章
- 世界最快轰炸机,只能携带14枚原子弹,60年代产物依旧无人能敌
- 乌克兰造出世界最快无人机,时速325超大疆数倍?中国能应付吗?
- 世界倒退最快的国家:从全球第六到一贫如洗,只用了短短五年!
- 世界五大最快飞机排名,第一7分钟从上海飞北京,歼20能排第几?
- 全球速度最快的5大飞机排行!中国歼20能够排第几呢?
- 你知道世界上最快的防弹车是哪辆吗?
- 世界最快直升机,最快时速超过500千米时,美国都被比了下去
- 1小时52秒!史上最快马拉松基普乔格全马十连冠
- 比GPU性价比高百倍!Cerebras推出AI推理服务,号称“全球最快”
- 中国十年污染防治攻坚:空气质量改善速度全球最快
- 世界上生长最快的动物
- 当今最快速度!世界百米飞人排名
- 1678公里/小时,世界上最快的汽车
- 10 辆曾荣膺世界最快汽车称号的汽车
- 世界最快显微镜问世,首次观察到电子运动
- 世界上跑得最快的人——尤塞恩·博尔特
- 世界上奔跑速度最快的动物都有哪些吗
- 魔兽世界:怀旧服盗贼赚钱的两个方法,黑下收益不比厄运低
- 世界最慢的动物,唯有交配时最快,50%死在拉粑粑的途中
- 潘展乐惊天逆转拿金牌:美媒直言世界最快, 欧媒高呼疯狂的统治力
热门阅读
-
世界上最快的快艇,非捷豹莫属。 07-14
-
世界最快的个人潜艇,数秒潜入100米 09-29
-
世界上跑的最快的男孩,100米仅用时13.48秒 04-26
-
世界上速度最快的火箭车,每小时达到1600公里 04-26
-
世界上飞行最快的鸟,灵活的军舰鸟 04-26