在这三项能力上,讯飞星火已经超越了ChatGPT
AI大模型应该是目前整个科技行业最火热的概念,作为国内知名的AI领域的龙头企业,科大讯飞自然不会落后。很早开始,他们就在从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究。并且在过去几年,讯飞已经将很多产品和技术推向了包含电子消费、教育、医疗、办公、车载、智慧城市在内的多个行业和市场。
上周六,科大讯飞正式对外发布了新一代认知智能大模型——星火。这名字取自“星星之火,可以燎原”之意,体现了科大讯飞对于对于AGI的远景目标。除此之外,早在2001年科大讯飞“半场会议”上,创业团队就提出了“燃烧最亮的火把,要么率先燎原,要么最先熄灭”。同时 “星火”一词还来自中国传统文化二十八星宿中的“心宿”星座,被视为吉祥的象征,代表着力量、勇气和坚韧不拔的精神。所以从星火这个名字,也能看到讯飞的野心。
发布会后,我们第一时间深度体验了这款大模型,在这里我们分享一些我们对这款AI大模型的感受和体验。
中文自然语义理解能力更强
讯飞星火认知大模型在交互和界面设计上与大家熟悉的ChatGPT比较类似。作为一款对话类的自然语言模型,它通过自然对话方式做到对用户需求的理解与任务的执行。
既然是对话模型,首先要考验的是模型对于自然语义的理解能力。这方面中文相当有发言权。因为中文之所以复杂,除了本身表意的属性之外,在日常交流过程中,同样的文字、语句所表达的含义可能会随着语境、音调、习惯甚至是标点符号的变化而截然不同、传统的交互模型在面对中文这类复杂的自然语言的时候经常翻车,就是因为无法准确理解这些变化背后的含义。
举个例子:我单身的原因有两个:一是谁都看不上,二是谁都看不上。两个原因在语句上完全一样,但含义却截然不同。将中文作为母语的我们能够通过对整个语境的理解,很快明白二者之间的不同。
但AI会怎么理解呢?
我们将这句话输入ChatGPT,让它解释这两种说法有何不同。ChatGPT给出的解释是:
显然ChatGPT认为,这两种表述的意思都是一样的。只是“没有得到注意和认可”和“不被看重,缺乏吸引力”的区别。
再来看看讯飞星火给出的解释:
显然,讯飞星火模型给出的解释更为准确,它能够判断出这句话中“对别人的挑剔”,甚至还能够分析出一种说法是相对自嘲的,而第二种说法“显得自我膨胀”。这种判断是更符合我们对于这句话的双重理解的含义。
这里其实就体现了讯飞星火对于中文自然语义超高的理解能力,这主要是得益于其本身作为一款中国本土市场的AI模型,能够基于海量中文文本语料进行训练,同时在相关的核心算法上也更贴近与中文的使用环境和习惯,在对于中文自然语义的理解方面,讯飞星火认知大模型拥有先天的优势。
我们还输入了一些其他比较复杂,或者有多重含义的中文语句,讯飞星火都能够根据所在的语境的不同给出相对准确的判断,能够很自然的理解这些语句背后想要表达的真实意图。
生成文本能够“拿来即用”
相对于这些单一的自然语言的理解能力,文本生成能力应该是这类语言大模型在当下最具“生产力”的特性。讯飞星火同样支持强大的文本生成能力,它能够根据需求创作出邮件、讲稿、文案等等任何文本内容。
这种文本生产的过程非常简单,你只需要赋予身份、描述背景、提出需求,这三个步骤就能够让AI模型生成文本,最后你可以再根据生成的文本进行一些细节上的调整和条件的补充。经过我们的实测,讯飞星火大部分时候生成的文本,都能够做到“拿来即用”的水平。
还是举例来看,我们告诉讯飞星火:你现在是一位小学班主任,你的一名学生因为经常违反课堂纪律,现在需要给他的家长写一封书信,告诉他们孩子的基本情况并且希望他们能够协助你和学校妥善的解决这个问题。
以下是讯飞星火提供给我们的内容:
可以看到,讯飞星火能够根据你简单的描述,直接生成信件的基本内容。并且这封信件的内容本身在逻辑性、通顺性、可读性方面都没有什么问题。你可能注意到,这封信件的措辞和一些描述可能相对比较生硬和直接,需要修改地委婉一些。于是我们向讯飞星火提出需求:希望措辞能够委婉一些,并且淡化孩子违反纪律的描述,更注重强调孩子的教育和关切问题。
在我们提出了更细化的要求之后。讯飞星火能够准确理解“委婉”的含义,最终生成的文本内容在整体的措辞和语气方面都显得要温和许多。它甚至还能够自己拿出一些可行性的建议和意见,来解决存在的问题。让整个信件内容传达出了对孩子问题的关注,以及希望寻求家长的协助,共同来帮助他解决问题的态度。
现实中如果你真的想要借助星火来生成一些文本内容。你可以向它提出一些更为具体和细致的要求,进而获得更理想的最终文本。实际上,仅从文本内容的创作能力来看,讯飞星火这类AI的水平已经超过了大多数的普通人。
未来的想象空间还很大
除了上述的这些能力之外,讯飞星火还在诸多场景化的能力方面做出了尝试和创新。
比如在多题型可解析数学能力能力上,星火认知大模型目前就具备很强的能力,能够解答常见的计算、几何、方程、代数以及情景应用题等,我们尝试过将一些初高中的数学题直接输入模型,模型能够直接生成运算步骤和答案,准确率非常高。
尤其是在一些涉及到大量中文自然语义的情景应用题型上,星火认知大模型能够凭借自身更为本土化的中文语义理解能力,在运算的精确性上很多时候比GPT还要高。我们都知道,讯飞这些年在教育领域一直都有深入的拓展,推出了很多面向教育市场的产品,后续借助讯飞星火大模型的能力,这些教育类产品能力将会得到飞速提升,也将会给教育行业带来更多的赋能。从长远来看,讯飞在这方面的创新和布局,拥有很广阔的应用前景和想象空间。
和当前行业其他的大模型相比,讯飞星火目前在核心算法、数据积累、算力支撑等方面都有自己的独到优势。短期来看,立足于讯飞本身在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术方面优势积累,接下来我们有望看到讯飞星火能够不断地进行技术迭代,尤其是在中文认知的智能领域,有望实现对ChatGPT这样的行业标杆的追赶。
讯飞官方表示,当前讯飞星火在文本生成、语言理解、数学能力方面已经超过了ChatGPT。并且讯飞官方也公布了接下来的迭代升级时间节点:6月9日,星火将突破开放式问答、多轮对话能力明显提升、数学能力再升级;8月15日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发者团队;10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。
讯飞星火采用的是“1+N”架构,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。
在这次讯飞星火的发布会上,科大讯飞就重点发布了星火认知大模型在教育、办公、汽车、数字员工等行业的应用成果。比如给我们留下非常深刻印象的“星火认知大模型+讯飞听见”。借助星火认知模型的能力,还能够对文字内容进行深度分析,可以一键生成包括新闻稿件、宣传文案、多语种翻译等多种文本内容,它甚至还可以根据内容,进行提问追溯。对于我们这样的文字工作者来说,这些功能无疑是我们一直以来都梦寐以求的。
类似的应用场景还有教育行业,讯飞已经将星火认知大模型的强大能力加入到自家的学习机、办公本、录音笔等智能硬件设备上,实现诸如类人批改和修订语篇规整等多重的智慧能力。这些新功能的加入能够极大提升现有产品的使用体验,真正做到生产力的大幅度提升。另外,当前讯飞在国内车载智能语音应用已经做到了市场占有率第一,这一次认知大模型技术会让车载人机交互再上一个新的台阶,实现更自由、更拟人化地沟通。
未来,讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业,这也是接下来,讯飞这款大模型最值得关注的看点。
目前讯飞已经将星火认知大模型加入到了讯飞开放平台,将赋能开发者打造更具价值的AI应用。官方还宣布,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各行业合作伙伴共建大模型“星火”生态。
这里也可以看出讯飞“星火”命名的背后含义,尽管目前它还是一个星星之火,但在可见的未来,它很有可能成长为AI领域的燎原之势,能力不容小视。
下一篇:维多利亚时代的科学架桥者
大家都在看
-
最新消息 12月21日凌晨5点前, “德阳造”获“世界之最”科技成果 编辑丨核桃您的点赞关注是我最大的动力!今天是12月21日,星期六,今日精彩要闻有:1、“德阳造”获“世界之最”科技成果认定中国重型机械工业协会发布2024年重型机械“世界之最”科技成果认定结果,国机重装研制的1 ... 科技之最12-21
-
东菱振动项目获“重型机械世界之最科技成果”认定 近日,根据中国重型机械工业协会发布的《2024年重型机械世界之最科技成果认定结果的公告》,苏高新股份下属东菱振动自主研制的“1000kN电动振动试验台”被认定为“世界单体推力最大的电动振动试验台(1000kN)”。此次 ... 科技之最12-19
-
地球之最科技篇:世界上最早的自行车 1791年,法国人西夫拉克用木头制造出一辆由横梁连接着的、前后有两个轮子的“木马轮”。1816年,德国人德莱斯在这种木马轮上加了车座和车把,这样在行进过程中便可以改变方向。不久,这种最原始的自行车便在欧洲的上 ... 科技之最12-16
-
“德阳造”获“世界之最”科技成果认定 【来源:德阳日报】近日,中国重型机械工业协会发布2024年重型机械“世界之最”科技成果认定结果,国机重装研制的13.5米直径圆筒形炼钢烟气电除尘器被认定为“世界最大直径圆筒形炼钢烟气电除尘器”。该除尘装备可确 ... 科技之最12-16
-
中国六大黑科技,个个领先全球,厉害了我的国 中国六大黑科技,个个领先全球,世界为之震撼,国人为之自豪,为我的国点赞。一,华为5G技木:在5G相关技术上,BBC报道称:全球最大的通讯设备制造商华为公司,乃全球5G领先的科技公司,然而这一技术西方国家已落后 ... 科技之最12-15
-
华为Mate XT领衔!2024年十大爆款手机:个个都凶残 2024年,AI硬科技创新大年。“不卷参数卷应用”成AI行业共识。一边,硬件狂叠AI的buff,AI硬件爆发,手机、PC、家电、汽车、清洁、家居、耳机、相机、存储等行业争相妙用AI;另一边,AI深入改造软件,文小言、豆包等 ... 科技之最12-14
-
重型机械“世界之最”科技成果公布 国机重装上榜 中新网四川新闻12月13日电 (李永辉)近日,中国重型机械工业协会发布了2024年重型机械“世界之最”科技成果认定结果,国机重装研制的13.5米直径圆筒形炼钢烟气电除尘器被认定为“世界最大直径圆筒形炼钢烟气电除尘器 ... 科技之最12-14
-
一夜暴涨8120亿,美国巨头量子芯片划时代突破,中国进展令我意外 谷歌最近发布了一款名为“Willow”的量子计算芯片,通过这款芯片,谷歌实现了计算性能和纠错能力上的重大突破,划时代的进展。这款芯片最新发布后,谷歌市值瞬间上涨8120亿元,吸引全球科技界的目光。报告中提到,该 ... 科技之最12-13
-
2024年十大划时代科技产品盘点:AI,AI,还是AI! 2024年,AI硬科技创新大年。“不卷参数卷应用”成AI行业共识。一边,硬件狂叠AI的buff,AI硬件爆发,手机、PC、家电、汽车、清洁、家居、耳机、相机、存储等行业争相妙用AI;另一边,AI深入改造软件,文小言、豆包等 ... 科技之最12-13
-
世界最大调水工程藏着哪些“科技密码”? 自古以来,我国的基本水情一直是夏汛冬枯、北缺南丰,水资源时空分布极不均衡。怎么打破这个困境?一项“世纪工程”——南水北调应运而生。南水北调是优化我国水资源配置、保障国家水安全的重大战略性基础设施,也是 ... 科技之最12-12
相关文章
- 精工科技为何火出圈?公司董事长解密背后的新质生产力
- 官方认定!中信智造新添两项“世界之最科技成果”
- 精工科技为何能火出圈?董事长接受专访,解密背后的新质生产力
- 江门中微子实验领先美国5年,中国院士:做第一最重要,老二啥也不是
- “有史以来最具标志性的100项科技发明”是一份您将为之奋斗名单
- 其实,科学也可以很有趣
- 7个惊人的科学事实,一个比一个不可思议
- 钱学森:民族脊梁,科技之光,照亮前行的路
- 科学之城闪耀人才之光
- 最早的宫城、最早的青铜兵器……二里头诞生了10个“中国之最”
- 科学史上最经典的大力出奇迹,莫过于用“土法制冷”挑战绝对零度
- “格美”致资兴受灾十个之最
- 这类化学实验走红!科学之美并非遥不可及
- 快手科技:科技向善,逐梦星河
- 全球最先进导弹大赏:军事科技的璀璨星光
- 肃然起敬,中国近代最德高望重的老中医,堪称国之瑰宝
- 山东博物馆馆长解锁最薄处仅0.2毫米的“黑科技” :4000年前地球文明最精致之作
- 世界上最名贵的珠宝,每一件都价值连城
- 华为Mate70,科技巅峰之作,究竟有多先进?
- 探秘奢华之巅:世界上最豪华的游艇,堪称行走的宫殿
热门阅读
-
万事胜意不能乱说的原因?告诉你万事胜意该对谁说 12-09
-
科威特第纳尔为什么那么值钱?比美元值钱的货币盘点 12-22
-
撕心裂肺十大催泪情歌,10首哭到崩溃的歌曲 12-24
-
不敢公布马航真实原因,内幕曝光简直太惊人! 12-25
-
陈百强什么原因怎么走的,陈百强85事件是什么 01-05
-
麻将公式一定要背下来,麻将手气背转运小妙招 01-19