在这三项能力上,讯飞星火已经超越了ChatGPT
AI大模型应该是目前整个科技行业最火热的概念,作为国内知名的AI领域的龙头企业,科大讯飞自然不会落后。很早开始,他们就在从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究。并且在过去几年,讯飞已经将很多产品和技术推向了包含电子消费、教育、医疗、办公、车载、智慧城市在内的多个行业和市场。
上周六,科大讯飞正式对外发布了新一代认知智能大模型——星火。这名字取自“星星之火,可以燎原”之意,体现了科大讯飞对于对于AGI的远景目标。除此之外,早在2001年科大讯飞“半场会议”上,创业团队就提出了“燃烧最亮的火把,要么率先燎原,要么最先熄灭”。同时 “星火”一词还来自中国传统文化二十八星宿中的“心宿”星座,被视为吉祥的象征,代表着力量、勇气和坚韧不拔的精神。所以从星火这个名字,也能看到讯飞的野心。
发布会后,我们第一时间深度体验了这款大模型,在这里我们分享一些我们对这款AI大模型的感受和体验。
中文自然语义理解能力更强
讯飞星火认知大模型在交互和界面设计上与大家熟悉的ChatGPT比较类似。作为一款对话类的自然语言模型,它通过自然对话方式做到对用户需求的理解与任务的执行。

既然是对话模型,首先要考验的是模型对于自然语义的理解能力。这方面中文相当有发言权。因为中文之所以复杂,除了本身表意的属性之外,在日常交流过程中,同样的文字、语句所表达的含义可能会随着语境、音调、习惯甚至是标点符号的变化而截然不同、传统的交互模型在面对中文这类复杂的自然语言的时候经常翻车,就是因为无法准确理解这些变化背后的含义。
举个例子:我单身的原因有两个:一是谁都看不上,二是谁都看不上。两个原因在语句上完全一样,但含义却截然不同。将中文作为母语的我们能够通过对整个语境的理解,很快明白二者之间的不同。
但AI会怎么理解呢?
我们将这句话输入ChatGPT,让它解释这两种说法有何不同。ChatGPT给出的解释是:

显然ChatGPT认为,这两种表述的意思都是一样的。只是“没有得到注意和认可”和“不被看重,缺乏吸引力”的区别。
再来看看讯飞星火给出的解释:

显然,讯飞星火模型给出的解释更为准确,它能够判断出这句话中“对别人的挑剔”,甚至还能够分析出一种说法是相对自嘲的,而第二种说法“显得自我膨胀”。这种判断是更符合我们对于这句话的双重理解的含义。
这里其实就体现了讯飞星火对于中文自然语义超高的理解能力,这主要是得益于其本身作为一款中国本土市场的AI模型,能够基于海量中文文本语料进行训练,同时在相关的核心算法上也更贴近与中文的使用环境和习惯,在对于中文自然语义的理解方面,讯飞星火认知大模型拥有先天的优势。



我们还输入了一些其他比较复杂,或者有多重含义的中文语句,讯飞星火都能够根据所在的语境的不同给出相对准确的判断,能够很自然的理解这些语句背后想要表达的真实意图。
生成文本能够“拿来即用”
相对于这些单一的自然语言的理解能力,文本生成能力应该是这类语言大模型在当下最具“生产力”的特性。讯飞星火同样支持强大的文本生成能力,它能够根据需求创作出邮件、讲稿、文案等等任何文本内容。
这种文本生产的过程非常简单,你只需要赋予身份、描述背景、提出需求,这三个步骤就能够让AI模型生成文本,最后你可以再根据生成的文本进行一些细节上的调整和条件的补充。经过我们的实测,讯飞星火大部分时候生成的文本,都能够做到“拿来即用”的水平。
还是举例来看,我们告诉讯飞星火:你现在是一位小学班主任,你的一名学生因为经常违反课堂纪律,现在需要给他的家长写一封书信,告诉他们孩子的基本情况并且希望他们能够协助你和学校妥善的解决这个问题。
以下是讯飞星火提供给我们的内容:

可以看到,讯飞星火能够根据你简单的描述,直接生成信件的基本内容。并且这封信件的内容本身在逻辑性、通顺性、可读性方面都没有什么问题。你可能注意到,这封信件的措辞和一些描述可能相对比较生硬和直接,需要修改地委婉一些。于是我们向讯飞星火提出需求:希望措辞能够委婉一些,并且淡化孩子违反纪律的描述,更注重强调孩子的教育和关切问题。

在我们提出了更细化的要求之后。讯飞星火能够准确理解“委婉”的含义,最终生成的文本内容在整体的措辞和语气方面都显得要温和许多。它甚至还能够自己拿出一些可行性的建议和意见,来解决存在的问题。让整个信件内容传达出了对孩子问题的关注,以及希望寻求家长的协助,共同来帮助他解决问题的态度。
现实中如果你真的想要借助星火来生成一些文本内容。你可以向它提出一些更为具体和细致的要求,进而获得更理想的最终文本。实际上,仅从文本内容的创作能力来看,讯飞星火这类AI的水平已经超过了大多数的普通人。


未来的想象空间还很大
除了上述的这些能力之外,讯飞星火还在诸多场景化的能力方面做出了尝试和创新。
比如在多题型可解析数学能力能力上,星火认知大模型目前就具备很强的能力,能够解答常见的计算、几何、方程、代数以及情景应用题等,我们尝试过将一些初高中的数学题直接输入模型,模型能够直接生成运算步骤和答案,准确率非常高。

尤其是在一些涉及到大量中文自然语义的情景应用题型上,星火认知大模型能够凭借自身更为本土化的中文语义理解能力,在运算的精确性上很多时候比GPT还要高。我们都知道,讯飞这些年在教育领域一直都有深入的拓展,推出了很多面向教育市场的产品,后续借助讯飞星火大模型的能力,这些教育类产品能力将会得到飞速提升,也将会给教育行业带来更多的赋能。从长远来看,讯飞在这方面的创新和布局,拥有很广阔的应用前景和想象空间。
和当前行业其他的大模型相比,讯飞星火目前在核心算法、数据积累、算力支撑等方面都有自己的独到优势。短期来看,立足于讯飞本身在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术方面优势积累,接下来我们有望看到讯飞星火能够不断地进行技术迭代,尤其是在中文认知的智能领域,有望实现对ChatGPT这样的行业标杆的追赶。

讯飞官方表示,当前讯飞星火在文本生成、语言理解、数学能力方面已经超过了ChatGPT。并且讯飞官方也公布了接下来的迭代升级时间节点:6月9日,星火将突破开放式问答、多轮对话能力明显提升、数学能力再升级;8月15日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发者团队;10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。
讯飞星火采用的是“1+N”架构,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。

在这次讯飞星火的发布会上,科大讯飞就重点发布了星火认知大模型在教育、办公、汽车、数字员工等行业的应用成果。比如给我们留下非常深刻印象的“星火认知大模型+讯飞听见”。借助星火认知模型的能力,还能够对文字内容进行深度分析,可以一键生成包括新闻稿件、宣传文案、多语种翻译等多种文本内容,它甚至还可以根据内容,进行提问追溯。对于我们这样的文字工作者来说,这些功能无疑是我们一直以来都梦寐以求的。
类似的应用场景还有教育行业,讯飞已经将星火认知大模型的强大能力加入到自家的学习机、办公本、录音笔等智能硬件设备上,实现诸如类人批改和修订语篇规整等多重的智慧能力。这些新功能的加入能够极大提升现有产品的使用体验,真正做到生产力的大幅度提升。另外,当前讯飞在国内车载智能语音应用已经做到了市场占有率第一,这一次认知大模型技术会让车载人机交互再上一个新的台阶,实现更自由、更拟人化地沟通。
未来,讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业,这也是接下来,讯飞这款大模型最值得关注的看点。

目前讯飞已经将星火认知大模型加入到了讯飞开放平台,将赋能开发者打造更具价值的AI应用。官方还宣布,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各行业合作伙伴共建大模型“星火”生态。
这里也可以看出讯飞“星火”命名的背后含义,尽管目前它还是一个星星之火,但在可见的未来,它很有可能成长为AI领域的燎原之势,能力不容小视。
下一篇:维多利亚时代的科学架桥者
大家都在看
-
精度超96%!大工“年度”成果,将在《科学》重点展示! 坐落在东部沿海城市大连的“985”“211”“双一流”建设高校大连理工大学,力学、机械工程、化学工程与技术3个学科入选国家第二轮“双一流”建设学科名单,计算机科学等15个学科位列ESI排名前1%;拥有数学等5个拔尖 ... 科技之最12-13
-
那个做电竞饮料的黑鲨,终于要推出旗舰新品了 如果只看新品的节奏,黑鲨在这两年时间一直很有存在感,但推新的产品多数为周边配件,像是散热背夹、充电宝、TWS耳机等,甚至还推出过黑鲨电竞手表和智能戒指。虽然新品不断,但黑鲨似乎很久没有拿出一款能吸引到电 ... 科技之最12-12
-
钱学森的最后一次系统谈话:谈科技创新人才的培养问题 他是中国航天事业奠基人“两弹一星”元勋美国人曾形容他“一个人抵得上5个海军陆战师”他就是钱学森今天是钱学森诞辰114周年让我们一起缅怀这位伟大的科学家2005年7月29日,钱学森提出,为什么我们的大学总是培养不 ... 科技之最12-12
-
她说“义不容辞地维护科学尊严,向不正之风进行坚决斗争!” 【科学家日历】点滴故事中,领略科学家精神的熠熠光辉。我们特别开设【科学家日历】专栏,讲述科学家的故事,打造展示科学家群像风采的“人物志”、讲述科技事业发展历程的“时光笺”、弘扬科学家精神内涵的“文化集 ... 科技之最12-12
-
2025末必看!10只量子科技黑马,长期持有躺赢 2025年末的A股市场,量子科技赛道正迎来政策与产业的双重爆发,从国家“十五五”规划重点扶持到地方真金白银补贴,从实验室技术突破到规模化商业落地,行业已经告别概念炒作,进入价值兑现的关键期。对于想长期布局 ... 科技之最12-12
-
三个“最”,解读宁波市科学技术奖 AI制图12月9日晚,宁波市科技局发布2024年度宁波市科学技术奖获奖名单,60项优秀科技成果、623名科研人员上榜。这份重磅榜单,不仅彰显了宁波科技创新的硬核实力,更勾勒出“以企业为主体、以人才为核心、以成果为导 ... 科技之最12-12
-
这位900多年前的杭州人,写出了“中国科学史上的坐标” 潮新闻 记者 李娇俨 严粒粒左图:中华世纪坛,沈括塑像。中图:中国国家博物馆展出的北宋水浮力指南针。据《梦溪笔谈》和《本草衍义》按1:1比例复制。右图:《梦溪笔谈》。 视觉中国供图飞机船舶的动力来源,时尚服 ... 科技之最12-12
-
AI眼镜爆发的真相:购买容易配镜难,线下渠道成了“最后一公里” 日前,智能眼镜鼻祖谷歌在Google Glass面世13年后,再度入局智能眼镜赛道。在一次小型活动上,谷歌展示了与XREAL合作开发的Project Aura。这款全球首款搭载Android XR平台以及Gemini AI的消费级AR眼镜产品,将于2026 ... 科技之最12-10
-
创新开放,倪飞回应豆包手机,句句都在向行业“开枪” 最近,努比亚 M153成为了科技行业最轰动的产品,更多的人习惯叫它豆包手机。自12月1日发布起,这款手机带着巨大的流量席卷各大平台。一时间各路大佬评论站台,极客们求F码。各家APP也反应不一。图片来源:豆包手机助 ... 科技之最12-10
-
黄仁勋语出惊人!CPU将成时代弃儿,英伟达靠GPU制霸未来? 日前美国政府宣布,将允许英伟达向中国和其他地区的“获准客户”销售其H200人工智能芯片,条件是美国政府将获得英伟达在这些地区H200销售额的 25% 的分成。GPU计算再度受到关注。就在前几天,黄仁勋在一场公开活动上 ... 科技之最12-10
相关文章
- 黄仁勋语出惊人!CPU将成时代弃儿,英伟达靠GPU制霸未来?
- 科技创新赋能 亳州聚链成势向未来
- 攻坚!向着科学最前沿
- 中国动力之最。
- 应变克难开新局——以习近平同志为核心的党中央引领中国经济收官“十四五”擘画新蓝图
- 应变克难开新局
- 在潮汕,撕开一条科技的“缝”
- 谷歌HOPE架构来了!突破大模型长期记忆难题,智能体要爆发?
- 2025自主五常冰与火之歌:比亚迪赢麻,但吉利才是大赢家?
- 金石为开:中华文明的铜筋铁骨
- 一加Ace 6T 24小时极限挑战:我能把这块8300mAh电池用光吗?
- 易经藏玄机,科学奔赴的未来,竟是“神之境”
- 阿基米德:古希腊的力学之父,开启科学的黄金时代
- 从“两种文化”到“主体性黄昏”,刘慈欣王晋康谈科技与人文
- 1350元!我买了台5年前的华为系游戏本,今天仍是大学生神机?
- 国产崛起!苹果2025年度App奖项出炉:腾讯斩获年度最佳
- 他们,经得起“一镜到底”
- 闪存巨头壮士断腕!美光放弃消费者市场,国产机会来了?
- 2399元起!「性能旗舰新选择」一加 Ace 6T发布:同档找不到对手
- 13亿欧元的败笔:科学史上最昂贵的实验
热门阅读
-
万事胜意不能乱说的原因?告诉你万事胜意该对谁说 12-09
-
科威特第纳尔为什么那么值钱?比美元值钱的货币盘点 12-22
-
撕心裂肺十大催泪情歌,10首哭到崩溃的歌曲 12-24
-
不敢公布马航真实原因,内幕曝光简直太惊人! 12-25
-
陈百强什么原因怎么走的,陈百强85事件是什么 01-05
-
麻将公式一定要背下来,麻将手气背转运小妙招 01-19
