在这三项能力上，讯飞星火已经超越了ChatGPT

发布者：秋雨舞春风 2023-5-19 00:12

AI大模型应该是目前整个科技行业最火热的概念，作为国内知名的AI领域的龙头企业，科大讯飞自然不会落后。很早开始，他们就在从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究。并且在过去几年，讯飞已经将很多产品和技术推向了包含电子消费、教育、医疗、办公、车载、智慧城市在内的多个行业和市场。

上周六，科大讯飞正式对外发布了新一代认知智能大模型——星火。这名字取自“星星之火，可以燎原”之意，体现了科大讯飞对于对于AGI的远景目标。除此之外，早在2001年科大讯飞“半场会议”上，创业团队就提出了“燃烧最亮的火把，要么率先燎原，要么最先熄灭”。同时 “星火”一词还来自中国传统文化二十八星宿中的“心宿”星座，被视为吉祥的象征，代表着力量、勇气和坚韧不拔的精神。所以从星火这个名字，也能看到讯飞的野心。

发布会后，我们第一时间深度体验了这款大模型，在这里我们分享一些我们对这款AI大模型的感受和体验。

中文自然语义理解能力更强

讯飞星火认知大模型在交互和界面设计上与大家熟悉的ChatGPT比较类似。作为一款对话类的自然语言模型，它通过自然对话方式做到对用户需求的理解与任务的执行。

既然是对话模型，首先要考验的是模型对于自然语义的理解能力。这方面中文相当有发言权。因为中文之所以复杂，除了本身表意的属性之外，在日常交流过程中，同样的文字、语句所表达的含义可能会随着语境、音调、习惯甚至是标点符号的变化而截然不同、传统的交互模型在面对中文这类复杂的自然语言的时候经常翻车，就是因为无法准确理解这些变化背后的含义。

举个例子：我单身的原因有两个：一是谁都看不上，二是谁都看不上。两个原因在语句上完全一样，但含义却截然不同。将中文作为母语的我们能够通过对整个语境的理解，很快明白二者之间的不同。

但AI会怎么理解呢？

我们将这句话输入ChatGPT，让它解释这两种说法有何不同。ChatGPT给出的解释是：

显然ChatGPT认为，这两种表述的意思都是一样的。只是“没有得到注意和认可”和“不被看重，缺乏吸引力”的区别。

再来看看讯飞星火给出的解释：

显然，讯飞星火模型给出的解释更为准确，它能够判断出这句话中“对别人的挑剔”，甚至还能够分析出一种说法是相对自嘲的，而第二种说法“显得自我膨胀”。这种判断是更符合我们对于这句话的双重理解的含义。

这里其实就体现了讯飞星火对于中文自然语义超高的理解能力，这主要是得益于其本身作为一款中国本土市场的AI模型，能够基于海量中文文本语料进行训练，同时在相关的核心算法上也更贴近与中文的使用环境和习惯，在对于中文自然语义的理解方面，讯飞星火认知大模型拥有先天的优势。

我们还输入了一些其他比较复杂，或者有多重含义的中文语句，讯飞星火都能够根据所在的语境的不同给出相对准确的判断，能够很自然的理解这些语句背后想要表达的真实意图。

生成文本能够“拿来即用”

相对于这些单一的自然语言的理解能力，文本生成能力应该是这类语言大模型在当下最具“生产力”的特性。讯飞星火同样支持强大的文本生成能力，它能够根据需求创作出邮件、讲稿、文案等等任何文本内容。

这种文本生产的过程非常简单，你只需要赋予身份、描述背景、提出需求，这三个步骤就能够让AI模型生成文本，最后你可以再根据生成的文本进行一些细节上的调整和条件的补充。经过我们的实测，讯飞星火大部分时候生成的文本，都能够做到“拿来即用”的水平。

还是举例来看，我们告诉讯飞星火：你现在是一位小学班主任，你的一名学生因为经常违反课堂纪律，现在需要给他的家长写一封书信，告诉他们孩子的基本情况并且希望他们能够协助你和学校妥善的解决这个问题。

以下是讯飞星火提供给我们的内容：

可以看到，讯飞星火能够根据你简单的描述，直接生成信件的基本内容。并且这封信件的内容本身在逻辑性、通顺性、可读性方面都没有什么问题。你可能注意到，这封信件的措辞和一些描述可能相对比较生硬和直接，需要修改地委婉一些。于是我们向讯飞星火提出需求：希望措辞能够委婉一些，并且淡化孩子违反纪律的描述，更注重强调孩子的教育和关切问题。

在我们提出了更细化的要求之后。讯飞星火能够准确理解“委婉”的含义，最终生成的文本内容在整体的措辞和语气方面都显得要温和许多。它甚至还能够自己拿出一些可行性的建议和意见，来解决存在的问题。让整个信件内容传达出了对孩子问题的关注，以及希望寻求家长的协助，共同来帮助他解决问题的态度。

现实中如果你真的想要借助星火来生成一些文本内容。你可以向它提出一些更为具体和细致的要求，进而获得更理想的最终文本。实际上，仅从文本内容的创作能力来看，讯飞星火这类AI的水平已经超过了大多数的普通人。

未来的想象空间还很大

除了上述的这些能力之外，讯飞星火还在诸多场景化的能力方面做出了尝试和创新。

比如在多题型可解析数学能力能力上，星火认知大模型目前就具备很强的能力，能够解答常见的计算、几何、方程、代数以及情景应用题等，我们尝试过将一些初高中的数学题直接输入模型，模型能够直接生成运算步骤和答案，准确率非常高。

尤其是在一些涉及到大量中文自然语义的情景应用题型上，星火认知大模型能够凭借自身更为本土化的中文语义理解能力，在运算的精确性上很多时候比GPT还要高。我们都知道，讯飞这些年在教育领域一直都有深入的拓展，推出了很多面向教育市场的产品，后续借助讯飞星火大模型的能力，这些教育类产品能力将会得到飞速提升，也将会给教育行业带来更多的赋能。从长远来看，讯飞在这方面的创新和布局，拥有很广阔的应用前景和想象空间。

和当前行业其他的大模型相比，讯飞星火目前在核心算法、数据积累、算力支撑等方面都有自己的独到优势。短期来看，立足于讯飞本身在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术方面优势积累，接下来我们有望看到讯飞星火能够不断地进行技术迭代，尤其是在中文认知的智能领域，有望实现对ChatGPT这样的行业标杆的追赶。

讯飞官方表示，当前讯飞星火在文本生成、语言理解、数学能力方面已经超过了ChatGPT。并且讯飞官方也公布了接下来的迭代升级时间节点：6月9日，星火将突破开放式问答、多轮对话能力明显提升、数学能力再升级；8月15日，代码能力升级以及多模态交互能力提升，希望能帮助到更多的合作伙伴及开发者团队；10月24日，将实现通用模型对标ChatGPT，中文超越ChatGPT的当前版本，英文能做到相当水平，并在教育、医疗等领域做到业界领先。

讯飞星火采用的是“1+N”架构，其中“1”是通用认知智能大模型算法研发及高效训练底座平台，“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。

在这次讯飞星火的发布会上，科大讯飞就重点发布了星火认知大模型在教育、办公、汽车、数字员工等行业的应用成果。比如给我们留下非常深刻印象的“星火认知大模型+讯飞听见”。借助星火认知模型的能力，还能够对文字内容进行深度分析，可以一键生成包括新闻稿件、宣传文案、多语种翻译等多种文本内容，它甚至还可以根据内容，进行提问追溯。对于我们这样的文字工作者来说，这些功能无疑是我们一直以来都梦寐以求的。

类似的应用场景还有教育行业，讯飞已经将星火认知大模型的强大能力加入到自家的学习机、办公本、录音笔等智能硬件设备上，实现诸如类人批改和修订语篇规整等多重的智慧能力。这些新功能的加入能够极大提升现有产品的使用体验，真正做到生产力的大幅度提升。另外，当前讯飞在国内车载智能语音应用已经做到了市场占有率第一，这一次认知大模型技术会让车载人机交互再上一个新的台阶，实现更自由、更拟人化地沟通。

未来，讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业，这也是接下来，讯飞这款大模型最值得关注的看点。