0°

现场实测,三大能力超越ChatGPT,科大讯飞「星火」大模型如约而至

  如若问谁最有希望在中国实现智慧涌现,十多年前科大讯飞成立时的那个回答依旧铿锵有力:要么率先燎原,要么率先熄灭。

  历时 5 个月、100 多天,5 月 6 日下午 2 点,科大讯飞「星火」认知大模型如约而至。

  发布会独具匠心,亮点一分为二:「1」 + 「N」。

  上半场围绕「1」,聚焦「星火」通用能力展示。无论是挖坑设雷还是烧脑为难,「星火」应对自如,会场不时响起掌声和笑声。

  下半场由「1」生「N」,旗下首批获「星火」加持的产品矩阵登台亮相。从教育、办公、车载到虚拟人,一次次人机交互体验盛宴,让人很难按捺点击购买的冲动。

  与之前其他公司大模型发布活动不同,本次发布是一场产品级发布会——购买相应硬件产品,用户即可升级系统,立刻体验大模型带来的神奇能力。

  AI 大模型将带来终端数量和产业规模 10 倍以上的提升,科大讯飞董事长刘庆峰在会上表示,未来,「星火」认知大模型「1+N」的技术红利将通过「平台+赛道」的商业逻辑逐步兑现。

  科大讯飞董事长在发布会上。

  一、「1」:七大维度体验「星火」的通用能力

  发布会开宗明义,为了科学 PK ChatGPT 能力,科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖 7 大类 481 个细分任务类型。

  其中,7 个能力具体包括语言理解、知识问答、逻辑推理,数学能力、代码能力以及多模态能力。

  先说结果:目前「星火」通用能力业内明显领先。中文方面,当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超 ChatGPT,10 月底将整体赶超 ChatGPT。

  10 月 24 日开发者大会上,「星火」要「对标 ChatGPT,在中文上超过,在英文上要达到跟它相当的水平。」刘庆峰在发布会上表示。

  接下来,我们看看这些能力的现场展示,包括机器之心内测体验。

  1、长文本生成能力。 「星火」现场演示了撰写大会欢迎词、翻译机英文品宣文案等能力。不过,让人倍感温度的案例是给孩子讲故事。

  「在今天的讯飞星火认知大模型的发布会上,孙悟空和奥特曼也偷偷潜入了现场,他们都抢着想做星火大模型的发言人,还为此吵了一架。」 科大讯飞副总裁、研究院院长刘聪起了一个头,「星火」立刻娓娓道来一段故事。

  每问一次,它讲述的故事都不一样。你不仅可以语音输入开头和故事要求,还能选择喜欢的合成声音甚至配合虚拟人形象,将这个故事说给孩子听。

  会场之外,机器之心也没闲着。我们以《麦田守望者》为题,要求「星火」创作一首现代诗歌和古代的绝句,你看,还不错。

  绝句最后一句对仗还是存在瑕疵。

  机器之心又让「星火」写一篇《荒野的呼唤》读后感,完全合格。

  现在化身婚礼策划,给窦骁和何超莲做一次婚礼策划吧!不知道窦骁有没有从大模型获取婚礼策划灵感呢?

  为了体验「星火」生成摘要的能力,机器之心故意输入一篇很长的专访,结果发现,摘要基本覆盖了核心内容。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论