距离上一个大版本仅两个月过去,科大讯飞在 1024 对外正式推出讯飞星火认知大模型 3.0 版本。
今年 5 月,讯飞星火认知大模型刚刚面世时,科大讯飞董事长刘庆峰曾立下 Flag:10 月 24 日,星火认知大模型的能力要全面对标 ChatGPT。
在今天的发布会上,刘庆峰对外正式宣告,星火 V3.0 已经实现全方位超越 ChatGPT,在中文上实现全面超越,在英文上实现对标。
相较于上一个版本,讯飞星火 3.0 版本在文本生成、语言理解,知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力上继续升级,并且推出了个性化功能。
多项能力的提升,推动了更多应用场景的落地,落地价值开始彰显。在此次发布会上,讯飞对外介绍了智能编程助手 iFlyCode2.0、星火科研助手、启发互动式英语 AI 答疑辅学、青少年 AI 心理咨询、AI 健康助手等一系列细分场景应用,并对外发布了金融、汽车、运营商、工业、住建、物业、法律等十二个行业模型。
刘庆峰称,通过与华为在算力上共同合作,讯飞在半年内实现了星火大模型训练和推理效率翻番。讯飞联合华为共同发布 “飞星一号” 大模型算力平台,并启动对标 GPT-4 的更大参数规模的星火大模型训练,2024 年上半年将实现对标 GPT-4。
七大维度全面升级,整体超越 ChatGPT
从大模型本身的技术升级来看,这次讯飞星火 V3.0 在其七大核心能力上都有不同程度的提升。
其中,代码能力、数学能力、主动对话、小样本学习、多模态指令跟随、个性化等能力是此次提升的重点和亮点。
先从代码能力上看,星火 3.0 版本进一步提高了代码的项目级理解能力,大模型能够理解和执行更复杂的代码生成要求,适用场景增多,降本增效效果更加明显。
发布会上,刘庆峰展示了一个简单的 Python 生成 Prompt,要求大模型 “用 Python 代码画出一个大大的心形,然后里面大大小小的五颜六色的很多星星逐步呈现出来。”新版本大模型在代码能力上的项目理解能力被强化,不再只能执行单一的任务要求。
在全新的星火大模型对话页面,Python 能力也被单独归纳成为一个小组件,可供用户在单独环境下使用。
由于发布会上介绍,升级过后的星火大模型在 Python 代码生成能力上已经超越了 ChatGPT,但距离 GPT-4 还有一定差距。
机器之心第一时间体验了讯飞星火 V3.0,接下来我们选取一个 Python 问题 ——“编写一个 Python 程序,实现一个简单的聊天机器人,能够回答用户的问题”,分别让 ChatGPT 以及星火 3.0 进行生成,最后用 GPT-4 对这两者的答案进行检验和点评。