在ChatGPT的“继任者”GPT-4发布一天之后,3月16日,百度在北京公开展示了新一代知识增强大语言模型、生成式AI产品“文心一言”。
作为后来者,文心一言无法逃脱与ChatGPT对比的命运。此前,不少人认为百度是“全村的希望”,但也有网友用一张梗图表达了对文心一言的担忧。
之所以如此,在于谷歌此前急炫AI搜索肌肉时暴露出了若干个瑕疵,导致了股价暴跌近8%;这次,在发布会进行的同时,百度港股市值也大幅下跌超9%。
和ChatGPT一样,文心一言是一个多模态大模型,包括文学创作、商业文案创作、数理逻辑推算等能力。那么,这个中国版的ChatGPT到底实力如何?能否担得起“全村的希望”?记者对文心一言和ChatGPT进行了实测。
中文检索准确度高
文学创作偏理性
在文学创作上,文心一言一开场就被提问《三体》的文学常识。
看起来已是标准答案。再用同样的问题问ChatGPT呢?
延续了“一本正经”胡说八道的习惯:直接把刘慈欣的籍贯都给改了。
下一个问题是对《三体》进行续写。
看起来中规中矩,比较理性。然后是ChatGPT的答案。
自古“文无第一”,你对谁的续写思路更有兴趣?
能给公司起名字
更懂中文背后的寓意
接下来,文心一言展示了在商业文案创作上的能力。
比如,给新公司起个名字,并且还强调这个名字是有寓意的。
再看看ChatGPT的商业策划能力。
看起来,ChatGPT对中文的理解还是相对肤浅。
解小学奥数题无压力
还知道出错了题
数学计算能力是考验生成式大模型的一大难题。ChatGPT刚上线时,也翻了不少车。现场,文心一言被问到的是小学数学竞赛常见的鸡兔同笼问题。
值得一提的是,现场展示的第一题题目出错了,文心一言也给与了及时反馈。修改了题目后,文心一言给出了详细的解题步骤。