没想到,众人加班加点抢“中国版ChatGPT”热度时,首个国内类ChatGPT模型竟然已经发布了!
砸出这个重磅消息的,不是紧锣密鼓宣传的BAT大厂,也不是直接出手几亿的投资大V,而是这段时间来一直没吭气的复旦大学。
事情一出,直接引爆了一众社交媒体,不仅在微博刷出数个热搜话题,知乎更是冲上热榜第一。
各路“ChatGPT爱好者”连夜赶来围观,甚至由于官网访问人数太多,服务器一度被挤爆,又上了一次热搜。
这是怎么回事?
原来,复旦NLP团队这个类ChatGPT模型,发布即面向公众进行内测,甚至连预告都没有:
紧接着,团队又投下另一颗重磅炸弹:模型3月份就会开源代码。
最关键的是模型的名字。
复旦团队用了《流浪地球》里面拥有自我意识的AI——MOSS来命名这一模型,直接把消息热度推上顶峰。
有网友表示,MOSS率先开放至少有一大优势,那就是“获得更多数据”:
ChatGPT有一个巨大的先发优势,就是通过抢先开始公测收集大量用户数据,并且这部分数据现阶段只有人家有。
算法都是成熟且公开的算法,真正的核心其实是数据和硬件。
说回模型本身。据MOSS自己介绍,它同样具备ChatGPT能实现的这些功能:
问答、文本翻译、摘要总结、故事撰写、情绪分析、建议提供、代码和算法编写等。
但实际测试效果又是如何,具体训练方法和效果会不会有什么差异?
我们一步步来看。
MOSS与ChatGPT相比效果如何?
据团队介绍,MOSS与ChatGPT主要有三大差异。
最主要的就是参数量的不同。MOSS模型的参数量比ChatGPT小了一个数量级。
然后是训练方式的不同。虽然MOSS也是自然语言模型基座训练+理解人类意图对话能力训练,但后者的训练方式与ChatGPT采用的RLHF不同。
复旦团队没有采取人工标注(指令微调)的方式来进行理解对话能力训练,而是基于与其他AI对话模型的交互来训练自己。
没错,相比人类调教,MOSS直接选择和其他AI模型进行对话……
最后是开放程度不同。ChatGPT背后模型目前还没有开源,但MOSS承诺会将代码开源。
说了这么多,MOSS的效果具体如何?
从官方给出示例来看,它问答和生成代码的能力似乎还不错。