北京青年报—半两财经消息,4月7日晚,阿里云大模型“通义千问”启动邀测。至此,包括百度、阿里、京东等大公司均已公开发布大模型产品。北青报记者了解到,目前尚有多个公司已有或正在研发类chatGPT产品,分析认为,未来一段时间内,各公司将会密集布局相关产业和应用,4-5月将是产品密集发布期。
百度首发“文心一言”大模型
百度是国内首个公布对标ChatGPT产品的大厂。3月16日,百度发布了大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
比如在商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
百度介绍,文心一言是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。
在商业化方面,已有超过650家企业宣布接入文心一言生态。李彦宏预测,大语言模型将带来诸多产业机会。文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,农业、工业、金融、教育、医疗、交通、能源等重点领域,都会因此效率大幅提升,并在每一个行业快速形成新的产业空间,助力数字中国的实现。李彦宏预告称,百度智能云也在一周后举办了发布会,主题围绕文心一言的云服务和应用产品,既有公有云服务和也可以做私有化部署。此外,百度文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型。
阿里云“通义千问”开启邀请测试
4月7日,阿里云大模型“通义千问”启动邀测。据介绍,“通义千问”是一个专门响应人类指令的大模型。这款产品类似于chatGPT和文心一言,用户可以在线与它对话。
打开“通义千问”产品页面,用户可输入不多于1000字的问题,“通义千问”会很快给出回应。页面提示称,用户还可以让它“撰写短文”“写封邮件”“电影脚本”或者帮助写“职场报告”,甚至“撰写代码”。
不过,通义千问目前仅支持文字生成,目前不支持画图、语音、视频等多模态生成。当北青报记者让其“画一幅画”时,它回复“作为一个语言模型,我无法画出图片。但我可以用文字来描述一幅画。”随后还为自己描述了一副简单的画面。而当让它创作视频时,他回答“作为一个语言模型,我无法创作视频。但我可以为您提供一些关于视频创作的建议”。
此前据阿里研究院公布的信息显示,阿里巴巴达摩院在2020年初启动中文多模态预训练模型M6项目,在阿里云内部,M6大模型的应用包括但不限于在犀牛智造为品牌设计的服饰已在淘宝上线、为天猫虚拟主播创作剧本,以及增进淘宝、支付宝等平台的搜索及内容认知精度等,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等前景中落地。
腾讯生成式AI先应用于内部场景
3月22日,腾讯在业绩会上透露,生成式AI可以用来提升腾讯旗下旗舰产品的用户体验,未来可能每一个用户都会有人工智能助理,如果效果好,有可能将生成式AI纳入微信和QQ。
此前,2月初腾讯旗下腾讯研究院发布《AIGC发展趋势报告2023》,报告指出,在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。
AI大模型方面,腾讯表示正大力投入人工智能与云基础设施建设,腾讯混元AI大模型覆盖NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业与领域模型,还推出了万亿中文NLP预训练模型。
腾讯总裁刘炽平表示,腾讯不会匆忙推出产品,而是将花费时间打造一个经过多次迭代后的长期发展机会。腾讯将充分利用自身资源,如基础设施、数据和云计算基础设施,以及打造人工智能应用的长期实践,为聊天机器人产品打造基础模型技术。还将提高既有业务的增长和变现能力,同时寻找新的商业模式。
华为布局用于行业的大模型“盘古”
今年2月,华为公司在回答“华为在类似ChatGPT方向的布局”采访问题时表示,华为公司2020年开始在大模型有布局,2021年发布鹏城盘古大模型,是业界当时首个千亿级生成和理解中文自然语言处理大模型。之后,又陆续发布行业大模型系列。
据华为相关人士介绍,华为的大模型重点在于行业应用。当前,华为云基于盘古预训练大模型,打造了药物分子大模型、气象大模型,以及矿山、电力、金融、轨道等行业大模型,让人工智能开发标准化、可复制、批量化生产,为行业创新带来新的思路、新的方法及新的工具,加速AI深入千行百业,为行业应用带来突破性的进展。
京东推出产业版“ChatJD”
今年2月10日,京东云宣布将推出产业版ChatGPT:ChatJD。ChatJD智能人机对话平台,预计参数量达千亿级,将率先落地在零售、金融等两个领域。
京东方面认为,ChatGPT在通用性方面已经展现出强大的能力,但在忠实度、可信度、精准度方面还存在一些不足,这主要是由于在中间层缺少垂直的产业知识和领域知识,难以在真实应用层广泛落地开花。基于产业需求,京东云旗下言犀人工智能应用平台将推出ChatJD,定位为产业版ChatGPT,旨在打造优势、高频、刚需的产业版通用ChatGPT。
ChatJD 落地应用路线图,包含一个平台、两个领域、五个应用。1个平台:ChatJD智能人机对话平台,即自然语言处理中理解和生成任务的对话平台,预计参数量达千亿级。2个领域:零售、金融,得益于京东云在零售与金融领域10余年真实场景的深耕与沉淀,已拥有4层知识体系、40多个独立子系统、3000多个意图以及3000万个高质量问答知识点,覆盖超过1000万种自营商品的电商知识图谱,更加垂直与聚焦。5个应用:内容生成、人机对话、用户意图理解、信息抽取、情感分类,涵盖零售和金融行业复用程度最高的应用场景,在客户咨询与服务、营销文案生成、商品摘要生成、电商直播、数字人、研报生成、金融分析等领域将发挥广泛的落地价值。
商汤将于4月10日发布最新进展
商汤方面宣布将在4月10日下午举办技术交流日活动,分享人工智能技术的前沿进展,据悉,这次将公布其在大模型方面的最新情况。
商汤科技方面负责人曾表示,商汤早在2021年上市时便提出“一平台 四支柱”的战略定位,其中“一平台”就是指SenseCore AI大装置这一AI基础设施,它也是对于算法模型,特别是大模型开发提供重要的算力基础。
商汤SenseCore AI大装置完成2.7万块GPU的部署并实现了5.0 exaFLOPS的算力输出能力,目前可最多支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。商汤称,SenseCore已支持了超过10个大模型训练项目,包括语言、文生图、视觉、多模态模型。
商汤科技CEO徐立表示,商汤作为专注人工智能企业,未来首先将在大基础设施领域,为行业提供更好的算力基础赋能。在此基础上,商汤科技也将提供完整的框架,来赋能下游的行业应用。