近日,AI创业公司「月之暗面」近期已完成新一轮超10亿美金融资,投资方包括阿里、红杉中国、小红书、美团,砺思资本等老股东跟投。本轮融资后,月之暗面估值已达约25亿美金,为国内大模型领域的头部企业之一。
据了解,自ChatGPT掀起全球浪潮以来,这是国内AI大模型公司迄今获得的单轮最大金额融资。
那么,月之暗面究竟有何魔力?
月之暗面创业团队背景深厚,长文本处理能力价值凸显
月之暗面是国内大模型领域的关键玩家。自成立以来,强大的创业团队、长文本和ToC一直是月之暗面的关键词。
创业团队方面,目前月之暗面团队人数已超80人,由清华大学交叉信息学院的杨植麟教授领衔。据介绍,创始人杨植麟虽然是一位90后,但却在学术界有着深厚的积累,其不仅拥有清华大学计算机科学的背景,以及卡内基梅隆大学的博士学位,还曾与多位图灵奖得主合作发表过论文,其学术成就和行业经验,为月之暗面带来了强大的技术背书。
团队成员中还包括来自Google、Meta、Amazon等国际科技巨头的人才,其核心团队曾参与到Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发中。其中,值得一提的是,联合创始人周昕宇和吴育昕,在拥有清华大学背景的同时,也拥有在旷视科技和Meta等知名科技公司的工作经验。
可见,月之暗面拥有一支在大模型道路上探索多年的队伍。
专业的团队仅是各路资本看好月之暗面的原因之一。强大的技术背景和研发能力造就的高端产品,是月之暗面能够持续获得看好的重要基础。
据悉,023年10月,月之暗面正式推出首个面向C端的产品“Kimi智能助手”,这是月之暗面做To C超级应用的第一次尝试。杨植麟曾表示,ToC就是一个自然而言的选择,他看到的是一个成为AI时代Super App的机会。
应用方面,Kimi Chat通过创新的网络结构和工程优化,在千亿参数下实现了无损的长程注意力机制,不依赖于滑动窗口、降采样、小模型等对性能损害较大的“捷径”方案。这些改进允许Kimi Chat在不牺牲理解能力和生成质量的前提下,处理长达20万汉字的输入,这在当前的AI模型中是非常罕见的。
据了解,月之暗面第一次亮相,没有写诗,没有写代码,而是用一个支持20万汉字的超长文本输入的AI产品完整吃下了一本《三体》。这在当时已经是市面上可使用的大模型中文本输入长度最长的一个。与月之暗面亮相同期,文本长度方面最引人关注的Claude-100k换算成汉字也只有8万字左右。
当前大模型落地的瓶颈,不仅有参数规模大小(即模型计算能力),还有模型的“内存”大小,即记忆力。每轮对话能处理多少上下文信息,决定着AI应用的体验好坏。
数据显示,其实际使用效果能够支持约20万汉字的上下文,2.5倍于Anthropic公司的Claude-100k(实测约8万字),8倍于OpenAI公司的GPT-4-32k(实测约2.5万字)。
可见,相比当前市面上一些追求“面面俱到”的大模型,月之暗面的大模型Kimi Chat的主攻方向更加触及当前大模型的技术本质,更专注于长文本方面的能力,这也恰好迎合了“处理海量信息”这一市场需求。
相比于或保守或跟风地投身B端市场的众多国产大模型,Kimi Chat却明确定位于C端市场,通过提供个性化和便捷的AI服务,与同类大模型形成了差异化竞争。
而上述优势也让Kimi Chat在金融、法律、科研等需要快速分析和总结长篇文档的领域,展现出了巨大的潜力。
月之暗面躺平稳赢,为时尚早?
不过,暂时脱颖而出的月之暗面还不能完全“躺平”。
从国内的AI竞赛来看,通用大模型领域的第一梯队也已经清晰展现。据当前公开信息,除月之暗面以外,包括智谱AI、MiniMax、百川智能、零一万物在内的创业公司,估值都已达10亿美金后。
而这五家初创公司中,阿里巴巴目前已经投资了MiniMax之外的其余四家;腾讯投资了包括智谱AI、百川智能以及MiniMax在内的三家;美团则参与了智谱AI和月之暗面两笔融资。
有业内人士分析称,当前头部的大模型公司的融资窗口仍在开放,“军备竞赛”还未告一段落。
此外,随着OpenAI发布的首个AI视频模型Sora问世,以及谷歌最新多模态模型Gemini Pro 1.5的重磅发布,有业内人士猜测,大模型创业公司的未来发展重点也在随之改变,多模态模型或将成为新的核心竞争点。
目前,多模态技术的需求正在不断增长。据了解,很多应用场景如果没有多模态技术支持几乎难以实现,尤其是在需要处理多种类型数据的领域,例如医疗、机器人、电商、零售、游戏等。
但是,多模态技术有着高标准的技术要求。有业内人士表示,一个好的多模态大模型评分标准应该具备四大特性。
第一,应该覆盖尽可能多的范围,包括感知和认知能力(感知是认知的基础);第二,它的数据或者标注应该尽可能避免采用已有的公开数据集,以减少数据泄露的风险;第三,指令设计应该尽可能简洁,并且符合人类的认知习惯;第四,多模态大模型在该简洁指令下的输出应该是直观的、并且便于定量统计。
因此,相比起以文本为主的大语言模型,以图像、视频为主的多模态模型,训练成本更高,未来将会需要更巨量的资金和人才,月之暗面将会面临更多挑战。
据业内人士透露,训练一个通用大模型,可能需要花费5000万元左右,而这只是一次的训练成本,还不包括后续的优化、更新、部署等费用。这样的成本对于大多数创业公司来说是难以承受的,甚至对于一些互联网巨头来说也是不小的负担。
同时,大模型并不是一劳永逸的,随着数据量和需求的增加,需要不断地进行调整和改进,否则就会出现“幻觉”问题(指模型生成不正确、无意义或不真实的文本)或者落后于竞争对手。
好在,月之暗面早已“未雨绸缪”。
据了解,月之暗面当前已经在秘密研发通用多模态模型,预计今年内将推出。月之暗面在多模态相关技术上多有储备,团队成员曾发明了包括基于对比学习的视觉预训练范式MoCo、最高效的视觉网络结构之一ShuffleNet等,也有团队成员主导开发了detectron2,后者是一个被广泛使用的视觉开源项目,曾被集成到Meta全线VR/AR产品中。