【笔者简介】松果出自私募冠军团队,累积规模10位数。13年投资经验,擅长抄底和重组,现为阳光私募基金经理。
一、CHATGPT的下一站,GPT4多模态
尽管官方尚未正式宣布,但是多家外媒纷纷报道,GPT-4可能将于2023年某个时间点推出。
根据《财富》杂志报道,OpenAI还有更多创新蓄势待发,OpenAI在贝塔测试版GPT-4中采用了更强大的大语言模型,预计该版本将于今年甚至很快发布。GPT4有可能是一个多模态模型,可用于图像等领域。根据财富杂志报道,OpenAI也确实在开发一款通过文字能生成视频的AI模型。若GPT4转向多模态,未来输入输出可能出现图像、视频等形态,有望打开下游千行百业应用空间。NLP只是大模型的应用领域之一,未来大模型的输入输出可以不仅限于文字,虽然当前影响力最强的ChatGPT是NLP模型,还可以包括图像、视频等多种形式,成为多模态模型。
二、GPT4打开市场想象力
据国盛证券研究,传统的CNN演绎下视觉应用解决问题都是单点模式,CHATGPT多模态有望带来通用模式。传统CNN模式下,视觉AI公司倾向于采用单点方式,在各个碎片场景中做客制化落地,定制化程度相对较高;若转向大模型模式,GPT4的多模态能力有望带来通用化的模式,显著提升AI模型生产效率。例如,商汤科技的SenseCore AI大装置中,模型层的模型工厂可以大幅降低人工智能生产要素的成本,提高人工智能的生产效率,实现人工智能以自动化、自适应的方式进行生产和落地,模型工厂已开发超过49000个商用人工智能模型。我们认为,若GPT4转向多模态,图像、视频等应用将层出不穷涌现。其使用场景将远远不仅限于文字、问答与办公,打开有望未来AI在下游千行百业的应用空间,进一步打开市场想象力。
三、今日AI生成视频发酵,相关概念梳理:
当虹科技:公司下设音视频高级技术研究部,研究方向为视频编解码引擎及人工智能,为底层算法研究部门。
网达软件:公司坚持“高新视频与人工智能结合”的发展战略,持续专注计算机视觉算法,将人脸识别、人体识别、人像处理、图像处理、物体识别等算法和视频资源进行整合,布局多领域、多方向前沿研究,打通 AI 在各个垂直场景中的应用,为智慧商业网点、智能生产监管、智能社会安全等领域提供解决方案。
云从科技:公司在技术研究方面一直保持较大投入,在视觉、语音、NLP等方向上都在实践类似于ChatGPT的“预训练模型+反馈调优”的技术路线,通过自研的视觉大模型和NLP大模型,大幅提高了算法的生产效率,也进一步提升了公司核心算法的效果。
大华股份:公司基于深度学习的视频结构化技术,完成视频中人、车和物的检测及各类属性的提取,多项性能指标已经达到国际一流,支持各种功能40余项;同时加大行业算法布局,针对各个子行业大力提升算法性能。
海康威视:安防视频监控领域龙头;深眸系列双目产品支持人脸识别、人脸动态对比,“脸谱”人脸智能分析服务器,“明眸”近景人脸识别产品,涵盖诸多边缘设备,支持大容量人脸比对及照片防假;未来重点布局生物识别技术。
数码视讯:公司多年来积极研发AI技术,在视频内容领域,公司通过AI技术对视频内容分辨率进行智能提高,自动生产获取高于成像系统分辨率的图像,利用AI算法AIGC自动生产高清、超高清视频内容。公司的AI技术还可对于设定的识别元素,实现快速的识别整理并AIGC生产单个视频。
粤传媒:参股公司影谱科技是一家AI影像生成基础设施及服务提供商。公司总部位于北京,业务范围辐射全球。致力于智能影像生产领域的视觉技术企业,通过在人工智能、视频结构化、深度学习等领域的技术,提供基于智能影像生产等相关技术的商业化综合服务。
宣亚国际:公司控股子公司云目未来科技有限公是一家依托深度学习与计算机视觉技术,用AI“理解”视频内容的科技公司。云目未来以海量图像训练的深度学习算法模型为基础,以AI视频技术为核心,推动政企提升在视频内容领域智能处理的效率,帮助政企克服未来海量数据对工作的挑战。
会畅通讯:AIGC是公司三维云视频(元宇宙产品)新产品的主要方向之一,基于AI的文字生成能够帮助改善企业元宇宙沟通的方式和效率。
恒信东方:公司AI 合家欢平台产品实现了基于单目摄像头的多人面部识别、人脸匹配技术;在动画影像中的实时追踪人脸替换技术。完成了无障碍人机沟通、智能交流、精确控制的语音交互系统。