2月16日凌晨,OpenAI发布了首款文本生成视频大模型Sora,再次震惊了全世界。Sora官网上更新的48个视频demo,给大家带来的感受就是:以前不相信是真的,现在不相信是假的。
Sora生成视频长度和质量如何?
Sora模型可以生成长达60s的高清视频,而且质量高,几乎可以秒杀其他视频生成平台。相比之下,其他平台如Pika只能生成4s的视频,而且质量较低。技术上看,Sora模型将视频生成领域提升到了一个新的水平,被认为是视频生成领域的2.0版本。其创作的视频质量高,几乎看不出是由人工智能生成的。
Sora模型有哪些优势?
准确性和多样性
Sora能够准确解释长文本提示,并生成多样化的高质量视频,覆盖了广泛的主题和场景,从人物到风景、城市场景等,使用户能够获得满足其需求的多样内容。
强大的语言理解
利用DALL-E模型的re-captioning技术,Sora能够将用户提供的文本提示转换为详细的描述,同时利用GPT技术将简短提示转换为更详细的内容,从而精确生成视频。
以图/视频生成视频
Sora不仅可以将文本转化为视频,还能接受其他类型的输入,如图像或视频,使其具有执行广泛图像和视频编辑任务的能力。
视频扩展功能
Sora可以根据已有的图像或视频创建视频,同时可以沿时间线向前或向后扩展视频,展现了其在视频编辑方面的无限潜力。
优异的设备适配性
Sora具备出色的采样能力,可以轻松适配各种设备的视频尺寸需求,同时能够以小尺寸迅速创建内容原型。
场景和物体的一致性和连续性
Sora能够生成带有动态视角变化的视频,处理物体遮挡问题,并确保画面主体即使暂时离开视野也能保持不变,从而提高了视频的连续性和真实感。
哪些领域可能优先受到Sora模型的影响?
Sora生成的视频让大家感受到,通用人工智能(AGI)正在加速到来。虽然Sora官方表示发布初衷是“帮助人们更轻松地创建和分享视频内容,而不是取代传统的视频制作方式”,但相信很多人已经感受到了职业危机即将到来。
娱乐影视
Sora模型的出现将大大简化动画和影视制作过程,减少制作成本和时间,同时提高创作效率。这可能会带来一场影视产业的变革,让更多人可以参与到内容创作中,促进产业的多样化和创新。
教育学习
Sora可以被用来创建生动的视频教程,提高学生的学习兴趣和效果。同时,它也可能改变教育的方式,使得学生在实践中掌握更多的技能,而不仅仅是传统的课堂教学。
广告营销
Sora模型可以帮助品牌创造更具吸引力的广告视频,降低制作成本,提高广告效果。这可能会改变传统广告公司的商业模式,加速广告行业的数字化转型。
新闻社交
利用Sora生成视频内容可以提高报道的时效性,保证内容的流行度。这可能会改变新闻报道和社交媒体内容创作的方式,让更多人可以参与到内容创作中。
科学研究
科研人员可以利用Sora创建复杂的动态模拟,帮助他们研究物理、化学、生物等领域的现象。这将推动科学研究的虚拟化和可视化,促进科研成果的共享和交流。
总之,Sora降低视频制作门槛,加速视频生产效率,带来更多创意可能性、视频多元化个性化,降低视频创作成本。Sora虽然能生产一个好视频,但视频的主题、脚本和分镜头策划、台词的配合,都需要人的创意,至少需要人给提示词。相信科技的变革,在带来危机的同时,也在带来新的机遇。