近日,OpenAI发布的文生视频大模型Sora能够根据文本描述生成长达60s视频,这些视频不仅保持良好的视觉品质,还能完整准确地还原用户的提示需求,其背后隐藏的强大物理世界理解及模拟能力引发了科技圈一连串震惊和感叹。
除了非凡的文本-视频生成能力,Sora还具有复杂场景-角色生成能力、语言理解能力、图像-视频生成能力、多镜头生成能力、物理世界模拟能力等。
近日,OpenAI发布的文生视频大模型Sora能够根据文本描述生成长达60s视频,这些视频不仅保持良好的视觉品质,还能完整准确地还原用户的提示需求,其背后隐藏的强大物理世界理解及模拟能力引发了科技圈一连串震惊和感叹。
除了非凡的文本-视频生成能力,Sora还具有复杂场景-角色生成能力、语言理解能力、图像-视频生成能力、多镜头生成能力、物理世界模拟能力等。