OpenAI推出新款大模型Sora 可根据文本生成视频

Photo: Фото: Euronews.com

 (哈萨克国际通讯社讯)综合外媒报道,近日,美国人工智能研究公司OpenAI推出了一款视频生成模型“Sora”。

据OpenAI官网介绍,使用这款模型可以用文本生成长达一分钟的视频,视频可具有多个角色、特定类型的运动、精确主题和背景细节等复杂场景。

开发这一模型旨在教会人工智能理解和模拟运动中的物理世界,并训练其帮助人们解决需要现实世界互动的问题。

市场研究公司ABI research的高级分析师里斯·海登(Reece Hayden)表示,尽管“多模态模型”并不新鲜,而且文本到视频的模型已经存在,但OpenAI声称Sora具有的长度和准确性使其与众不同。

对“Sora”的介绍中,OpenAI指出,当前的模式存在弱点,可能难以准确地模拟复杂场景的物理表现,也可能无法理解因果关系的具体实例,并举例称,视频很可能会出现一个人咬了一口饼干后,饼干上没有咬痕。

同时,该模型还可能混淆诸如左和右这类的空间细节。

OpenAI表示,计划与专家团队合作测试最新模型,并密切关注包括错误信息、仇恨内容和偏见在内的各个领域。