中国团队发布视频大模型Vidu 称达到Sora级别

中国科研团队在一场未来人工智能先锋论坛上，发布视频大模型Vidu，称它达到了Sora级别。

据中国新闻网报道，清华大学联合生数科技星期六（4月27日）在2024中关村论坛年会未来人工智能先锋论坛上，正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。

该模型采用团队原创的Diffusion与Transformer融合的核心技术架构U-ViT，支持一键生成长达16秒、分辨率高达1080P的高清视频内容。

据介绍，Vidu不仅能够模拟真实物理世界，还拥有丰富想象力，具备多镜头生成、时空一致性高等特点。Vidu是自Sora今年2月发布推出之后全球率先取得重大突破的视频大模型，性能全面对标国际顶尖水平，并在加速迭代提升中。

清华大学教授、生数科技首席科学家朱军在论坛上说，与Sora一致，Vidu能够根据提供的文本描述直接生成长达16秒的高质量视频。除在时长方面的突破外，Vidu在视频效果方面实现显著提升，主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。

朱军说：“值得一提的是，Vidu采用的是‘一步到位’的生成方式。Vidu的命名不仅谐音‘Vedio’，也蕴含‘We do’的寓意。”

中国科研团队在一场未来人工智能先锋论坛上，发布视频大模型Vidu，称它达到了Sora级别。据中国新闻网报道，清华大学联合生数科技星期六（4月27日）在2024中关村论坛年会未来人工智能先锋论坛上，正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。该模型采用团队原创的Diffusion与Transformer融合的核心技术架构U-ViT，支持一键生成长达16秒、分辨率高达1080P的高清视频内容。据介绍，Vidu不仅能够模拟真实物理世界，还拥有丰富想象力，具备多镜头生成、时空一致性高等特点。Vidu是自Sora今年2月发布推出之后全球率先取得重大突破的视频大模型，性能全面对标国际顶尖水平，并在加速迭代提升中。清华大学教授、生数科技首席科学家朱军在论坛上说，与Sora一致，Vidu能够根据提供的文本描述直接生成长达16秒的高质量视频。除在时长方面的突破外，Vidu在视频效果方面实现显著提升，主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。朱军说：“值得一提的是，Vidu采用的是‘一步到位’的生成方式。Vidu的命名不仅谐音‘Vedio’，也蕴含‘We do’的寓意。” 《联合早报》中国

正文完

发表至：联合早报

2024-04-28

中国多地高校禁止学生五一长假自行组团出游

中国团队发布视频大模型Vidu 称达到Sora级别

字节发布豆包大模型家族，一块钱生成三本《三国演义》，价格比行业便宜 99%

[VPS] 出狗云韩国经典云 1c1g（已加 0.8 折扣）

[问与答] 锁续期和锁归属问题？

[Apple] 0 分钟前刚拆箱 iPad Pro 2024 款 12.9 寸+256G，有关于体验问题的可以问

[问与答] 请问如何禁止 Edge 修改地址栏搜索引擎？

出海执业，中国医生的新选择？

South Africa asks World Court to order Israel’s withdrawal from Rafah

苹果发布 tvOS 17.5 正式版、HomePod 17.5 更新

Former USS Howard CO was fired after ‘racially harassing comments’

美国国务卿布林肯发表涉台声明，外交部回应！

babymonster 抗洪失败

宁德时代 2024 年一季度净利润 105.1 亿元同比增长 7%，营收下降 10.41%

[求职] 怎么背八股啊。。。

马斯克：特斯拉或很快在中国市场推行完全自动驾驶

氯雷他定

Police hunt former cop after two women are found dead and a child is abducted

大众集团一季度全球销量超 210 万辆，营业利润同比下降 20%

向世界展示汉服之美

[投资] 我也说个炒股风波

女子丰胸检出骆驼等动物源性成分

留言板 +—