您现在的位置是:首页 > 车险车险
中国首个Sora级视频大模型发布 性能全面对标国际顶尖水平
小财2024-04-28【车险】81569人已围观
凤凰网科技讯(作者/于雷) 4月27日,在今日举行中关村(000931)论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型――Vidu。Vidu是自Sora发布之后,全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。
该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。
Vidu的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构。2023年3月,团队开源了全球首个基于U-ViT融合架构的多模态扩散模型UniDiffuser,率先完成了U-ViT架构的大规模可扩展性验证。
基于对U-ViT架构的深入理解以及长期积累的工程与数据经验,团队在短短两个月里进一步突破了长视频表示与处理的多项关键技术,研发了Vidu视频大模型,显著提升视频的连贯性和动态性。
Vidu的问世,不仅是U-ViT融合架构在大规模视觉任务中的又一次成功验证,也代表了生数科技在多模态原生大模型领域的持续创新能力和领先性。作为通用视觉模型,Vidu能够支持生成更加多样化、更长时长的视频内容,同时面向未来,灵活架构将能够兼容更广泛的模态,进一步拓展多模态通用能力的边界。
(责任编辑:董萍萍 )
相关文章
- 澳洋健康(002172):独立董事工作制度(2024年4月)
- 永安期货(600927):永安期货股份有限公司2023年度内部控制评价报告
- 发现新质好公司 | 工业富联:AI服务器有望增厚利润,研发及供应链实力显著
- 盛邦安全2023年营收增长23%,网空地图产品营收增长42%
- 泸州老窖2023年年度董事会经营评述
- 上入“云端” 下接地气,苏州互联网法庭为“云”上断案探路
- 品牌升级聚焦高钙,奶酪博士发布行业首个儿童奶酪团标,同步上线10余款新品
- 浙江:适应数字经济发展,上线全国首个数据知识产权一体化服务平台
- 盛邦安全2023年营收增长23%,网空地图产品营收增长42%
- 盛邦安全2023年营收增长23%,网空地图产品营收增长42%