电竞周至对标Sora 生数科技结合清华推出邦内首个纯自研视频大模子 大模界

发布日期:2024-05-04 20:18浏览次数:

  最新传达:已有24人确认归天,20辆车失守!梅大高速塌陷地段已下雨近一个月,景象部分曾指挥防御山体滑坡

  最新动静!高速塌方已致36人归天!血库急急电竞,市民深夜列队献血;事件道段筑成通车不到十年

  4月27日,正在中闭村论坛他日人工智能前锋论坛上,生数科技共同清华大学正式颁发中邦首个长时长、高相同性、高动态性视频大模子Vidu。

  据悉,该模子采用Diffusion(扩散概率模子)与Transformer调和的架构U-ViT,助助一键天生长达16秒、折柳率高达1080P的高清视频实质。生数科技方面先容,与Sora相同,Vidu可以遵循供给的文本描画直接天生长达16秒的高质地视频。

  生数科技方面先容,其主题技巧U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是环球首个Diffusion(扩散概率模子)与Transformer调和的架构,完整由团队自立研发。

  Vidu所天生的短片,采用的是“一步到位”的天生格式,与Sora雷同,文本到视频的转换是直接且贯串的,正在底层算法完成上是基于简单模子完整端到端天生,不涉及中央的插帧和其他众步伐的惩罚。

  所谓插帧即通过正在视频的每两帧画面中填补一帧或众帧来晋升视频的长度或贯通度。这种要领需求对视频实行逐帧惩罚,通过插入卓殊的帧来改正视频长度和质地,是一个分步伐的流程。但Vidu与Sora则是通过简单步伐直接天生高质地的视频,无需经历众个步伐的环节帧天生和插帧惩罚。

  2023年3月,生数科技团队开源环球首个基于U-ViT架构的众模态扩散大模UniDiffuser,正在环球限制内率先落成调和架构的大界限可扩展性(Scaling Law)验证。UniDiffuser是正在大界限图文数据集LAION-5B上陶冶出的近10亿参数目模子,助助图文模态间的大肆天生和转换。正在架构上,UniDiffuser比同样是DiT架构的Stable Diffusion 3领先了一年。

  生数科技暗示,大模子的冲破是一个众维度、跨规模的归纳性流程,需求技巧与家产操纵的深度调和。于是正在颁发之际,生数科技正式推出“Vidu大模子配合伙伴铺排”,诚邀家产链上下逛企业、切磋机构参与,协同修筑配合生态。

  生数科技缔造于2023年3月,公司创始团队来自清华大学人工智能切磋院,是环球限制内最早从事扩散概率模子切磋的团队之一。截至目前,生数科技已落成数亿元融资,投资方搜罗启明创投、蚂蚁集团、BV百度风投、达泰血本、锦秋基金、卓源亚洲等出名机构。

  2未经《逐日经济音讯》授权,不得以任何格式加以利用,搜罗但不限于转载、摘编、复制或创设镜像等,违者必究。

如果您有什么问题,欢迎咨询技术员 点击QQ咨询