直接生成16秒高清视频 我国自研视频大模型在京发布
新华社北京4月27日电(记者魏梦佳)只需一段文字指令就能生成一段逼真视频,今年初,文生视频大模型Sora在全球人工智能业内外引发广泛关注。27日,2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。

图片来源于网络,如有侵权,请联系删除
记者从会上获悉,这一视频大模型由清华大学联合北京生数科技有限公司共同研发,可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容,不仅能模拟真实物理世界,还拥有丰富想象力。
清华大学人工智能研究院副院长、生数科技首席科学家朱军说,当前国内视频大模型的生成视频时长大多为4秒左右,Vidu则可实现一次性生成16秒的视频时长。同时,视频画面能保持连贯流畅,随着镜头移动,人物和场景在时间、空间中能保持高一致性。
在动态性方面,Vidu能生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换,包括能直接生成长镜头、追焦、转场等效果。
“Vidu能模拟真实物理世界,生成细节复杂且符合物理规律的场景,例如合理的光影效果、细腻的人物表情等,还能创造出具有深度和复杂性的超现实主义内容。”朱军介绍,由于采用“一步到位”的生成方式,视频片段从头到尾连续生成,没有明显的插帧现象。
此外,Vidu还可生成如熊猫、龙等形象。
据悉,Vidu的技术突破源于团队在机器学习和多模态大模型方面的长期积累,其核心技术架构由团队早在2022年就提出并持续开展自主研发。“作为一款通用视觉模型,我们相信,Vidu未来能支持生成更加多样化、更长时长的视频内容,探索不同的生成任务,其灵活架构也将兼容更广泛的模态,进一步拓展多模态通用能力的边界。”朱军说。
【责任编辑:陈听雨】
“直接生成16秒高清视频 我国自研视频大模型在京发布” 的相关文章
(原标题:上海生生招股书信披“自相矛盾”:子公司2017年成立 监事2010年已任职)图片来源于网络,如有侵权,请联系删除 欲冲刺“医药冷链第一股”的上海生生医药冷链科技股份有限公司(以下简称“上海生生”)主板IPO已恢复上市流程。 《大众证券报》明镜财经工作室记者发现,上海生生初始股东早在20...
(原标题:华庄科技:创始股东相关股权转让“疑影”重重)图片来源于网络,如有侵权,请联系删除 近日,冲击创业板IPO的广东华庄科技股份有限公司(下称“华庄科技”)已收到深交所向公司发出的第二轮审核问询函。此次IPO其拟募集资金4.5亿元,拟投入电子智造生产基地建设项目、研发中心建设项目、补充流动资金...
(原标题:兄弟科技再融资:前次募投发生重大变更、此次募投必要性与合理性存疑,业绩波动剧烈且期后录得巨亏、多元化下抗风险能力堪忧)图片来源于网络,如有侵权,请联系删除 多元化是一把双刃剑,其可以为企业提供营收增量业绩的同时,进入新业务领域也可能造成管理、市场等多种风险的加剧,甚至可能导致企业陷入财...
(原标题:唱响A股好公司系列海康威视:智能物联网万亿市场规模大趋势下,提前布局主业和创新业务的组合,面对未来不确定性具有较强韧性!)图片来源于网络,如有侵权,请联系删除 编者按:估值之家精心策划推出“唱响A股好公司系列”文章,本文系本系列中的第十二篇。图片来源于网络,如有侵权,请联系删除 中国...
27日,清华大学113周年校庆到来之际,清华大学成立人工智能学院,聚焦“人工智能核心基础理论与架构”和“人工智能+X”两个重点方向,以高定位和新机制建设中国自主的“AI顶尖人才和原始创新基座”。“图灵奖”获得者、中国科学院院士姚期智担任清华大学人工智能学院首任院长。图片来源于网络,如有侵权,请联...
(原标题:宏中药业北交所IPO:报告期内业绩突然爆发式增长,营业收入真实性存疑,部分财务数据呈现规律性变化)图片来源于网络,如有侵权,请联系删除 蕲春,湖北省黄冈市下辖县,据晋代刘伯庄《地名记》记载:“蕲春以水隈多蕲菜(水芹菜)”,因此得名。蕲,一名水芹,蕲春意为蕲菜之春。蕲春走出4,200余位...