我国自研视频大模型面向全球上线|
输入文字描述或上传图片,就能生成一段逼真视频。近日,我国自主研发的通用视频大模型Vidu(www.vidu.studio)面向全球正式上线。据悉,这款视频大模型开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P,生成一段4秒的视频片段经实测仅需30秒。
图为根据文字描述用Vidu生成的视频画面。(受访者供图)
Vidu由清华大学联合北京生数科技有限公司共同研发,于今年4月在2024中关村论坛年会上首次发布。清华大学人工智能研究院副院长、北京生数科技首席科学家朱军介绍,Vidu具有“长时长、高一致性、高动态性”的特点,可根据文字和图片生成高清视频,且能保持高流畅、高动态的画面效果。截至目前,Vidu可支持一次性生成最长32秒的视频。
“Vidu能模拟真实物理世界,生成细节复杂且符合物理规律的场景,例如合理的光影效果、细腻的人物表情等,还能创造出具有深度和复杂性的超现实主义内容。”朱军说,对于科幻、西部、浪漫、动画等多类型电影,Vidu能生成符合对应风格的画面片段,还能生成影视级特效画面,如烟雾、炫光等效果。
图为根据文字描述用Vidu生成的特效画面。(受访者供图)
据介绍,在动态性方面,Vidu可生成复杂动态镜头,支持大幅度、精准的动作生成,能在画面里实现远景、近景、中景、特写等不同镜头的切换,能直接生成长镜头、追焦、转场等效果。
记者从北京生数科技有限公司获悉,除文生视频和图生视频的两大基础功能外,为了给用户提供更多样化和个性化的视频创作体验,Vidu还上线“动漫风格”和“角色一致性”两大新功能。在“图生视频”板块中,利用“角色一致性”功能,用户可上传人像图或自定义的角色图,通过文字描述就可指定图中角色在任意场景中做任意动作。该功能简化了视频制作流程,也提升了创作自由度。
据悉,操作Vidu无需申请,用户直接使用邮箱注册即可上手体验。Vidu的技术突破源于研发团队在机器学习和多模态大模型方面的长期积累,其核心技术架构由团队在2022年就提出并持续开展自主研发。
来源 新华社
编辑 骆航念
二审 杨韬
三审 周文君
搜狐小时报:拳王1.3游戏攻略与更新信息
2025.05.01,JEALOUSVUE平台成人内容享受与优惠信息🐭国研精华液一二三区区别🔇WRITEAS平台如何通过夹东西出门🍎🍀WRITEAS平台上分享冰棍创意的独特方式
伽罗躺床流白色分泌物
2025.05.01,梦幻手游技能图标全面解析帮助玩家快速上手💣🔩探讨父亲与孩子关系中的深层次情感与心理草草最新发地CCYY备用资源汇总与使用说明🐬🍎久久日产一线二线SUV车型对比与推荐🚨人狗大战2中文版在哪里看
早报:恨锁金瓶与醉闹葡萄架的精彩故事解析与探讨
2025.05.01,部部夸电影百度影音解析与观影体验分享🪰🔩🌵一注守号技巧揭秘助你彩票中奖概率提升🐭⭕🔩大巴车最后一排的秘密曝光乘客必知的舒适体验🎯🪖职场潜伏心理学书籍下载与实用技巧分享
XL上司的樱花未增删翻译全方位解析多元文化)
2025.05.01,陪读生的秘密校内生活与情感纠葛分析🔻YELLOW日本动漫免费在线观影平台🛩️🛟🍇兜兜动漫:热门动漫推荐与精彩剧情分析🔔北条麻妃出租车相关事件引发关注探讨娱乐圈与现实生活的界限
据报道:雯雅婷的五种出招表解析助你成为游戏高手
2025.05.01,羞羞漫画免费版在线阅读全攻略🐧🔔⛏️精彩片段解析与角色深度剖析科技大学视频12分钟精彩内容📵🔗🧁热潮红🛑无颜之月花未增删内容翻译深度解析小说情节
黑寡妇v3pro与ROGRX的全面对比评测
2025.05.01,歪歪漫画登录界面及最新漫画首页体验🐍🐄《小米和爷爷》第一章阅读感受温暖故事带来的情感共鸣🐌🍌TTTZZZ668.SU黑料不打烊❕🫐🐵七月雪电视剧全集高清免费观看尽在这里!
责编:陈乐融
审核:阮某
责编:陈哲