我国自研视频大模型面向全球上线|
输入文字描述或上传图片,就能生成一段逼真视频。近日,我国自主研发的通用视频大模型Vidu(www.vidu.studio)面向全球正式上线。据悉,这款视频大模型开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P,生成一段4秒的视频片段经实测仅需30秒。
图为根据文字描述用Vidu生成的视频画面。(受访者供图)
Vidu由清华大学联合北京生数科技有限公司共同研发,于今年4月在2024中关村论坛年会上首次发布。清华大学人工智能研究院副院长、北京生数科技首席科学家朱军介绍,Vidu具有“长时长、高一致性、高动态性”的特点,可根据文字和图片生成高清视频,且能保持高流畅、高动态的画面效果。截至目前,Vidu可支持一次性生成最长32秒的视频。
“Vidu能模拟真实物理世界,生成细节复杂且符合物理规律的场景,例如合理的光影效果、细腻的人物表情等,还能创造出具有深度和复杂性的超现实主义内容。”朱军说,对于科幻、西部、浪漫、动画等多类型电影,Vidu能生成符合对应风格的画面片段,还能生成影视级特效画面,如烟雾、炫光等效果。
图为根据文字描述用Vidu生成的特效画面。(受访者供图)
据介绍,在动态性方面,Vidu可生成复杂动态镜头,支持大幅度、精准的动作生成,能在画面里实现远景、近景、中景、特写等不同镜头的切换,能直接生成长镜头、追焦、转场等效果。
记者从北京生数科技有限公司获悉,除文生视频和图生视频的两大基础功能外,为了给用户提供更多样化和个性化的视频创作体验,Vidu还上线“动漫风格”和“角色一致性”两大新功能。在“图生视频”板块中,利用“角色一致性”功能,用户可上传人像图或自定义的角色图,通过文字描述就可指定图中角色在任意场景中做任意动作。该功能简化了视频制作流程,也提升了创作自由度。
据悉,操作Vidu无需申请,用户直接使用邮箱注册即可上手体验。Vidu的技术突破源于研发团队在机器学习和多模态大模型方面的长期积累,其核心技术架构由团队在2022年就提出并持续开展自主研发。
来源 新华社
编辑 骆航念
二审 杨韬
三审 周文君
搜狐小时报:魔法盾补丁安装教程与常见问题解决
2025.05.01,一同看彩虹2023年最新活动安排与参与方式🪖深入分析may18_XXXXXL56endian的潜在影响及相关话题羞羞漫画网站免费漫画资源大全🌪️🛟🐱蜜芽miya737mon网站使用及资源获取技巧🙊🕊️一世枭雄2游戏评测与策略分享
Z00z00z00z00sool兽的详细解析与讨论
2025.05.01,揭秘座敷童子御魂的力量与传说背景🐚挪威的森林短视频带你感受奇妙的自然景观🐗🪰⛏️RunningMan130804精彩节目回顾与亮点分析🦕🪢黑人双人RAPPER的最新音乐作品与入口分享
早报:YEEZY350V1在亚洲的市场反应与穿搭建议
2025.05.01,初中生接吻事件引发的讨论与社会反思☣️老公生日三p1💥深入解析亲爱的妈妈4的情节与角色关系感受到真情⛔🪢🍷战场双马尾角色呈现如何展现独特的战斗风格
唯美意境推动写作与绘画的灵感激发)
2025.05.01,新婚娇妻1到25集李晶的爱情故事及剧情回顾🧰🍫火影忍者第431集详解剧情回顾与分析🐀🦕🐔98精产国品一二三产区区⚙️看B站的夜月直播精彩节目不容错过
据报道:诱人的肥肉美食推荐合集满足你的味蕾享受
2025.05.01,QQ恋爱甜宠故事男友打女友的感人瞬间🐛🐌🦫揭秘e站浏览器入口的网页版使用方法与技巧🦆虐杀原形2完美存档下载及使用方法🪳⛄如何在网上找到最新的免费高清观看网站
9亚洲精华国产精华精华液
2025.05.01,深入分析游戏中情感与互动的设计霍格沃茨入学信息填写指南🐜📍🥬8809鲁大师评测与使用技巧了解这款软件的特色与功能🦺🧳🧇腾讯与360:两大互联网巨头的竞争与合作分析🐿️🌶️🪲使命召唤9僵尸模式攻略与生存技巧
责编:陈乐融
审核:阮某
责编:陈哲