国产视频大模型双榜登顶!分数超Runway、Sora一镜到底运镜丝滑价格低至3毛秒2025/6/8视频转化成gif免费
智东西4月22日报道,AI视频生成创企生数科技最新上线视频大模型,同时登上多个权威文生视频、图生视频基准测试榜单的第一。
该模型可支持生成1080p分辨率5秒视频,生成效果清晰稳定,已在网页端(、手机端上线进一步提升了语义理解、画质、动作、美学、逼真和丝滑程度,首尾帧衔接更加流畅,上传两张图就能生成一镜到底的自然运镜。
Vidu Q1的动态表现出色,能驾驭特写、特效、微缩镜头,生成即可商用,适用于广告营销、短剧、电商、互动娱乐等场景。比如用它生成耳机、香水的广告:
Vidu Q1已拿下海外权威视频生成评测榜单VBench-1.0和VBench-2.0综合榜单的双冠,分数超越Runway、Sora、Luma AI等国内外知名视频生成模型,并在VBench-1.0的视频质量、视频语义一致性和VBench-2.0的常识推理、物理理解这几个综合维度上达到SOTA水平(即当前最先进的模型)。
提示词:深夜古堡的走廊,身穿西装的男子手持蜡烛转身走在走廊中,两旁的灯光忽明忽暗,紧张刺激的氛围,推进镜头拍摄,镜头定格在男子的脸。
提示词:一张黑白照片,一位优雅的黑发女子穿过人群,动作模糊,从街道拍摄,穿着现代服装,空灵,穿越时空,电影摄影,对比,颗粒
提示词:充满活力的动漫风格水下场景,一个睁大眼睛的女孩,有着飘逸的水蓝色双马尾和水手风格的校服,轻轻地悬浮在水中,伸手去够在闪闪发光的气泡和旋转的光束中嬉戏游动的金橙色锦鲤鱼,魔幻的氛围,超细节,吉卜力风格的幻想,16:9 的宽高比
除了上线外,生数科技还推出了全新AI音效(AI Sound Effects)功能。该功能具有三个主要特点:
(1)精准Timing:可精准控制每段音效的长短区间,精准设置每段音频出现的时间点,如0-2s风声、3-5s雨声,是商业领域全球首家支持精细化时间控制的文生音效系统。
(2)音效叠加:支持多段音效叠加,比如暴雨天的场景,涉及雨声、风声、打雷声等多种类型声音的混合,可以通过“音效叠加”来实现层次分明且动态变化的音效,具备影视级混音表达力。
(3)高采样率音频,高保线kHz,Vidu做出了商业领域全球首家支持48KHz的文生音效系统,解决音效刺耳、压缩失真、声音不自然流畅等问题。
生成式AI正以前所未有的速度重塑视频制作的方式。AI视频生成工具的迭代升级,有望使动漫、影视、广告、视频剪辑、UGC创作平台等众多行业受益。
近年来,AI视频生成模型的进步日新月异,从只能生成几秒钟的简单视频画面,逐渐发展到能够输出更加复杂、连贯、自然的高质量视频内容,不断为视频内容创作拓宽边界和降低门槛。
从Vidu Q1的发布可以看到,准确的语义理解、拟真的表现力、角色稳定一致、强时空连贯性等特性,是当前视频生成模型提高输出质量的重要优化方向。
生数科技最新推出的AI音效功能可与视频生成功能形成互补,根据视频或场景,用一段文字即可自动生成符合氛围、精准匹配视频画面的背景音乐或个性化音效,有助于减少搜索音效库的时间,甚至减少对昂贵版权音乐的依赖。
(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)
原标题:《国产视频大模型双榜登顶!分数超Runway、Sora,一镜到底运镜丝滑,价格低至3毛/秒》