3 月 29 日音问,清华大学东说念主工智能讨论院副院长、生数科技独创东说念主兼首席科学家朱军本日发布了高可控视频大模子 Vidu Q1泷泽萝拉第二部,官方声称其为业内首个高可控 AI 视频大模子。
从官方获悉,Vidu Q1 在多主体细节可控(止境是当作、布局可控)、音效同步可控、画质增强等方面均获取显耀见效。以多主体细节可控为例,在语义提示的基础上,通过融入参考图的视觉提示,Vidu Q1 解救对场景中多主体的位置、大小、趋附轨迹等属性进行更进一步的可控,对总共当作活动(出场、退场、坐立姿态、活动蹊径)进行精确调养。
干妹妹其解救音效同步可控功能,可确保跟着视频环境与画面转场,Vidu Q1 大略输树立成相应音效,并可精确适度每段音效的口角区间,精确建造每段音频出现的时分点泷泽萝拉第二部,如 0-2s 风声、3-5s 雨声等。
发布于:北京市