VASA-1

  • 真假难辨:微软 AI 模型 VASA-1 让照片开口唱歌

    微软推出的最新 AI 模型 VASA-1 可将肖像照片与音频文件进行关联,并生成视频,使照片能够以 “逼真的方式说话和唱歌”。微软分享了演示视频(围观地址),包括蒙娜丽莎说唱的视频。使用该模型的用户可以自行调整头部运动或视线方向等参数。在离线模式下,VASA-1 能够以 512×512 像素、45fps 的帧数生成视频,其在线版本中支持最高 40f…

    2024-04-22
    0