VASA-1

业界

真假难辨：微软 AI 模型 VASA-1 让照片开口唱歌

微软推出的最新 AI 模型 VASA-1 可将肖像照片与音频文件进行关联，并生成视频，使照片能够以 “逼真的方式说话和唱歌”。微软分享了演示视频（围观地址），包括蒙娜丽莎说唱的视频。使用该模型的用户可以自行调整头部运动或视线方向等参数。在离线模式下，VASA-1 能够以 512×512 像素、45fps 的帧数生成视频，其在线版本中支持最高 40f…

无忌
04-22
00