有否想過蒙娜麗莎除了微笑,還會說唱?微軟(Microsoft)上周公布新人工智能(AI)模型VASA-1,只要上載肖像硬照及錄音,AI就可合成影片,讓相中人「說話」。
微軟表示,公司以大量人類說話的面部動作影片訓練新AI模型,包括人類表情、嘴唇動作、眼神及眨眼等,令生成影片更逼真。用家亦可控制相中人的視線方向或特定表情,用喜怒哀樂表達同一句子。除了上載真人照片,用家亦可上載畫作或動畫人物,配上文字或音檔。
微軟表示,開發VASA-1原意希望用於教育、協助有溝通障礙的人,甚至為人類創造虛擬伙伴,但亦擔心被濫用冒充真人,因此公司目前不打算將新模型開放公眾使用,直至有適當法規規管才會公開。
社群媒體平台Reddit不少網民對微軟新AI技術生成的影片逼真度感驚訝,形容是「真實得可怕(terrifyingly real)」,有網民認為若在Zoom會議期間套用影片亦不會覺得假,亦有人稱要開始與親友建立暗語,方能測試對方是否真人。(Microsoft/CNN/Reddit)