Mjeti AI i Microsoft shndërron fotot në video që duken shumë pranë realitetit

Ky mjet ka aftësinë për të krijuar shprehi fytyre dhe lëvizje të kohës nga një foto së bashku me lëvizjet e buzëve për t’ju përshtatur të folurës që ka audioja.

Microsoft Research Asia ka prezantuar një mjet eksperimental AI quajtur VASA-1 që mund të marrë fotot e një personi dhe një audio për të krijuar një video të tyre duke folur në kohë reale.

Ky mjet ka aftësinë për të krijuar shprehi fytyre dhe lëvizje të kohës nga një foto së bashku me lëvizjet e buzëve për t’ju përshtatur të folurës që ka audioja.

Hulumtuesit kanë ngarkuar dhjetëra shembuj në faqen e projektit dhe rezultatet duken aq të mira saqë njerëzit mendojnë se është reale.

Edhe pse lëvizjet e buzëve dhe të kokës mund të duken pak robotike, sinkronizimi është gjëja më e afërt me realitetin që kemi parë nga kjo teknologji.

Hulumtuesit janë në dijeni të faktit se teknologjia mund të përdoret për të krijuar video deepfake të njerëzve të vërtetë prandaj kanë vendosur të mos publikojnë një demo online, API, produkt apo mënyrë implementimit.