Az NVIDIA MI-je 2D-s képekből is beszélő fejeket és videokonferenciát generál

Egyre ijesztőbb, hogy milyen tartalmak előállítására képesek AI használatával: az NVIDIA 2D-s képekből videokonferenciákhoz gyárt beszélő fejeket.

A világban egyre nagyobb problémát jelentenek az álhírek, a tévinformáció, a szélsőséges és offenzív tartalmak, ennek ellenére az ezek előállítására alkalmas technológia is egyre gyorsabb ütemben fejlődik. Nem lenne nehéz visszaélni például az NVIDIA mesterséges intelligenciával kapcsolatos kutatási részlegének legújabb megoldásával, amely 2D-s képekből képes videokonferenciákhoz beszélő fejeket generálni.

A rendszer ráadásul nem csak az illető száját animálja, fejmozgatásra és a fejnek a döntésére is képes. A videó rekonstrukciójakor az AI a 2D-s fotót veszi alapul, majd egy tanulási eljárás keretében 3D-s kulcspontokat állít fel a videóban.

Az NVIDIA a különböző teszteken nem csak lekörözte a rivális megoldásokat, de a H.264-es videója a korábban szükséges sávszélesség tizedét igényelte mindössze.

Mesterséges intelligenciát egyébként sok videokonferenciás szolgáltatás használ, például a virtuális hátterek alkalmazásakor vagy a kiterjesztett valóságra építő animációknál és effekteknél (Zoom, Microsoft Teams). Októberben az NVIDIA is indított ilyen szolgáltatást, Maxine néven, AI avatarral és élő fordítással.

A bejelentés időpontja szakértők szerint nem véletlen: a Salesforce a napokban jelentette be, hogy felvásárolja a Slacket, a Microsoft Teams pedig újabb funkciókkal bővített.

Az NVIDIA a GANs-modellek terén az egyik piacvezető cég, de mivel az ilyen technológia elmossa a hiteles és a generált, hamis tartalom közötti határvonalat, ezért nem csak szórakozásra és játékra, de álhírek gyártására és személyek virtuális lecserélésére is bevethető.

Azóta történt

Előzmények