A generatív mesterséges intelligencia rohamos terjedésével egyre nehezebb megkülönböztetni a valós felvételeket a manipulált, úgynevezett deepfake vagy AI-asszisztált tartalmaktól. A YouTube már korábban is elvárta a feltöltőktől, hogy önkéntesen helyezzenek el egy figyelmeztető címkét, amennyiben a felvétel valósághű, de digitálisan módosított vagy teljesen fiktív elemeket tartalmaz. A gyakorlatban azonban sok tartalomgyártó figyelmen kívül hagyta ezt az irányelvet, ami komoly félreértésekhez és a dezinformáció terjedéséhez vezetett - írja a HVG.
 

A platform most bejelentett szigorítása radikális fordulatot jelent: a cég a jövőben nem hagyatkozik kizárólag a felhasználók becsületességére. Bár maguk az MI-jelölésekre vonatkozó alapvető irányelvek nem változtak, a YouTube rendszerei mostantól proaktív, ellenőrző szerepet kapnak. Ha a rendszer mesterséges intelligencia nyomait észleli a feldolgozás során, és a készítő nem tüntette fel a kötelező címkét, a platform saját hatáskörben, automatikusan helyezi el a figyelmeztetést a videón.

A Google kiemelte, hogy a szigorítással a transzparenciát és a nézők biztonságát szeretnék garantálni, hogy mindenki számára egyértelmű legyen, mikor lát valódi és mikor manipulált képsorokat. Az új, automatizált szűrőrendszer élesítését és globális bevezetését már megkezdte a YouTube, így a mesterséges intelligenciára utaló címkék hamarosan minden felhasználó képernyőjén megjelennek a kérdéses videóknál.

1

Bár a mesterséges intelligencia elképesztő sebességgel fejlődik, a generált vagy manipulált videóknak még mindig vannak olyan tipikus „gyermekbetegségei”, amelyek alaposabb megfigyeléssel könnyen lebuktatják őket.

Természetellenes pislogás és szemmozgás: Az egyik legnehezebb feladat az MI számára az emberi szem tükröződésének és a pislogás ritmusának élethű leutánzása. Ha a videón szereplő személy túl ritkán, túl sűrűn, vagy gépies, merev tekintettel pislog, esetleg a szembogara furcsán elmosódik mozgás közben, szinte biztosan deepfake-ről van szó.

Problémák a részletekkel (ujjak, fogak, ékszerek): Az MI imádja „elrontani” a finom anatómiai részleteket és a szimmetriát. Figyeld meg a kezeket: gyakran előfordul, hogy a szereplőnek 6 ujja van, vagy az ujjai természetellenesen hosszúak, egymásba folynak. Ugyanígy a túl tökéletes, egybefüggő „kerámia” fogsor vagy az aszimmetrikus, fülből furcsán kinövő fülbevalók is tipikus generálási hibák.

A szájmozgás és a hang csúszása (szinkronhibák): Ha a beszélő személy szájmozdulatai nem esnek tökéletesen egybe a hallható hanggal, vagy a kiejtett hangzókhoz képest a száj formája természetellenesnek tűnik, az MI-módosításra utal. Gyakori jel az is, ha az illető beszéd közben nem vesz levegőt, vagy a hanghordozása teljesen monoton, érzelemmentes robotizált hatást kelt.

Fura textúrák és elmosódások a határokon: Nézd meg alaposan az arc és a haj, vagy az arc és a nyak találkozási pontjait. A generált videóknál a hajvégek gyakran maszatosak, mintha rá lennének festve a háttérre, és hirtelen fejmozdulatoknál a szoftver nem tudja valós időben követni az arc éleit, így a fül vagy a szakáll egy pillanatra „elúszhat” vagy elmosódhat.

Logikátlan fények, árnyékok és fizika: A mesterséges intelligencia nem ismeri a fizika törvényeit, csak pixeleket tippel meg. Ha a háttérben lévő fényforrás balról jön, de a szereplő arcának jobb oldala van megvilágítva, vagy ha a mozgó tárgyak mögött az árnyékok nem mozdulnak, esetleg a háttérben lévő minták (pl. egy tapéta vagy könyvespolc) folyamatosan és indokolatlanul hullámoznak, akkor egy generált környezetet látsz.

2