Era deepfake’ów ujawnia ukryte różnice między ludźmi

W dobie sztucznej inteligencji niektóre osoby potrafią niemal bezbłędnie odróżnić syntetyczne twarze od prawdziwych fotografii. Naukowcy w końcu odkryli, co kryje się za tą niezwykłą umiejętnością.

To nie wysokie IQ ani doświadczenie z nowoczesnymi technologiami. Kluczem okazuje się mało znana, lecz mierzalna zdolność wzrokowa, którą badacze zaczęli testować przy pomocy specjalnego narzędzia o nazwie AI Face Test.

Nowa era sztucznych twarzy i zwodnicza pewność siebie

W mediach społecznościowych codziennie pojawiają się doskonałe uśmiechy i perfekcyjnie oświetlone portrety. Część z nich przedstawia rzeczywiste osoby, część nigdy nie istniała i powstała wyłącznie w modelach generatywnych. Wielu użytkowników twierdzi, że tych obrazów już nie da się rozpoznać i że pomylić może się absolutnie każdy.

Badania zespołu z Vanderbilt University ujawniły jednak bardziej złożoną rzeczywistość. Ludzie dramatycznie różnią się umiejętnością wykrywania sztucznych twarzy. Niektórzy mylą się niemal za każdym razem, inni osiągają znakomite wyniki, które pozostają stabilne nawet przy powtarzanych testach. Ta różnica nie jest przypadkowa.

Silna ogólna zdolność rozpoznawania obiektów sprawia, że dana osoba znacznie lepiej wykrywa twarze stworzone przez sztuczną inteligencję i rzadziej daje się oszukać obrazom.

Ani inteligencja, ani technologia – chodzi o sposób postrzegania

Psycholog Isabel Gauthier wraz ze swoimi współpracownikami badała, co wyróżnia osoby doskonale oceniające autentyczność twarzy. Intuicyjna odpowiedź większości z nas brzmiałaby: wysoka inteligencja, zaawansowane doświadczenie z komputerami lub doskonała pamięć do twarzy.

Wyniki badań obaliły te założenia. Najlepszym wyjaśnieniem okazała się ogólna zdolność rozpoznawania obiektów – czyli umiejętność dostrzegania subtelnych różnic między bardzo podobnymi obrazami, nie tylko twarzami. Ten sam typ sprawności wzrokowej pomaga radiologom dostrzec drobne nowotwory na zdjęciach rentgenowskich lub patologom zidentyfikować komórki rakowe pod mikroskopem.

Osoby z wysokim poziomem tej zdolności regularnie osiągały zwycięstwa w zadaniach wykrywania twarzy AI. Co więcej, przy powtarzaniu testu w innym okresie ich wyniki pozostawały spójne. Badacze doszli zatem do wniosku, że nie chodzi o jednorazowe szczęście, lecz o względnie trwałą cechę wzrokowego przetwarzania informacji.

AI Face Test – jak mierzy się odporność na syntetyczne twarze

Dla weryfikacji hipotezy powstał specjalny zestaw zadań nazwany AI Face Test. Uczestnicom i uczestnikom pokazywano serie fotografii twarzy – część prawdziwych, część stworzonych przez modele generatywne. Przy każdym zdjęciu następowała prosta decyzja: człowiek czy AI?

Ten pozornie prosty test odsłonił ogromne różnice. Niektórzy badani mylili się regularnie, inni niemal zawsze odpowiadali poprawnie. Naukowcy porównywali wyniki z dodatkowymi pomiarami, włączając w to testy rozpoznawania różnych obiektów niezwiązanych z twarzami.

Najlepszym predyktorem sukcesu w AI Face Test okazała się ogólna sprawność wzrokowa w rozpoznawaniu obiektów, a nie poziom IQ, doświadczenie z technologiami czy wyspecjalizowana pamięć do twarzy.

Co dokładnie mierzy zdolność rozpoznawania obiektów

Ta właściwość przejawia się w wielu różnych sytuacjach, na przykład:

rozróżnianie bardzo podobnych modeli samochodów czy elektroniki
dostrzeganie drobnych różnic między obrazami medycznymi
rozpoznawanie konkretnych gatunków ptaków lub roślin na podstawie detali
śledzenie zmian w skomplikowanych wykresach czy schematach

Osoba z wysokim poziomem tej zdolności jakby skanuje obraz z większą precyzją. Zauważa nieregularności w oświetleniu, nienaturalne proporcje, dziwnie wygładzone fragmenty skóry czy detale w tęczówce oka, które modele generatywne wciąż czasami zniekształcają.

Dlaczego niektórzy dają się nabrać niemal zawsze

Część uczestników badania wypadła bardzo słabo. Pomimo rosnącej liczby prób wciąż odpowiadali błędnie, a ich wyniki nie różniły się znacząco od losowego zgadywania. Nie było to spowodowane brakiem inteligencji ani nieobecnością kontaktu z obrazami cyfrowymi.

Badacze podkreślają, że mamy tendencję do przeceniania własnego „oka”. Wiele osób nie docenia trudności zadania i zakłada, że wystarczy odrobina skupienia, by wykryć każdą manipulację. Wyniki pokazują, że bez odpowiedniej sprawności wzrokowej sama ostrożność nie wystarczy.

Wzrokowy „supertalent” w walce z dezinformacją

Zespół z Vanderbilt University wskazuje na praktyczne konsekwencje. Jeśli niektóre osoby mają wyjątkowo wysoką sprawność wzrokową, można tę grupę lepiej wykorzystać tam, gdzie chodzi o bezpieczeństwo informacyjne. Dotyczy to na przykład weryfikacji wrażliwych materiałów wizualnych – fotografii z konfliktów wojennych, katastrof czy kampanii wyborczych.

Naukowcy sugerują, że osoby z wysokim wynikiem mogłyby funkcjonować jako „filtr” dla obrazów wchodzących do zbiorów treningowych systemów AI. Jeśli do uczenia modeli trafią głównie nieoznaczone lub błędnie oznaczone obrazy, kolejne generacje narzędzi będą tworzyć jeszcze bardziej mylącą treść. Selekcja przygotowana przez ludzi z wybitnym wzrokiem mogłaby to ryzyko ograniczyć.

Pomimo gwałtownego rozwoju generatywnej AI ludzki wzrok pozostaje ważnym elementem ochrony przed fałszywymi obrazami – choć nie każdy ma takie same predyspozycje.

Czy można wytrenować oko na syntetyczne twarze?

Naturalnie nasuwa się pytanie, czy tę rzadką zdolność można wytrenować. Badanie opisuje przede wszystkim wrodzone lub czasowo bardzo stabilne różnice, lecz wyniki nie wykluczają, że trening wizualny może coś poprawić. Przykłady z innych dziedzin – jak uczenie się czytania zdjęć rentgenowskich – pokazują, że długoletnia praktyka pod kierunkiem ekspertów rzeczywiście zwiększa precyzję oceny.

Jest więc możliwe, że w przyszłości powstaną programy treningowe oparte na zadaniach podobnych do AI Face Test. Szybkie serie porównań, informacja zwrotna, stopniowe zwiększanie trudności i różnorodne style generowania obrazów mogłyby podnosić wrażliwość na subtelne anomalie. Jak dotąd pozostaje to jednak w sferze hipotez – dostępne dane mówią przede wszystkim o obecnym stanie, a nie o możliwościach modyfikacji tej cechy.

Co to oznacza dla zwykłego użytkownika internetu

Jeśli nie należysz do garstki osób z nadzwyczaj wrażliwym wzrokiem, nie oznacza to całkowitej bezsilności. Warto zaakceptować, że każdy może się pomylić, i uzupełniać własne „oko” dodatkowymi strategiami bezpieczeństwa. W praktyce oznacza to:

weryfikowanie kontekstu: skąd pochodzi fotografia, kto ją opublikował i kiedy
porównywanie tego samego wydarzenia w wielu źródłach, również tekstowych
korzystanie z narzędzi do analizy obrazów, które wykrywają ślady generowania
zachowywanie ostrożności wobec emocjonalnie naładowanych materiałów wizualnych

Badanie AI Face Test przypomina, że bezpieczeństwo informacyjne nie ogranicza się do jednej aplikacji czy filtra. Chodzi o kombinację ludzkich predyspozycji, narzędzi technologicznych i zdrowego sceptycyzmu. Część osób rzeczywiście ma wzrok, który wykrywa syntetyczne twarze niemal bez wysiłku, lecz nawet najlepszy obserwator może czasem przeoczyć zręcznie przygotowaną manipulację.

Dla twórców systemów AI to sygnał, by bardziej uwzględniać różnice między ludźmi. Przyszłe rozwiązania do weryfikacji obrazów mogą łączyć automatyczne algorytmy z doborem ekspertów wizualnych – osób z wysoką zdolnością rozpoznawania obiektów potwierdzoną w testach. Dla pozostałych użytkowników staje się ważniejsze uświadomienie sobie własnych ograniczeń i gotowość polegania nie tylko na pierwszym wrażeniu, lecz również na sprawdzalnych źródłach i procedurach kontroli treści.

Author

Agnieszka Komorowska

Agnieszka Komorowska to polska blogerka DIY, która dzieli się pomysłami na rękodzieło, dekoracje i praktyczne rozwiązania do domu.