Każdy z nas widział nagrania, na których stare czarno-białe zdjęcia nagle ożywają. Nagle z portretu sprzed stu lat uśmiecha się do nas dziadek, a twarz na fotografii, którą zrobiliśmy na wakacjach, mruga i porusza głową.
To nie magia, a zaawansowana technologia, która w ostatnich latach stała się dostępna dla każdego, kto ma smartfona. Ale na jakiej zasadzie działa taka aplikacja do poruszania zdjęć z AI?
Za kulisami tej cyfrowej animacji kryją się potężne algorytmy sztucznej inteligencji, które wykonują zadanie w kilku skomplikowanych, ale fascynujących krokach.
1. Rozpoznanie twarzy i mapowanie 3D
Pierwszym krokiem jest dla AI to, co dla nas jest naturalne – identyfikacja twarzy. Algorytm w ułamku sekundy skanuje zdjęcie i wykrywa na nim rysy twarzy. Co więcej, nie tylko je znajduje, ale też analizuje, gdzie znajduje się nos, usta, oczy i uszy, a następnie tworzy na ich podstawie cyfrową mapę twarzy. To właśnie ta mapa pozwala AI na zrozumienie jej kształtu, perspektywy i głębi, mimo że ma do dyspozycji tylko płaski, dwuwymiarowy obraz.
2. Zastosowanie danych ruchu
Kiedy cyfrowy model twarzy jest już gotowy, AI robi coś, co przypomina pracę reżysera w filmie animowanym. Algorytmy posiadają w swojej bazie danych ogromną bibliotekę „gotowych” ruchów i wyrazów twarzy. Mogą to być nagrania, na których aktorzy mrugają, uśmiechają się, poruszają głową czy marszczą brwi.
Sztuczna inteligencja wybiera najbardziej pasujący do zdjęcia ruch, a następnie nakłada go na cyfrową mapę twarzy. Można to porównać do nałożenia „cyfrowego szkieletu” na nieruchomą postać, a następnie poruszenia nim, aby postać ożyła.
3. Synteza obrazu i wygładzanie
To najtrudniejszy etap. Po nałożeniu ruchu AI musi wygenerować setki nowych klatek, by animacja była płynna. Algorytmy muszą odtworzyć brakujące fragmenty obrazu, na przykład te, które są ukryte za głową, gdy osoba się odwraca. Wykorzystują do tego otoczenie i tekstury, które widzą na zdjęciu.
Efektem tego procesu jest gotowy plik wideo, który jest na tyle spójny, że wygląda jak autentyczne nagranie. Nowoczesne aplikacje potrafią wygładzić nierówności i usunąć szumy, dzięki czemu efekt jest naturalny i przekonujący.
Praktyczne zastosowania i etyka
Choć najczęściej używamy ruchomych zdjęć AI do zabawy i dzielenia się nimi w mediach społecznościowych, technologia ta ma poważniejsze zastosowania, np. w cyfrowej konserwacji historycznych portretów czy w tworzeniu archiwów.
Jednocześnie warto pamiętać, że ta sama technologia leży u podstaw deepfake'ów. Możliwość tworzenia realistycznie wyglądających filmów z fałszywą zawartością budzi etyczne pytania o prywatność i wiarygodność cyfrowych treści. Zanim skorzystasz z takich aplikacji, zawsze sprawdź, w jaki sposób Twoje dane są chronione.
Zrozumienie, jak to działa, pozwala docenić nie tylko kreatywność twórców, ale także świadomie i bezpiecznie korzystać z tych fascynujących narzędzi.