TECHNOLOGIE: Sesja zdjęciowa zrobiona przez sztuczną inteligencję?

79

W cyfrowym świecie wygląd reprezentowany jest jako obraz w komputerze. Nic więc dziwnego, że wymiany ubrań (close swapping) wchodzą również do świata cyfrowego, by zredukować koszty sesji zdjęciowych i przyspieszyć proces wprowadzania nowych produktów na rynek, a pomaga w tym… sztuczna inteligencja.

W październiku 2017 roku Zalando opublikowało pracę naukową, jak i artykuł zatytułowany The Conditional Analogy GAN: Swapping Fashion Articles on People Images. Jest to interesująca aplikacja opisywanych we wcześniejszym artykule GANów do automatycznej zamiany ubrań na zdjęciach modelek. 

po lewej oryginalne zdjęcie, po prawej zdjęcie wygenerowane przez algorytm. Źródło: Zalando research

Nie jest tajemnicą, że w dzisiejszym świecie e-commerce skala i szybkość jest zarówno szansą jak i wyzwaniem. Wąskim gardłem okazują się powolne i drogie sesje zdjęciowe. Gdy weźmiemy pod uwagę jak często pojawiają się nowe kolekcje, które zawierają nawet kilkaset nowych artykułów, wykonanie sesji zdjęciowe na profesjonalnych modelach jest czasochłonne i kosztowne. Jak napisało samo Zalando: Wykorzystanie dostępnych danych i ponowne wykorzystanie obrazów ludzkich modeli i produktów byłoby zatem bardzo przydatne w branży mody.

Trudno się z nimi nie zgodzić. Obraz może zostać wygenerowany w zaledwie kilka minut, a jego koszt jest dużo niższy niż w przypadku tradycyjnych sesji. Oczywiście warto wspomnieć, że na aktualnym etapie technologia nie zastąpi jeszcze sesji wizerunkowych – które są bardziej dynamiczne i ukazują tożsamość marki. Jednak technologia może znacznie odciążyć generowanie zdjęć typu lookbook, wykorzystywanych głównie w sklepach internetowych. Oznacza to szybszą dostępność produktów z niezbędnymi zdjęciami na platformie internetowej, a co za tym idzie możliwość sprawniejszego uzyskania pierwszych zysków z produktu.

>>> Przeczytaj również: Zakupy przez Instagram Stories?

Zamianie poddawane są 2 zdjęcia; jedno z modelką, a drugie z produktem, efektem jest zmodyfikowane zdjęcie będące kombinacją dwóch poprzednich, a przenosząc to z świata wirtualnego możemy metaforycznie powiedzieć, że algorytm ubiera modelkę w nowe ubranie. Podczas „wymiany” algorytm, który uczy się, by lepiej zrozumieć, co cechuje naturalnie wyglądające zdjęcia na danych treningowych – dostępnej bazie obrazów – zwany generatorem dokonuje zniekształceń, zmian oświetlenia, obrotów 3d i deformacji, by jak najlepiej „przekonać” drugi model zwany dyskryminatorem, który ocenia jak realistyczna jest zamiana, a tym samym generator dąży do jak najlepszego, naturalnie wyglądającego odwzorowania.

Można powiedzieć, że generator ubiera modelkę, a dyskryminator ocenia, czy wygląda ona naturalnie, na podstawie oceny generator poprawia swoje wyniki, by przekonać dyskryminator, że wygenerowane zdjęcie jest prawdziwe – nieodbiegające od zdjęć z bazy treningowej. Takie zdjecie będzie też naturalnie wyglądającym dla ludzkiego oka.

Ubranie po lewej jest oryginalnym ubraniem, algorytm dopasowuje na modelce ubranie pokazane z lewej strony. Źródło: Zalando research

Rozwiązanie ma nie tylko potencjał przyspieszyć gotowość produktu, ale wraz z większym zaawansowaniem w przyszłości może też być wykorzystywany do tzw. wirtualnych przymierzalni.

Kolejną pracę wykorzystującą GANy Zalando zaprezentowało w tym roku, chodziło o wsparcie przy procesie projektowania ubrań. Celem było usprawnienie całego cyklu poprzez możliwość szybkiej wizualizacji projektu i redukcji  jego iteracji. Rozwiązanie wspomogłoby projektantów poprzez umożliwienie bazowania na już istniejących ubraniach i możliwości swobodniejszej manipulacji ich kształtami, teksturami i kolorami w czasie prawie rzeczywistym, bez wysublimowanego oprogramowania graficznego.

Największym wyzwaniem dla algorytmu było tutaj izolowanie efektów np. utrzymanie tego samego koloru przy zmianie tekstury i kształtu. Zalando udało się stworzyć rozwiązanie, które wraz z specjalistyczna wiedzą projektantów może usprawnić proces i pozwolić na szybsze prototypowanie jeśli chodzi o manipulacje wcześniej wymienionymi trzema parametrami ubioru: rozmiar, kolor, tekstura.

Jakość generowanych przez algorytmy GAN zdjęć z roku na rok jest coraz lepsza i na pewno zagoszczą one na stałe w wachlarzu narzędzi branży modowej.

Postęp w jakości generowanych przez GANy twarzy. Postać na zdjęciu po prawej to całkowicie wygenerowana twarz, choć wygląda całkowicie realistycznie. Źródło: Brundage et al., 2018

Wykorzystanie GANów nie ogranicza się tylko do statecznych zdjęć są one również eksplorowane w dynamicznej formie video. Na zakończenie zatem krótki film, który pokazuje aktualne możliwości GANów jeśli chodzi o mapowanie ruchów z innych video.

Nie tylko Zalando mocno eksploruje sposoby usprawnienia procesów branży fashion, startupy modowe również w Polsce pomagają innym markom modowym nie odstawać od konkurencyjnych gigantów, korzystając z dobrodziejstw algorytmu GAN. Jedno jest pewne – na dzień dzisiejszy kwestia wprowadzania rozwiązań sztucznej inteligencji w branży modowej to już nie kwestia pytania „czy warto?”, tylko „kiedy?”. Warto zaczynać krok po kroku i dobrze zdefiniować, które z rozwiązań przyniesie w krótkim czasie odczuwalne benefity dla marki.

Autorzy: Zespół AIMEE (część grupy technologicznej ULAM.AI, która wykorzystuje najnowsze badania nad sztuczną inteligencją w różnych dziedzinach biznesu).