FaceApp a stav strojového učení

23. 8. 2019 ǀ 5 minut

STÁHLI JSTE SI FACEAPP? VÍTE, NA JAKÉM PRINCIPU FUNGUJE? O STROJOVÉM UČENÍ I RIZIKU VÝMĚNY SOUKROMÍ ZA BEZPLATNOU SLUŽBU SI PŘEČTĚTE V NAŠEM KOMENTÁŘI.

FaceApp a stav strojového učení

23. 8. 2019 ǀ 5 minut

STÁHLI JSTE SI FACEAPP? VÍTE, NA JAKÉM PRINCIPU FUNGUJE? O STROJOVÉM UČENÍ I RIZIKU VÝMĚNY SOUKROMÍ ZA BEZPLATNOU SLUŽBU SI PŘEČTĚTE V NAŠEM KOMENTÁŘI.

Pokud jste nestrávili poslední měsíc na opuštěném ostrově, zaplavily Vás na sociálních sítích zábavné obrázky toho, jak by Vaši přátelé vypadali v osmdesáti letech nebo jako příslušníci opačného pohlaví, a to vše vytvořené virální aplikací FaceApp.

Možná jste si aplikaci stáhli a sami vyzkoušeli. Pojďme se na tuto aplikaci podívat blíže z hlediska jejího fungování. Poskytuje totiž zajímavou možnost k prozkoumání stavu strojového učení v roce 2019 v souvislosti s tématy, jakými jsou technologie, viralita a soukromí.

Technologie

V terminologii strojového učení je stroj, který vytváří obrázky, např. lidských obličejů, neuronovou sítí nazývanou generátor. Generátor přijímá šumový vektor, tj. seznam náhodných čísel, a používá jej ke generování obrázku. Šumový vektor zajišťuje rozmanitost, jinak by stroj pokaždé vygeneroval stejný obličej.

Trénování generátoru k vytváření tváří, které vypadají realisticky, by vyžadovalo miliony příkladů trénovacích dat, kdy generátor vygeneruje obrázek, člověk zhodnotí výsledky tím, že určí, které části obrázku nejsou realistické, a generátor poté upraví svůj model založený na lidské zpětné vazbě a zkusí to znovu.

V roce 2014 přišel Ian Goodfellow s nápadem vložit proti sobě dvě neuronové sítě místo vyžadování lidského zhodnocení. Takový stroj nazýváme generativní kompetitivní síť (Generative Adversarial Network – GAN), kdy jedna neuronová síť funguje jako tvořitel pokoušející se vygenerovat realistické obrázky, zatímco druhá neuronová síť funguje jako umělecký kritik poskytující zpětnou vazbu o tom, které části generovaného obrázku obsahují vady. Generativní síť nakonec vytvoří obrázek, který projde porovnáním s kompetitivní sítí, tj. vytvoří se realistický obrázek.

Podmíněná síť GAN rozšiřuje tento koncept přidáním kategorického vstupu do GAN; např. generovat pouze starší obličeje. To vyžaduje trénovací data, která jsou označena věkem, takže GAN zná charakteristiky staršího obličeje. Generátor používá tato tréninková data ke generování obličejů různých věkových kategorií a diskriminátor používá tréninková data k posouzení, zda je obličej dostatečně starý.

Podmíněná síť GAN dokáže generovat realistické tváře určité kategorie, ale FaceApp dělá něco víc – generuje roztříděné tváře, které vypadají jako konkrétní osoba. To vyžaduje podmínku GAN pro zachování identity, kde musí generativní GAN začínat nikoli náhodným šumovým vektorem, ale spíše očesanou verzí konkrétního vstupního obrazu obličeje, neznečištěnou informacemi o kategorii. Tento „nešumový“ vektor šumu pak může být přiváděn do podmíněné GAN, jak je uvedeno výše.

Překážky pro vstup

Vše, co bylo doposud popsáno, je v komunitě strojového učení dobře známo a je implementováno do algoritmů otevřeného zdrojového kódu, které jsou k dispozici ve snadno použitelných softwarových knihovnách. FaceApp pravděpodobně začal s těmito algoritmy a přidal nějakou „tajnou ingredienci.“  Zdá se, že tvůrci odvedli dobrou práci při identifikaci ústředních rysů vstupního obličejového obrazu a shromáždili mnoho tréninkových dat roztříděných podle podmínek, jakými jsou věk a výrazy obličeje.

Jedna z důležitých věcí, kterou si lze z případu FaceApp odnést, je, že v roce 2019 už neexistuje pro strojové učení překážka pro vstup. Každý programátor v jazyce Python může vytvořit prvotřídní aplikaci, která využívá nejnovější akademické průlomové algoritmy, aniž by musel rozumět detailům těchto algoritmů. To vytváří obrovské příležitosti pro inovace, např. jak tyto algoritmy kombinujete, jaké problémy pomocí těchto algoritmů řešíte, kde najdete tréninková data.

Soukromí a viralita

Základní pravidlo při hodnocení bezplatných online služeb zní: když je služba bezplatná, produktem jste Vy. Jak FaceApp zamýšlí zpeněžit svoji bezplatnou aplikaci? Existuje několik možností, od prodeje pokročilejších funkcí úpravy fotografií až po vytvoření databáze obrázků, které by mohly být prodány jako tréninková data jiným společnostem.

Bez ohledu na základní obchodní model není pochyb o tom, že při souhlasu s podmínkami FaceApp se vzdáte části svého soukromí. Dáváte FaceApp právo přístupu k Vašemu fotoaparátu a Vašim fotografiím a navždy také udílíte práva na veškeré obrázky, které nahrajete. Tyto informace mohou padnout do nesprávných rukou a být zneužity, např. k vytvoření realistických fotomontáží Vás na místě činu k oklamání softwaru pro rozpoznávání obličeje, který se stále častěji používá jako forma identifikace.

Navzdory těmto potenciálním rizikům se miliony uživatelů zaregistrovaly a báječně se bavily pohledem na to, jak by mohly vypadat za 30 let. Zajímavé svědectví o tom, kde jsme se v roce 2019 ocitli – jsme čím dál tím bezstarostnější, i když se vzdáváme svého soukromí výměnou za bezplatné online služby. Společnosti možná čelí rostoucí regulaci ochrany osobních údajů (viz GDPR), ale doma zůstávají naše osobní online údaje do značné míry nechráněné.

Zdroj: Forbes India
Moshe Kranc, Chief Technology Officer Ness Digital Engineering

Pokud jste nestrávili poslední měsíc na opuštěném ostrově, zaplavily Vás na sociálních sítích zábavné obrázky toho, jak by Vaši přátelé vypadali v osmdesáti letech nebo jako příslušníci opačného pohlaví, a to vše vytvořené virální aplikací FaceApp.

Možná jste si aplikaci stáhli a sami vyzkoušeli. Pojďme se na tuto aplikaci podívat blíže z hlediska jejího fungování. Poskytuje totiž zajímavou možnost k prozkoumání stavu strojového učení v roce 2019 v souvislosti s tématy, jakými jsou technologie, viralita a soukromí.

Technologie

V terminologii strojového učení je stroj, který vytváří obrázky, např. lidských obličejů, neuronovou sítí nazývanou generátor. Generátor přijímá šumový vektor, tj. seznam náhodných čísel, a používá jej ke generování obrázku. Šumový vektor zajišťuje rozmanitost, jinak by stroj pokaždé vygeneroval stejný obličej.

Trénování generátoru k vytváření tváří, které vypadají realisticky, by vyžadovalo miliony příkladů trénovacích dat, kdy generátor vygeneruje obrázek, člověk zhodnotí výsledky tím, že určí, které části obrázku nejsou realistické, a generátor poté upraví svůj model založený na lidské zpětné vazbě a zkusí to znovu.

V roce 2014 přišel Ian Goodfellow s nápadem vložit proti sobě dvě neuronové sítě místo vyžadování lidského zhodnocení. Takový stroj nazýváme generativní kompetitivní síť (Generative Adversarial Network – GAN), kdy jedna neuronová síť funguje jako tvořitel pokoušející se vygenerovat realistické obrázky, zatímco druhá neuronová síť funguje jako umělecký kritik poskytující zpětnou vazbu o tom, které části generovaného obrázku obsahují vady. Generativní síť nakonec vytvoří obrázek, který projde porovnáním s kompetitivní sítí, tj. vytvoří se realistický obrázek.

Podmíněná síť GAN rozšiřuje tento koncept přidáním kategorického vstupu do GAN; např. generovat pouze starší obličeje. To vyžaduje trénovací data, která jsou označena věkem, takže GAN zná charakteristiky staršího obličeje. Generátor používá tato tréninková data ke generování obličejů různých věkových kategorií a diskriminátor používá tréninková data k posouzení, zda je obličej dostatečně starý.

Podmíněná síť GAN dokáže generovat realistické tváře určité kategorie, ale FaceApp dělá něco víc – generuje roztříděné tváře, které vypadají jako konkrétní osoba. To vyžaduje podmínku GAN pro zachování identity, kde musí generativní GAN začínat nikoli náhodným šumovým vektorem, ale spíše očesanou verzí konkrétního vstupního obrazu obličeje, neznečištěnou informacemi o kategorii. Tento „nešumový“ vektor šumu pak může být přiváděn do podmíněné GAN, jak je uvedeno výše.

Překážky pro vstup

Vše, co bylo doposud popsáno, je v komunitě strojového učení dobře známo a je implementováno do algoritmů otevřeného zdrojového kódu, které jsou k dispozici ve snadno použitelných softwarových knihovnách. FaceApp pravděpodobně začal s těmito algoritmy a přidal nějakou „tajnou ingredienci.“  Zdá se, že tvůrci odvedli dobrou práci při identifikaci ústředních rysů vstupního obličejového obrazu a shromáždili mnoho tréninkových dat roztříděných podle podmínek, jakými jsou věk a výrazy obličeje.

Jedna z důležitých věcí, kterou si lze z případu FaceApp odnést, je, že v roce 2019 už neexistuje pro strojové učení překážka pro vstup. Každý programátor v jazyce Python může vytvořit prvotřídní aplikaci, která využívá nejnovější akademické průlomové algoritmy, aniž by musel rozumět detailům těchto algoritmů. To vytváří obrovské příležitosti pro inovace, např. jak tyto algoritmy kombinujete, jaké problémy pomocí těchto algoritmů řešíte, kde najdete tréninková data.

Soukromí a viralita

Základní pravidlo při hodnocení bezplatných online služeb zní: když je služba bezplatná, produktem jste Vy. Jak FaceApp zamýšlí zpeněžit svoji bezplatnou aplikaci? Existuje několik možností, od prodeje pokročilejších funkcí úpravy fotografií až po vytvoření databáze obrázků, které by mohly být prodány jako tréninková data jiným společnostem.

Bez ohledu na základní obchodní model není pochyb o tom, že při souhlasu s podmínkami FaceApp se vzdáte části svého soukromí. Dáváte FaceApp právo přístupu k Vašemu fotoaparátu a Vašim fotografiím a navždy také udílíte práva na veškeré obrázky, které nahrajete. Tyto informace mohou padnout do nesprávných rukou a být zneužity, např. k vytvoření realistických fotomontáží Vás na místě činu k oklamání softwaru pro rozpoznávání obličeje, který se stále častěji používá jako forma identifikace.

Navzdory těmto potenciálním rizikům se miliony uživatelů zaregistrovaly a báječně se bavily pohledem na to, jak by mohly vypadat za 30 let. Zajímavé svědectví o tom, kde jsme se v roce 2019 ocitli – jsme čím dál tím bezstarostnější, i když se vzdáváme svého soukromí výměnou za bezplatné online služby. Společnosti možná čelí rostoucí regulaci ochrany osobních údajů (viz GDPR), ale doma zůstávají naše osobní online údaje do značné míry nechráněné.

Zdroj: Forbes India
Moshe Kranc, Chief Technology Officer Ness Digital Engineering

Přečtěte si také

Souboje v rámci modernizace a vysvětlitelná umělá inteligence

Expertní pohled na technologické výzvy současnosti

Inovativní myšlení je pohonem nových modelů dopravy

Chytrá mobilita včetně inovací v řešení propojených aut

FaceApp a stav strojového učení

Stáhli jste si FaceApp? Stav strojového učení a naše soukromí

Přečtěte si také

Souboje v rámci modernizace a vysvětlitelná umělá inteligence

Expertní pohled na technologické výzvy současnosti

Inovativní myšlení je pohonem nových modelů dopravy

Chytrá mobilita včetně inovací v řešení propojených aut

FaceApp a stav strojového učení

Stáhli jste si FaceApp? Stav strojového učení a naše soukromí