Umělá inteligence změní svět k nepoznání, říká futurista Martin Spano

Co přinese světu umělá inteligence? Na to jsme se zeptali Martina Spana, slovenského informatika, spisovatele a futuristy, který se dlouhodobě věnuje její popularizaci.

Martin Spano od roku 2017 působí jako vědec na volné noze a pracuje na vlastním výzkumu umělé inteligence (AI). Konkrétně se věnuje syntetickým médiím, což jsou například pomocí technologie deepfake vytvořené ultra realistické avatary. Zajímá vás, k čemu slouží či jak se tvoří? Přečtěte si náš rozhovor.

Co vás přivedlo k tématu umělé inteligence? Proč jste se o ni začal zajímat?

Umělá inteligence mě fascinovala už od dětství. Můj zájem probudila kniha 2001: Vesmírná odysea, kterou jsem objevil v knihovně rodičů. Zaujal mě počítač HAL – byla to neživá bytost, která dokázala mít emoce. V té době mi bylo asi osm let, takže jsem si úplně neuvědomoval, že se jedná o sci-fi a věřil jsem, že to je reálné. Byl jsem tedy poměrně zklamaný z prvního počítače, který o rok později otec přinesl domů. Podobná situace nastala i ve spojitosti se seriálem Knight Rider s Davidem Hasselhoffem, který jezdil v inteligentním autě.

Co přesně si tedy pod pojmem umělá inteligence máme představit?

Jedná se o software se schopností učit se a naučené informace následně používat na řešení nových problémů. To jsou znaky inteligence podobné té lidské, ale protože je počítačová, nazýváme ji umělou.

Lidé si ale AI často představují jako něco složitějšího, než to ve skutečnosti je.

Přesně tak. Obvykle si představí HAL, KITT, Terminátora, WALL-E, Avu z Ex Machina nebo Samanthu z Her a tak dále. Tak daleko ale bohužel – a zároveň bohudík – nejsme. Umělou inteligenci běžně používáme, ale ani si to neuvědomujeme, přestože už nyní dramaticky zvyšuje naši produktivitu a kvalitu života.

Já sám si například pomocí umělé inteligence překládám odborné materiály z jakéhokoliv světového jazyka. Když se vydávám do přírody, nechávám si předčítat materiály aplikací. Následně si dělám poznámky tak, že do mobilu diktuji informace a umělá inteligence je převádí z hlasu na text.

Jeden ze známých příkladů je i doporučování obsahu na internetu, ať už ve vyhledávači nebo na streamovacích službách jako je Netflix. A tak bychom mohli pokračovat ještě dlouho, příkladů je opravdu hodně.

Které oblasti využití AI podle vás mají do budoucna největší potenciál?

V bezprostřední budoucnosti má velký potenciál zejména zpracování přirozeného jazyka. A to nejenom překlady, které jsem zmiňoval, ale také tvorba textu na základě osnovy nebo komunikace ve formě chatbotů. Velký potenciál má i oblast, které se věnuji já, a to jsou syntetická média, která se brzy začnou běžně využívat.

A k čemu slouží?

Používají se k tvorbě realistických videí bez účasti lidí, kdy se pomocí technologie deepfake vytváří ultra realistické avatary.

Před několika dny jsem představil první slovenskou platformu na tvorbu syntetických médií, kterou jsem nazval SLOVATAR, tedy „slovenský avatar“. Na první pohled na videu nepostřehnete nic zvláštního, vidíte mě. Ale nejsem to já, jedná se o můj digitální avatar.

V praxi se avatary mohou využívat například jako vizuální stránka chatbotů, při prezentacích nebo například při učení v domácím prostředí. Tato technologie se dá ale využívat i na absolutně sci-fi záležitost, jako je překládání videí. Video v cizím jazyce vám přeloží do jiného jazyka a zároveň tomu přizpůsobí i pohyby úst. To je velmi fascinující.

Ve vašem nedávno zveřejněném videu SLOVATAR mluví hned několika jazyky. Jak dlouho trvá vytvořit takové relativně krátké video?

Práce s avatarem se dělí na několik částí. Nejprve jsem musel technologii, která za ním stojí, vymyslet. Vytvořit a vyladit mého avatara se mi podařilo zhruba za dva roky. Ke každému dalšímu avatarovi, kterého bych chtěl vytvořit, bych potřeboval několikaminutové video daného člověka, na kterém by vyslovoval předem určené fráze. Vytvoření modelu by mi pak trvalo několik dní. Samotné použití je pak ale rychlé. Napíšete text, který do modelu vložíte a vytvoří se vám syntetické video. Půlminutové video pak vzniká několik minut.

Takže bez člověka, jehož avatar chcete vytvořit, se při tvorbě neobejdete?

Je to možné, existují dva způsoby vytváření avatarů. První je počítačově generovaná grafika, která je kompletně uměle vytvořená. V tom je nejpokročilejší nástroj MetaHuman od Unreal Engine. Na takto vytvořených avatarech ale poznáte, že nejsou reálné. Oproti tomu deepfake vychází z reality, a proto je i výsledný avatar mnohem realističtější.

Jaké jsou podle vás přínosy deepfake? A jaká naopak přináší nebezpečí?

Hlavní přínos spočívá v tom, že můžeme tvořit videomateriál za zlomek finančních prostředků. V současnosti video kraluje sociálním sítím a používá se i k výuce a v dalších oblastech. Díky deepfaku jich tedy budeme moct vyrábět mnohem více a levněji. A zároveň je budeme moct libovolně přizpůsobovat. Deepfake vám například umožní poslat milionu lidí personalizované video s novoročním přáním.

Co se týče nebezpečí, jedná se o zastírání reality a lhaní. V budoucnu už nebude platit, že to, co vidíte, je nevyhnutelně pravda – může se jednat o podvrh. Existuje ale několik řešení. To první je lidské. Uživatelé se musí znovu naučit používat selský rozum a nevěřit automaticky všemu, co na internetu vidí. Druhé je technické a spočívá v technologii blockchain, na které fungují i kryptoměny. Tímto způsobem se video označkuje a pokud do něj někdo zasáhne, hash se „nalomí“ a hned bude jasné, že video není reálné.

Je tvorba deepfaku složitá?

V podstatě není. Stačí si stáhnout nějakou aplikaci, například Reface, kde vám nabídnou předem vytvořené modely, na kterých si můžete vyměnit tvář. Vyfotíte se a za chvíli je váš obličej třeba na postavě Wonder Woman. Kdybyste ale chtěli vytvářet deepfake z čehokoliv, jako to dělám já, museli byste si naprogramovat svůj vlastní model, a to už tak jednoduché není.

Jak si podle vás vedou Česko a Slovensko na poli umělé inteligence? Zaujaly vás v poslední době některé konkrétní projekty?

V obou našich zemích se mozky snaží sjednocovat. V Čechách jsem si všiml například iniciativy prg.ai a na Slovensku působí Slovak.AI nebo institut Kempelen. Myslím si, že pokud budeme chtít něčeho dosáhnout, musí se týmy z obou zemí spojit. Jedná se o velmi nákladnou oblast, která vyžaduje ty nejlepší mozky a sami o sobě toho tolik nezmůžeme.

Ve světě hrají prim Spojené státy, které vedou ve výzkumu. V datech má ale náskok Čína: pokud jsou data nová ropa, pak je Čína nová Saúdská Arábie. Aktuálně to vypadá tak, že zhruba do roku 2030 Čína v umělé inteligenci USA předběhne. Velmi se o to snaží a má úplně jinou pracovní kulturu než západ, což jí hraje do karet, společně s přístupem ke kvalitním datům.

A co tedy můžeme dělat pro to, abychom se dostali do popředí?

Kromě spojování, které jsem zmiňoval, musíme umělou inteligenci popularizovat. Měli bychom u lidí budit takový zájem, aby tento obor chtěli studovat. Kromě toho by určitě pomohla úprava legislativy, například umožnění testování autonomních aut na cestách nebo úprava rámce pro bezpečné sbírání a používání dat, takové „GDPR 2.0“.

Jak vidíte vývoj umělé inteligence v blízké budoucnosti?

Příští desetiletí bude patřit umělé inteligenci a přidruženým technologiím, tedy rozšířené, virtuální a smíšené realitě a díky synergii těchto technologií se svět změní k nepoznání. Naprosto se promění to, co nazýváme realitou a jak ji vnímáme. Bude existovat několik vrstev reality, které si – alespoň v první fázi – zobrazíme pomocí chytrých brýlí. A zároveň se budeme běžně setkávat s deepfake videi. Bude to zajímavé, ale samozřejmě také společensky dost náročné. Budeme se totiž muset dost zamýšlet nad tím, co je základní realita a co vlastně neexistuje.

To připomíná sci-fi film.

Až na to, že to bude realita, a to je jisté. Už se k tomu blížíme. Vždyť i Facebook se přejmenoval na Meta, aby si lidé asociovali jeho svět s metaverzem. Pokud nejmocnější firmy, které mají nejvíc prostředků, jdou tímto směrem, o něčem to jasně vypovídá. Vidíme to například i u Applu, který aktuálně jen vyčkává do té doby, než vypustí na trh vlastní chytré brýle. V blízké budoucnosti mobily postupně upadnou. Nepředpokládám, že by je v roce 2035 někdo používal.

A co autonomní auta? Už se jejich vývoj posunul?

Někteří lidé už zkouší autonomní funkce, kterými disponuje Tesla. Umí třeba zabrzdit, pokud to vypadá, že narazíte, a podobně. Ale vývoj bude trvat ještě roky. Auta sice fungují na 90 % dobře, ale těch 10 % jsou hraniční případy, které mohou stát život. Kromě technologické stránky se musí také dořešit legislativa, například otázka toho, kdo by byl zodpovědný za případnou nehodu. Otázka autonomních aut tedy podle mě ještě není ještě úplně jistá, na rozdíl od metaverza.

A jak posun v technologiích vnímáte?

Technologie jsou neutrální. To, jak je využijeme, je jen na nás lidech. Já osobně se na tento vývoj těším. Stejně nemám na výběr, nastane v každém případě.

Deepfake slovenské moderátorky Zlatice Švajdové Puškárové, na jehož tvorbě se Martin Spano podílel.

Martin Spano

Vystudoval počítačovou vědu na Matematicko-fyzikální fakultě Univerzity Karlovy v Praze
Věnuje se programování, konzultacím a přednáškám ve firmách a influencer marketingu
Od roku 2017 působí jako vědec na volné noze
Vyvinul vlastní platformu na tvorbu syntetických médií SLOVATAR
Napsal populárně-naučnou publikaci The Artificial Intelligence in a Nutshell (2019), knihu o podnikání Následuj svou vášeň (2022) a chystá se vydat hravou učebnici Dobrodružství s Pythonem

Služba	Zpracovatel	Označení cookies
Dynamic Cookies Bar	NextGen Services, s.r.o.	dcb_dsv, dcb_config	Aktivní
Google Tag Manager	Google LLC - 1600 Amphitheatre Parkway, Mountain View, CA 94043, United States	cookiePreferences	Aktivní

Služba	Zpracovatel	Označení cookies
Google Analytics	Google LLC - 1600 Amphitheatre Parkway, Mountain View, CA 94043, United States	_ga, _ga_, _gid, _gat, _dc_gtm_, AMP_TOKEN, _gat_gtag_, _gac_, __utma, __utmt, __utmb, __utmc, __utmz, __utmv, __utmx, __utmxx	Neaktivní Aktivní
Hotjar	Hotjar Ltd - Dragonara Business Centre, 5th Floor, Dragonara Road, Paceville St Julian\'s STJ 3141, Malta	_hjid, _hjIncludedInSample, _hjClosedSurveyInvites, _hjDonePolls, _hjMinimizedPolls, _hjDoneTestersWidgets, _hjMinimizedTestersWidgets, _hjShownFeedbackMessage, _hjTLDTest, _hjUserAttributesHash, _hjCachedUserAttributes, _hjLocalStorageTest, _hjptid, _hjAbsoluteSessionInProgress, _hjFirstSeen, _hjIncludedInPageviewSample, _hjIncludedInSessionSample	Neaktivní Aktivní

Služba	Zpracovatel	Označení cookies
Google Ads	Google LLC - 1600 Amphitheatre Parkway, Mountain View, CA 94043, United States	_gac_UA-, goog_pem_mod, ads/ga-audiences, session_depth, _gac_, google_pem_mod	Neaktivní Aktivní
Facebook Pixel	Meta Platforms, Inc. - Hacker Way, Menlo Park, California, United States	_fbp, tr, s, fr, oo, js_ver, rc, campaign_click_url	Neaktivní Aktivní