Jak a proč Google vytváří umělou inteligenci. Umělá inteligence Google navrhuje hrát Crocodile. Zvedák všech řemesel a budoucnost vyhledávání Google

Umělá inteligence je v našich životech již dlouho pevně zavedena. Nejčastěji o tomto problému ani nepřemýšlíme, když obvykle používáme hlasového asistenta ve smartphonu nebo automatické rozpoznávání obrázků v programu. Ani vyhledávání Google se neobejde bez strojového učení, odvětví umělé inteligence.

Již zhruba dva roky funguje technologie s názvem RankBrain, která slouží k chytrému řazení výsledků vyhledávání. Asi 15 % denních dotazů je pro Google nových, což znamená, že nebyly formulovány žádným uživatelem.

„Naše umělá inteligence se obejde bez lidských příkazů“

Profesor David Stříbrný, hlavní programátor umělé inteligence
Google AlphaGo Zero

Algoritmy RankBrain hledají existující formuláře v neznámých vyhledávacích dotazech a spojují je se sémanticky podobnými koncepty. Vyhledávač se v konečném důsledku musí učit sám a být schopen poskytnout vhodné odpovědi na otázky, které dosud nebyly položeny.

Google ve svých datových centrech používá tensor procesory (TPU) speciálně navržené pro tento účel.

Jednotky TPU (Tensor Processing Units)

Pokrok umělé inteligence Google je působivý. Jedním z důvodů je, že Google vyvinul speciální hardware, který urychluje neuronové sítě mnohem efektivněji než standardní CPU a GPU. Překvapivě procesory tensor částečně využívají běžné PC komponenty. Jsou umístěny na jedné zásuvné SATA desce a komunikují přes PCI Express s ostatními tensor procesory.

Struktura procesoru Tensor

Rychlé sčítání a násobení je síla procesoru tensor. V modulu, který je za to zodpovědný, s maticí jako centrální komponentou, se provádějí výpočty neuronové sítě. Zabírá zhruba čtvrtinu plochy procesoru. Zbývající prostor slouží k rychlému poskytnutí vstupních dat. Ty jsou dodávány přes PCI Express a DDR3 RAM. Výsledky výpočtu jsou vráceny na server přes PCI Express a hostitelské rozhraní.


Nadlidská inteligence

Procesory dostaly své jméno podle softwarové knihovny TensorFlow. Hlavním účelem TPU je urychlit algoritmy umělé inteligence, které se spoléhají na knihovny svobodného softwaru.

TPU si zpočátku získaly oblibu jako hardwarová platforma pro AlphaGo, umělou inteligenci, která porazila nejlepší světové hráče v asijské hře Go. Na rozdíl od šachů byl vývoj softwaru pro Go na profesionální úrovni po mnoho let považován za nemožný.

Následný vývoj, AlphaGo Zero, se dokázal samostatně naučit hru na základě pravidel, která mu byla dána. Za tři dny se dostal na profesionální úroveň, za tři týdny dohnal předchozí verzi AlphaGo, jejíž zaškolení stálo obrovské úsilí a vyžádalo si miliony profesionálních her. Ukázalo se, že umělá inteligence dříve omezovala studium lidských pohybů. Po dalších šesti týdnech už AlphaGo Zero nebyl nepřekonatelný.

Akcelerátor pro neuronové sítě

Oproti běžným procesorům se tenzorové procesory specializují na využití umělých neuronových sítí. Skládají se z mnoha síťově propojených matematických funkcí, které napodobují lidský mozek s jeho nervovými buňkami a jejich spojeními. Stejně jako náš mozek vyžaduje neuronová síť odpovídající vstup. Školení probíhá například v rozpoznávání řeči, rozpoznávání obrázků nebo v pravidlech hry „Go“.

Umělá neuronová síť obsahuje několik vrstev neuronů. Každý neuron používá vážený součet výstupních hodnot připojených neuronů v předchozí vrstvě. Správné srovnávání je klíčem k úspěchu ve strojovém učení, ale musí být provedeno jako první, což v praxi často znamená více operací s pohyblivou řádovou čárkou.

V této disciplíně jsou GPU vlastně nejlepší volbou. K následnému třídění výsledků vyhledávání nebo předvídání pohybů již neuronová síť nepotřebuje vysoce přesné výpočty s pohyblivou řádovou čárkou. Tento proces vyžaduje velmi velký počet operací násobení a sčítání celých čísel.

Tensor procesory v Google Compute Center

Google používá TPU ve svých datových centrech od roku 2016. Deska má obvykle několik procesorů v jednom clusteru. Používají se hlavně v blocích po čtyřech.

Tenzorový procesor Google sestává především z výpočetní jednotky, matice 256x256 jednotek. Pracuje na osmibitových celých číslech, dosahuje výpočetního výkonu 92 bilionů operací za sekundu a výsledky ukládá do paměti.

Diagram ukazuje, že matice zabírá jen asi čtvrtinu plochy procesoru. Zbývající komponenty jsou zodpovědné za neustálé poskytování nových dat jádrům. Procesory Tensor nevydávají příkazy samy sobě – přicházejí z připojeného serveru přes PCI Express. Konečné výsledky jsou také přenášeny jako odpověď stejným způsobem.

Srovnávací hodnoty potřebné pro výpočty neuronové sítě poskytuje paměťový modul First-In/First-Out. Vzhledem k tomu, malé změny tam pro konkrétní aplikaci, stačí připojit přes DDR3 RAM. Mezivýsledky jsou umístěny na 24 MB vyrovnávací jednotce a vráceny do výpočetní jednotky.

Spotřeba energie ve srovnání

Porovnání výkonu procesoru na watt spotřebované elektřiny ukazuje větší efektivitu tensor procesorů.


Závody CPU a GPU

Procesory Tensor počítají rychlostí 225 000 predikcí neuronové sítě za sekundu. CPU a GPU si nemohou konkurovat.

45krát rychlejší než běžný procesor

Přestože instrukční sada CISC (Complex Instruction Set Computer) procesoru tensor zvládne složité příkazy, existuje jich jen asi tucet. A většina požadovaných operací vyžaduje pouze pět instrukcí, včetně instrukcí pro čtení, provedení násobení matic nebo vyhodnocení aktivační funkce.

Díky optimalizaci výpočtů umělé inteligence jsou tensor procesory výrazně rychlejší než běžné procesory (45krát) nebo grafické procesory (17krát). Zároveň pracují s vyšší energetickou účinností.

A Google je teprve na začátku cesty: pomocí jednoduchých opatření lze výkon tensor procesorů dále zvyšovat. Pouhá instalace paměti GDDR5 RAM může ztrojnásobit váš aktuální výpočetní výkon.

Inteligentní počítač je jen tak všestranný jako lidé, kteří ho učí.

Robert Ito

Pro minulost tři léta přišly na Stanfordskou univerzitu asi dvě desítky potenciálních počítačových vědců, aby se dozvěděli o umělé inteligenci od těch nejchytřejších v oboru. Účastníci, sebraní ze stovek uchazečů, podnikají jednodenní výlety do okolních technologických společností, komunikují se sociálními roboty a hexakoptérami a dozvídají se o počítačové lingvistice (co dělají stroje, když slova mají více významů, řekněme) a důležitosti řízení času (velmi) . Hrají frisbee. Ale pokud je vaším mentálním obrazem AI parta chlapů, kteří si pro své oblíbené videohry vytvářejí chytřejší nepřátele, není to ono. Všechny studentky zde v programu Stanford Artificial Intelligence Laboratory's Outreach Summer (SAILORS) jsou dívky, které právě dokončily devátou třídu a jejich studium se zaměřují na hledání způsobů, jak zlepšit životy, nikoli na zlepšení jejich hry: Jak používáme AI k udržení jumbo? trysky z narážení do sebe? Chcete-li zajistit, aby si lékaři před zásahem na operační sál umyli ruce? „Naším cílem bylo přehodnotit vzdělávání AI způsobem, který podporuje rozmanitost a studenty ze všech oblastí života,“ říká Fei-Fei Li, ředitel laboratoře AI ve Stanfordu a zakladatel programu SAILORS. "Když máte různorodou škálu budoucích technologů, opravdu jim záleží na tom, aby se technologie využívaly pro dobro lidstva."

"Když máte různorodou škálu budoucích technologů, opravdu jim záleží na tom, aby se technologie využívaly pro dobro lidstva."

Google a Stanford

SAILORS byl vytvořen v roce 2015 Li a bývalou studentkou Olgou Russakovsky (nyní odbornou asistentkou na Princetonské univerzitě), aby pomohl přinést větší genderovou rovnost do technologického průmyslu. Příčina je vznešená i naléhavá. Podle nedávného průzkumu klesá počet žen, které hledají diplomy z informatiky; v sektoru AI ženy zastávají méně než 20 procent vedoucích pozic. Je to obrovské pole, které je třeba vynechat, vezmeme-li v úvahu, že každý den stále více lidí používá AI, aby si usnadnili a zefektivnili život: AI je způsob, jakým fotografické aplikace rozpoznávají vaši tvář mezi všemi ostatními, nemluvě o pláži. kde jste snímek pořídili. Takto vám vaše zařízení rozumí, když se zeptáte, jaké bude zítra počasí. Pak jsou tu méně známé aplikace, jako je diagnostika diabetické retinopatie (která často vede ke slepotě) nebo vyslání dronu na pátrací a záchrannou misi do nejvzdálenějších končin světa.

S tím, jak je umělá inteligence stále všudypřítomnější, potřeba genderové vyváženosti v této oblasti překračuje pouze správnost příčiny – rozmanitost je klíčovou součástí umělé inteligence kvůli povaze strojového učení. Cílem umělé inteligence je vyrábět stroje pro plnění úkolů, které lidé přirozeně dělají: rozpoznávat řeč, rozhodovat se, rozlišovat mezi burritem a enchiladou. Aby to bylo možné, stroje dostávají obrovské množství informací – často miliony slov nebo konverzací nebo obrázků – stejně jako my všichni vstřebáváme informace, každý okamžik bdění, od narození (v podstatě jde o strojové učení). Čím více aut stroj vidí, tím je zběhlejší v jejich identifikaci. Ale pokud jsou tyto datové soubory omezené nebo zaujaté (pokud výzkumníci nezahrnou, řekněme, obrázky Trabantů), nebo pokud lidé v AI nevidí nebo neberou v úvahu tyto limity nebo předsudky (možná nejsou znalci obskurních východoněmecké automobily), stroje a výstup budou vadné. Už se to děje. V jednom případě software pro rozpoznávání obrazu identifikoval fotografie asijských lidí jako blikající.

„Nejde jen o transparentnost dat. Ve skutečnosti potřebujeme, aby se čísla posunula správným směrem."

Zahrnout projekt

Jak lidé vytvářejí inkluzivnější laboratoře a pracovní prostory? Této výzvě se staví řada projektů a jednotlivců. Letos Li-ho, který je také hlavním vědcem v oblasti umělé inteligence a strojového učení ve společnosti Google Cloud, a další pomohli spustit AI4ALL. Cílem této národní neziskové organizace je přinést do umělé inteligence větší rozmanitost a jako mentory angažovala odborníky na genomiku, robotiku a udržitelnost. Staví na práci SAILORS, ale také se zaměřuje na lidi s jinou barvou pleti a studenty s nízkými příjmy po celé zemi prostřednictvím partnerství s Princeton, UC Berkeley a Carnegie Mellon, kromě Stanfordu. „Přišlo k nám mnoho kolegů a lídrů v oboru a řekli: ‚SAILORS je skvělý, ale je to jen Stanford, který obsluhuje několik desítek studentů ročně, většinou z Bay Area‘,“ říká Li. „Takže AI4ALL je o rozmanitosti a začlenění. Nejde jen o pohlaví."

AI a ML

jaký je v tom rozdíl?

Pojmy umělá inteligence (AI) a strojové učení (ML) se často používají zaměnitelně, ale nejsou totéž. Umělá inteligence popisuje schopnost strojů zdánlivě napodobovat lidské způsoby myšlení a učit se, jak jdou, na rozdíl od dodržování konkrétních příkazů. ML je jednou z nejúčinnějších a nejoblíbenějších technik, které počítače používají k získání této schopnosti. V ML stroje prosévají příklady, aby rozpoznaly vzory.

Mezi další podobné iniciativy patří Code Next, snaha společnosti Google v Oaklandu povzbudit latinskoamerické a afroamerické studenty, aby prozkoumali kariéru v technologii; DIY Girls, vzdělávací a mentorský program STEAM (věda, technologie, inženýrství, umění a matematika) pro komunity s nedostatečnými zdroji v Los Angeles; a Project Include, který pomáhá novým a středním startupům najímat více žen a lidí jiné barvy pleti. Tracy Chou, dříve z Pinterestu, minulý rok založila Project Include se sedmi dalšími prominentními ženami v technologickém průmyslu. V roce 2013 Chou skvěle prohlásil, že technologické společnosti mají zjistit, kolik žen zaměstnávají. Jak čísla přibývala, potvrdila to, co všichni v Silicon Valley věděli: Svět technologií, od největší korporace po nejmenší startup, je v drtivé většině bílý a mužský. Projekt Include, říká Chou, byl logickým dalším krokem. „Po několika letech, kdy tyto datové zprávy vycházely a neproběhlo mnoho změn, začal v konverzaci docházet k posunu,“ říká. „Nyní to není jen o transparentnosti v datech. Ve skutečnosti potřebujeme, aby se čísla posunula správným směrem."

Tento směr zahrnuje zpřístupnění práce v oblasti AI masám. V AI je zaměstnáno relativně málo lidí a už nyní vidíme roboty, kteří se starají o lidi a osobní asistenty, kteří předvídají naše potřeby. S lidmi ovládajícími data a kritéria a stroji vykonávajícími práci znamená lepší a větší lidský vstup lepší a lepší výsledky.

V mnoha ohledech, demokratizace AI je již na cestě. Vezměte si tento příklad: V Japonsku syn farmáře použil AI k třídění rodinné sklizně okurek podle různých vlastností. Je to druh příběhu, který oslovuje Li, která přišla do USA z Číny ve věku 16 let, ví jen málo o své adoptivní zemi a ještě méně o New Jersey, kde skončila. Poté, co pracovala na různých příležitostných pracích, od úklidu domů přes venčení psů až po pokladní v čínské restauraci, se Li ocitla na Princetonu a později na postgraduální škole na Caltechu.

Li přichází ke své práci jako trojnásobný outsider: imigrantka, žena a barevná osoba ve světě ovládaném bílými muži. To, co mohlo být překážkou pro kohokoli jiného, ​​se stalo pro Li. Většinu času tráví studiem počítačového vidění, součásti strojového učení, kterou nazývá „vražednou aplikací AI“. Počítačové vidění analyzuje a identifikuje vizuální data a může jednoho dne pomoci vytvořit citlivější robotické končetiny, řekněme, nebo vyřešit nejspletitější matematické důkazy. Ale stejně jako u všech AI je klíčem k této technologii naučit stroje rozbalit množství informací z různých míst a perspektiv. Být v podstatě vizuálními občany světa – ne nepodobný Li.

Podpora různorodé skupiny tvůrců, kteří utvářejí tento svět, je zásadní pro různé příběhové a technické problémy, se kterými se obsahová stratég Diana Williamsová setkává každý den v ILMxLAB, přísně tajném centru snů Lucasfilm, kde vývojáři vytvářejí pohlcující interaktivní zábavu – setkání s VR. Darth Vader, možná inspirovaný rozsáhlým vesmírem Star Wars. Williamsová je hluboce zapojena do pro-tech organizací, jako je Black Girls Code, a pamatuje si nedostatek barevných žen na její vysoké škole v 80. letech. „Vždy jsem byla jediná na hodinách matematiky, jediná na hodinách podnikání,“ říká. "To unavuje a začíná to být děsivé." Její řešení, jak nasměrovat více žen k technice: „Začněte je mladé a posílejte je v jejich sebevědomí, takže když vejdou do místnosti a budou tam jediné, neotáčely se.“

Maya Gupta, výzkumník strojového učení ve společnosti Google, pracuje na vylepšení AI, i když z jiného úhlu. Ve Stanfordu pomohla norské společnosti odhalit praskliny v jejích podvodních plynovodech. "Nelze tam moc dobře jít, takže jsme museli použít částečné informace, abychom se pokusili uhodnout," říká. Výuka strojů určovat jemné odhady je pro Guptu známá. Pokud na YouTube posloucháte „Truth“ tenorsaxofonisty Kamasi Washingtona a hudba bez námahy přechází do nádherného „Turiya and Ramakrishna“ Alice Coltrane, jako je práce nejchytřejšího DJe, kterého jste nikdy neznali, poděkujte Guptovi, jehož tým pomáhá počítačům vyladit jejich doporučení. "Všechno je to o předpovídání, že?" ona říká. "Pokoušíte se uhodnout, co se děje s omezenými daty."

Dnes ve společnosti Google vede výzkumný a vývojový tým, jehož cílem je mimo jiné dosáhnout větší přesnosti ve strojovém učení. „Řekněme, že chci být stejně přesná při identifikaci bostonského přízvuku a texaského přízvuku, ale mám rozpoznávač řeči, který je na ten texaský o něco lepší,“ říká. "Mám potrestat lidi s texaským přízvukem tím, že to uznání udělám stejně špatné jako pro Boston, abych byl spravedlivý?" A co když je prostě těžší rozpoznat lidi, kteří mluví s bostonským přízvukem?

Gupta a její tým také vylepšují systémy, které by byly nekonečně transparentnější než jejich návrháři na bázi uhlíku. Doufáme, že pomocí strojů můžeme odstranit mnoho předsudků nebo podvědomých procesů, které sužují lidské myšlení – nebo je alespoň snáze rozpoznat, když se objeví. Stroje neztrácejí pozornost, když jsou unavené, podrážděné nebo hladové. Studie ukázala, že soudci jsou méně ochotní udělit podmínečné propuštění těsně před obědem, když uvažují spíše o sendvičích než o postranních panelech. "Je těžké změřit, co se skutečně děje v myslích lidí," říká Gupta. "Chceme, aby naše systémy strojového učení byly vysvětlitelné, a upřímně řečeno, mnoho z nich je již vysvětlitelnějších než lidé."

"Chceme, aby naše systémy strojového učení byly vysvětlitelné, a upřímně řečeno, mnoho z nich je již vysvětlitelnějších než lidé."

Jak se umělá inteligence stává stále užitečnější – nemluvě o snazším používání – je potřeba ji umístit do co největšího počtu rukou. Christine Robson, výzkumná pracovnice IBM před příchodem do Googlu, je nadšenou šampionkou open source softwaru, jako je TensorFlow, systém strojového učení, který lze použít pro řadu úkolů, od překládání jazyků přes rozpoznání nemocí až po vytváření originálního umění.

Pro Robsona znamená začlenění do umělé inteligence zpřístupnění jejích nástrojů více než jen samozvaným matematickým pitomcům, jako je ona sama. „Jsem nadšená z dostupnosti strojového učení pro svět,“ říká. „Hodně mluvíme o demokratizaci strojového učení, ale já tomu věřím. Je velmi důležité, aby tyto nástroje byly opravdu snadno použitelné a aby je mohl používat každý.“

Sci-fi literatura a film již dlouho nabízí příklady, kdy se umělá inteligence pokazila (Mary Shelley's Frankenstein příští rok oslaví 200 let). Dnes se mnoho lidí v oboru – včetně Li, Robsona a Choua – méně zajímá o to, co by nám umělá inteligence mohla udělat, a více o to, co bychom my lidé mohli udělat s AI. Příklad: Programátoři dávají virtuálním asistentkám ženský hlas, protože muži i ženy mají tendenci jeden preferovat. „Ale udržuje to myšlenku, že asistentky jsou ženy, takže když se zapojíme do těchto systémů, posiluje to tuto sociální zaujatost,“ říká Chou. Mnoho nejlepších mozků v oboru se obává toho, co se děje v reálných systémech umělé inteligence – a tím i toho, co se objeví. To je místo, kde přichází tlak na větší rozmanitost v AI. Málo z toho bude snadné. Ale jeho zastánci jsou chytří, vynalézaví a oddaní věci.

„Učinit tyto nástroje AI opravdu snadno použitelnými a umožnit, aby tyto techniky mohl používat každý, je naprosto zásadní.“

Musíme zajistit, aby se všichni cítili vítáni, říká Gupta. Vybavuje si zeď fotografií vysloužilých profesorů elektrotechniky na její alma mater Rice, které ‚nevypadaly jako já‘. Musíme holky přesvědčit, že umělá inteligence není magie, dodává Robson: „Je to matematika.

V SAILORS se studenti učí, jak používat zpracování přirozeného jazyka k vyhledávání na sociálních sítích a pomoci při záchraně katastrof. „Pomohlo by to záchranářům objevit lidi v nouzi v reálném čase pomocí jejich zpráv na Twitteru,“ říká Li. Účinky kurzů a projektů trvají dlouho po nezapomenutelných létech. Někteří ze studentů založili ve škole své vlastní kluby robotiky, publikovali články ve vědeckých časopisech a pořádali workshopy na středních školách, aby šířili evangelium AI ještě mladším dívkám. Pro tyto studenty, jejichž zázemí a zkušenosti jsou stejně rozmanité jako nesčetné množství projektů, které řešili na táboře, není umělá inteligence nejnovější cool gadget, ale mocná síla pro dobro. Před prvním setkáním SAILORS v roce 2015 program sdílel zprávy od příchozích táborníků, včetně tohoto ambiciózního přání: „Doufám, že svou cestu AI začnu nyní, abych mohl v budoucnu ovlivnit svět.“

Robert Ito je spisovatel žijící v Los Angeles. Je častým přispěvatelem do New York Times, Salon a Los Angelesčasopis.

Pokud vás vždy zajímalo, co se děje v neuronech neuronových sítí, pak vám to Google konečně bude moci vysvětlit. Společnost vydala výběr experimentálních služeb, které ukazují, čeho je moderní umělá inteligence schopna.

Nejzajímavější z nich je Quick, Draw! - navrhuje hrát nějakého „krokodýla“. Vaším úkolem je nakreslit za 20 sekund daný objekt, jako je mrkev, kolo, míč, obličej a tak dále. Během této doby by měl program rozpoznat, co přesně jste se pokusili zobrazit. Zatímco kurzorem kreslíte neohrabané čáry, neuronová síť vyhazuje možnosti, dokud nerozpozná tu správnou.

Přitom, jak se na neuronovou síť sluší a patří, učí se na základě nákresů ostatních uživatelů. A čím více obrázků AI uvidí, tím rychleji dokáže najít správnou odpověď. Například v těchto čmáranicích neuronová síť rozpoznala krokodýla během několika sekund. Mohl byste?

Další zábavná služba se jmenuje Giorgio Cam. Dokáže identifikovat předměty, které vidí ve fotoaparátu. Zde výsledky nejsou tak působivé a AI se často mýlí. Nepřesnost je však kompenzována prezentací. Proces identifikace předmětu doprovází hravá elektronická hudba a neuronová síť rytmicky rozkládá možnosti odpovědí do rytmu. Všechno to vypadá docela strašidelně, ale fascinující.

Obecně platí, že AI je stále docela primitivní a zjevně není schopna přijít s účinným plánem na převzetí lidstva. Ale to je zatím vše.

Zobrazit veškerou zábavu Experimenty Google v oblasti vytváření umělé inteligence můžete.

Strojové učení Google blokuje spam s 99,9% účinností

27. února

Google na svém blogu oznámil použití strojového učení založeného na TensorFlow, které blokuje spam, aby se dostal do Gmailu.

Tato technologie je schopna blokovat 99,9 % spamu, což ve fyzickém vyjádření znamená 100 milionů dalších spamových zpráv odfiltrovaných každý den.

„Kde jsme našli těchto 100 milionů dalších spamových zpráv? Nyní blokujeme kategorie spamu, které bylo dříve velmi obtížné odhalit. Používání TensorFlow nám pomohlo zablokovat zprávy s obrázky, zprávy se skrytým vloženým obsahem a zprávy z nově vytvořených domén, které se snaží skrýt nízkoobjemové spamové zprávy mezi legitimním provozem.

Vzhledem k tomu, že jsme již zablokovali drtivou většinu spamu na Gmailu, je zablokování dalších milionů s takovou přesností úspěch. TensorFlow nám pomáhá chytit spammery, kteří se propašují přes méně než 0,1 % bez náhodného blokování zpráv, které jsou pro uživatele důležité.“.

Google Lens se naučil rozpoznávat miliardy objektů

3. ledna

Google uvedl, že jeho fotografický nástroj s umělou inteligencí Lens nyní dokáže identifikovat více než miliardu objektů.

Jde o znatelný nárůst schopností oproti první verzi utility, která zpočátku dokázala identifikovat asi 250 tisíc objektů. Nástroj byl vyškolen na systému Google DeepMind.


Zároveň byla získána miliarda položek z těch, které byly prezentovány v Nákupech Google. To znamená, že mezi nimi nenajdete věci, které nejsou ve výprodeji. Ani herní konzole z 90. let nebo první vydání starých knih už přes Lens nenajdete. Mezi moderními produkty však bude snadné najít pozici.


Google používá AI k předpovídání zpoždění letů

2. února 2018

Informace o zpoždění letů jsou velmi užitečné, ale oznámení o zpoždění často závisí na letecké společnosti a ne vždy mají zájem informace rychle aktualizovat. Nyní vám s tím pomůže Google.

Společnost aktualizovala svou službu Flights, ve které začala nejen hlásit možná zpoždění letů, ale také posuzovat pravděpodobnost. K tomu využívá systém strojového učení historická data k předpovídání zpoždění a zvýraznění letů, pokud existuje více než 80% pravděpodobnost zpoždění. Google zároveň poznamenává, že byste stále neměli mít zpoždění na letadlo, protože ani 99% pravděpodobnost neznamená, že letadlo nepoletí podle plánu. Ale taková předpověď vám může napovědět, kolik času navíc budete muset strávit na letišti.

Aktualizovaná služba Google vám také pomůže ušetřit na letu. Zatím funguje pro 3 letecké společnosti: American, Delta a United. Díky novým funkcím můžete odhadnout náklady na doplňkové služby v nízkonákladových tarifech, jako je zvýšená příruční zavazadla nebo nadměrná zavazadla, a také tyto náklady porovnat s náklady na běžné letenky.

Vidíte na fotce kapustňáka?

15. prosince 2017

Google využívá umělou inteligenci nejen ke zlepšování svých služeb, ale také k pomoci ekologům a vědcům, čímž opět potvrzuje svůj titul „dobré korporace“.

Neuronová síť TensorFlow s otevřeným zdrojovým kódem se stala srdcem projektu, který pomáhá zachovat populaci mořských krav nebo kapustňáků.

Navzdory jejich působivé velikosti může být pro biology docela obtížné sledovat jejich pohyby. K tomu vědci provedli letecké snímkování oceánu pomocí dronů, ale najít i takto velká zvířata je velmi obtížný úkol. Pro člověka.

Tady je jedna taková fotka pořízená z dronu:

Vidíte na něm kapustňáka?

Pro odpověď přejděte dolů.


Výzkumnice Amanda Hodgson z Murdoch University a její tým vytvořili pomocí open-source softwaru TensorFlow od Googlu detektor, který na fotografiích najde kapustňáky. Dřívější verze detektoru dokázaly najít 80 % těchto zvířat na leteckém snímku pořízeném dronem. Vědci doufají, že v budoucnu AI zlepší svou práci.

Vědci se také domnívají, že umělou inteligenci lze přizpůsobit hledání dalších velkých savců, jako jsou keporkaci a dokonce i delfíni.

Umělá inteligence Google poráží Bing a Siri v IQ testu

2. listopadu 2017

Tři výzkumníci: Feng Liu, Yong Shi a Yin Liu vyvinuli IQ test zaměřený na kontrolu různé systémy A.I.

Podle jejich výsledků se jako nejchytřejší ukázala umělá inteligence Googlu, která získala 47,8 bodu. Pro srovnání, skóre 18letého je 96 bodů a šestiletého 55,5.

Hlavní konkurenti Googlu za ním poměrně znatelně zaostávají. Bing a Baidu tedy dosáhli 31,98 a 32,92 bodů. Nejhůře si vedla Siri od Applu se skóre 23,9.

Vědci poznamenali, že i když nejlepší umělá inteligence nedosáhne ani na šestileté dítě, rychle se stahují. V roce 2014 dosáhly Google a Baidu AI 26,5 a 23,5 bodů. To znamená 80% nárůst inteligence za pouhé dva roky (pro Google), takže obavy Elona Muska z toho, že nás zotročí vlastním počítačům, nemusí být úplně neopodstatněné.

Studie také rozděluje umělou inteligenci na gradace a typy v závislosti na směru použití. S úplným výzkumem je to možné podívejte se na tento odkaz.

Google hovořil o druhé generaci TPU

26. května 2017

Během konference Google I/O organizátoři předvedli druhou generaci Tensor Processing Unit (TPU), která se používá v umělé inteligenci společnosti.

Nový model procesoru lze využít jak pro trénování, tak pro hledání vztahů. A systém čtyř nových cloudových TPU slibuje výkon systému strojového učení 180 teraflopů. Podle Googlu je tento čip výrazně produktivnější než řešení na bázi GPU, a proto společnost plánuje nabídnout platformu Cloud komerčním vývojářům.

Pokud jde o výkon, Google vysvětlil, že trénování velkého modelu jazykového překladu trvá celý den na 32 špičkových GPU. Stejná práce trvá 6 hodin na jedné osmině clusteru, nebo na 8 TPU.

Google představil první generaci TPU v roce 2015. Tyto procesory se používají v celé řadě cloudových služeb společnosti, včetně vyhledávání, překladů a Google Photos.

Google TPU zpracovává data 15krát rychleji než běžné komponenty

29. dubna 2017

Před dvěma lety Google vytvořil vlastní integrovaný obvod nazvaný Tensor Processing Unit, který je určen pro výpočetní fázi úloh strojového učení.

Společnost původně uvedla, že TPU by měl zvýšit výkon na watt u typických úloh až 10krát oproti tradičním CPU a GPU. A nyní, po získání provozních zkušeností, společnost provedla studii dopadu výkonu čipů tohoto typu.

Ukázalo se, že 10násobné zvýšení energetické účinnosti bylo příliš mírné. Ve skutečnosti se výkon zvýšil z 30 na 80krát ve srovnání s konvenčními řešeními a v závislosti na scénáři. Pokud jde o přímý výkon, Google říká, že TPU je 15 až 30krát rychlejší než standardní hardware.

Tento procesor provozuje vlastní software založený na rámci strojového učení TensorFlow a část tohoto zrychlení je způsobena tímto rámcem. Autoři studie poznamenali, že programátoři mají stále prostor pro optimalizaci.

Google viděl potřebu TPU před 6 lety. Společnost využívá hluboké učení v různých projektech, včetně vyhledávání obrázků, fotografování a překladů. Strojové učení je ze své podstaty proces poměrně náročný na zdroje. Inženýři Googlu například poznamenali, že pokud by lidé používali rozpoznávání řeči po dobu 3 minut denně, a to bez TPU, společnost by musela zdvojnásobit počet datových center.

Google zajistí zvětšení hollywoodského obrazu

22. února 2017

Koncept vylepšování pixelovaných obrázků známe z mnoha hollywoodských filmů, ale jako téměř vždy je skutečná technologie daleko od kina. Inženýři z Google Brain však přišli na způsob, jak sci-fi přiblížit realitě.

Nová technologie využívá dvojici neuronových sítí, které zpracovávají obrázky 8x8 pixelů, aby znovu vytvořily tvář osoby, která se za ní skrývá. Neuronové sítě samozřejmě nezvětšují obrázek bez pixelace, ale vytvářejí nový, který by mohl vypadat jako originál.

Jak již bylo zmíněno výše, do procesu rekonstrukce obličeje jsou zapojeny dvě neuronové sítě. První mapuje obrázek 8x8 pixelů na podobně vypadající obrázek s vyšším rozlišením. Tento obrázek se používá jako kostra pro druhou síť, která dodává obrázku více detailů na základě existujících obrázků s podobnými mapami pixelů. Výsledné obrazy dvou sítí se pak spojí a vytvoří konečný obraz.

Samozřejmě, že znovu vytvořený obraz je daleko od reality, takže tato technologie je pro zpravodajské agentury k ničemu, ale je užitečná při zpracování snímků, pokud je nutné extrémní zvětšení.

Technologie Google RAISR snižuje přenos obrazu čtyřnásobně

28. ledna 2017

Téměř všechny tarify mobilních operátorů vyžadují omezené využití dat a Google se rozhodl výrazně snížit spotřebu vývojem technologie komprese obrazu RAISR – Rapid and Accurate Image Super-Resolution (rychlý a přesný obraz v super rozlišení).

V podstatě tato technologie není tradiční metoda komprese, je to spíše forma umění, kterou dělá systém strojového učení. RAISR tedy zvětšuje miniatury obrázků získaných v nižším rozlišení pomocí speciálních algoritmů strojového učení. Umělá inteligence nakonec chybějící detaily obnoví a vrátí snímku do původní podoby. Díky tomu lze snížit přenosový provoz obrazu o 75 % oproti originálu při zachování většiny viditelných detailů.

Tuto technologii Google zatím nabízí pouze pro službu Google+ a pouze pro obrázky umístěné ve službě. „V nadcházejících týdnech“ společnost rozšíří rozsah technologie na své další služby.

Není jasné, zda Google tuto technologii využije pouze pro své vlastní služby, nebo ji rozšíří jako Brotli, ale určitě bychom rádi viděli, jak pohání weby plné obrázků, jako jsou sociální sítě a internetové obchody.

Umělá inteligence Googlu vynalezla svůj vlastní jazyk

29. listopadu 2016

Není třeba panikařit, ale umělá inteligence od Googlu si omylem (nebo ne) vytvořila svůj vlastní tajný jazyk. A tento jazyk byl vynalezen Neural Machine Translation (NMT) nezávisle, bez lidského zásahu.

Google představil nový neuronový překladový engine v září a byl představen poměrně nedávno. Nový systém umožňuje překládat celé věty bez jejich dělení na části a lépe sdělovat význam. Systém NMT se samoučí, což znamená, že se během provozu zdokonaluje.

Systém byl nejprve použit ke zlepšení překladu z angličtiny do korejštiny a naopak a poté z angličtiny do japonštiny a naopak. Inženýři měli zájem zjistit, zda stroj dokáže přeložit text z korejštiny do japonštiny bez angličtiny. A odpověď se ukázala být „ano“, stroj přeložil text přímo.

Jak toho Google AI dosáhl, je trochu nejasné. Ukázalo se, že NMT vytvořil svůj vlastní vnitřní jazyk „interlingua“. Zabývá se spíše pojmy a větnými strukturami než ekvivalentními slovy. Výsledkem je, že NMT vytváří přesnější překlady než dříve. Tvůrci neuronového strojového překladače si nejsou jisti principy fungování neuronové sítě a nemohou říci, jak se přímý překlad mezi jazyky vyučuje. Jinými slovy, umělá inteligence Google si vytvořila vlastní vlastním jazykem, kterému my lidé nemůžeme plně porozumět.

Překladač Google je nyní chytřejší

26. listopadu 2016

Google tvrdí, že se mu podařilo učinit strojový překlad přirozenější tím, že jej nabízí pro chytré telefony a webové aplikace.

Vyhledávací gigant si všiml, že nyní používá „neuronový strojový překlad“, který mu umožňuje přeložit celou větu, místo aby ji rozděloval na části a pak ji dále překládal. Výsledný text je díky tomu přirozenější a má lepší syntaxi a gramatiku.

"Jednou změnou bylo dosaženo více zlepšení než za 10 let.", řekl produktový lídr Překladač Google Barak Turowski.

Kromě angličtiny nový systém překlad je k dispozici pro dalších osm ze 103 jazyků podporovaných systémem. Takže „neurální“ překlad podporuje francouzštinu, němčinu, španělštinu, portugalštinu, čínštinu, japonštinu, korejštinu a turečtinu. Společnost poznamenala, že tyto jazyky tvoří 35 % všech překladů provedených službou. Podle Turovského může tato metoda snížit chyby o 55 % až 85 %.

Google se naučil odpovídat na složité otázky

19. listopadu 2015

Spolu s vývojem inteligentní systémy Microsoft a Apple, Google Assistant také ukazuje průlom. Společnost tedy na svém blogu uvedla, že aplikace Google se nyní stala mnohem chytřejší, protože nyní rozumí a odpovídá na složité otázky, které dříve nezvládala.

Google nyní může porozumět významu otázky a také porozumět účelu otázky, která je položena.

Virtuální asistent nyní například rozumí:

  • Srovnávací stupeň (nejvyšší, největší atd.);
  • Seřazené dotazy (Kdo je nejvyšší hráč Mavericku?);
  • Temporary Connections (Jakou píseň nahrála Taylor Swift v roce 2014?);
  • Složité kombinace (Jaká byla populace USA, když se narodil Bernie Sanders?).

Pokud máte na svém smartphonu nebo tabletu příslušnou aplikaci Google, pak už jí můžete pokládat podobné složité otázky. Hledání informací na smartphonu samozřejmě není příliš pohodlné, ale pokud s ním nyní můžete mluvit jako člověk, tak proč to nevyužít častěji.

Google otevírá zdrojový kód pro systém strojového učení

12. listopadu 2015

Aby Google přilákal co nejvíce vývojářů a urychlil vývoj technologií, rozhodl se otevřít zdrojový kód engine umělé inteligence známý jako TensorFlow.

Společnost na tomto projektu nějakou dobu pracovala a systém dokázal přinést ovoce například ve Fotkách Google, díky čemuž bylo možné na fotkách identifikovat lidi a místa. Tato technologie funguje také v e-mailovém klientovi Inbox, který skenuje poštu a usnadňuje přípravu odpovědí.

Generální ředitel společnosti Google Sundar Pichai na svém blogu napsal: „Ještě před pár lety jsi nemohl dát tým Google aplikace v hluku ulice nebo číst nápisy v ruštině pomocí Překladače Google nebo okamžitě najít obrázky svého Labradoodle ve Fotkách Google. Naše aplikace nebyly dost chytré. Ale během krátké doby se stali mnohem, mnohem chytřejšími. Nyní, díky strojovému učení, můžete všechny tyto věci dělat docela snadno.“.

Ředitel poznamenal, že systém „TensorFlow je rychlejší, chytřejší a flexibilnější než náš starý systém, takže jej lze mnohem snadněji a bohatěji přizpůsobit novým produktům. Dnes máme také open source TensorFlow. Doufáme, že to umožní komunitě strojového učení, všem od akademiků přes inženýry až po fandy, sdílet nápady mnohem rychleji prostřednictvím pracovního kódu namísto pouhého studia dokumentů.“.

Google vylepšil rozpoznávání řeči

29. září 2015

Ze všech velkých společností s podporou hlasových služeb stojí Google sám. Na rozdíl od Siri od Applu a Cortany od Microsoftu si Google svou hlasovou asistentku nepřizpůsobuje. Kromě toho má Google nejlepší rozpoznávací algoritmus, který nyní získal další vylepšení.

V nedávném příspěvku na blogu Google Research Blog zástupce týmu pro výzkum řeči diskutoval o nedávných změnách algoritmu rozpoznávání. Společnost již používá hlubokou neuronovou síť, stejnou, která vytváří podivné obrázky se „sny“ umělé inteligence, aby pochopila, co přesně se právě teď snažíte svému telefonu sdělit. Nyní společnost vyvinula a začala používat rekurzivní neuronové sítě. Nový algoritmus pro modelování řeči bere v úvahu časové závislosti, což jim prý umožňuje lépe analyzovat každý kus zvuku odkazováním na příchozí zvuky.

V důsledku toho se uživatelé dočkají rychlejšího a přesnějšího rozpoznávání řeči. Společnost také tvrdí, že nový algoritmus je odolnější vůči rozpoznání v hlučném prostředí. Nový algoritmus rozpoznávání řeči již byl spuštěn pro vyhledávací aplikace v systémech iOS a Android a také pro hlasové zadávání.

Google vyvíjí algoritmus pro výpočet kalorií z fotografií

20. června 2015

Google podal patent na technologii Im2Calories, která analyzuje fotografii jídla a odhaduje přibližný počet kalorií v tomto jídle.

Technologie Im2Calories je založena na řadě algoritmů umělé inteligence a nástroj pro analýzu fotografií samozřejmě ne příliš přesně odhadne přibližný počet kalorií v jídle na pořízené fotografii.

Tento projekt je stále ve vývoji a jeho podoba se očekává až za několik let. Je pravděpodobné, že Im2Calories se v budoucnu představí ve formě aplikací pro Android a iOS.

Ještě jeden zajímavé místo Algoritmus využijí zdroje Twitteru a Instagramu, protože právě tam lidé nejčastěji zveřejňují fotografie svého jídla. Použití nástroje ve vlastní síti Google+ je nepravděpodobné, protože vyhledávací gigant má o podporu platformy malý zájem.

Nyní můžete najít podobné aplikace pro obě oblíbené mobilní platformy, ale není pochyb o tom, že Google dokáže udělat lepší produkt, a to díky vynikajícím systémům umělé inteligence, které společnost vyvíjí.

Google otevřel nové výzkumné zařízení v Curychu. Centrum Google Výzkum, který se bude zabývat strojní inteligencí. Nyní je jedním z největších výzkumných center souvisejících s vývojem umělé inteligence mimo Spojené státy. Jeho objev je spojen s novou strategií Google, která zahrnuje aktivní zavádění strojové inteligence do služeb a aplikací. Dnes společnost využívá vývoj v této oblasti v produktech, jako jsou Translate a Photos. A na konferenci Google I/O 2016 byl představen messenger a zařízení pro chytrou domácnost, které rovněž využívají strojovou inteligenci. S otevřením nového výzkumného centra v Curychu plánuje Google v této oblasti udělat výrazný průlom. Mohli jsme se zúčastnit otevření tohoto centra a dozvědět se o tom, jak a proč společnost vyvíjí umělou inteligenci.

Jak Google vytváří umělou inteligenci?

Otevřené výzkumné centrum v Curychu se zaměří na vývoj ve třech klíčových oblastech umělé inteligence: strojové učení, strojové vnímání a přirozené zpracování a porozumění řeči. Všechny jsou potřebné k vytvoření nové generace počítačů, které se mohou učit od lidí a světa kolem nich.

Strojové učení

Strojová nebo umělá inteligence bývá často zaměňována se strojovým učením, a přestože to první bez druhého nemůže existovat, je založeno na trochu jiných principech. Samotný koncept „umělé inteligence“ zahrnuje vytvoření počítače, který myslí, zatímco „strojové učení“ je vývoj počítačů, které se mohou učit. „Naprogramovat počítač, aby byl chytrý, může být obtížnější než naprogramovat počítač, aby se naučil být chytrý,“ vysvětluje rozdíl Greg Corrado, hlavní výzkumník strojového učení společnosti Google.

Každý uživatel Gmailu si dnes může vyzkoušet sílu strojového učení. Zatímco dříve se spamový filtr služby řídil přísnými pravidly s klíčovými slovy, dnes se učí na příkladech. Jak filtruje poštu, je to lepší a lepší. Jde o jeden z nejjednodušších příkladů využití strojového učení, ale dnes již Google vytváří složitější samoučící se systémy.

K tomu společnost využívá tři metody strojového učení:

1. Doučovaný výcvik- toto je učení příkladem, stejně jako filtr spamu Gmailu filtruje poštu a dostává stále více příkladů spamových e-mailů. Jediný problém s touto metodou: aby byla účinná, musíte ji mít velký počet hotové příklady.

2. Učení bez dozoru- jedná se o shlukování dat, počítač je vybaven objekty bez popisu a snaží se mezi nimi najít vnitřní vzory, závislosti a vztahy. Vzhledem k tomu, že data jsou zpočátku neoznačená, neexistuje žádný chybový signál ani odměna pro systém a nezná správné řešení.

3. Posílení učení- tato metoda souvisí s „učením pod dohledem“, ale zde se data jednoduše nezadávají do počítače, ale používají se k řešení problémů. Pokud je rozhodnutí správné, systém obdrží kladnou odezvu, kterou si pamatuje, a tím posílí své znalosti. Pokud je řešení nesprávné, pak počítač obdrží negativní odpověď a musí najít jiný způsob, jak problém vyřešit.

Google dnes pro své služby primárně využívá učení pod dohledem, nicméně společnost poznamenává, že „učení ze strany“ může mít ještě větší potenciál. Právě spojením těchto dvou metod vznikla umělá inteligence AlphaGo, která dokázala porazit profesionální hráče Go. Nejprve počítač porazil evropského šampiona Go Fan Hui (2. dan) se skóre 5:0 a poté hrál s Lee Sedolem, hráčem 9. danu (nejvyšší pozice v Go), a opět bylo konečné skóre 4- 1 není ve prospěch osoby.

Proč je vítězství umělé inteligence ve hře Go tak důležité pro rozvoj strojového učení? Faktem je, že samotná hra je pro počítač velmi obtížná. Go používá desku gobanů o rozměrech 19x19, na kterou jeden hráč umístí černé kameny a druhý hráč bílé kameny ve snaze obsadit co největší část desky. Na rozdíl od šachu, kde má každá figurka jasně definovanou pozici a tahy, jsou v Go hráči limitováni pouze šachovnicí. Při hře proto využívají nejen znalosti, ale i intuici. Pro počítač je další složitostí obrovský počet možných pozic (10^170) a také je pro něj těžké posoudit, kdo hru vyhraje.

Proto byly pro AlphaGo vyvinuty dvě neuronové sítě. První se nazývá „hodnotová síť“, vyhodnocuje pozici kamenů na hřišti čísly od -1 do 1, aby určil, které kameny jsou ve vedení: bílý (-1) nebo černý (1). Pokud je pozice vyrovnaná a každý hráč může vyhrát, pak se hodnota bude blížit 0. Neuronová síť naskenuje desku a vyhodnotí pozici kamenů, načež začne chápat, jak výhodně jsou umístěny bílé a černé kameny. Druhá neuronová síť se nazývala „politická síť“. Na základě expertních dat o tahech v Go sestaví mapu a určí, které tahy v této pozici budou nejúspěšnější.

„Síť hodnot“ tedy umožňuje AlphaGo porozumět pozici kamenů na desce a určit, kdo vyhraje, a „síť politik“ usnadňuje vyhledávacímu algoritmu výběr možných tahů, protože jej omezuje v závislosti na pozici. z kamenů.

Než budete pokračovat, je důležité pochopit, co je „neuronová síť“? Dnes bohužel není žádný single formální definice„umělá neuronová síť“. Pokud se to pokusíte vyjádřit jednoduchými slovy, neuronová síť je řada matematických modelů, které jsou vytvořeny na principu fungování biologických neuronových sítí. Umělé neurony (jednoduché procesory) se vzájemně spojují, přijímají signál, zpracovávají jej a posílají na další neuron. Každý neuron je jednoduchá matematická funkce, ale společnými silami mohou řešit složité problémy.

Jak byly neuronové sítě trénovány pro AlphaGo?

„Začali jsme s daty od profesionálních hráčů Go. Jelikož se partie většinou nahrávají, měli jsme spoustu dvojic: pozice plus tah, kterým bylo dosaženo. Jedna hra nám dá asi 300 takových párů. Každý pohyb v takové hře je profesionální, protože ho dělá odborník. Použili jsme „učení pod dohledem“, abychom neuronovou síť naučili předvídat, jaký pohyb by v této pozici udělal profesionální hráč. Tak vznikla „síť politik“. Dále jsme dovolili neuronové síti hrát proti sobě, a to jak z pozice černých, tak bílých kamenů. Výsledky těchto her jsme nahráli zpět do neuronové sítě. To už je „posilovací učení“, ještě to není tak dobře prozkoumané, ale věříme, že tohle je budoucnost strojového učení. Dále, díky neuronové síti hrající proti sobě, jsme obdrželi velké množství dat o poloze kamenů na herním plánu a také o výsledcích her. Na jejich základě jsme vytrénovali „síť významu“, která se naučila chápat, ve kterých pozicích vítězí černé kameny a ve kterých bílé. Bodování je velmi důležitým parametrem pro tvorbu herního programu a strojového učení obecně, protože potřebujete způsob, jak určit pokrok ve hře,“ říká Thore Graepel, vědecký pracovník projektu DeepMind společnosti Google, který vyvinul AlphaGo.

Přestože AlphaGo porazilo profesionální hráče Go a snadno poráží i další umělé inteligence vyvinuté pro hru, není to jediný pozoruhodný úspěch systému. Ve druhé hře s Lee Sedolem udělal AlphaGo velmi neobvyklý tah 37 na řádku 5, který se zpočátku nezdál úspěšný, ale pak umožnil počítači převzít tuto část hrací desky. Faktem je, že expertní informace, které byly načteny do AlphaGo, takové pohyby neobsahovaly a lze mít za to, že to byl jeden z prvních projevů kreativity při provádění počítače.

Dnes pro stroj Google učení používá open source softwarovou knihovnu TensorFlow. Jde o rozhraní API druhé generace, které funguje pro výzkum i pro komerční produkty Google využívající strojové učení, včetně vyhledávání, rozpoznávání řeči, Gmailu a fotek.

Strojové vnímání

Další důležitou oblastí pro rozvoj umělé inteligence je strojové vnímání. I když počítače za poslední desetiletí udělaly velký pokrok v rozpoznávání zvuků, hudby a ručně psaného textu, stále mají problémy s rozpoznáváním obrázků a videí. Lidský zrakový systém snadno rozpoznává obrazy v každé mozkové hemisféře našeho mozku je primární zraková kůra (vizuální oblast V1), která obsahuje 140 milionů neuronů s desítkami miliard spojení mezi nimi. A přesto lidský mozek navíc využívá extrastriátní zrakovou kůru (oblasti V2, V3, V4 a V5) pro rozpoznávání obrazu. Není pro nás proto velký problém vidět ležet šedou kočku na šedém koberci. To je ale pro počítač velmi obtížný úkol.

Dříve Google katalogizoval fotografie podle popisu, uživatel potřeboval k obrázkům přidat značky, aby je bylo možné později seskupit nebo najít. Dnes v služba Google Photos provozuje pokročilejší rozpoznávání obrázků založené na „konvoluční neuronové síti“. Tato architektura, kterou vyvinul vědec Yann LeCun, má jeden z nejlepších algoritmů pro rozpoznávání obrazu. Aniž bychom zacházeli do detailů, jedná se o vícevrstvou strukturu umělých neuronů, z nichž každá vrstva bere jako vstup pouze malou část vstupního obrazu. S pomocí projektu Deep Dream dnes může kdokoli přesně vyhodnotit, jak konvoluční neuronová síť vidí obrázky.

Google využívá veřejné databáze obrázků k trénování své neuronové sítě. Například v roce 2012 Google naučil neuronovou síť rozpoznávat obrázky koček pomocí 10 milionů snímků koček z videí na YouTube.

Zpracování a porozumění přirozené řeči

Aby počítač rozuměl nejen hlasové příkazy, ale také přirozenou řeč, Google využívá rekurentní neuronové sítě.

Tradiční rozpoznávání řeči rozděluje zvuky na malé kousky o délce 10 milisekund. Každý takový fragment je analyzován na frekvenční obsah a výsledný vektor charakteristik prochází akustickým modelem, jehož výstupem je rozdělení pravděpodobnosti pro všechny zvuky. V kombinaci s dalšími charakteristikami řeči pak systém prostřednictvím výslovnostního modelu propojí posloupnost zvuků správných slov v jazyce a v modelu a určí, jak pravděpodobné je dané slovo v používaném jazyce. Nakonec jazykový model analyzuje výsledná slova a celou frázi a snaží se posoudit, zda je taková posloupnost slov v tomto jazyce možná. Ale u některých slov ve fonetickém zápisu je obtížné určit, kde končí jedno písmeno a kde začíná druhé, a to je velmi důležité pro správné rozpoznání.

Google nyní používá akustický model založený na rekurentní neuronové síti s architekturou „dlouhé krátkodobé paměti“. Jednoduše řečeno, tato neuronová síť si lépe než ostatní pamatuje informace, což ji umožnilo natrénovat rozpoznávání fonémů ve frázi, což výrazně zlepšilo kvalitu systému rozpoznávání. Proto dnes rozpoznávání hlasu na Androidu funguje téměř v reálném čase.

Umělá inteligence: Pomocník nebo hrozba?

Etická stránka používání umělé inteligence je vždy na pořadu dne, připouští Google. Společnost však zatím nevěří, že jsme dostatečně blízko k vytvoření počítačů, které jsou si vědomy sebe sama, abychom tuto otázku podrobně probrali. "Počítače se učí pomalu," říká Greg Corrado. Prozatím může Google vytvořit umělou inteligenci, která je dobrá v jednom úkolu, jako je hra Go, jako je AlphaGo. Ale pro plnohodnotnou umělou inteligenci mnohonásobně větší výpočetní výkon. Dnes vidíme, že výkon procesorů se zpomaluje, téměř jsme dosáhli hranice „Mooreova zákona“, a přestože je to částečně kompenzováno zvýšením výkonu grafických karet a nástupem specializovaných procesorů, stále to nestačí. Další překážkou je navíc nedostatek dostatečného množství odborných informací, které by bylo možné využít pro strojové učení. Lidstvo může vyřešit všechny tyto, a nejen, problémy během 20, 50 nebo 100 let, nebo je nikdy nikdo nevyřeší. Podle toho se umělá inteligence, kterou vidíme ve filmech, bude pravděpodobně velmi lišit od toho, co nakonec dostaneme.

Zvedák všech řemesel a budoucnost vyhledávání Google

Google si aktuálně klade reálnější cíl – vytvořit virtuální asistenty založené na umělé inteligenci. Dnes už takoví jsou virtuální asistenti jako Siri nebo Google Now, ale jsou velmi omezené a oddělené od reality, ve které se uživatel nachází. Co chce Google udělat? Společnost věří, že virtuální asistentka musí rozumět světu kolem sebe, pozici uživatele v tomto světě a také se v komunikaci spoléhat na aktuální kontext.

„Představte si, že máte neuvěřitelně chytrého asistenta a řeknete mu: Prostudujte si tuto oblast a řekněte mi, co si myslíte. To je to, co se snažíme vytvořit. V mém případě bych rád řekl svému asistentovi: ukaž mi ty nejzajímavější a nejrelevantnější věci, které ještě neznám,“ říká Eric Schmidt, předseda představenstva společnosti Alphabet, která vlastní Google.

Google tedy vnímá umělou inteligenci jako nový nástroj, který může rozšířit lidské schopnosti tím, že mu poskytne nové znalosti. Dobrým příkladem toho je AlphaGo, které hráči Go vnímají jako příležitost ke zlepšení své úrovně. Pokud totiž trénujete proti umělé inteligenci, která už ve hře překračuje maximální rank, pak ji to může posunout na novou úroveň.




Nahoru