Hluboké strojové učení


Deep Machine Learning

Hluboké strojové učení (Deep Machine Learning)


S našimi klienty vytváříme partnerství, ve kterém využíváme naše znalosti z oblasti hlubokého strojového učení, které kombinujeme s daty našich partnerů, jejich specifickými znalostmi oboru a přístupem na trh pro řešení reálných problémů.


Hluboké strojové učení (Deep Machine Learning) učí počítače dělat to, co lidé a zvířata dělají přirozeně – učit se ze zkušenosti. Algoritmy strojového učení používají výpočetní metody pro „učení se „ informacím přímo z dat bez spoléhání se na předem definovaný model. Algoritmy adaptivně zlepšují svoji výkonnost se vzrůstajícím počtem dat. Algoritmy analyzují historická data z proběhlých výrobních cyklů a identifikují skryté vzory v milionech datových bodů které lidé nejsou schopni zachytit jako např. vztahy mezi charakteristikami zakázky a seřizovacími časy a časy výrobního cyklu nebo jakýmikoliv jinými měřitelnými daty.


Systém bude obsahovat Deep Neural Convolutional Networks (hluboké neuronové konvoluční sítě) které simulují pochody v mozku pomocí umělé neuronové sítě, která má mnoho vnořených vrstev kde výstup z jednoho uzlu vrstvy je nelineární kombinací (konvolucí) všech vstupů z předchozí vrstvy. 


Nemůžete se ovšem jen tak podívat do hluboké neuronové sítě, abyste viděli, jak funguje. Síťový charakter je zakotven v chování tisíců simulovaných neuronů uspořádaných do desítek nebo dokonce stovek složitě propojených vrstev. Neurony v první vrstvě obdrží vstup, jako je amplituda signálu ze senzoru na zařízení, a potom provedou konvoluční výpočet před vygenerováním nového signálu. Tyto výstupy jsou propojeny v komplexní síti na neurony v dalších vrstvách dokud se nevytvoří celkový výstup. Navíc existuje proces nazývaný zpětné šíření, který upravuje výpočty jednotlivých neuronů tak, aby se síť naučila produkovat požadovaný výstup např. odhalit opotřebení součásti zařízení, nebo zpožďování zakázky.


Propojíme sílu hlubokého strojového učení (Deep Machine Learning) s tzv. posilovaným učením (Reinforcement Learning) a vytvoříme systém, který se bude sám učit tak, aby rozpoznal jemné vzory vyskytující se ve velkém množství vašich dat, a spojil akce (například úprava času výrobní operace) s výsledky (jako například včas dodaný výrobek zákazníkovi). Software bude mít přístup k aktualizovaným datům v reálném čase a v podstatě mu bude řečeno: "Využij je, abys zjistil, jak maximalizovat využití zdrojů a produktivity."  


Posilované strojové učení (Reinforcement Learning)

Během posilovaného strojového učení softwarový agent provádí pozorování a podniká akce v prostředí a na oplátku získává odměny. Jeho cílem je naučit se jednat způsobem, který maximalizuje očekávané dlouhodobé odměny. Stručně řečeno, agent působí v prostředí a učí se pokusem a omylem, aby maximalizoval své odměny a minimalizoval svou ztrátu.

Agentem může být program, který sleduje aktualizovaná data v reálném čase a rozhodne jak upravit např. čas výrobní operace tak, aby získal pozitivní odměnu např. když se přiblíží cílovým hodnotám klíčových ukazatelů výkonnosti KPI a negativní odměnu když KPI budou pod určitou minimální hodnotou.

Algoritmus používaný softwarovým agentem k určení jeho akcí se nazývá jeho strategie. Strategií například může být neuronová síť, která přijímá na vstupu aktualizovaná data v reálném čase a vyvozuje akci, která má být přijata.


Neuronová síť v mozku.


Umělá konvoluční hluboká neuronová síť.


Posilované strojové učení (Reinforcement Learning)

Hra kterou nikdo nedokáže vysvětlit – překonání Polanyiho paradoxu

Naučit se hrát strategickou hru Go (vznikla před 2 500 lety v Číně) bylo vždy obtížné - Konfucius radil, že "pánové by neměli ztrácet čas triviálními hrami - měli by studovat Go„, ale naprogramovat počítač pro tuto hru se zdálo nemožné.

Odhaduje se, že na standardní kartě Go je asi 2 × 10 na170 možných pozic – více než počet atomů obsažených ve vesmíru a hráči Go nejsou schopni popsat jak zvládají tuto obrovskou komplexitu hry – situace popsaná ve 20. století matematikem Michaelem Polanyim: "Víme víc, než můžeme říct.„ - tento Polanyiho paradox byl nepřekonatelnou překážkou pro programování Go - jak napsat program, který obsahuje nejlepší strategie pro hraní hry, když žádný člověk nedokáže formulovat tyto strategie?

V říjnu 2016 Google DeepMind – Londýnská pobočka společnosti Google specializující se na hluboké strojové učení porazila 4 – 1 se svoji aplikací AlphaGo využívající hluboké neuronové sítě mistra světa ve hře Go Lee Sedola z Jižní Koreje a překonala Polanyiho paradox – Sedol po porážce řekl: „Cítil jsem se bezmocný. .  . mám rozsáhlé zkušenosti, pokud jde o hraní hry Go, ale nikdy jsem nebyl pod takovým tlakem.„

Styl Lee Sedola byl popisovaný jako "Intuitivní, nepředvídatelný, kreativní, intenzivní, divoký, komplikovaný, hluboký, rychlý, chaotický" - charakteristiky, které podle něj mu dávají definitivní výhodu nad jakýmkoli počítačem.

Přesto byl Lee Sedol poražen protože tým DeepMind nenaprogramoval AlphaGo s vynikajícími strategiemi Go a heuristikou. Místo toho použil sílu hlubokého strojového učení (Deep Machine Learning) na oblast posilovaného učení (Reinforcement Learning) a vytvořil systém, který se sám učil. AlphaGo byl vytvořen k rozpoznání jemných vzorů, které se vyskytují ve velkém množství dat, a spojení akcí (například hrát kámen na určité místo na desce) s výsledky (jako například vyhrát hru Go). Software měl přístup k 30 mil. herních pozic z online úložiště a v podstatě mu bylo řečeno: "Využij je, abys zjistil, jak vyhrát."  


Vítězství umělé inteligence nad mistrem světa ve hře GO znamená překonání Polanyiho paradoxu a přináší nové možnosti ve využití hlubokých konvolučních neuronových sítí v oblastech vyžadujících vlastnosti jako je intuice, kreativita nebo schopnost analýzy komplexních problémů.