www.modernitovarna.com
16
'19
Written on Modified on
Cognex Germany Inc
Hluboké učení + strojové vidění = kontrola kvality nové generace
Kombinace techniky strojového vidění a metod hlubokého učení (deep learning) dává firmám výkonný prostředek pro optimalizaci provozních nákladů a návratnosti investic (ROI). Pro maximalizaci návratnosti investic je klíčové pochopit, jak se mohou klasické metody zpracování obrazu a metody hlubokého učení navzájem doplňovat – spíše než si konkurovat nebo se nahrazovat. Tento článek pomůže věc objasnit.
V poslední dekádě se svět techniky mění a objevuje se mnoho různých nových pojmů: mobilní zařízení, big data, umělá inteligence (AI), internet věci (IoT), robotika, blockchain, 3D tisk, strojové vidění... Novinky přicházející z výzkumných a vývojových pracovišť pomáhají zlepšovat náš každodenní život.
Inženýři tyto novinky rádi přijímají a přizpůsobují je pro náročné průmyslové prostředí a těžké podmínky. Pro průmyslové podniky je zásadní, aby strategicky plánovaly implementaci a využití všech těchto novinek, nebo alespoň některých z nich.
Zde se soustředíme na umělou inteligenci, AI, a konkrétně na analýzu obrazu založenou na hlubokém učení a na porovnávání snímaného obrazu s množinou vzorů. V kombinaci s tradičním strojovým viděním využívajícím rozhodování založené na pevných pravidlech to může pomoci lépe identifikovat správné díly při robotizované montáži, detekovat, zda je díl přítomen nebo ne, popř. zda není do hotového produktu namontován nesprávný díl, a rychle určit, je-li detekovaná odlišnost vadou nebo jen nepodstatnou odchylkou. A to vše může být vykonáno s velkou přesností.
Podívejme se nejprve, co je to hluboké učení
Bez toho, že bychom se ponořili hluboko do detailů teorie (lze to tak říci?), pojďme si nejprve něco povědět o hardwaru GPU. GPU (Graphics Processing Units) jsou procesorové jednotky, které se skládají z tisíců relativně jednoduchých výpočetních jader na jednom čipu. Jejich architektura vypadá jako neuronová síť. To umožňuje využívat biologicky inspirované a mnohovrstvé "hluboké" neuronové sítě připomínající lidský mozek.
Taková architektura umožňuje prostřednictvím hlubokého učení řešit specifické úlohy bez explicitního programování. Jinými slovy, klasické počítačové aplikace založené na rozhodování podle pravidel jsou pro plnění specifických úloh programovány lidmi, ale hluboké učení využívá trénování neuronové sítě na trénovacích datech (obrazech, řeči, textu, číslech...). Neuronové sítě v průběhu hlubokého učení začínají s primární logikou vyvinutou při počátečním natrénování a kontinuálně s tím, jak jsou jim dodávána nová data, zlepšují svůj výkon.
Metoda je založena na detekci rozdílů: permanentně hledá v množině dat změny a nepravidelnosti. Je citlivá na nepředvídatelné poruchy a dokáže na ně reagovat. Lidé to tak dělají přirozeně, ovšem počítačové systémy založené na rigidním programování v tom nejsou zrovna dobré. (A na rozdíl od lidských kontrolorů na výrobních linkách se počítačové systémy nikdy neunaví tím, že dělají stále dokola stejnou iteraci.)
V každodenním životě jsou typickými úlohami pro hluboké učení rozeznávání obličejů (pro přihlášení uživatele do počítače nebo identifikaci osob na fotografiích), výběr doporučení (u služeb streamování videa nebo hudby nebo při nákupu v e-shopech), filtrování spamu v emailech, podpora diagnostiky chorob v medicíně, detekce zneužití kreditních karet atd.
Metoda hlubokého učení dává na základě dostatečné množiny tréninkových dat velmi přesné výstupy. Používá se pro odhad vzorů, detekci odchylek a anomálií a pro přijímání kritických podnikatelských rozhodnutí. Tato metoda se nyní přesouvá do oblasti pokročilé výrobní praxe např. pro kontrolu kvality a pro jiné úlohy, v nichž je třeba přijímat rozhodnutí.
Jestliže je metoda hlubokého učení spolu se strojovým viděním implementována pro správný typ úloh v podniku, rychle zvyšuje ziskovost výroby (to je výhoda zvláště ve srovnání s investicemi do jiných emergentních technologií, u nichž je třeba počítat s návratností až za mnoho let).
Jak hluboké učení doplňuje strojové vidění?
Systém strojového vidění se spoléhá na digitální senzor obrazu umístěný v průmyslové kameře s objektivem vybraným podle požadavků úlohy. Senzor snímá obrazy, které jsou následně přenášeny do počítače. Specializovaný software obrazy zpracovává, analyzuje a počítá různé charakteristiky potřebné pro přijímání rozhodnutí. Systémy strojového vidění s rozhodováním založeným na pravidlech pracují spolehlivě s konzistentními, shodně vyrobenými díly. Využívají postupné filtrování a jejich rozhodovací algoritmy mají pevně daná pravidla.
Ve výrobní lince může systém strojového vidění s tímto rozhodovacím algoritmem vysoce přesně kontrolovat stovky až tisíce dílů za minutu. Ve srovnání s lidskou kontrolou je systém strojového vidění cenově úspornější. Při řešení úloh rozhodování je třeba pro analýzu obrazu určit a do aplikace naprogramovat pevně daná a jednoznačná pravidla.
V podnikové praxi je tradiční strojové vidění s vyhodnocením založeným na pravidlech ideální pro: navádění (určení pozice, orientace...), identifikaci (čárové kódy, data-matrix kódy, značky, písmena a číslice...), měření (srovnání rozměrů se specifickými jmenovitými hodnotami...) nebo kontrolu (trhliny a jiné problémy, jako jsou chybějící bezpečnostní těsnění, zlomené díly...).
Strojové vidění s rozhodováním založeným na pravidlech je skvělé, je-li k dispozici známá množina proměnných: je díl přítomen nebo ne? jak daleko je přesně jeden předmět od druhého? kde má robot uchopit tento díl? Tyto úlohy je snadné vyřešit na montážních linkách v kontrolovaném prostředí. Co se však stane v případě, že věci nejsou tak jednoznačné?
To je právě oblast, kde se do hry může zapojit hluboké učení:
• řešení úloh strojového vidění v případech, kdy by jejich naprogramování podle pravidel bylo příliš složité,
• řešení úloh, kde je třeba vypořádat se s rušivým pozadím nebo odchylkami ve vzhledu dílů,
• údržba aplikací v provozu a trénování s novými obrazovými daty,
• přizpůsobení novým příkladům bez nutnosti znovu programovat neuronovou síť v jádru aplikace.
Typickým příkladem z průmyslu je vyhledávání škrábanců na obrazovkách elektronických zařízení. Tyto defekty mohou mít různou velikost, vzhled a umístění a mohou se vyskytovat na displejích s různým pozadím. S ohledem na tuto různorodost je to právě hluboké učení, které dokáže určit rozdíl mezi vyhovujícím a nevyhovujícím dílem. A navíc, natrénovat neuronovou síť na nový cíl (např. na nový typ displeje) je jednoduché – stačí jen mít trénovací množinu nových referenčních obrazů.
Dalším výrazným problémem pro tradiční systémy strojového vidění s rozhodováním založeným na pravidlech je kontrola vzhledově podobných dílů se složitou texturou povrchu a odchylkami vzhledu. "Funkční" nedostatky, která mají vliv na užitnou hodnotu, jsou téměř vždy nežádoucí, ale "kosmetické" odchylky mohou být v některých případech, v závislosti na potřebách a preferencích výrobce, přijatelné. Pro tradiční systémy strojového vidění však může být rozlišení mezi těmito defekty obtížné.
Vzhledem k mnoha vlivům, které je těžké eliminovat (osvětlení, změny barvy, tvaru nebo zorného pole) je detekci některých vad těžké pevně naprogramovat a úlohu vyřešit prostřednictvím tradičních metod strojového vidění. A zde je opět vhodným nástrojem hluboké učení.
Krátce řečeno, tradiční metody strojového vidění pracují spolehlivě s konzistentními, shodně vyrobenými díly, ale aplikaci je složité naprogramovat, je-li knihovna defektů a výjimek z pravidel příliš rozsáhlá. U složitých úloh, kde je třeba vidění podobné lidskému, ale s rychlostí a spolehlivostí počítačového systému, je možné se jako na vhodnou variantu spolehnout na hluboké učení.
Výhody metod hlubokého učení pro průmyslovou výrobu
Strojové vidění využívající rozhodování založené na pravidlech a metody hlubokého učení se navzájem doplňují a při volbě nástrojů pro novou generaci průmyslové automatizace nejde o výběr buď-nebo. V mnoha úlohách, např. při měření rozměrů, jsou klasické metody strojového vidění s naprogramovanými pravidly stále preferovanou a cenově výhodnou volbou. Pro složité kontrolní úlohy s mnoha odchylkami a nepředvídatelnými závadami jsou aplikace strojového vidění naprogramované tradičním způsobem příliš rozsáhlé a komplikované z hlediska tvorby i údržby aplikace, a v těchto případech jsou metody hlubokého učení výbornou alternativou.
Chcete-li se o řešeních s hlubokým učením od firmy Cognex dozvědět více, navštivte cognex.com/ViDi-deep-learning