Čo potrebujete vedieť na rozbehnutie pomocou technológií umelej inteligencie? Aké procesy musíte zvážiť, ako potrebujete pripraviť a spracovať údaje na výcvik neurónovej siete a čo treba hľadať pri nábore a testovaní? Toto všetko si treba preštudovať pred bratstvom za prácu.
Porozumenie obchodných potrieb a zdrojov zdrojových údajov je zásadné. Stáva sa, že sa objaví dobré riešenie bez použitia technológií umelej inteligencie.
Na čo sa musíte zamerať, aby ste sa mohli správne rozhodnúť, podľa potrieb používateľov alebo použitej technológie? Verí sa, že taký produkt využívajúci AI, ktorý je navrhnutý tak, aby pomohol ľuďom získať prístup k informáciám alebo ich priamo spracovať, urobiť správne rozhodnutia, je úspešný.
1. Stanovenie cieľa a stanovenie úlohy
Prvou a najdôležitejšou otázkou pre vývojový tím je správna formulácia problému, ktorého riešenie prostredníctvom umelej inteligencie bude obchodnou potrebou. Výsledkom riešenia tohto problému bude konečný očakávaný výsledok a výsledok musí byť skontrolovaný, aby sa zabezpečila maximálna presnosť.
2. Zber a príprava počiatočných údajov
Ďalším krokom je rozhodnutie o zdrojoch údajov. Je potrebné skontrolovať, či sú pravdivé, aké sú spôsoby integrácie týchto údajov do vyvíjaného systému a ako ich môže vývojový tím využiť na dosiahnutie obchodných cieľov. Jednoducho povedané, pri práci s údajmi musia byť tieto dáta spracované čo najefektívnejšie, a to aj napriek zložitým transformáciám a nízkej rýchlosti spracovania, aby bol na výstupe dosiahnutý správny výsledok. Na kvalite primárnych údajov nezáleží, hlavné je správne pripraviť tréningovú vzorku. Ak je správne vybraný princíp vzorkovania tréningových údajov, je možné úlohu škálovať pomocou úplnejšej množiny údajov.
Ak zhrniete, čo bolo povedané, môžete pripraviť zoznam otázok:
• Aké zdroje údajov sú k dispozícii?
• Čo sú tieto údaje?
• Máme dostatok údajov?
• Odkiaľ údaje pochádzajú, ako sa zhromažďujú a spracúvajú?
V budúcnosti by sa malo položiť niekoľko otázok, pretože ak sa tak nestane, táto skutočnosť môže výrazne skomplikovať vývoj projektu.
Ďalšie otázky:
✓ Je vzorka údajov, ktorú používame na zaškolenie modelového zástupcu?
✓ Existujú nejaké prekážky, ktoré sme nezohľadnili?
✓ Obsahuje vzorka osobné údaje a sme oprávnení ich použiť?
Ďalším krokom, ktorý je potrebné podniknúť pred vytvorením samotného algoritmu, je spracovanie. To znamená samo osebe (príprava, klastrovanie) a normalizáciu údajov. Tento krok je potrebný na prípravu vzorky na správnu interpretáciu matematickým modelom umelej inteligencie. Napríklad operácie ako zvýšenie premenných na výkon alebo násobenie konštantou je možné vykonať na číselnom výbere. To umožní lineárnym modelom modelovať nelineárne vzťahy na identifikáciu bežných vzorov.
Niekedy je potrebné vykonať transformáciu, aby ste správne interpretovali frekvenčné charakteristiky pri spracovaní zvuku alebo aby ste pri riešení problému zhody obrazu použili algoritmus SIFT. Musíte pochopiť, že normalizácia a príprava údajov sú pre tradičné strojové učenie zásadné. Tento proces významne ovplyvňuje výber architektúry použitých neurónových sietí, najmä pri takzvanom deep learningu, keď je potrebné správne určiť počet skrytých vrstiev v neurónovej sieti a počet umelých neurónov v nich. Jednou z hlavných výhod viacvrstvových neurónových sietí je modelovanie práce určitého zložitého matematického vzťahu.
3. Vývoj modelu umelej inteligencie, programovanie a výcvik neurónovej siete
Teraz, keď existuje jasný obchodný cieľ, správna sada počiatočných údajov pre vzorku a samotnú vzorku, môžete začať vyvíjať modely neurónových sietí, programovať ich a ďalej trénovať. Nová etapa bude zahŕňať výber algoritmu učenia, aplikáciu algoritmu učenia, jeho vizualizáciu a hodnotenie kvality učenia.
Výcvik neurónovej siete sa dá porovnať s výcvikom psa na povel, ktorý sa robí miliónkrát. Akokoľvek to znie triviálne, proces učenia je dosť jednoduchý. Máte tréningovú vzorku obsahujúcu vstupy a výstupy. Počiatočné dáta napájate na vstup neurónovej siete a na výstupe získate určitý výsledok spracovania neurónovou sieťou. Ďalej porovnáte výsledok s konečným výsledkom z vyššie uvedenej vzorky s uvedením stupňa podobnosti. Tento proces sa môže zdať jednoduchý, ale jeho efektívne a správne vykonanie na veľkých súboroch údajov nie je ani zďaleka ľahké zabezpečiť. Je potrebné zvoliť správny algoritmus učenia pre neurónovú sieť, inak sa vytvorená umelá inteligencia môže naučiť nesprávne interpretovať prichádzajúci dátový tok, čo povedie k nežiaducim chybám.
Jeden taký prípad sa stal v prípade spoločnosti Google, keď bola do jej softvéru na rozpoznávanie tváre vložená fotografia afroamerickej rodiny a program označil tento obrázok ako rodinu opíc. Súvisí v tomto prípade výsledok práce AI s rasizmom? Vo výsledku sa ukazuje, že konečné správanie vytvorenej umelej inteligencie vyplýva zo súboru počiatočných údajov, postupov ich spracovania a normalizácie a použitého cvičného algoritmu a kritéria pre validáciu výsledku výcviku. Práve v tomto štádiu kombinácia niekoľkých prístupov umožňuje správne trénovať neurónovú sieť tak, aby boli interakcie s vyvinutým matematickým modelom čo najefektívnejšie.
4. Overenie získaných výsledkov
Reprezentatívna by mala byť aj vzorka na testovanie, ako aj súbor údajov na školenie. Predtým platilo pravidlo, že sa použije pôvodná tréningová sada v pomere 80 ku 20, z ktorých sa väčšina údajov používa na trénovanie neurónovej siete. Teraz zostáva rozhodnúť o zložení tímu a úlohe každého účastníka. Vývojový tím by mal prevziať prácu na nácviku neurónovej siete, najmä vývoj a testovanie algoritmov strojového učenia. Jedna časť tímu bude trénovať a druhá otestuje algoritmus a skontroluje, ako presne AI rieši problém. Jednou z bežných chýb, ktorej čelí veľa vývojových tímov, je použitie rovnakého súboru údajov na trénovanie a testovanie neurónovej siete.
Vývojový tím, ktorý sa dostane do tejto pasce, bude v pokušení povedať, že v dôsledku vykonaného strojového učenia dáva neurónová sieť vo výsledku správny výsledok. Ďalej musí vývojový tím vyhodnotiť výkonnosť modelu neurónovej siete z hľadiska citlivosti a nákladov. Neexistujú dokonalé modely, ale nie všetky chyby sú samy osebe rovnaké. Model môže produkovať takzvaný falošne pozitívny alebo falošne negatívny výsledok. Samozrejme, falošný pozitív je lepší. Umožňuje to pri rozhodovaní trochu hrať na istotu.
V prípade maloobchodných riešení môže nadmerné predpovedanie zvýšiť náklady na prevádzkový kapitál, zatiaľ čo podhodnotenie môže viesť k výraznejším nákladom v dôsledku prudkého poklesu predaja zákazníkom. Rozhodovanie o tom, ako správne trénovať neurónovú sieť na riešenie konkrétneho problému, je vždy kompromisom.
Ako odpovedať na otázku, koľko tréningových cyklov je potrebných?
Je prácou AI iba zapamätanie si poľa údajov a ich načítanie, alebo bude prioritou identifikácia určitých vzorov údajov v tomto poli?
Vyvažovanie preťaženia neurónovej siete a zovšeobecnenia je ďalšou zložitou vedou. Počas celého procesu učenia sa hlavný problém často zostáva, akoby skrytý, zmizne z oblasti viditeľnosti. Napríklad, ako merať úspech, hodnotu, preferencie? Je toto opatrenie v súlade s obchodnými požiadavkami? Je to technicky užitočné? Na tieto otázky je často potrebné okamžite odpovedať. Všetky súbory údajov majú slabé stránky a úskalia a nie všetky sú matematicky užitočné na učenie.
Ak si vývojový tím bude istý správnym riešením problému, môže pracovať na transformácii výsledkov neurónovej siete na nápady, akčné prvky, predpovede alebo ich jednoducho použiť ako výsledok spracovania údajov.