Root NationČlánkyTechnologieCo jsou neuronové sítě a jak fungují?

Co jsou neuronové sítě a jak fungují?

-

Dnes se pokusíme přijít na to, co jsou neuronové sítě, jak fungují a jaká je jejich role při vytváření umělé inteligence.

Neuronové sítě. Tuto větu slýcháme téměř všude. Dochází k tomu, že neuronové sítě najdete i v ledničkách (to není vtip). Neuronové sítě jsou široce využívány algoritmy strojového učení, které dnes najdeme nejen v počítačích a chytrých telefonech, ale také v mnoha dalších elektronických zařízeních, například v domácích spotřebičích. A přemýšleli jste někdy, co jsou tyto neuronové sítě zač?

Nebojte se, tohle nebude akademická přednáška. Existuje mnoho publikací, mimo jiné v ukrajinském jazyce, které velmi odborně a spolehlivě vysvětlují tuto problematiku v oblasti exaktních věd. Takové publikace jsou staré více než tucet let. Jak je možné, že tyto staré publikace jsou stále aktuální? Faktem je, že základy neuronových sítí se nezměnily a samotný koncept – matematický model umělého neuronu – vznikl během druhé světové války.

Co jsou neuronové sítě a jak fungují?

To samé s internetem, dnešní internet je nesrovnatelně vyspělejší, než když byl odeslán první e-mail. Základy internetu, základní protokoly, existovaly od samého počátku jeho vzniku. Každý komplexní koncept je postaven na základech starých struktur. Stejné je to s naším mozkem, nejmladší mozková kůra není schopna fungovat bez nejstaršího evolučního prvku: mozkového kmene, který je v našich hlavách od dob daleko starších než existence našeho druhu na této planetě.

Trochu jsem tě zmátl? Pojďme si tedy porozumět podrobněji.

Zajímavé také: ChatGPT: Jednoduchý návod k použití

Co jsou to neuronové sítě?

Síť je soubor určitých prvků. Toto je nejjednodušší přístup v matematice, fyzice nebo technice. Je-li počítačová síť souborem vzájemně propojených počítačů, pak neuronová síť je zjevně souborem neuronů.

nervová síť

Tyto prvky však nejsou ani vzdáleně srovnatelné ve složitosti s nervovými buňkami našeho mozku a nervového systému, ale na určité úrovni abstrakce jsou některé znaky umělého neuronu a biologického neuronu společné. Je ale nutné připomenout, že umělý neuron je mnohem jednodušší pojem než jeho biologický protějšek, o kterém stále ještě nevíme vše.

- Reklama -

Přečtěte si také: 7 nejlepších využití ChatGPT

Nejprve to byl umělý neuron

První matematický model umělého neuronu vyvinuli v roce 1943 (ano, to není chyba, během druhé světové války) dva američtí vědci Warren McCulloch a Walter Pitts. To se jim podařilo na základě interdisciplinárního přístupu, spojujícího základní znalosti fyziologie mozku (vzpomeňte na dobu, kdy tento model vznikl), matematiky a tehdejšího mladého IT přístupu (využili mj. teorii vyčíslitelnosti Alana Turinga ). McCulloch-Pittsův model umělého neuronu je velmi jednoduchý model, má mnoho vstupů, kdy vstupní informace prochází váhami (parametry), jejichž hodnoty určují chování neuronu. Výsledný výsledek je odeslán na jeden výstup (viz diagram McCulloch-Pitts neuronu).

nervová síť
Schéma umělého neuronu 1. Neurony, jejichž výstupní signály jsou vstupem na vstup daného neuronu 2. Sčítač vstupních signálů 3. Kalkulačka přenosových funkcí 4. Neurony, na jejichž vstupy je přiváděn signál daného neuronu 5. ωi — váhy vstupních signálů

Taková stromovitá struktura je spojena s biologickým neuronem, protože když přemýšlíme o kresbách znázorňujících biologické nervové buňky, vybaví se nám charakteristická stromovitá struktura dendritů. Člověk by však neměl podlehnout iluzi, že umělý neuron se alespoň trochu blíží skutečné nervové buňce. Těmto dvěma výzkumníkům, autorům prvního umělého neuronu, se podařilo prokázat, že pomocí sítě propojených neuronů lze vypočítat jakoukoli vypočítatelnou funkci. Připomeňme však, že tyto první koncepty vznikaly pouze jako myšlenky, které existovaly pouze „na papíře“ a neměly reálnou interpretaci v podobě provozního zařízení.

Přečtěte si také: O kvantových počítačích jednoduchými slovy

Od modelu po inovativní implementace

McCulloch a Pitts vyvinuli teoretický model, ale na vytvoření první skutečné neuronové sítě si muselo počkat více než deset let. Za jeho tvůrce je považován další průkopník výzkumu umělé inteligence Frank Rosenblatt, který v roce 1957 vytvořil síť Mark I Perceptron a sám jste ukázal, že díky této struktuře stroj získal schopnost, která byla dříve vlastní pouze zvířatům a lidem: to se může učit. Nyní však víme, že ve skutečnosti existovali další vědci, kteří přišli s myšlenkou, že se stroj může učit, a to i před Rosenblattem.

Mark I Perceptron

Mnoho výzkumníků a průkopníků informatiky v 1950. letech minulého století přišlo s nápadem, jak přimět stroj, aby dělal to, co by sám nezvládl. Například Arthur Samuel vyvinul program, který hrál dámu s člověkem, Allen Newell a Herbert Simon vytvořili program, který mohl nezávisle dokazovat matematické věty. Ještě před vytvořením první Rosenblattovy neuronové sítě sestrojili další dva průkopníci výzkumu v oblasti umělé inteligence, Marvin Minsky a Dean Edmonds, v roce 1952, tedy ještě před objevením se Rosenblattova perceptronu, stroj nazvaný SNARC (Stochastic Neural Analog Reinforcement Calculator) - stochastické neuronové analogové kalkulátorové zesílení, mnohými považované za první stochastický počítač neuronové sítě. Nutno podotknout, že SNARC neměl s moderními počítači nic společného.

SNARC

Výkonný stroj, využívající více než 3000 elektronek a náhradního mechanismu autopilota z bombardéru B-24, dokázal simulovat činnost 40 neuronů, což se ukázalo jako dostačující k matematické simulaci krysího hledání východu z bludiště. . Žádná krysa samozřejmě nebyla, šlo jen o proces dedukce a hledání optimálního řešení. Tento vůz byl součástí Ph.D. Marvina Minského.

adaline síť

Dalším zajímavým projektem v oblasti neuronových sítí byla síť ADALINE, kterou v roce 1960 vyvinul Bernard Withrow. Lze si tedy položit otázku: protože před více než půl stoletím vědci znali teoretické základy neuronových sítí a dokonce vytvořili první funkční implementace takových výpočetních rámců, proč to trvalo tak dlouho, až do 21. vytvářet skutečná řešení založená na neuronových sítích? Odpověď je jedna: nedostatečný výpočetní výkon, ale nebyla to jediná překážka.

nervová síť

I když v 1950. a 1960. letech bylo mnoho průkopníků umělé inteligence fascinováno možnostmi neuronových sítí a někteří z nich předpovídali, že strojový ekvivalent lidského mozku je vzdálen pouhých deset let. To je dnes dokonce úsměvné číst, protože k vytvoření strojového ekvivalentu lidského mozku jsme se stále ani nepřiblížili a k ​​vyřešení tohoto úkolu máme ještě daleko. Rychle se ukázalo, že logika prvních neuronových sítí byla fascinující i omezená. První implementace umělé inteligence využívající umělé neurony a algoritmy strojového učení dokázaly vyřešit určitý úzký okruh úloh.

Když však došlo na širší prostory a řešení něčeho opravdu závažného, ​​jako je rozpoznávání vzorů a obrázků, simultánní překlad, rozpoznávání řeči a rukopisu atd., tedy věci, které už dnes umí počítače a umělá inteligence, ukázalo se, že první implementace neuronových sítí to prostě nedokázaly. proč tomu tak je? Odpověď dal výzkum Marvina Minského (ano, ten samý ze SNARC) a Seymoura Paperta, kteří v roce 1969 prokázali omezení perceptronové logiky a ukázali, že zvyšování schopností jednoduchých neuronových sítí pouze díky škálování nefunguje. Byla tu ještě jedna, ale velmi důležitá bariéra – výpočetní výkon, který byl v té době k dispozici, byl příliš malý na to, aby bylo možné využít neuronové sítě podle plánu.

Zajímavé také:

- Reklama -

Renesance neuronových sítí

V 1970. a 1980. letech XNUMX. století byly neuronové sítě prakticky zapomenuty. Až koncem minulého století se dostupný výpočetní výkon stal tak velkým, že se k němu lidé začali vracet a rozvíjet své schopnosti v tomto oboru. Tehdy se objevily nové funkce a algoritmy, schopné překonat omezení prvních nejjednodušších neuronových sítí. Tehdy vznikla myšlenka hlubokého strojového učení vícevrstvých neuronových sítí. Co se vlastně s těmito vrstvami děje? Dnes jsou téměř všechny užitečné neuronové sítě fungující v našem prostředí vícevrstvé. Máme vstupní vrstvu, která má za úkol přijímat vstupní data a parametry (váhy). Počet těchto parametrů se liší v závislosti na složitosti výpočetního problému, který má síť řešit.

nervová síť

Navíc tu máme takzvané „skryté vrstvy“ – zde se dějí všechna „kouzla“ spojená s hlubokým strojovým učením. Právě skryté vrstvy jsou zodpovědné za schopnost této neuronové sítě učit se a provádět potřebné výpočty. Konečně posledním prvkem je výstupní vrstva, tedy vrstva neuronové sítě, která dává požadovaný výsledek, v tomto případě: rozpoznaný rukopis, obličej, hlas, vytvořený obraz na základě textového popisu, výsledek tomografické analýzy diagnostický obraz a mnoho dalšího.

Přečtěte si také: Testoval jsem a vyzpovídal Bingova chatbota

Jak se neuronové sítě učí?

Jak již víme, jednotlivé neurony v neuronových sítích zpracovávají informace pomocí parametrů (vah), kterým jsou přiřazeny jednotlivé hodnoty a spojení. Tyto váhy se během procesu učení mění, což vám umožňuje upravit strukturu této sítě tak, aby generovala požadovaný výsledek. Jak přesně se síť učí? To je jasné, musí se to neustále trénovat. Nedivte se tomuto rčení. I my se učíme a tento proces není chaotický, ale řekněme uspořádaný. Říkáme tomu vzdělání. V každém případě lze trénovat i neuronové sítě, a to většinou pomocí vhodně zvolené sady vstupů, která síť nějakým způsobem připraví na úkoly, které bude v budoucnu plnit. A to vše se krok za krokem opakuje, někdy proces učení do jisté míry připomíná samotný tréninkový proces.

Pokud je například úkolem této neuronové sítě rozpoznávat obličeje, je předem natrénována na velké množství snímků obsahujících obličeje. V procesu učení se váhy a parametry skrytých vrstev mění. Odborníci zde používají slovní spojení „minimalizace nákladové funkce“. Nákladová funkce je veličina, která nám říká, jak moc daná neuronová síť dělá chyby. Čím více dokážeme minimalizovat nákladovou funkci v důsledku tréninku, tím lépe bude tato neuronová síť fungovat v reálném světě. Nejdůležitější vlastností, která odlišuje jakoukoli neuronovou síť od úlohy naprogramované pomocí klasického algoritmu, je to, že v případě klasických algoritmů musí programátor krok za krokem navrhnout, jaké akce bude program provádět. V případě neuronových sítí je síť sama schopna naučit se správně plnit úkoly sama. A nikdo přesně neví, jak složitá neuronová síť provádí své výpočty.

nervová síť

Neuronové sítě jsou dnes široce a možná překvapivě velmi často využívány bez pochopení, jak vlastně výpočetní proces v dané síti funguje. Není to potřeba. Programátoři používají hotové strojově naučené neuronové sítě, které jsou připraveny na vstupní data určitého typu, zpracovávají je způsobem, který znají jen oni, a produkují požadovaný výsledek. Programátor nemusí vědět, jak proces odvození funguje uvnitř neuronové sítě. To znamená, že člověk zůstává stranou velkého objemu výpočtů, způsobu získávání informací a jejich zpracování neuronovými sítěmi. Odtud určité obavy lidstva ohledně modelů umělé inteligence. Jednoduše se bojíme, že si neuronová síť jednoho dne zadá určitý úkol a samostatně, bez pomoci člověka, najde způsoby, jak jej vyřešit. To lidstvo znepokojuje, vyvolává strach a nedůvěru v používání algoritmů strojového učení.

chat gpt

Tento utilitární přístup je dnes běžný. U nás je to stejné: víme, jak někoho vycvičit v konkrétní činnosti, a víme, že tréninkový proces bude efektivní, pokud se bude dělat správně. Člověk získá požadované dovednosti. Chápeme ale přesně, jak v jeho mozku probíhá proces dedukce, který tento efekt způsobil? Nemáme tušení.

Úkolem vědců je tyto problémy co nejvíce studovat, aby nám sloužily a pomáhaly tam, kde je to nutné, a hlavně se nestaly hrozbou. Jako lidé se bojíme toho, co neznáme.

Zajímavé také: 

Yuri Svitlyk
Yuri Svitlyk
Syn Karpat, neuznaný génius matematiky, "právník"Microsoft, praktický altruista, levá-pravá
- Reklama -
Přihlásit se
Upozornit na
host

0 Komentáře
Vložené recenze
Zobrazit všechny komentáře