Root NationArticoliTecnologieCosa sono le reti neurali e come funzionano?

Cosa sono le reti neurali e come funzionano?

-

Oggi cercheremo di capire cosa sono le reti neurali, come funzionano e quale è il loro ruolo nella creazione dell'intelligenza artificiale.

Reti neurali. Sentiamo questa frase quasi ovunque. Si arriva al punto che troverete reti neurali anche nei frigoriferi (non è uno scherzo). Le reti neurali sono ampiamente utilizzate dagli algoritmi di apprendimento automatico, che oggi si possono trovare non solo nei computer e negli smartphone, ma anche in molti altri dispositivi elettronici, ad esempio negli elettrodomestici. E ti sei mai chiesto cosa sono queste reti neurali?

Non preoccuparti, questa non sarà una lezione accademica. Esistono molte pubblicazioni, anche in lingua ucraina, che spiegano questo problema in modo molto professionale e affidabile nel campo delle scienze esatte. Tali pubblicazioni hanno più di dodici anni. Com'è possibile che queste vecchie pubblicazioni siano ancora attuali? Il fatto è che i fondamenti delle reti neurali non sono cambiati e il concetto stesso – un modello matematico di un neurone artificiale – è stato creato durante la Seconda Guerra Mondiale.

Cosa sono le reti neurali e come funzionano?

Lo stesso vale per Internet: Internet oggi è incomparabilmente più avanzata rispetto a quando fu inviata la prima e-mail. Le basi di Internet, i protocolli fondamentali, esistevano fin dall'inizio della sua creazione. Ogni concetto complesso è costruito sulle fondamenta di vecchie strutture. Lo stesso vale per il nostro cervello, la corteccia cerebrale più giovane non è in grado di funzionare senza l'elemento evolutivo più antico: il tronco encefalico, che è nella nostra testa da tempi molto più antichi dell'esistenza della nostra specie su questo pianeta.

Ti ho confuso un po'? Quindi capiamo più in dettaglio.

Interessante anche: ChatGPT: semplici istruzioni per l'uso

Cosa sono le reti neurali?

Una rete è una raccolta di determinati elementi. Questo è l’approccio più semplice in matematica, fisica o tecnologia. Se una rete di computer è un insieme di computer interconnessi, allora una rete neurale è ovviamente un insieme di neuroni.

rete neurale

Tuttavia, questi elementi non sono nemmeno lontanamente paragonabili in complessità alle cellule nervose del nostro cervello e del nostro sistema nervoso, ma a un certo livello di astrazione alcune caratteristiche di un neurone artificiale e di un neurone biologico sono comuni. Ma è necessario ricordare che il neurone artificiale è un concetto molto più semplice del suo omologo biologico, di cui ancora non sappiamo tutto.

- Annuncio pubblicitario -

Leggi anche: 7 usi più interessanti di ChatGPT

Prima c'era un neurone artificiale

Il primo modello matematico di neurone artificiale fu sviluppato nel 1943 (sì, non è un errore, durante la seconda guerra mondiale) da due scienziati americani, Warren McCulloch e Walter Pitts. Sono riusciti a farlo sulla base di un approccio interdisciplinare, combinando le conoscenze di base della fisiologia del cervello (ricordate l'epoca in cui è stato creato questo modello), la matematica e l'allora giovane approccio informatico (hanno utilizzato, tra le altre cose, la teoria della computabilità di Alan Turing ). Il modello del neurone artificiale McCulloch-Pitts è un modello molto semplice, ha molti input, dove l'informazione in input passa attraverso pesi (parametri), i cui valori determinano il comportamento del neurone. Il risultato risultante viene inviato a un'unica uscita (vedi diagramma del neurone McCulloch-Pitts).

rete neurale
Schema di un neurone artificiale 1. Neuroni i cui segnali di uscita vengono immessi nell'ingresso di un dato neurone 2. Sommatore di segnali di ingresso 3. Calcolatore della funzione di trasferimento 4. Neuroni ai quali viene applicato il segnale di un dato neurone 5. ωi — pesi dei segnali di ingresso

Una tale struttura ad albero è associata a un neurone biologico, perché quando pensiamo ai disegni raffiguranti cellule nervose biologiche, ci viene in mente la caratteristica struttura ad albero dei dendriti. Tuttavia non bisogna cedere all’illusione che un neurone artificiale sia almeno un po’ vicino a una vera cellula nervosa. Questi due ricercatori, autori del primo neurone artificiale, sono riusciti a dimostrare che qualsiasi funzione computabile può essere calcolata utilizzando una rete di neuroni interconnessi. Ricordiamo però che questi primi concetti furono creati solo come idee che esistevano solo "sulla carta" e non avevano una reale interpretazione sotto forma di apparecchiature operative.

Leggi anche: A proposito di computer quantistici in parole semplici

Dal modello alle implementazioni innovative

McCulloch e Pitts svilupparono un modello teorico, ma la creazione della prima vera rete neurale dovette attendere più di dieci anni. Il suo creatore è considerato un altro pioniere della ricerca sull'intelligenza artificiale, Frank Rosenblatt, che nel 1957 creò la rete Mark I Perceptron, e tu stesso hai dimostrato che grazie a questa struttura la macchina ha acquisito un'abilità precedentemente riservata solo agli animali e agli esseri umani: può imparare. Tuttavia, ora sappiamo che ci furono altri scienziati, anche prima di Rosenblatt, ad avanzare l’idea che una macchina potesse imparare.

Marco I Perceptron

Molti ricercatori e pionieri dell'informatica negli anni '1950 ebbero l'idea di come far fare a una macchina ciò che non poteva fare da sola. Ad esempio, Arthur Samuel ha sviluppato un programma che giocava a dama con un essere umano, Allen Newell e Herbert Simon hanno creato un programma in grado di dimostrare in modo indipendente teoremi matematici. Ancor prima della creazione della prima rete neurale di Rosenblatt, altri due pionieri della ricerca nel campo dell'intelligenza artificiale, Marvin Minsky e Dean Edmonds, nel 1952, cioè ancor prima della comparsa del perceptron di Rosenblatt, costruirono una macchina chiamata SNARC (Stochastic Neural Calcolatore di rinforzo analogico) - rinforzo del calcolatore analogico neurale stocastico, considerato da molti il ​​primo computer di rete neurale stocastico. Va notato che SNARC non aveva nulla a che fare con i computer moderni.

SNARC

La potente macchina, utilizzando più di 3000 tubi elettronici e un meccanismo di pilota automatico di riserva di un bombardiere B-24, è stata in grado di simulare il funzionamento di 40 neuroni, che si sono rivelati sufficienti per simulare matematicamente la ricerca di un topo per uscire da un labirinto . Ovviamente non c'era nessun ratto, era solo un processo di deduzione e ricerca della soluzione ottimale. Questa macchina faceva parte del dottorato di ricerca di Marvin Minsky.

rete adalina

Un altro progetto interessante nel campo delle reti neurali è stata la rete ADALINE, sviluppata nel 1960 da Bernard Withrow. Pertanto, ci si può chiedere: poiché più di mezzo secolo fa i ricercatori conoscevano i fondamenti teorici delle reti neurali e creavano persino le prime implementazioni funzionanti di tali strutture computazionali, perché ci è voluto così tanto tempo, fino al 21° secolo, per creare soluzioni reali basate su reti neurali? La risposta è una: potenza di calcolo insufficiente, ma non è stato l’unico ostacolo.

rete neurale

Anche se negli anni Cinquanta e Sessanta molti pionieri dell’intelligenza artificiale erano affascinati dalle possibilità delle reti neurali e alcuni di loro predissero che una macchina equivalente al cervello umano sarebbe stata solo a dieci anni di distanza. È persino divertente da leggere oggi, perché non ci siamo ancora nemmeno avvicinati alla creazione di una macchina equivalente al cervello umano e siamo ancora lontani dal risolvere questo compito. Divenne subito chiaro che la logica delle prime reti neurali era allo stesso tempo affascinante e limitata. Le prime implementazioni dell’intelligenza artificiale utilizzando neuroni artificiali e algoritmi di apprendimento automatico sono state in grado di risolvere una gamma ristretta di compiti.

Tuttavia, quando si è trattato di spazi più ampi e di risolvere qualcosa di veramente serio, come il riconoscimento di modelli e immagini, la traduzione simultanea, il riconoscimento vocale e della grafia, ecc., cioè cose che i computer e l’intelligenza artificiale possono già fare oggi, si è scoperto che il le prime implementazioni delle reti neurali semplicemente non erano in grado di farlo. Perché è così? La risposta è stata data dalla ricerca di Marvin Minsky (sì, lo stesso della SNARC) e Seymour Papert, che nel 1969 hanno dimostrato i limiti della logica del percettrone e hanno dimostrato che aumentare le capacità delle reti neurali semplici esclusivamente grazie al ridimensionamento non funziona. C’era un’altra barriera, ma molto importante: la potenza di calcolo disponibile a quel tempo era troppo piccola perché le reti neurali potessero essere utilizzate come previsto.

Interessante anche:

- Annuncio pubblicitario -

Rinascimento delle reti neurali

Negli anni ’1970 e ’1980 le reti neurali erano praticamente dimenticate. Fu solo alla fine del secolo scorso che la potenza di calcolo disponibile divenne così grande che le persone iniziarono a ritornarvi e a sviluppare le proprie capacità in questo campo. Fu allora che apparvero nuove funzioni e algoritmi, in grado di superare i limiti delle prime più semplici reti neurali. Fu allora che nacque l'idea dell'apprendimento automatico profondo delle reti neurali multistrato. Cosa succede realmente a questi strati? Oggi, quasi tutte le reti neurali utili che operano nel nostro ambiente sono multistrato. Abbiamo un livello di input il cui compito è ricevere dati e parametri di input (pesi). Il numero di questi parametri varia a seconda della complessità del problema computazionale che deve essere risolto dalla rete.

rete neurale

Inoltre, abbiamo i cosiddetti "strati nascosti": è qui che avviene tutta la "magia" associata all'apprendimento automatico profondo. Sono gli strati nascosti che sono responsabili della capacità di questa rete neurale di apprendere ed eseguire i calcoli necessari. Infine, l'ultimo elemento è l'output layer, cioè lo strato della rete neurale che dà il risultato desiderato, in questo caso: grafia riconosciuta, volto, voce, immagine formata in base alla descrizione testuale, risultato dell'analisi tomografica di l'immagine diagnostica e molto altro ancora.

Leggi anche: Ho testato e intervistato il chatbot di Bing

Come apprendono le reti neurali?

Come già sappiamo, i singoli neuroni nelle reti neurali elaborano le informazioni con l'aiuto di parametri (pesi), a cui vengono assegnati valori e connessioni individuali. Questi pesi cambiano durante il processo di apprendimento, il che consente di adattare la struttura di questa rete in modo tale da generare il risultato desiderato. Come apprende esattamente la rete? È ovvio, deve essere costantemente addestrato. Non essere sorpreso da questo detto. Stiamo anche imparando, e questo processo non è caotico, ma ordinato, diciamo. La chiamiamo educazione. In ogni caso, le reti neurali possono anche essere addestrate, e questo di solito avviene utilizzando un insieme di input opportunamente selezionati, che in qualche modo preparano la rete ai compiti che svolgerà in futuro. E tutto questo si ripete passo dopo passo, a volte il processo di apprendimento assomiglia in una certa misura al processo di formazione stesso.

Se, ad esempio, il compito di questa rete neurale è riconoscere i volti, essa viene pre-addestrata su un gran numero di immagini contenenti volti. Nel processo di apprendimento, i pesi e i parametri degli strati nascosti cambiano. Gli esperti qui usano l'espressione “minimizzazione della funzione di costo”. Una funzione di costo è una quantità che ci dice quanto una determinata rete neurale commette errori. Quanto più riusciamo a minimizzare la funzione costo come risultato dell'addestramento, tanto migliori saranno le prestazioni di questa rete neurale nel mondo reale. La caratteristica più importante che distingue qualsiasi rete neurale da un compito programmato utilizzando un algoritmo classico è che, nel caso degli algoritmi classici, il programmatore deve progettare passo dopo passo quali azioni eseguirà il programma. Nel caso delle reti neurali, la rete stessa è in grado di imparare da sola a eseguire correttamente i compiti. E nessuno sa esattamente come una rete neurale complessa esegua i suoi calcoli.

rete neurale

Oggi, le reti neurali sono ampiamente utilizzate e, forse sorprendentemente, molto spesso senza comprendere come funziona effettivamente il processo computazionale in una determinata rete. Non ce n'è bisogno. I programmatori utilizzano reti neurali già pronte, apprese dalla macchina, predisposte per dati di input di un certo tipo, li elaborano in un modo noto solo a loro e producono il risultato desiderato. Un programmatore non ha bisogno di sapere come funziona il processo di inferenza all'interno di una rete neurale. Cioè, una persona rimane lontana da un grande volume di calcoli, un metodo per ottenere informazioni e la loro elaborazione da parte delle reti neurali. Da qui certi timori dell'umanità riguardo ai modelli di intelligenza artificiale. Abbiamo semplicemente paura che un giorno la rete neurale si prefiggerà un determinato compito e troverà autonomamente, senza l'aiuto di una persona, il modo di risolverlo. Ciò preoccupa l’umanità, provoca paura e sfiducia nell’uso degli algoritmi di apprendimento automatico.

chatgpt

Questo approccio utilitaristico è comune oggi. Per noi è lo stesso: sappiamo come formare qualcuno in un'attività specifica e sappiamo che il processo formativo sarà efficace se svolto correttamente. Una persona acquisirà le competenze desiderate. Ma capiamo esattamente come avviene nel suo cervello il processo di deduzione che ha causato questo effetto? Non ne abbiamo idea.

Il compito degli scienziati è studiare questi problemi il più possibile in modo che ci servano e ci aiutino dove necessario e, soprattutto, non diventino una minaccia. Come esseri umani, abbiamo paura di ciò che non conosciamo.

Interessante anche: 

Yuri Svitlyk
Yuri Svitlyk
Figlio dei Carpazi, genio non riconosciuto della matematica, "avvocato"Microsoft, altruista pratico, sinistra-destra
- Annuncio pubblicitario -
Iscrizione
Avvisare su
ospite

0 Commenti
Recensioni incorporate
Visualizza tutti i commenti