Elaborazione vocale

Name: Elaborazione vocale | Progressi nella comunicazione e interazione tra uomo e robot
Brand: Un Miliardo Di Ben Informato [Italian]
Price: 4.49 EUR
Availability: OnlineOnly

Progressi nella comunicazione e interazione tra uomo e robot

Fouad Sabry(Autor*in)

Un Miliardo Di Ben Informato [Italian] (Verlag)

1. Auflage

Erschienen am 29. Dezember 2024

317 Seiten

E-Book

ePUB mit Adobe-DRM

Systemvoraussetzungen

6610000692149 (EAN)

4,49 €inkl. 7% MwSt.

Systemvoraussetzungen

für ePUB mit Adobe-DRM

E-Book Einzellizenz

Als Download verfügbar

Beschreibung

Elaborazione vocale-un'introduzione ai concetti fondamentali nell'elaborazione vocale, che prepara il terreno per approfondimenti sul ruolo del parlato nella robotica.

Rete neurale (apprendimento automatico)-esplora il nucleo dell'apprendimento automatico e il modo in cui le reti neurali vengono applicate ai sistemi robotici per il processo decisionale e la comprensione del parlato.

Riconoscimento vocale-discute le tecnologie di riconoscimento vocale e la loro importanza nel consentire ai robot di interpretare e rispondere al parlato umano.

Codifica predittiva lineare-fornisce approfondimenti sulle tecniche di modellazione predittiva e la loro applicazione nel migliorare l'accuratezza dell'elaborazione vocale nella robotica.

Quantizzazione vettoriale-si concentra sui metodi di quantizzazione vettoriale e su come ottimizzano la compressione dei dati vocali, garantendo un'elaborazione più rapida ed efficiente nei sistemi robotici.

Modello di Markov nascosto-spiega come i modelli di Markov nascosti vengono utilizzati per elaborare dati sequenziali, fondamentali per attività quali il riconoscimento vocale e il movimento robotico.

Apprendimento non supervisionato-descrive le tecniche di apprendimento non supervisionato che consentono ai robot di apprendere da dati non strutturati senza la necessità di input etichettati.

Reti neurali addestrate istantaneamente-esamina l'innovativo concetto di reti neurali addestrate al volo, rendendo i sistemi di riconoscimento vocale più adattabili e reattivi.

Macchina di Boltzmann-introduce le macchine di Boltzmann e la loro applicazione nell'apprendimento probabilistico, migliorando le capacità cognitive dei robot.

Rete neurale ricorrente-esplora l'uso di reti neurali ricorrenti per gestire dati temporali, cruciali per l'elaborazione di input vocali continui e il miglioramento dell'interazione robot-uomo.

Informazioni sullo stato del canale-fornisce una panoramica di come le informazioni sullo stato del canale influenzano la trasmissione e il riconoscimento del parlato nei sistemi robotici, garantendo una comunicazione chiara.

Memoria a lungo termine-discute le reti di memoria a lungo termine, una svolta nell'addestramento dei robot per conservare ed elaborare dati vocali complessi nel tempo.

Funzione di attivazione-analizza il ruolo delle funzioni di attivazione nelle reti neurali e come aiutano i robot a elaborare i dati vocali in modo efficiente.

Riconoscimento dell'attività-illustra come i metodi di riconoscimento dell'attività consentono ai robot di interpretare le azioni umane, fondamentale per migliorare l'interazione e l'autonomia.

Modello di Bernoulli nascosto non omogeneo nel tempo-spiega il modello di Bernoulli non omogeneo nel tempo e la sua rilevanza in attività di apprendimento sequenziale come l'elaborazione del parlato.

Stima dell'entropia-descrive in dettaglio come le tecniche di stima dell'entropia vengono applicate all'elaborazione del parlato nella robotica, garantendo che i sistemi prendano decisioni più informate.

Tipi di reti neurali artificiali-fornisce una panoramica dei diversi tipi di reti neurali e delle loro applicazioni specifiche nella robotica e nell'elaborazione vocale.

Apprendimento profondo-discute i metodi di apprendimento profondo e il loro impatto sull'avanzamento dell'elaborazione vocale, rendendo i sistemi robotici più intelligenti e reattivi.

Yasuo Matsuyama-onora i contributi di Yasuo Matsuyama, un pioniere nell'elaborazione vocale e nella robotica, il cui lavoro continua a ispirare l'innovazione.

Rete neurale convoluzionale-introduce le reti neurali convoluzionali e il loro ruolo critico nel riconoscimento vocale e nei sistemi di visione robotica.

Weitere Details

Personen

Inhalt

Capitolo 2 : Rete neurale (apprendimento automatico)

Una rete neurale, nota anche come rete neurale artificiale o rete neurale, e conosciuta con le sue abbreviazioni ANN o NN, è un modello utilizzato nell'apprendimento automatico. Questo modello si ispira alla forma e alla funzione delle reti neurali biologiche osservate nei cervelli animali.

I neuroni artificiali che compongono una rete neurale artificiale (ANN) sono unità o nodi collegati che sono modellati sui neuroni che si trovano nel cervello. I bordi che li collegano sono una rappresentazione delle sinapsi che si trovano nel cervello. Dopo aver ricevuto segnali da altri neuroni ad esso collegati, ogni neurone artificiale elabora tali segnali e poi li trasmette ad altri neuroni ad esso collegati. Il "segnale" è un numero reale e la funzione di attivazione è una funzione non lineare che opera sul totale degli input a ciascun neurone. Questa funzione è responsabile del calcolo dell'output di ciascun neurone. Durante il processo di apprendimento, viene utilizzato un peso per determinare la potenza del segnale su ciascun collegamento. Questo peso viene regolato e regolato secondo necessità.

In una situazione tipica, i neuroni sono raggruppati in strati. È possibile che vari livelli eseguano ciascuno una trasformazione univoca sui rispettivi input. È possibile che i segnali passino attraverso numerosi strati intermedi, noti anche come livelli nascosti, mentre si fanno strada dal primo strato, che è il livello di input, all'ultimo strato, che è il livello di output. Quando una rete include almeno due livelli nascosti, viene spesso definita rete neurale profonda per descrivere la rete.

Esistono diverse applicazioni per le reti neurali artificiali, tra cui la modellazione predittiva, il controllo adattivo e la risoluzione dei problemi nell'intelligenza artificiale. Ci sono anche molte altre applicazioni. Hanno la capacità di acquisire conoscenze attraverso l'esperienza e possono trarre inferenze da una raccolta di fatti che sembrano non essere correlati tra loro.

La maggior parte delle volte, le reti neurali vengono addestrate attraverso il processo di limitazione empirica del rischio. Questo approccio si basa sul concetto di ottimizzazione dei parametri della rete al fine di minimizzare la differenza, nota anche come rischio empirico, tra l'output previsto e i valori target effettivi in un particolare set di dati. La stima dei parametri della rete è spesso ottenuta utilizzando approcci basati su gradienti come la retropropagazione. Le reti neurali artificiali (ANN) apprendono dai dati di addestramento etichettati durante la fase di addestramento modificando iterativamente i parametri al fine di ridurre al minimo una funzione di perdita che è stata impostata. Utilizzando questa strategia, la rete è in grado di generalizzare a dati che non ha mai incontrato in precedenza.

Più di due secoli fa, i primi lavori in statistica hanno gettato le basi per le reti neurali profonde che vengono utilizzate oggi. Il tipo più semplice di rete neurale feedforward (FNN) è una rete lineare. Questo tipo di rete è costituito da un singolo strato di nodi di uscita che hanno funzioni di attivazione lineare. Gli ingressi vengono inviati direttamente alle uscite attraverso una serie di pesi. I calcoli vengono eseguiti in ogni nodo per determinare il totale dei prodotti dei pesi e degli input. Al fine di ridurre al minimo gli errori quadratici medi che si verificano tra questi output stimati e i valori obiettivo forniti, è stato creato un aggiustamento dei pesi. Sia il metodo dei minimi quadrati che la regressione lineare sono nomi che sono stati usati per riferirsi a questa tecnica per più di due secoli. Legendre (1805) e Gauss (1795) lo utilizzarono come metodo per determinare un adattamento lineare approssimativo decente a un insieme di punti al fine di fare previsioni riguardanti il movimento dei pianeti.

Il funzionamento dei computer digitali, come l'architettura di von Neumann, è stato tradizionalmente realizzato attraverso l'esecuzione di istruzioni esplicite, con l'accesso alla memoria da parte di un certo numero di processori discreti. Alcune reti neurali, d'altra parte, sono state inizialmente sviluppate come risultato di un tentativo di descrivere l'elaborazione delle informazioni che avviene nei sistemi biologici utilizzando il quadro del connessionismo. L'informatica connessionista, in contrasto con l'approccio di von Neumann, non divide la memoria e l'elaborazione in due categorie distinte.

Nel 1943, Warren McCulloch e Walter Pitts esaminarono la possibilità di ideare un modello computazionale per le reti neurali che non includesse l'apprendimento. La ricerca è stata in grado di essere suddivisa in due metodologie distinte come risultato di questo modello. Il primo metodo si è concentrato sui processi biologici, mentre il secondo metodo era incentrato sull'utilizzo delle reti neurali nel campo della scienza dell'intelligenza artificiale.

D. è nato alla fine degli anni '40. L'apprendimento hebbiano è un'ipotesi di apprendimento che è stata proposta da O. Hebb. Questa ipotesi è stata fondata sul meccanismo della plasticità cerebrale e si è sviluppata in una teoria. Numerose reti neurali antiche, come il percettrone di Rosenblatt e la rete di Hopfield, ne fecero uso nelle loro operazioni. Nel 1954, Farley e Clark effettuarono una simulazione di una rete hebbiana utilizzando dispositivi informatici. Rochester, Holland, Habit e Duda (1956) sono stati quelli che hanno inventato ulteriori macchine computazionali a rete neurale.

L'Ufficio per la ricerca navale degli Stati Uniti ha fornito finanziamenti per lo sviluppo del percettrone, che è stata una delle prime reti neurali artificiali ad essere sviluppata. Il percettrone è stato descritto dallo psicologo Frank Rosenblatt nell'anno 1958.

Un dispositivo simile al percettrone ancora più antico fu sviluppato da Farley e Clark, secondo R. D. Joseph (1960). Scrive che "Farley e Clark del MIT Lincoln Laboratory hanno effettivamente preceduto Rosenblatt nello sviluppo di un dispositivo simile al percettrone". Tuttavia, "hanno lasciato cadere l'argomento".

Come risultato del percettrone, l'interesse del pubblico per la ricerca relativa alle reti neurali artificiali è aumentato, il che ha portato a un aumento significativo dei finanziamenti da parte del governo degli Stati Uniti. "L'età d'oro dell'intelligenza artificiale" è stata alimentata dalle affermazioni ottimistiche degli informatici sulla capacità dei percettroni di replicare l'intelligenza umana. Questa circostanza ha contribuito allo sviluppo dell'intelligenza artificiale.

Non era possibile per i percettroni iniziali avere unità nascoste adattive. Tuttavia, Joseph (1960) ha anche affrontato i percettroni multistrato che includevano uno strato nascosto adattabile sulla loro struttura. Questi concetti sono stati citati e utilizzati da Rosenblatt (1962), che ha anche dato credito al lavoro svolto da H. Sia D. Block che da B. Il cavaliere, W. I primi sforzi che sono stati fatti, tuttavia, non hanno portato a un algoritmo di apprendimento in grado di funzionare per unità nascoste, noto anche come deep learning.

Negli anni '60 e '70 è stata condotta una ricerca fondamentale sulle reti neurali artificiali (ANN). La tecnica di gestione dei dati del Gruppo, sviluppata nel 1965 in Ucraina da Alexey Ivakhnenko e Lapa, è stato il primo algoritmo per l'apprendimento profondo che ha avuto lo scopo previsto. Era un modo per addestrare reti neurali che erano arbitrariamente profonde. Secondo la loro interpretazione, si trattava di un tipo di regressione polinomiale o di una generalizzazione dell'analisi del percettrone di Rosenblatt. Questo metodo, che si basa sull'addestramento strato per strato attraverso l'analisi di regressione, è stato riportato in uno studio pubblicato nel 1971. La rete profonda che è stata sviluppata utilizzando questo metodo comprendeva otto strati. Attraverso l'utilizzo di un set di convalida distinto, vengono eliminate le unità nascoste non necessarie. A causa del fatto che le funzioni di attivazione dei nodi sono calcolate utilizzando i polinomi di Kolmogorov-Gabor, queste sono state anche le prime reti profonde a contenere unità moltiplicative, a volte note come "porte".

Il primo percettrone multistrato di deep learning appreso utilizzando la discesa stocastica del gradiente è stato pubblicato da Shun'ichi Amari nell'anno 1967. Nel corso degli esperimenti al computer condotti da Saito, uno studente di Amari, un percettrone multistrato (MLP) con cinque strati e due strati che potevano essere modificati ha appreso rappresentazioni interne per identificare classi di pattern non linearmente separabili. Come risultato di ulteriori miglioramenti nell'hardware e nelle regolazioni degli iperparametri, la discesa stocastica del gradiente end-to-end è emersa come la tecnica di allenamento più popolare al momento.

Era il 1969 quando Kunihiko Fukushima presentò per la prima volta la funzione di attivazione ReLU, che sta per unità lineare rettificata. È già noto che il raddrizzatore è la funzione di attivazione più utilizzata per il deep learning.

Ciononostante, la ricerca si fermò negli Stati Uniti fino al lavoro di Minsky e Papert (1969), che notarono che i percettroni di base erano incapaci di elaborare il circuito esclusivo-o. Nel caso delle reti profonde proposte da Ivakhnenko (1965) e Amari (1967), questa comprensione era del tutto irrilevante.

Le architetture di deep learning per reti neurali convoluzionali (CNN) con strati convoluzionali e livelli di downsampling e replicazione del peso sono state sviluppate per la prima volta da Kunihiko Fukushima nel 1979 con il Neocognitron. Tuttavia, la retropropagazione non è stata utilizzata per addestrare il...

Systemvoraussetzungen

Als PDF speichern Als Link merken