BETA, la rivista ipertestuale tecnica
BETA, la rivista ipertestuale tecnicaBarra BETA
Sommario Abbonamenti a BETA Redazione Liste/Forum Informazioni Indici BETA La rivista ipertestuale tecnica Collegamento al sito Web
BETA - Approfondimenti

BETA 2499.7 - Approfondimenti - Filtraggio di segnali vocali con tecniche caotiche

Filtraggio di segnali vocali con tecniche caotiche

    L'analisi non-lineare di serie temporali comprende una serie di tecniche per lo studio, la manipolazione e la comprensione di segnali complessi, basandosi sull'ipotesi di caos deterministico.

Parte I

Lorenzo Matassini
Articolista Collaboratore, BETA

    Questo significa che il sistema che ha generato il segnale evolve secondo una dinamica complicata ma allo stesso tempo deterministica, nella quale niente è lasciato al caso, nonostante l'impossibilità di effettuare predizioni a lungo termine sull'evoluzione futura del sistema stesso.

La voce umana rappresenta un segnale non-stazionario governato da fenomeni non-lineari, ingrediente quest'ultimo necessario (ma non sempre sufficiente) per la manifestazione di comportamenti caotici. La soppressione del rumore nei segnali vocali ha un impatto tecnologico di notevole rilevanza, basti pensare alle telecomunicazioni, al riconoscimento della voce e a tutte le apparecchiature di amplificazione.

In questo contesto uno schema di proiezione locale, sviluppato originariamente per sistemi caotici, viene adattato al caso della voce. Ciò risulta possibile analizzando le proprietà del sistema vocale umano che simulano le tipiche strutture esibite da sistemi caotici. Il segnale sonoro, quantità scalare, viene trasformato in una quantità vettoriale in accordo alla teoria dell'embedding, e poi trattato con tecniche sviluppate nell'ambito del caos deterministico.

Un tentativo di modellare l'apparato vocale umano nella sua interezza richiederebbe un modello di complessità troppo elevata. Con il metodo proposto siamo in grado di effettuare in modo implicito ed automatico la suddivisione di una frase nei fonemi che la compongono, ognuno dei quali occupa regioni distinte e può essere descritto con un modello di complessità accettabile.

Descrizione del filtro

    Il filtro adottato per la soppressione del rumore si basa sul concetto di determinismo, sul quale conviene soffermarsi per un attimo. Consideriamo un sistema puramente deterministico, nel quale cioè le regole di evoluzione siano ben specificate. Una volta fissato lo stato presente del sistema, anche gli stati futuri risultano ben determinati. Per questo motivo è di fondamentale importanza riuscire ad identificare quelle componenti che permettano, una volta note, di avere tutte le informazioni possibili sul sistema stesso. Queste quantità, considerate nel loro insieme, prendono il nome di vettore di stato del sistema. In uno spazio vettoriale avente come componenti queste stesse quantità, ogni vettore di stato viene rappresentato univocamente da un punto. Possiamo quindi affermare che esiste un'equivalenza tra lo specificare lo stato del sistema e un punto in questo spazio vettoriale, comunemente chiamato spazio delle fasi o spazio degli stati. Come diretta conseguenza si ha che è possibile studiare la dinamica di un sistema studiando la dinamica dei vettori di stato. Generalmente un sistema dinamico è definito da un insieme di equazioni differenziali di cui, sotto certe ipotesi assolutamente non restrittive, la teoria matematica assicura l'esistenza ed unicità della soluzione. Nel corrispondente spazio delle fasi questo si traduce nell'esistenza ed unicità di una traiettoria, intesa come succesione di punti, cioè di vettori di stato.

Generalmente però quello che si osserva in un esperimento non è lo spazio delle fasi, né si è tantomeno a conoscenza del sistema di equazioni differenziali che governano il comportamento del sistema fisico sotto osservazione; il risultato di una qualunque misura effettuata sul sistema è una serie temporale, una successione, generalmente scalare, di numeri, che deve essere in qualche modo convertita in vettori di stato. Si tratta del ben noto problema della ricostruzione dello spazio delle fasi, che viene risolto tecnicamente tramite il metodo dell'embedding. Quello che si riesce a ricostruire non è lo spazio originale, ma un qualcosa ad esso equivalente, nel senso che i due spazi possono essere messi in corrispondenza biunivoca e sono coincidenti a meno di una trasformazione invertibile.

Per definire uno spazio di embedding di dimensione m si devono prima definire i corrispondenti vettori di embedding, ottenibili considerando m elementi della serie temporale, non necessariamente consecutivi ma con possibili salti tra l'uno ed il successivo. Un importante teorema, dovuto a Takens e risalente al 1981, asserisce che se m è maggiore del doppio del numero di gradi di libertà del sistema, allora lo spazio ricostruito è proprio un embedding: possiede tutte le proprietà tangenziali dello spazio delle fasi e tutte le quantità dinamiche risultano invarianti. La condizione imposta dal teorema è sufficiente ma non necessaria, nel senso che, a seconda dei casi, può bastare anche una dimensione più piccola.

Introduciamo adesso il funzionamento concettuale del filtro, considerando di nuovo un sistema deterministico e lasciandolo evolvere a partire da uno stato iniziale: si ottiene una successione di stati, ognuno dei quali è univocamente determinato dal precedente. Nello spazio delle fasi si ottiene una traiettoria ed il determinismo insito nel sistema, cioè la sua regola di evoluzione, ossia l'insieme di equazioni del modello che ne descrive il comportamento, costringe questa traiettoria a giacere in un iperpiano dello spazio delle fasi. In questa situazione la traiettoria prende il nome di attrattore. Un sistema stocastico, in cui è presente una componente non deterministica, non rispetta questa semplice regola. Per un segnale completamente casuale non è possibile individuare uno spazio delle fasi, poiché non siamo in grado di imporre un limite superiore al numero di gradi di libertà.

Alla luce di queste considerazioni, è facile capire come sia possibile distinguere tra un segnale deterministico ed uno stocastico, una volta individuato lo spazio delle fasi del primo. Quando un segnale x_k viene contaminato dall'aggiunta di rumore eta_k, ottenendo la serie s_k=x_k+eta_k, allora ogni punto nello spazio delle fasi subisce una deviazione dalla posizione originale. Viene persa la condizione di unicità della traiettoria e l'appartenenza di quest'ultima ad un iperpiano. In altre parole l'attrattore si deforma e quella che prima era una chiara struttura risulta come sfuocata: la conseguenza dell'introduzione del rumore è la formazione di una specie di nube di punti che avvolge l'attrattore di partenza. Ridurre il rumore significa pertanto proiettare ogni punto della serie temporale s_k sull'iperpiano individuabile a partire dalla serie degli x_k. Un primo problema da risolvere consiste nel fatto che non siamo a conoscenza del segnale x_k e quindi l'identificazione dell'iperpiano su cui effettuare le proiezioni non sembra possibile. Considerando spazi di dimensione elevata si può però identificare chiaramente l'azione del rumore, visto che il segnale proviene da una sorgente deterministica, mentre il rumore ha origine stocastica e quindi non privilegia nessuna direzione particolare. Una seconda difficoltà sorge nell'uso del teorema di Takens: come è possibile identificare m se non si conosce il numero di gradi di libertà attivi del sistema? Inoltre, noto m, conviene usare elementi consecutivi della serie oppure è vantaggioso saltare dei campioni in modo da coprire una finestra temporale di dimensione maggiore? Affronteremo questi argomenti quando analizzeremo le proprietà della voce, osservando come alcune considerazioni di carattere euristico siano sufficienti per una soddisfacente soluzione del problema.


Collegamento d'articolo

Parte I | Parte II | Parte III | Parte IV
Successivo: Parte II


Articoli correlati

Altri Articoli della stessa Rubrica...

Siti Web

Elenco di siti consigliati da BETA... (est.)


Lorenzo Matassini è Ricercatore presso il Max Planck Institut di Dresda , Dottore in Ingegneria Informatica, Collaboratore di BETA dal 2000 è raggiungibile su Internet tramite la redazione oppure all'indirizzo lorenzo@mpipks-dresden.mpg.de.

Ultima revisione:
URL: http://www.beta.it/beta/bs029801/2499.7/b2499lm1.htm

Copyright © 1995-2000 BETA, tutti i diritti sono riservati. E' vietata la riproduzione senza autorizzazione dell'editore o dell'autore dentro i termini e le condizioni della Licenza Pubblica BETA (LPB)

BETA La rivista ipertestuale tecnica (http://www.beta.it/beta)email info@beta.it
BETA: Frontespizio | Abbonamenti | Redazione | Liste/Forum | Indici | Guida | Copyright