BETA, la rivista ipertestuale tecnica
BETA, la rivista ipertestuale tecnicaBarra BETA
Sommario Abbonamenti a BETA Redazione Liste/Forum Informazioni Indici BETA La rivista ipertestuale tecnica Collegamento al sito Web
BETA - Approfondimenti

BETA 2499.7 - Approfondimenti - Filtraggio di segnali vocali con tecniche caotiche

Filtraggio di segnali vocali con tecniche caotiche

   

Parte IV

Lorenzo Matassini
Articolista Collaboratore, BETA

    Osserviamo come il rumore residuo non sia costante, ma vari con una certa sistematicità; in particolare nella transizione tra le parole ``buon'' e ``giorno'' si ha un netto picco, dovuto alla carenza di ridondanza nel passaggio tra i due fonemi. Non essendo disponibili molte ripetizioni delle strutture caratteristiche, la stima dell'iperpiano su cui effettuare la proiezione presenta un maggior grado di incertezza. I vettori di embedding costruiti in prossimità di transizioni tra fonemi popolano regioni dello spazio di embedding che non appartengono né al fonema che sta terminando né a quello appena pronunciato. In queste circostanze il filtraggio ha luogo con una qualità inferiore.

Come ultima prova del funzionamento del filtro proposto, consideriamo la figura PRESTAZIONI. Viene presa in esame una data frase ed applicato l'algoritmo al variare del livello di rumore introdotto. Come misura della prestazione del filtraggio si fa uso del guadagno in decibel, quantità che esprime la differenza tra il rapporto segnale/rumore rispettivamente a valle e a monte del trattamento.

Il livello di rumore introdotto varia tra il 10% (appena percettibile come lieve fruscio) ed il 500% (l'intelligibilità è completamente perduta) della varianza del segnale pulito. Parallelamente al filtro qui descritto, la figura PRESTAZIONI riporta il funzionamento della soluzione proposta da Ephraim e Malah, considerata un punto di riferimento in tema filtraggio di segnali vocali.

Locale
Fig.6: Filtraggio di segnali vocali con tecniche caotiche Prestazioni
 

Conclusioni

Il filtro descritto è stato originariamente ideato per trattare segnali la cui sorgente soddisfi l'ipotesi di caos deterministico di bassa dimensione e con parametri costanti. Gli ingredienti essenziali sono l'idea di embedding di dati scalari (che da un punto di vista strettamente matematico ha senso solo per seganli deterministici e stazionari) e di iperpiani che rappresentino vincoli dinamici. Con questa trattazione abbiamo voluto mostrare come la rappresentazione in uno spazio degli stati e il confinamento in un iperpiano siano validi localmente, cioè a livello di singoli fonemi, anche per segnali vocali; occorre solamente considerare un cosiddetto over-embedding con gli opportuni parametri. L'alta dimensionalità di questo spazio vettoriale aiuta a risolvere la non-stazionarietà, dal momento che fonemi distinti, tecnicamente interpretabili come regimi dinamici distinti, vengono adeguatamente separati e confinati in iperpiani di modesta complessità, dove il filtraggio può avere luogo efficacemente.



Parte I | Parte II | Parte III| Parte IV
Precedente: Parte III


Articoli correlati

Altri Articoli della stessa Rubrica...

Siti Web

Elenco di siti consigliati da BETA... (est.)


Lorenzo Matassini è Ricercatore presso il Max Planck Institut di Dresda , Dottore in Ingegneria Informatica, Collaboratore di BETA dal 2000 è raggiungibile su Internet tramite la redazione oppure all'indirizzo lorenzo@mpipks-dresden.mpg.de.

Ultima revisione:
URL: http://www.beta.it/beta/bs029801/2499.7/b2499lm1.htm

Copyright © 1995-2000 BETA, tutti i diritti sono riservati. E' vietata la riproduzione senza autorizzazione dell'editore o dell'autore dentro i termini e le condizioni della Licenza Pubblica BETA (LPB)

BETA La rivista ipertestuale tecnica (http://www.beta.it/beta)email info@beta.it
BETA: Frontespizio | Abbonamenti | Redazione | Liste/Forum | Indici | Guida | Copyright