• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Thèse de Doctorat
DOI
10.11606/T.18.2017.tde-05012017-141759
Document
Auteur
Nom complet
Fernando Araujo de Andrade Sobrinho
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Carlos, 2016
Directeur
Jury
Alberto, Luís Fernando Costa (Président)
Bispo, Bruno Catarino
Eisencraft, Marcio
Pereira, José Carlos
Pinheiro, Alan Petrônio
Titre en portugais
Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz
Mots-clés en portugais
Análise acústica de voz
Dinâmica não linear
Reconstrução do espaço de fase
Seção de Poincaré
Resumé en portugais
Diversos estudos foram realizados para detecção de patologias na laringe. Essas patologias causam alteração na frequência, amplitude e formato de onda do sinal de voz e podem ser estudadas através dos parâmetros convencionais de análise como jitter e shimmer, ou sob o enfoque da dinâmica não linear. Essas técnicas são não invasivas e servem de apoio ao especialista da área de fonoaudiologia para o diagnóstico de patologias nas pregas vocais. As técnicas de análise acústica baseiam-se no formato de onda vocal no domínio do tempo e domínio da frequência, enquanto que a técnica de análise não linear utilizada nesse trabalho baseia-se no atrator reconstruído do sinal de voz. O objetivo dessa tese é diferenciar vozes normais e patológicas e entre patologias usando a técnica de análise não linear conhecida como Seção de Poincaré. Foram analisados 48 sinais de vozes humanas, divididos em 3 grupos (16 normais, 16 com nódulo e 16 com edema de Reinke). Em seguida foram selecionados 3 trechos de 500 ms nos intervalos 0.5s-1.0s, 2.0s-2.5s e 4.0s-4.5s chamado de primeiro critério e um trecho 500ms no trecho de maior variação de pitch, chamado de segundo critério. Em seguida, o atrator foi reconstruído em 3 dimensões, determinado o atrator médio, e de cada ponto do atrator médio foi extraída a seção de Poincaré. De cada seção de Poincaré foi calculada a dispersão dos pontos do atrator no plano através da média e desvio padrão das dispersão dos pontos da seção de Poincaré em relação ao ponto médio da seção. A validação da ferramenta desenvolvida para essa tese foi realizada utilizando um sinal senoidal inserindo jitter gradativamente, onde verificou-se uma variação proporcional da média da dispersão. Os resultados obtidos mostraram que não foi possível diferenciar patologias mas foi possível classificar vozes normais das patológicas. O melhor intervalo para classificar as vozes normais das patológicas utilizando o primeiro critério foi entre 0.5s-1.0s pois nesse intervalo todas as vozes normais foram classificadas corretamente. No entanto, 6 vozes patológicas foram classificadas como normais com 2 vozes patológicas na fronteira que separa as vozes normais das patológicas. O segundo critério classificou todas as vozes normais corretamente e apenas uma voz patológica foi classificada como patológica. Concluiu-se que a ferramenta proposta utilizando o segundo critério mostrou-se superior em relação ao primeiro critério para diferenciar vozes normais das patológicas.
Titre en anglais
Detection of pathologies in vocal fold by means of Poincaré section of the tridimensional phase space of a voice signal
Mots-clés en anglais
Acoustic analysis of voice
Nonlinear dynamic
Phase space reconstruction
Poincaré section
Resumé en anglais
Several studies have been performed to detect pathologies of the larynx. These pathologies cause changes in the frequency, amplitude, and waveform of the voice signal. They can be studied by means of conventional analysis parameters such as jitter and shimmer, or from nonlinear dynamics concepts. These techniques are noninvasive and can help the speech therapist to better diagnose the pathologies in the vocal folds. The acoustic analysis techniques are based on the voice waveform in the time and frequency domains, while the non-linear analysis techniques are based on the attractor reconstructed from the speech signal.The aim of this thesis is to differentiate normal and pathological voices using a nonlinear analysis technique named Poincaré section. We analyzed 48 human voice signals divided into 3 groups (16 normal, 16 nodule and 16 Reinke's edema). Then, we analyzed 3 stretches of 500ms in the intervals 0.5s-1.0s, 2.0s-2.5s e 4.0-4.5s, denominated first criteria, and a stretch of 500ms in a higher variation in pitch, denominated second criteria. The attractor was then reconstructed in three dimensions, the average attractor was determined, and at each point of the average attractor, a Poincaré section was extracted. From each Poincaré section, the dispersion of the points of the attractor was calculated in the plane by means of the statistical average and standard deviation related to the medium point of the section. The validation of the tool developed for this thesis was achieved by inserting jitter gradually in a sinusoidal wave, where there was a proportional variation of average's dispersion was observed. The results obtained for this set of voices showed that the average and standard deviation of dispersion of the points in the Poincaré section differentiate the groups of voices, but not the pathological groups. The Statistical tests of Anova and Tukey were used to analyze the 3 groups and all group pairings, two by two, with a statistical significance of 5%. The best interval to classify normal voices from pathological voices by means of the first criteria was between 0.5s-1.0s, given the fact that in this interval, all normal voices were correctly classified. However, 6 pathological voices were classified as normal voices, with 2 voices border lining the frontier between normal voices from pathological voices. The second criteria classified all normal voices correctly, with only one pathological voice incorrectly classified. In conclusion, the second criteria tool proposed by this thesis was proven superior to differentiate normal voices from pathological ones.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Fernando.pdf (17.69 Mbytes)
Date de Publication
2017-01-17
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2019. Tous droits réservés.