Resumen:
Introducción: la severidad de una disfonía da cuenta del grado de alteración que tiene una voz en relación con todos los procesos fisiológicos involucrados con la producción del sonido. Es importante determinar el nivel de severidad a fin de establecer un programa con el conjunto de ejercicios que permitan una rehabilitación apropiada.
Objetivo: comprender si el comportamiento de los diferentes parámetros aerodinámicos, electroglotográficos, acústicos y de autorreporte vocal permite o no determinar la severidad de una disfonía.
Método: se evaluaron 55 sujetos con diferentes tipos de disfonía según parámetros aerodinámicos, electroglotográficos, acústicos y de autorreporte vocal. La muestra fue dividida en 3 grupos de acuerdo con el grado de gravedad de la patología. Se aplicó un análisis de varianza para comparar el comportamiento de las variables dependientes en relación con los niveles de severidad de la disfonía. Con el fin de determinar las diferencias entre estos niveles, se aplicó la prueba Post hoc (Tukey) a las variables significativas.
Resultados: es posible determinar el nivel de severidad de una disfonía a partir de parámetros acústicos como el CPP, HNR y el cociente de pendiente espectral 1/5-5/8Khz. También se puede hacer por medio de cuestionarios de autorreporte vocal como el VOISS, el VHI y el VTDS.
Palabras clave: Voz, disfonía, fonación, trastornos de la voz, calidad de la voz, signos y síntomas, evaluación, vocología, rehabilitación, parámetros, severidad.
Abstract:
Introduction: the severity of dysphonia shows the degree of alteration that a voice has in relation to all the physiological processes involved in the production of sound. It is essential to determine the level of severity to establish a program with the set of exercises required for a proper rehabilitation.
Objective: to understand if the behavior of the different aerodynamic, electroglottographic, acoustic, and vocal self-report parameters allows, or not, to determine the severity of dysphonia.
Method: 55 subjects with different types of dysphonia were evaluated according to aerodynamic, electroglottographic, acoustic, and vocal self-report parameters. The sample was divided into three groups in relation to the severity degree of the pathology. An analysis of variance was applied to compare the behavior of dependent variables with the severity levels of dysphonia. The Post hoc test (Tukey) was applied to the significant variables to determine the differences between the severity levels.
Results: it is possible to determine the level of severity of dysphonia from acoustic parameters such as CPP, HNR, and the ratio of spectral slope 1 / 5-5 / 8Khz. It is also possible to use voice self-report questionnaires such as the VOISS, the VHI, and the VTDS.
Keywords: Voice, dysphonia, phonation, voice disorders, quality of voice, signs and symptoms, assessment, vocology, rehabilitation, parameters, severity.
Artículos de investigación
Parámetros vocales para definir la severidad de una disfonía
Vocal parameters to determine severity of voice disorders
Recepción: 13/09/2020
Revisado: 17/10/2020
Aprobación: 19/10/2020
Autor de correspondencia: carlos.calvache@ibero.edu.co
Las deficiencias vocales (disfonías) son clasificadas de acuerdo con su comportamiento glótico [1-3]. Habitualmente se caracterizan por el uso excesivo de la voz y pueden producir lesiones por esfuerzo repetitivo que llegan incluso a convertirse en alteraciones del tejido (nódulos, pólipos, quistes, entre otros) [4-10]. Por otra parte, existen deficiencias vocales que se relacionan con la dificultad en la administración del aire espirado, pues este escapa fácilmente durante la fonación porque existe insuficiencia glótica y reducción de la resistencia glótica [2,6].
En todos los casos, la severidad de una disfonía da cuenta del grado de alteración que tiene una voz en relación con todos los procesos fisiológicos involucrados con la producción del sonido [11,12]. Para el clínico es importante determinar tal nivel de severidad, a fin de establecer un programa con el conjunto de ejercicios más apropiado para la rehabilitación [12,13].
Para esto se debe determinar la eficacia de la laringe como un transductor de energía aerodinámica en acústica cuantificando la presión del aire durante una emisión vocal [14]. Un parámetro que describe este factor es el PTP (por las siglas en inglés de Phonation Threshold Pressure), que hace referencia a la presión subglótica mínima requerida para iniciar la fonación [15]. El PTP depende de propiedades biomecánicas de la laringe como el grosor del pliegue vocal, el coeficiente de amortiguamiento del tejido, la velocidad de la onda mucosa y en especial el gap glótico durante la fonación [16,17]. La oscilación de los pliegues vocales se inicia desde un estado de reposo, cuando la presión subglótica supera el umbral de presión de la fonación [18]. Por lo general, la rigidez de los pliegues se ha asociado con la necesidad de una presión subglótica más alta y, por lo tanto, con un aumento de la fatiga vocal [10,16,17,19].
Además, se debe tener en cuenta que las propiedades biomecánicas de los pliegues vocales determinan las características de su vibración [20]. Parámetros como la tensión, el grosor y otros pueden afectar los modos de fonación [21]. Experimentos realizados han demostrado que el PTP aumenta con la viscosidad de la mucosa y disminuye con el grosor de la cuerda vocal [18]. A nivel clínico, el umbral de presión de la fonación se ha correlacionado con: características de fatiga vocal [19]; variaciones de la frecuencia fundamental y la hidratación sistémica [22]; producción de esfuerzo fonatorio y carga vocal [16]; uso de lubricantes en aerosol [23]; con la respiración oral y con la deshidratación de la mucosa del pliegue vocal [7].
Por otro lado, la presión subglótica (PSUB) también se ha relacionado con patologías vocales de tipo hiperfuncional e hipofuncional [16,17,24]; específicamente se han realizado estudios en los que se vincula el PTP, como medida de esfuerzo fonatorio, con el gap glótico, encontrando que en voces hipofuncionales aumenta este índice como consecuencia de una disminución del contacto glótico [18]. Basados en las propiedades biomecánicas de los pliegues vocales, también se ha demostrado que la presión subglótica se ve alterada por distintos síntomas laríngeos, entre ellos principalmente la fatiga vocal [25] y el bajo nivel de hidratación [19,22]. Optimizar el manejo de la presión subglótica se convierte en un indicador de la eficiencia fonatoria [16,24].
En todas las deficiencias vocales se produce una alteración en los procesos aerodinámicos y en las cualidades perceptuales y acústicas del sonido [26]. Existe una correlación entre la fisiopatología de los procesos involucrados en la voz (respiración, fonación, resonancia) que hace parte de la caracterización de las diferentes disfonías [24,27]; por ello es importante comprender este tipo de correlaciones fisiológicas, a fin de establecer, para cada caso un tratamiento efectivo [8,28].
Adicional a los recursos ya mencionados, para identificar el comportamiento fonatorio puede utilizarse la Electroglotografía (EGG). Esta permite estudiar el grado de aducción de los pliegues vocales y por tanto estimar su nivel de colisión interpretando los cambios en la conductividad a través de la glotis, lo que permite conocer la amplitud y las variaciones en la forma de onda EGG [29]. La Electroglotografía es un procedimiento no invasivo y sencillo que facilita la evaluación objetiva de la función glótica, basándose en el valor del cociente de contacto (CQ), que refleja el grado de aducción de los pliegues vocales y por tanto, determina su estrés de colisión [30]. Las medidas electroglotográficas en la voz se han estudiado a través de diferentes tipos de ejercicios en sujetos con fatiga vocal [31].
Así como el PTP, el PSUB y el CQ son parámetros que permiten identificar las características aerodinámicas y mecánicas de la voz, la acústica complementa la interpretación en sujetos con deficiencias vocales. A través de la grabación de señales sonoras tomadas de tareas fonatorias –habla conectada o canto– y con la ayuda de un software de análisis acústico, se pueden correlacionar la fisiología y la acústica de la voz [32]. En este punto, los parámetros de la voz incluyen la frecuencia fundamental, la intensidad, las medidas de perturbación, la relación de la señal con el ruido, las características del espectro acústico y su variación en el tiempo a corto y largo plazo [10]. Este tipo de análisis a nivel investigativo también se correlaciona con la evaluación perceptual- auditiva. GRBAS es la escala más utilizada al momento de realizar un juicio concerniente a las características acústicas de la voz [26,33].
Por último, es importante medir de manera objetiva la autopercepción vocal de la disfonía por parte del paciente [34,35]. Para ello se han creado diferentes instrumentos de autorreporte [11,36-42] que permiten identificar la apreciación del sujeto sobre sus cualidades vocales y el grado de dificultad que observa a la hora de realizar tareas y actividades cotidianas [43-45]. Los datos registrados en estas mediciones suelen estar vinculados con el nivel de gravedad de la disfonía [36,37,40,41].
Teniendo en cuenta lo planteado, el propósito de este estudio es analizar cómo el comportamiento de los diferentes parámetros aerodinámicos, electroglotográficos, acústicos y de autorreporte vocal, permite, o no, determinar la severidad de una disfonía.
El tamaño de la muestra se determinó de manera no probabilística, puesto que se trata de una población por conveniencia (solo portadores de patología vocal). La muestra estuvo constituida por 55 sujetos con disfonía. Este volumen muestral se estableció de manera arbitraria por motivos de aplicabilidad técnica.
Tres grupos diferentes conformaron el estudio, de acuerdo con el estado vocal de los participantes: (1) voz sana, (2) disfonía leve y (3) disfonía moderada. Jueces expertos examinaron, utilizando la escala GRBAS, el grado general de la patología en cada sujeto. Los jueces fueron fonoaudiólogos, especialistas en el área de voz, con una experiencia mínima de 5 años en procesos asistenciales de evaluación perceptual y acústica de la voz.
Todos los participantes fueron observados una sola vez, durante una sesión de 30 minutos aproximadamente, y firmaron un consentimiento informado avalado para la metodología del presente estudio a través del comité de ética institucional para el proyecto 201910D002.
Diagnóstico de disfonía funcional u orgánica; edades entre 20 y 50 años.
Estado de embarazo; signos de alguna enfermedad respiratoria durante la evaluación; antecedentes quirúrgicos relacionados con laringe; tener el hábito de fumar; menopausia; enfermedad respiratoria crónica; síntomas de presbifonía.
La razón para excluir a mujeres embarazadas o menopaúsicas en el presente estudio se debe a que, en ambos casos, el equilibrio de líquidos en el cuerpo es diferente, lo que puede afectar de alguna manera la viscosidad de las cuerdas vocales, y por ende la producción de la voz.
El reclutamiento de participantes se realizó de dos formas: 1) a través de avisos en redes sociales, y 2) obtención de contactos de bases de datos de los investigadores del proyecto. En este último caso los participantes fueron contactados vía telefónica y por correo electrónico.
Instrumentos de recolección de datos:
(2) Electroglotógrafo EGG Glottal Enterprises (Two Chanel Electroglottograph, Glottal Enterprises).
(3) Micrófono omnidireccional de condensador con patrón polar Rode NT-2.
(4) Praat Software.
(5) Interfaz de audio M-Audio Fast Track.
(6) Cabina sonoamortiguada.
(7) Escalas para sensaciones vocales autorreportadas: VoiSS, VAS, VHI, VTDS.
Tareas fonatorias:
o Vocal /a/ sostenida por 5 segundos, en tono e intensidad cómodas (tres repeticiones)
o Contar de 1 a 10 en tono e intensidad cómodos
o Glissandos ascendentes y descendentes con la vocal /a/.
o Vocal /a/ sostenida por 5 segundos, en tono e intensidad cómodas (tres repeticiones).
o En la Presión Subglótica repetición de la sílaba /pa/ (tres repeticiones) en tono e intensidad cómodas.
o En el Umbral de Presión de la Fonación: repetición de la sílaba /pa/ (tres repeticiones) en tono cómodo con la menor intensidad posible, sin llegar al susurro.
Variables dependientes
o Cepstral Peak Prominence (CPP)
o Relación Alpha
o L1-L0
o HNR.
o Cociente de contacto glótico (CQ)
o Presión subglótica
o Umbral de presión de fonación
o Cualidad de voz resonante.
o Voice handicap index-30
o Voice Symptom Scale – VoiSS
o Vocal tract discomfort scale (VTD)
o Self-assessment of voice quality.
Todas las escalas fueron utilizadas con sus versiones válidas en español.
Se utilizó el programa estadístico Stata® 13.1 (StataCorp, College Station). Las variables numéricas fueron descritas por promedios y cuartiles. También se realizó un análisis de varianza a través de la prueba de Kruskal-Wallis para comparar el comportamiento de las variables dependientes en relación con los niveles de severidad de la disfonía, considerando un p<0.05 estadísticamente significante. En el análisis de varianza se aplicó la prueba Post hoc (Tukey) para las variables significativas, con el fin de determinar las diferencias entre los niveles de severidad.
Todas las variables dependientes presentaron un comportamiento típico y registraron una tendencia a ser simétricas. Los promedios de todas las variables son representados a través de gráficos boxplots.
La figura 1 muestra las medias del Cociente de Contacto (CQ), de la presión subglótica (PSUB) y del Umbral de Presión de la Fonación (PTP).
La figura 2 presenta las medias de las variables correspondientes a los parámetros acústicos de la voz: Prominencia del Pico Cepstral (CPP, por sus siglas en inglés Cepstral Peak Prominence); Relación Armónico Ruido (HNR, por sus siglas en inglés Harmonics to Noise Ratio); y de los coeficientes de los espectros promedios a largo plazo (LTAS, por sus siglas en inglés Long Term Average Spectrum), entre ellos la relación Alpha, L1-L0 y 1/5 – 5/8 Khz.
Por su parte, la figura 3 presenta las medias de las variables de autorreportes: Voice Handicap Index (VHI), Escala de Síntomas Vocales (VOISS), Escala análoga Visual (VAS), Vocal Tract Disnfort Scale (VTDS).
La tabla 1 muestra la estadística descriptiva de todas las variables dependientes a nivel respiratorio, fonatorio, acústico y autorreportes, incluyendo valores mínimos, promedios, máximos y cuartiles.
Para obtener un análisis de varianza, lo primero que se hizo fue calcular los promedios de todas las variables dependientes para cada nivel de severidad evaluado, según la escala GRBAS, por jueces expertos (Tabla 2). En la tabla se pueden observar diferencias entre los grupos de disfonía (Leve, Moderado, Voces sanas). Llaman la atención, por su divergencia entre los grupos, los puntos relacionados con autorreportes.
Al realizar el análisis de varianza para las medias obtenidas en las variables dependientes, según el tipo de severidad de la disfonía, se encuentran diferencias significativas a nivel acústico en el CPP (0.000255), el HNR (0.00157) y el cociente espectral 1/5 – 5/8 Khz (0.0151). Además, en los autorreportes en el VOISS (4.79e-05), el VHI (0.00227) y el VTDS (0.00655). Variables relacionadas con la electroglotografía y medidas aerodinámicas no mostraron valores de significancia con un p<0,05 (Tabla 3).
Con el fin de identificar las diferencias según nivel de severidad de la disfonía se realizó la prueba Post hoc (Tukey) para las variables que presentaron significancia. Para CPP se evidencia que el promedio CPP con severidad moderada es significativamente menor a los promedios CPP con voz sana y disfonía leve, con una significancia del 0.05. En el caso de HNR sucede algo muy similar, el HNR con severidad moderada es significativamente menor a los promedios HNR de las voces sanas y disfonía leve, con una significancia del 0.05. Por su parte, el promedio de 1-5/5-8 KHZ en voces sanas es significativamente menor a los promedios 1-5/5-8 KHZ con severidad moderado y leve, con una significancia del 0.05. (Tabla 4).
En cuanto a las variables relacionadas con autorreportes, en el VOISS y el VHI se identifica que el promedio de estas variables en las voces sanas es significativamente menor a los de severidad moderada y leve, con una significancia del 0.05. Para el caso de VTDS el promedio en las voces sanas es significativamente menor a los promedios de VTDS con severidad moderado y leve, con una significancia del 0.05
El presente estudio ha hecho una descripción del comportamiento de distintos parámetros vocales con los cuales se describe las características fisiológicas de la voz en casos con diferentes niveles de disfonía. Con el trabajo realizado se comprende que los parámetros que mayor significancia tienen, para tal caracterización en voces sanas y con disfonía leve y moderada, son los relacionados con las medidas acústicas y de autorreporte vocal [13,46,47]. Desde la literatura hay evidencia de que aquellos vinculados con la aerodinámica (PTP - PSUB) y el grado de aducción de los pliegues vocales (CQ) influyen en la calidad vocal de un paciente [48-50]; desde una perspectiva fisiológica esto permite distinguir cualidades fisiológicas de la voz [51-54], pero no podría ser un factor para clasificar el nivel de severidad de una disfonía. Este estudio no presentó un análisis de varianzas significativas entre tales parámetros y los niveles de severidad de la disfonía.
Con el comportamiento de la variable CPP (relacionada directamente con la calidad de la voz) [13,47] es posible evidenciar el papel fundamental que juega este factor en la determinación del nivel de severidad de una disfonía. Se ha comprobado que las voces hipofuncionales tienen menos calidad resonancial [55,56], es decir que tendrían valores de CPP más bajos con respecto a voces normales [13]. En el caso de las voces hiperfuncionales, el comportamiento de esta variable dependerá del grado de aducción de los pliegues vocales (EGG) [57-60] –lo cual corresponde directamente al cierre glótico y, por tanto, también al PTP [48]– así que, es muy probable que en voces hiperfuncionales el valor del CPP esté por debajo de los de voces normales. Esto debería ser un punto para investigar en futuros estudios.
En el análisis de varianza, resaltan las variables CPP y HNR por tener diferencias significativas entre los niveles de severidad de disfonía, especialmente en el nivel moderado. Esto indicaría que la prominencia del pico cepstral y la conexión armónico-ruido son indicadores importantes para sustentar la severidad de las disfonías. Es muy probable que, en voces disfónicas moderadas, exista mayor alteración de la calidad vocal. Sin embargo, no es muy fuerte la diferenciación entre voces clasificadas como leves y normales, aspecto que es pertinente seguir estudiando para tener mayor precisión en el comportamiento de esta variable.
Para el caso de los LTAS (Alpha, L1-L0 y 1-5/5-8 Khz) el análisis de varianza sólo muestra resultados significativos en el cociente 1-5/5-8 Khz. Se ha reportado que este se relacionaría directamente con el grado de aducción de los pliegues vocales [60-62], lo cual se convierte en una clave importante para la clasificación de la severidad de una disfonía; así, se confirma que aquellas que son moderadas llegan a tener una característica de soplosidad, independiente de la categoría hipo o hiperfuncional asignada. Esto también es coherente con lo mencionado en líneas anteriores: las voces hiperfuncionales se caracterizan por tener aumento de calidad armónica en la pendiente espectral [63,64], aspecto que pudo haber causado la baja significancia en el ANOVA entre los cocientes Alpha y L1-L0 con la clasificación de severidad de las disfonías.
Con los resultados presentados en este estudio es posible afirmar que existe un vínculo fuerte entre la severidad de la disfonía y la autopercepción de la voz medida a través de cuestionarios de autorreporte. La literatura ha referido que la autopercepción vocal de los pacientes es coherente con la severidad de la disfonía presentada [34,35,37,39-41,44], aspecto que refuerza la importancia de utilizar este tipo de instrumentos en la evaluación de la voz.
En el caso del CQ se observó un comportamiento estadístico muy plano con relación a los niveles de severidad de la disfonía, este fue uno de los parámetros con menor significancia en el análisis de varianza. Si bien el EGG permite reconocer de forma objetiva el grado de aducción de los pliegues vocales durante la fonación y a través de la observación de la onda EGG se puede realizar un análisis cualitativo del comportamiento durante todas las fases del ciclo vibratorio [29,57-59], este estudio muestra que no es un parámetro objetivo para determinar el nivel de severidad de una disfonía. Los valores de este parámetro deberían analizarse siempre en contexto junto con el comportamiento aerodinámico y acústico de la voz del paciente [48,65]. Lo mismo sucede con PSub: tanto en voces hipofuncionales como hiperfuncionales, este parámetro tiene un valor aumentado [49,51,52,54], por esta razón no debe tomarse como un determinante de severidad de la disfonía. CQ, PTP y PSub deben analizarse en conjunto y no de manera aislada para identificar, tanto el comportamiento fisiológico de una voz, como el nivel de severidad de una disfonía.
Es posible determinar el nivel de severidad de una disfonía a partir de parámetros acústicos como el CPP, HNR y el cociente de pendiente espectral 1/5-5/8Khz. También es posible utilizando cuestionarios de autorreporte vocal como el VOISS, el VHI y el VTDS. Estas mediciones son las únicas que demostraron un alto nivel de significancia para tal relación.
Por el contrario, los parámetros CQ y Psub, presentaron baja significancia, por esto se afirma que no deberían usarse para determinar el nivel de severidad de una disfonía. Para un análisis fisiopatológico el contexto clínico, se sugiere relacionar los valores de los parámetros PTP, PSub y CQ y no interpretarlos de manera aislada, con el fin de establecer características fisiológicas de una disfonía y determinar su nivel de severidad.
How to cite: Calvache-Mora CA. Parámetros vocales para definir la severidad de una
disfonía. Revista de Investigación e Innovación en Ciencias de la Salud. 2020;2(2): 14-30. https://doi.org/10.46634/riics.39
Editor in charge: Lady Catherine Cantor-Cutiva,
Ph.D. https://orcid.org/0000-0002-4530-4345
Editor in chief: Jorge Mauricio
Cuartas Arias, Ph.D. https://orcid.org/0000-0001-9007-713X
Coeditor: Fraidy-Alonso Alzate-Pamplona, MSc. https://orcid.org/0000-0002-6342-3444
Copyright: © 2020. María Cano University Foundation. The Revista de Investigación
e Innovación en Ciencias de la Salud provides
open access to all its content under the terms of the Creative Commons
Attribution-NonCommercial-NoDerivatives
4.0 International (CC BY-NC-ND 4.0).
Conflicts of
Interest: The author has declared that no competing interests
exist.
Data Availability
Statement: All relevant data is in the article. For more detailed
information, write to the Corresponding Author.
Funding: None. This research did not receive any specific
grants from funding agencies in the public, commercial, or non-profit sectors.
Disclaimer: The opinions expressed in the article belong to the
author and do not represent an official position of the Corporación Universitaria Iberoamericana.
http://revistas.fumc.edu.co:8080/ojs/index.php/RCMC/article/view/39 (html)
Correspondence Carlos Alberto Calvache-Mora. Calle 67 # 5 – 27, Chapinero, Bogotá, Colombia. Teléfono: +57 3175005387; Email: carlos.calvache@ibero.edu.co