Artículos

METODOLOGÍA PARA DISCERNIR ENTRE SONIDO CARDIACO NO PATOLÓGICO DE REGURGITACIÓN Y ESTENOSIS AÓRTICA, EMPLEANDO DTW[1]

METHODOLOGY TO DISCERN BETWEEN NON-PATHOLOGICAL SOUND FROM REGURGITATION AND AORTIC STENOSIS, USING DTW

ROSARIO RÍOS-PRADO
Instituto Politécnico Nacional-UPIITA, Ciudad de México, México
ÁLVARO ANZUETO-RÍOS
Instituto Politécnico Nacional-UPIITA, Ciudad de México, México
BLANCA TOVAR-CORONA
Instituto Politécnico Nacional-UPIITA, Ciudad de México, México

METODOLOGÍA PARA DISCERNIR ENTRE SONIDO CARDIACO NO PATOLÓGICO DE REGURGITACIÓN Y ESTENOSIS AÓRTICA, EMPLEANDO DTW[1]

Revista de la Facultad de Ciencias, vol. 8, núm. 1, 2019

Universidad Nacional de Colombia

Recepción: 10 Septiembre 2018

Aprobación: 17 Diciembre 2018

Resumen: En este artículo se describe la metodología empleada para adquirir, almacenar y procesar señales de sonido cardiaco con el objetivo de comparar las señales de sonidos no patológicos conlos patológicos y determinar las fronteras de decisión correspondientes para una futura clasificación. Las señales de sujetos no patológicos se han adquirido con el sistema propuesto en este documento, el cual se ha diseñado considerando las frecuencias tanto de sonidos patológicos como no patológicos. Dos casos, uno de estenosis aórtica y otro de regurgitación aórtica, obtenidos de un sitio público, se han analizado para efectuar las comparaciones. Empleando el algoritmo computacional de Alineamiento Temporal Dinámico se evaluó la similitud que existe en la forma de las señales no patológicas y patológicas. Los resultados han ayudado a proponer las fronteras de decisión de separación entre las clases de señales.

Palabras clave: Alineamiento Temporal Dinámico, estenosis aórtica, fonocardiograma, regurgitación aórtica, sonido cardiaco.

Abstract: This paper describes the methodology used to acquire, store and process cardiac sound signals in order to compare signals from non-pathologic with pathologic sounds and determine the respective decision boundaries for a future classification. Non-pathologic signals have been acquired with the system described here, which has been designed considering the frequencies of non-pathologic and pathologic sounds. Two signals, one with aortic stenosis and another with aortic regurgitation have been obtained from a public site to compare them with the non-pathologic. Using the Dynamic Time Warping algorithm, it was evaluated the similarity that exists in the shape of non-pathologic and pathologic signals. Results have helped to determine the decision boundaries for separation between signals classes.

Keywords: Dynamic Time Warping, aortic stenosis, phonocardiogram, aortic regurgitation, cardiac sound.

1. INTRODUCCIÓN

El corazón posee cuatro válvulas que controlan el flujo de la sangre por todo el cuerpo (Sastre & Pérez, 2017), la turbulencia de la sangre y la mecánica de los ventrículos, aurículas y válvulas generan fenómenos simultáneos que dan lugar a los sonidos característicos. Cuando las válvulas se abren no generan ruido perceptible, pues es un proceso relativamente lento, pero al cerrarse, los velos de las válvulas y los líquidos circundantes vibran bajo la influencia de los cambios repentinos de la presión, provocando un sonido que viaja en todas las direcciones a través del tórax. Con la contracción de los ventrículos se provoca un aumento en la presión ventricular generando un ruido por el cierre de las válvulas auriculoventriculares (AV). La vibración tiene un tono bajo y es relativamente prolongada, este sonido se conoce como primer tono cardíaco o S1 (Noor & Shadi, 2014). Cuando se cierran las válvulas aórtica y pulmonar al final de la sístole se genera un sonido debido al cierre rápido; en este lapso los líquidos circundantes vibran durante un período corto, lo que genera el segundo tono cardíaco o S2 (Guyton & Hall, 2011). Las dos componentes principales; S1 y S2, forman el ciclo de sonido cardiaco, reflejado en dos fases: la sístole y la diástole, lo que se visualiza en la Figura 1.

El primer tono cardíaco o S1 tiene una duración aproximada de 0.07 a 0.16 segundos. Las dos componentes de S1, debidas al cierre de las válvulas mitral y tricúspide, denotadas como M1 y T1 respectivamente, son consideradas de alta frecuencia, típicamente entre 20-150 Hz (Tilkian & Conover, 2001; Mahabuba et al., 2009). El rango de frecuencia para S2 está entre 50-250 Hz y su duración entre 0.04-0.12 segundos (Noor & Shadi, 2014; Mahabuba et al., 2009). El segundo sonido cardíaco indica el final de la sístole ventricular y tiene dos componentes de alta frecuencia, A2 y P2, relacionadas al cierre de la válvula aórtica y pulmonar, respectivamente, ver Figura 1.

Así como la actividad mecánica del corazón genera una señal cíclica del sonido, la cual se registra en el fonocardiograma (PCG), la actividad eléctrica da paso al ciclo cardiaco representado en el electrocardiograma (ECG) como se muestra en la Figura 2. Por separado, los procesos mecánico y eléctrico se relacionan con los cambios en las presiones y volúmenes en las cavidades cardiacas, lo cual es evidente en las curvas de la Figura 2. Generalmente la señal de ECG, no es alterada por problemas valvulares leves o moderados, por ello sirve como referencia para determinar el inicio y fin del ciclo de sonido cardiaco cuando la identificación de S1 y S2 se dificulta.

El cuerpo humano comprende procesos adicionales que generan ruidos, como el respiratorio y gastrointestinal que, junto al sonido cardiaco, se transmiten a través del tórax y se registran en la señal de sonido.

Señal de un sonido cardiaco normal con dos componentes: S1 y S2.
Figura 1
Señal de un sonido cardiaco normal con dos componentes: S1 y S2.
Elaboración propia.

Acontecimientos del ciclo cardíaco para la función del ventrículo izquierdo,
que muestran los cambios de la presión

auricular izquierda, presión ventricular izquierda, presión
aórtica, volumen ventricular, electrocardiograma y fonocardiograma.
Figura 2
Acontecimientos del ciclo cardíaco para la función del ventrículo izquierdo, que muestran los cambios de la presión auricular izquierda, presión ventricular izquierda, presión aórtica, volumen ventricular, electrocardiograma y fonocardiograma.
Guyton (2012).

La presencia de ruidos fisiológicos del proceso respiratorio hace necesario considerar las duraciones en las que ocurre cada ciclo con la finalidad de evaluar, tanto el sonido cardiaco como respiratorio (con duración entre 4 a 5 segundos) y verificar los cambios durante la expiración y la inspiración. (Serra, 2011).

En la actualidad existen diversas técnicas para verificar el funcionamiento del corazón como: tomografía computarizada (TC), imágenes de resonancia magnética (IRM) y ecocardiografía, empleados para verificar el funcionamiento del corazón. Estas técnicas resultan ser procedimientos de evaluación costosos y sofisticados, para los que se requiere personal especializado en su manejo, lo que disminuye su accesibilidad (Babaei & Geranmayeh, 2009; Maglogiannis et al., 2009). Una de las técnicas más empleadas para analizar el estado del corazón es la adquirida por medio del electrocardiograma (ECG), en el que se analiza la señal generada por los impulsos eléctricos cardíacos; a partir de esta lectura es posible detectar ciertas patologías como se describe en las propuestas de Maglogiannis et al. (2009) y Zheng et al. (2015), sin embargo, esta técnica no es suficiente cuando se trata de detectar anomalías en las válvulas cardiacas.

Los estudios e investigaciones actuales han empleado el PCG para extraer características que determinen la existencia de patologías cardíacas o soplos, asociados a una falla valvular. Dos grandes objetivos han sido planteados en trabajos previos; el primero consiste en segmentar y caracterizar las dos componentes principales del ciclo de sonido cardíaco normal (S1 y S2, ver Figura 1), la segunda es verificar las componentes que están fuera de lo normal para la detección de soplos y patologías que puedan modificar la señal de sonido de una persona sana. Entre los métodos empleados se encuentra la transformada Wavelet y Fast Fourier Transform (FFT). (Patrício, 2013).

M. El-Segaier desarrolló un método basado en la activación de los complejos del ECG. En este método se adquiere de manera simultánea las señales de fonocardiograma (del inglés Phonocardiogram o PCG) y ECG. El algoritmo de detección está basado en envolventes, en los que se detectaron las ondas R del ECG y se calculó la distancia R-R. Las ondas T también fueron calculadas. La técnica de Short-Time Fourier Transform (STFT) se usó para obtener el espectro del PCG. Usando la relación entre el PCG y el ECG, se definieron intervalos para S1 y S2 y el máximo en el espectro en cada uno de esos intervalos se definió como S1 o S2. (El-Segaier, 2007).

En 2015, Randhawa y Singh lograron clasificar los sonidos en tres categorías: señales normales, murmullos sistólicos y murmullos diastólicos, a partir de una base de datos con 144 registros. De los cuales se extrajeron 28 características iniciales, reducidas a 7, siendo las más significativas. Posteriormente, estas características se usaron en diferentes clasificadores con los que se obtuvo una exactitud de 99.6% con las técnicas de k Nearest Neighbour (k-NN) y fuzzy k-NN. (Randhawa & Singh, 2015).

1.1. Dynamic Time Warping

Dynamic Time Warping (DTW por sus siglas en inglés) o Alineamiento Temporal Dinámico es una técnica empleada para evaluar secuencias donde hay una variabilidad interna en la duración de los grupos fónicos que la forman, de modo que no se presenta sincronización temporal (alineamiento temporal). Además, la falta de alineamiento no obedece una ley fija, es decir, se da de manera heterogénea, produciendo variaciones localizadas que aumentan o disminuyen la duración del tramo de análisis. Del mismo modo, las señales a comparar no se ven limitadas a que los sonidos S1 y S2 se encuentren sincronizados; es decir, no es necesario recorrer temporalmente las señales para generar la alineación, la técnica de comparación realiza esta tarea, mediante su procedimiento matemático.

El objetivo de DTW es comparar dos secuencias de datos dependientes del tiempo, X = {x1,x2,..., xi,...,xM} de longitud M ∈ N y Y = {y1,y2,...,yj,...,yN} de longitud N ∈ N. Estas secuencias pueden ser señales discretas (series de tiempo) o, comúnmente, secuencias muestreadas a puntos equidistantes de tiempo (ver Figura 3(a)). Para comparar dos secuencias del mismo espacio (denotado como F), donde xm,yn ∈ F para m ∈ [1 : M] y n ∈ [1 : N], es necesaria una medida de costo local (c(x,y)) definida como se muestra en la ecuación (1)

(1)

De donde (d(xm,yn)) es la medida de Distancia Euclidiana Cuadrática que está definida como se indica en la ecuación (2).

(2)

Cuando la diferencia entre los valores cuadráticos de xm y yn es menor a 1 (indicador de alta semejanza), disminuye al elevar al cuadrado; para el caso cuando el valor de la diferencia es mayor a 1 (indicador de baja semejanza), el valor cuadrático lo aumenta, logrando con esto mayor separabilidad entre los costos mínimos y máximos.

Evaluando el costo de cada par de elementos de las secuencia X yY, se obtiene la matriz de costoC ∈RM×N definida por C(m,n) = c(xm,yn). Un ejemplo de una matriz de costo se muestra en la Figura 3(b).

Después el objetivo será encontrar una alineación entre X y Y teniendo el mínimo costo en general. El costo total cp(X,Y) de un camino de alineación p entre X y Y respecto a la medida de costo local está definido como se describe en la ecuación (3).

(3)

Para un caso particular, en que se desee comparar dos señales de fuentes diferentes, como ejemplo, señal de sonido de un foco aórtico y señal de sonido del foco mitral, tanto para patológico como no patológico, es necesario realizar el proceso de DTW para ambas señales y determinar el nivel de semejanza entre ellas. Por lo tanto se puede definir K como cantidad de procesos de comparación, entre pares de señales.

Debido a que DTW es una distancia bien definida incluso con grandes cantidades de alineaciones de costo total mínimo, el alineamiento temporal permite que el eje temporal de la señal de prueba se comprima y expanda de forma no lineal para alinear los vectores de características entre el patrón y la prueba (Müller, 2007). Por ello, existen variaciones en la forma de la señal de sonido que se presentan como componentes adicionales a S1 y S2, esta variabilidad permite determinar la existencia de anormalidad y el grado de daño asociado a una patología valvular. Así, la propuesta presenta una metodología para adquirir, almacenar, procesar y analizar la señal sonora del corazón, que mediante la extracción de características y obtención de patrones, ayude a identificar las componentes del ciclo de sonido cardiaco y la presencia de anormalidades, con la finalidad de generar las fronteras de decisión para una futura clasificación, empleando la técnica de DTW.

Representación del alineamiento de DTW.
Figura 3
Representación del alineamiento de DTW.

Alineación en el tiempo de dos secuencias cuyos puntos alineados se indican con flechas (a). Matriz de costo de dos secuencias con valores reales X (eje vertical) y Y (eje horizontal), empleando distancia cuadrática como medida de costo local c, dónde las regiones de bajo costo están en colores negros (b).

Müller (2017).

2. MATERIALES Y MÉTODOS

La metodología propuesta describe la serie de pasos para efectuar una comparación entre señales de sonido cardiaco para encontrar un grado de similitud, cuyo objetivo final será analizar la separabilidad de los resultados y generar una posible frontera de decisión. En el diagrama de la Figura 4, se presentan los pasos que se siguen para aplicar la metodología propuesta.

Diagrama de los pasos de la metodología propuesta.
Figura 4
Diagrama de los pasos de la metodología propuesta.
Elaboración propia.

En el primer bloque se adquieren las señales fisiológicas, las cuales pasan a una etapa de pre-amplificación con lo que se busca tener una amplitud de trabajo superior para el procesamiento. El paso siguiente consiste en filtrar la señal analógica con filtros activos para atenuar las frecuencias por debajo de los 800 Hz. La adquisición y almacenamiento de la señal permitirá almacenar las señales en archivos digitales, esto se hará con el soporte de la tarjeta NI-USB 6009. Teniendo los archivos digitales se procede a realizar las comparaciones con la técnica de DTW, finalmente se hace la propuesta de una posible frontera de decisión para separar los datos obtenidos.

2.1. Caso de estudio y datos obtenidos

Se evaluó un adulto joven sano de 24 años de edad, de 1.63 m de altura y un peso de 53 kg, quien no realiza actividad física con frecuencia. Se registraron sus señales, no patológicas, con el sistema descrito en la sección 2.2 de Sistema de adquisición. Las señales de sonido no patológicas con duración de 10 segundos, se seleccionaron de un registro de cuatro señales tomadas en diferentes puntos de auscultación a una frecuencia de muestreo de 2000 Hz; el segmento de la Figura 5(a) (Señal de referencia 1 ideal), es considerado ideal, debido a que S1 y S2 están definidas y S1 es de mayor amplitud que S2; además, el intervalo entre S1 y S2 es regular y se mantiene cíclico durante todo el segmento empleado en el análisis. Para el caso de una señal patológica se tienen variaciones en el intervalo que existe entre la ocurrencia de S1 y S2, al igual que los cambios de S2 a S1. El ruido presente en una señal patológica puede llegar a ser mayor o igual que S1 y S2 en magnitud.

El segmento de la Figura 5(b) (Señal de referencia 2), difiere de la señal de la Figura 5(a) debido a que entre los intervalos de S1 a S2 y de S2 a S1, contiene pequeñas variaciones de ruido sin que éste sobrepase la amplitud de S1 o S2; además, el segmento continúa siendo regular. El segmento de la Figura 5(c) (Señal de prueba 1) corresponde a una señal no patológica, donde S1 y S2 están definidos, pero la amplitud de S1 no sobresale de la amplitud de S2.

Las señales patológicas del segmento de la Figura 5(d) (Señal de prueba 2 de Estenosis aórtica) y del segmento de la Figura 5(e) (Señal de prueba 3 de Regurgitación aórtica) empleadas en la evaluación, fueron seleccionadas de una recopilación de señales de sonidos patológicos, disponibles en formato mp4 en el sitio de Thinklabs (2016), con duraciones distintas. Los segmentos patológicos tienen la característica de presentar irregularidades entre los intervalos de S1 y S2 y, de S2 a S1. Para evaluar las señales patológicas como señales de sonido fue necesario convertir el video a formato de audio (.WAV). Lo siguiente fue adecuar el valor de la frecuencia de muestreo del archivo al valor con el que se adquirieron las señales propias, para lo cual se realizó un diezmado de 44100 Hz a 2000 Hz, lo que permitió tener la misma velocidad de muestreo de 2000 datos por segundo y una duración de 10 segundos, para los dos segmentos patológicos y los que fueron adquiridos con el sistema desarrollado.

Para aplicar la técnica de comparación de la sección 2.3 se han seleccionado segmentos de 10 segundos en los que se contempla tener, al menos un ciclo respiratorio completo de 5 segundos de duración (inspiración y expiración), con lo que se analiza una señal de sonido cardiaco acompañada de los posibles ruidos respiratorios para no excluir las características fisiológicas naturales del sonido producido dentro del cuerpo.

Señales de sonido cardiaco empleadas en el desarrollo de la metodología.
Figura 5
Señales de sonido cardiaco empleadas en el desarrollo de la metodología.

Señales no patológicas: Señal de referencia 1 ideal (a), Señal de referencia 2 (b), Señal de prueba 1 (c). Señales patológicas: Señal de prueba 2 de Estenosis aórtica (d), Señal de prueba 3 de Regurgitación aórtica (e).

Elaboración propia.

Adicionalmente, todos los segmentos se han normalizado quedando dentro de un rango de -1 a 1.

2.2. Sistema de adquisición

La arquitectura del sistema se compone del acoplamiento del sensor (micrófono) al estetoscopio para la adquisición de sonido, pre-amplificación y filtrado analógico a la señal cruda del micrófono, lectura de las señales filtradas por medio de un dispositivo DAQ, almacenamiento de la información en la PC, pruebas de comparación entre señales con la técnica DTW y evaluación de los datos extraídos de DTW para la generación de las fronteras de decisión, como se muestra en la Figura 6.

2.2.1. Sensor y pre-amplificación

Se adquirieron tres micrófonos electret para las pruebas de adquisición de señal, con las características de la Tabla 1 y se seleccionó el modelo CMA-4544PF, que posee un rango de frecuencia de trabajo de 20-20000 Hz, cuyo límite inferior es el parámetro de mayor ponderación para su elección, debido a que los sonidos cardiacos se encuentran en valores de frecuencia entre 20 y 250 Hz, y los soplos entre 100 y 750 Hz de acuerdo a la literatura.

Para la adquisición de la señal se adaptó el micrófono al tubo flexible de un estetoscopio marca Medfex, modelo 500 de cabeza dual. El micrófono fue colocado lo más cerca posible de la cabeza del estetoscopio, para lograr mayor fidelidad del sonido.

Arquitectura del sistema electrónico y de almacenamiento.
Figura 6
Arquitectura del sistema electrónico y de almacenamiento.
Elaboración propia.

Tabla 1
Descripción de los micrófonos adquiridos.
Descripción Valor Unidad
Micrófono 1 Micrófono 2 Micrófono 3
CEM-C9745 CMA-4544PF MO093803-2
Direccionalidad Omnidireccional Omnidireccional Omnidireccional -
Tecnología Electret condenser Electret condenser Electret condenser -
Sensitividad -46 ±- 2.0 (0 db=1V/Pa) at 1 K Hz f=1 kHz, 1 Pa, 0 dB = 1 V/1 Pa -38 dB
Rango de frecuencia 100-10000 20-20000 50-16000 Hz
Voltaje de operación 1-10 3-10 3-10 VCD
Impedancia de salida - 2.2 2.2 KΩ

El circuito eléctrico del micrófono se realizó tomando en cuenta la recomendación del fabricante CUI INC (2013), la salida de voltaje del sensor pasa a una etapa de pre-amplificación con ganancia de 20, en el que se ha empleado el amplificador de potencia de audio de bajo voltaje LM386, considerando lo propuesto en la hoja de especificaciones del fabricante Texas Instruments (2017). La conexión del micrófono y la etapa de pre-amplificación se pueden ver en la Figura 8.

2.2.2. Filtrado activo analógico

El filtrado activo analógico consiste en atenuar las frecuencias altas de la señal proveniente de la etapa de pre-amplificación mediante un filtro pasa bajas tipo Butterworth de 5◦ orden, con ganancia unitaria y frecuencia de corte igual a Fc = 800 Hz, en el que se emplearon los amplificadores operacionales con número de serie LM324 (Texas Instruments, 2015). Para ello, se calcularon tres filtros parciales, uno de primer orden y dos de segundo orden, que al ser colocados en conexión en serie resultan en un filtro de quinto orden (Stout & Kaufman, 1976). Para el cálculo del filtro de primer orden se empleó la ecuación (4), para los dos filtros de segundo orden se emplearon las ecuaciones (5) a (8). En cada etapa se propusieron los valores de los capacitores y se obtuvieron los valores de las resistencias como se describe a continuación.

Etapa 1. Filtro pasa-bajas de primer orden con Fc = 800 Hz.

Con C1 = 1 nF:

(4)

Etapa 2. Filtro pasa-bajas de segundo orden con Fc = 800 Hz.

Con C1 = 820 pF:

(5)

Cuyo valor más próximo es de 1.5 nF.

Con C1 = 820 pF y C2 = 1.5 nF, se calculan los valores de R1 y R2:

(6)

Etapa 3. Filtro pasa-bajas de segundo orden con Fc = 800 Hz.

Con C1 = 330 pF:

(7)

Cuyo valor más próximo es de 4.7 nF.

Con C1 = 330 pF y C2 = 4.7 nF, se calculan los valores de R1 y R2 empleando la ecuación (8).

(8)

Diagramas de Bode de la respuesta del filtro en tres frecuencias diferentes.
Figura 7
Diagramas de Bode de la respuesta del filtro en tres frecuencias diferentes.
Elaboración propia.

En la Figura 7 se muestran los diagramas de bode de la respuesta del filtro activo analógico pasa-bajas con frecuencia de corte de 800 Hz.

El diagrama de la Figura 8 muestra el diseño eléctrico y las conexiones entre las etapas de la sección 2.2.1 y 2.2.2 del Sensor y pre-amplificación y de Filtrado activo analógico, respectivamente.

Diseño electrónico del sistema electrónico de adquisición de las señales
analógicas.
Figura 8
Diseño electrónico del sistema electrónico de adquisición de las señales analógicas.
Elaboración propia.

2.2.3. Lectura y almacenamiento de las señales

Para las etapas de lectura y almacenamiento de las señales se ha empleado la tarjeta de adquisición de datos NI USB-6009 de National Instruments. La adquisición y almacenamiento de la señal de sonido se realizó con el soporte de LabVIEW por medio de los canales analógicos de la tarjeta. Se configuraron las propiedades de las entradas analógicas a velocidad de muestreo de 2000 datos por segundo.

La etapa siguiente consistió en hacer el análisis sobre los datos obtenidos. Para ello se hace uso de los archivos guardados por medio de LabVIEW con extensión .TDM, los cuales se cargan y procesan con el software MATLAB R .

2.3. Técnica de comparación

Se empleó DTW como técnica de comparación entre señales. DTW funcionó como una aproximación para determinar la relación existente entre las formas de las señales no patológicas y patológicas dada por la alineación de los datos de cada vector por medio de distancia euclidiana cuadrática. La forma en que DTW realiza su proceso de comparación se resume en la Figura 9, donde, se tienen dos señales que ingresan al proceso (señal de referencia y señal de prueba). El primer paso será obtener las distancias entre todos los puntos de los segmentos cuyo resultado será una matriz de distancias; ésta, a su vez, se empleará para determinar la matriz de costos parciales de todas las alineaciones posibles; el último paso de la comparación de DTW será realizar la sumatoria para cada trayectoria posible, y determinar cuál es la mínima, el valor mínimo obtenido será el valor de costo total, el cual se empleará en la generación de las líneas de separación o fronteras de decisión entre clases de señales.

Procedimiento de DTW para la comparación entre una señal de referencia y una
señal de prueba.
Figura 9
Procedimiento de DTW para la comparación entre una señal de referencia y una señal de prueba.
Elaboración propia.

Los segmentos descritos en la Figura 5 en la sección 2.1 de Caso de estudio y datos obtenidos, se presentan nuevamente en la Figura 10, distribuidas en señales de referencia (columna izquierda) y señales de prueba (columna derecha), las cuales son usadas en las comparaciones de similitud mediante la técnica DTW. El método de comparación toma las señales de referencia (segmentos de la Figura 10(a) y 10(b)) para ser comparadas contra las señales de prueba (segmentos de la Figura 10(c), 10(d) y 10(e)), con lo que se determina un valor de costo por cada par de señales. Finalmente, se obtienen seis costos, correspondientes al número total de comparaciones o pruebas.

En la primera prueba se emplearon los segmentos de la Figura 10(a) (Señal ideal) y 10(c) (Señal 1). Debido a que ambos sonidos son no patológicos, una hipótesis preliminar indicaría que el resultado de costo debería ser bajo, respecto a las comparaciones con señales patológicas, a pesar de las variaciones en amplitud. Visualmente, es posible destacar que ambas señales son semejantes en forma y con el resultado del alinea miento, el valor de costo obtenido es de 69.10. El resultado del alineamiento generado por DTW se muestra en la Figura 11(a).

Diagrama de comparaciones entre señales.
Figura 10
Diagrama de comparaciones entre señales.

Donde la columna izquierda presenta las señales de referencia que serán comparadas con las señales de la columna derecha (señales de prueba). Señal de referencia 1 ideal (a), Señal de referencia 2 (b), Señal de prueba 1 (c). Señales patológicas: Señal de prueba 2 de Estenosis aórtica (d), Señal de prueba 3 de Regurgitación aórtica (e).

Elaboración propia.

En la segunda comparación entre las señales no patológicas de la Figura 10(b) (Señal 2) y 10(c) (Señal 1), ha dado un costo de 137.13, que en relación con la prueba uno, indicaría que la semejanza es menor. El resultado gráfico del alineamiento se muestra en la Figura 11(b).

En la prueba siguiente, los segmentos de la Figura 10(a) (Señal ideal) y 10(d) (Señal de estenosis aórtica), fueron comparadas, lo cual arrojó un valor de costo de 317.32, que es mayor al obtenido en la prueba uno, donde la señal de la Figura 10(a) ideal se empleó como referencia; es decir, que la semejanza entre la referencia ideal y la señal de prueba 1 es mucho mayor que la que existe entre la señal ideal y la de estenosis aórtica. La alineación generada por DTW se muestra en la Figura 11(c).

La cuarta comparación se hizo con el segmento de la Figura 10(b) (Señal 2) y 10(d) (Señal de estenosis aórtica); el valor del costo es de 290.34, valor menor al obtenido entre la señal de estenosis y la señal ideal; lo que indica el resultado es que el ruido presente en la señal dos es más parecido a una señal patológica. En la Figura 11(d) se muestra la alineación hecha por DTW.

Resultados
de las comparaciones entre señales empleando DTW.
Figura 11
Resultados de las comparaciones entre señales empleando DTW.
Elaboración propia.

En la quinta prueba se emplearon los segmentos de la Figura 10(a) (Señal ideal) y 10(e) (Señal de regurgitación aórtica). La prueba dio un valor de costo de 581.27, el cual es mayor que los valores obtenidos en las cuatro comparaciones anteriores y, en realidad sobresale de las tres pruebas anteriores, lo que indica que la señal de regurgitación aórtica ha sido la que menor similitud ha tenido con la señal ideal en cuanto a su forma. El alineamiento entre las señales generado por DTW se muestra en la Figura 11(e).

La última comparación se realizó entre los segmentos de la Figura 10(b) (Señal 2) y 10(e) (Señal de regurgitación aórtica). El valor de costo para esta prueba es de 516.47, valor con el que se concluyen las pruebas de semejanza entre señales. El resultado continúa siendo mayor que los obtenidos en las comparaciones entre señales no patológicas; e incluso, es mayor que los costos de las pruebas que emplearon a la señal de estenosis aórtica. La Figura 11(f) representa la alineación encontrada por DTW con el valor mínimo de costo encontrado.

Con los seis costos obtenidos en cada prueba es posible generar las posibles fronteras de decisión correspondientes.

3. RESULTADOS

Partiendo de conocer previamente el diagnóstico de las señales entre patológicas y no patológicas y después de obtener los costos de las comparaciones correspondientes y graficarlos, es posible observar una separación entre las señales patológicas y no patológicas, generando así una frontera de decisión en el valor de costo 227.23, calculado del promedio entre el valor de costo de la prueba 2 y 3, como se observa en la Figura 12. Además, dentro de las señales patológicas, se propone una segunda frontera de decisión en el valor de costo 435.80 como línea de separación entre estenosis y regurgitación aórtica. El cual se obtiene promediando los valores de costos entre la prueba 4 y 5. Así las fronteras de decisión representan una línea de separación entre clases. Donde la Frontera 1 de la Figura 12, es la separación entre clase normal y patológica, y la Frontera 2, será la que separe la estenosis de regurgitación.

Posibles fronteras de decisión y costos.
Figura 12
Posibles fronteras de decisión y costos.
Elaboración propia.

Con los datos obtenidos y refiriéndose únicamente a la forma de las señales, es posible determinar que, una alta similitud entre las alineaciones para comparar la forma de los datos, correspondería a un valor de costo por debajo de 227.23 (valores por debajo de la línea continua de la Figura 12, mientras que, valores de costo por encima de 227.23 correspondería a señales patológicas.

4. DISCUSIÓN

El DTW contrasta las formas entre las señales, encontrando el valor mínimo entre las alineaciones de sus vectores, por ello, sin importar el tiempo de ocurrencia o el valor de la amplitud, es posible compararlas por medio de las variaciones en la forma.

Al aplicar DTW entre señales patológicas y no patológicas, los resultados en el valor de costo presentan diferencias que ayudan a hacer afirmaciones sobre la clase a la que pertenece la señal.

Si bien, los resultados de DTW sugieren una primera frontera de decisión entre señales patológicas y no patológicas, también permiten proponer una segunda frontera de decisión entre las señales con estenosis y regurgitación aórtica, esto se puede verificar observando los resultados presentados en la Figura 11.

Debido a que la cavidad torácica y el sistema respiratorio generan sonido, la forma en la que éste se transmite a través del tórax no permite separar el sonido cardiaco del generado por la respiración, por ello es necesario contemplar segmentos de señales de sonidos cardíacos donde pueda asegurarse al menos un ciclo respiratorio completo para la caracterización y evaluación más real, lo cual implicará la modificación del tiempo de registro y, por lo tanto, el número de datos registrados. En caso de padecer un problema respiratorio que dificulte la diferenciación de los sonidos cardiacos de los respiratorios, el sistema aquí propuesto perdería eficiencia.

De acuerdo a las señales obtenidas con el sistema entre el micrófono y estetoscopio. Se corroboró que corresponden a las señales descritas en la literatura, lo que indica que el diseño del sistema propuesto puede ser empleado para futuras adquisiciones.

5. CONCLUSIONES

Los resultados preliminares al emplear DTW como primer método de comparación y diferenciación muestran datos favorables para la distinción entre clases de las señales, permitiendo generar una posible frontera de decisión.

Con la metodología propuesta es posible adquirir las señales de sonido cardiaco y mediante la alineación dada por DTW se pueden comparar las señales.

Los datos presentados en este trabajo determinan que las comparaciones entre las señales no patológicas con las señales de regurgitación y estenosis aórtica empleando DTW son viables de acuerdo con la variación en los patrones de las señales.

Debido a que existen condiciones patológicas diversas en las válvulas del corazón que pueden estar presentes en un mismo paciente, es necesario proponer técnicas adicionales de procesamiento.

Referencias

Babaei, S. & Geranmayeh, A. (2009). Heart sound reproduction based on neural network classification of cardiac valve disorders using wavelet transforms of PCG signals. Computers in Biology and Medicine, 39(1), 8–15.

CUI INC. (2013). Electret condenser microphone. Recuperado de https://www.cui.com/product/resource/cma-4544pf-w.pdf

El-Segaier, M. (2007). Digital analysis of cardiac acoustic signals in children. Suecia: División de Cardiología Pediátrica, Departamento de Ciencias Clínicas, Universidad de Lund.

Guyton, A. & Hall, J. (2011). Tratado de fisiología médica. Barcelona: Editorial Elsevier.

Maglogiannis, I.; Loukis, E.; Zafiropoulos, E. & Stasis, A. (2009). Support vectors machine-based identification of heart valve diseases using heart sounds. Computer Methods and Programs in Biomedicine, 95(1), 47–61.

Mahabuba, A.; Vijay, J. & Anil, G. (2009). Analysis of heart sounds and cardiac murmurs for detecting cardiac disorders using phonocardiography. Journal of Instrument Society of India, 39(1), 38–41.

Müller, M. (2007). Information retrieval for music and motion. Heidelberg: Springer.

Noor, A. & Shadi, M. (2014). The heart auscultation: from sound to graphical. ARPN Journal of Engineering and Applied Sciences, 9(10), 1924–1929.

Patrício, J.M. (2013). Heart sound analysis for cardiac pathology identification: detection and characterization of heart murmurs. Portugal: Facultad de Ingeniería, Universidad de Porto.

Randhawa, S. K. & Singh, M. (2015). Classification of heart sound signals using multi-modal features. Procedia Computer Science, 58, 165–171.

Sastre, I. & Pérez, R. (2017). Anatomía y fisiología del corazón. Abordaje del paciente con infarto de miocardio. Editorial Formación Alcalá.

Serra, R. (2011). Aparato respiratorio, ventilación pulmonary. Recuperado de http://www.webfisio.es/fisiologia/resp/textos/vp.htm

Stout, D. F. & Kaufman, M. (1976). Handbook of operational amplifier circuit design. McGraw-Hill.

Texas Instruments. (2017), LM386 Low voltage audio power amplifier. Recuperado de http://www.ti.com/lit/ds/symlink/lm386.pdf Thinklabs. (2016) HeartSounds. Recuperado de www.thinklabs.com

Tilkian, A. G. & Conover, M. B. (2001). Understanding heart sounds and murmurs with an introduction to lung sounds. WB Saunders Company.

Zheng, Y.; Guo, X.; Qin, J.; & Xiao, S. (2015). Computer-assisted diagnosis for chronic heart failure by the analysis of their cardiac reserve and heart sound characteristics. Computer Methods and Programs in Biomedicine, 122(3), 372–383.

Texas Instruments. (2015). LMx24-N, LM2902-N Low-Power, Quad-Operational Amplifiers. Recuperado de http://www.ti.com/lit/ds/symlink/lm324-n.pdf

Notas

[1] Ríos-Prado, R.; Anzueto-Ríos, A. & Tovar-Corona, B. (2018). Metodología para discernir entre sonido cardiaco no patológico de regurgitación y estenosis aórtica, empleando DTW. Rev. Fac. Cienc., 8(1), 138–155. DOI: https://doi.org/10.15446/rev.fac.cienc.v8n1.74802
HTML generado a partir de XML-JATS4R