Estimación del grado de afectación pulmonar por covid-19 mediante la clasificación supervisada de la imagen de rayos x
Estimation of the Degree of Lung Affection by CoviD-19 through Supervised Classification of the X-Ray image
Revista Cubana de Transformación Digital
Unión de Informáticos de Cuba, Cuba
ISSN-e: 2708-3411
Periodicidad: Trimestral
vol. 3, núm. 2, 2021
Recepción: 07 Junio 2021
Aprobación: 27 Junio 2021
Resumen: El trabajo presenta la propuesta de un índice de afectación de los pulmones en imágenes de rayos x de tórax en pacientes diagnosticados con COVID-19 en estado grave de la enfermedad. El índice se obtiene a partir de un algoritmo que combina métodos de procesamiento digital de imágenes y aprendizaje au- tomático para la segmentación de la región pulmonar, la evaluación de su cali- dad y la clasificación de la imagen segmentada de los pulmones. Los resultados alcanzados en los experimentos realizados en imágenes de pacientes sanos y afectados por COVID-19 mostraron altos valores de sensibi- lidad y especificidad en la clasificación. Por otra parte, se estudió la variación de los valores del índice con respecto a variables clínicas en series de tiempo de imágenes de pacientes con COVID 19 ingresados en las unidades de terapia intensiva de hospitales de La Habana, Cuba. El comportamiento de la relación entre el índice y la evolución de la respuesta clínica de los pacientes, evidenció que pudiera ser utilizado como un indicador de la efectividad de los tratamien- tos y protocolos aplicados.
Palabras clave: Aprendizaje automático, Clasificación supervisada, CO- VID-19, Imágenes de rayos x, Procesamiento digital de imágenes.
Abstract: This work presents the proposal of a simple quantitative index of lung affection derived from chest x-ray images in patients diagnosed with COVID-19 in an advanced stage of the disease. The index is obtained from an algorithm that combines digital image processing and machine learning methods for the seg- mentation of the lung region, the evaluation of its quality and the classification of each pixel of the segmented lung image. The results achieved in the experiments carried out on images of healthy pa- tients and those affected by COVID-19 showed high values of sensitivity and specificity in the classification. The study of the variation of the values of the proposed index in time series of images from patients with COVID 19 admitted to the intensive care units of hospitals in Havana, Cuba, showed a relationship between these variations with the evolution of the disease and the patients’ res- ponse the proposed index as an indicator of the effectiveness of the treatments and protocols applied.
Keywords: Machine learning, Supervised classification, COVID-19, x-ray images, Digital image processing.
INTRODUCCIÓN
Luego de más de un año en la lucha con la pandemia de la COVID-19 los protocolos y formas de actuación en el tratamiento de pacientes en estado grave o crítico han estado en constante renovación en aras de llegar en primera instancia a salvar la vida de estos pacientes.
En Batista et al. (2020) se realiza un análisis del papel de las imágenes en el diagnóstico de la neumonía provocada por la COVID-19. Los autores aseguran que en este contexto, las radio- grafías RX de tórax han demostrado su importancia en la detección temprana y el manejo de manifestaciones pulmonares provocadas por la COVID-19. Estudios recientes demuestran que las anomalías en las imágenes de la radiografía de tórax que son características de las personas infectadas con COVID-19 (Ming-Yen, et al., 2020; Huang, et al., 2020) pueden ir disminuyendo o aumentando en dependencia del estado de gravedad del paciente y de la efectividad de los pro-
tocolos aplicados (Borghesi, et al., 2020; Monaco, et al., 2020) Sin embargo en la revisión biblio- gráfica realizada no se encontró ninguna investigación que proponga el cálculo automático de un indicador, medida o índice derivado de la clasificación de la imagen de CRX (Monaco, et al., 2020; Schalekamp, et al., 2020; Baratella, et al., 2020; Liang et al., 2020; Zhu, et al., 2020; Teixei- ra et al., 2020). En este trabajo se propone un índice de afectación de los pulmones en pacientes con COVID-19 a partir de un algoritmo que combina métodos de procesamiento digital de imá- genes y aprendizaje automático. La metodología empleada consta de los siguientes pasos para la obtención del índice: 1- Evaluación de la calidad de las imágenes y corrección; 2- Segmentación de los pulmones en la imagen CXR; 3- Clasificación de cada pixel de la imagen; 4- Cálculo de un índice global de afectación
La calidad de una imagen médica está determinada por el método de captura de la imagen,
las características del equipo y las variables de imagen seleccionadas por el operador. La calidad de la imagen no es un factor único, sino una combinación de al menos cinco factores: contraste, desenfoque, ruido, artefactos y distorsión (Sprawls, 2021)
De la variedad de factores que influyen de forma negativa en la calidad de las imágenes, el grado de nitidez es uno de los más importantes, ya que si la imagen se encuentra borrosa o fue- ra de foco podrían perderse los detalles de la textura de los pulmones, o sea, de las estructuras internas del mismo que son las que pueden sufrir las afectaciones de la enfermedad (Samajdar y Quraishi, 2015).
En Chen, et al. (2015) se propone un método de evaluación objetiva con el fin ajustar pará- metros técnicos para lograr el control del circuito cerrado del sistema de imágenes CXR. Sin embargo el objetivo de este método es el de servir de guía para corregir los problemas de los sen- sores de rayos x con el objetivo de obtener directamente del equipo imágenes de calidad y no se considera la posibilidad de un proceso de mejoramiento de las imágenes ya adquiridas a partir de los valores obtenidos por el método propuesto.
En Garea-Llano, et al. (2018) se realizó un análisis del uso del filtro de Kang y Park utilizan- do imágenes de ojos tomadas en el espectro infrarrojo cercano. El kernel es capaz de filtrar las altas frecuencias dentro de la textura de la imagen mejor que otros operadores del estado del arte (Garea-Llano, et al., 2018) además de poseer un bajo costo computacional debido al tamaño reducido del mismo. Por otro lado la entropía de una imagen ha probado ser un buen indicador del volumen de información contenida en ella (González y Woods, 2018). La entropía solo de- pende del volumen de niveles de gris y la frecuencia de cada nivel.
El objetivo fundamental del proceso de segmentación de los pulmones en la imagen CXR es
el de poder concentrar el proceso de clasificación solo en las regiones del pulmón, evitando la interferencia en el proceso que puedan causar el resto de las regiones de la imagen.
La segmentación automática de las CXR se ha estudiado ampliamente desde la década de 1970, al menos en lo que respecta a la segmentación de los pulmones, la caja torácica, el corazón y las clavículas (Toriwaki, et al., 1973; Wechsler y Sklansky, 1977). Los métodos convencionales se basan en conocimientos previos (Zhu, et al., 2009) para delimitar objetos anatómicos a par- tir de imágenes de rayos x. Los enfoques modernos utilizan redes convolucionales profundas y
han demostrado un rendimiento superior (Gómez, et al., 2020). A pesar de los grandes avances logrados en la segmentación automática de estos órganos, aún persisten limitaciones, como la necesidad de utilizar CXRs de tamaño reducido o la irregularidad e imprecisión de los bordes resultante de la segmentación que reducen su aplicabilidad en entornos clínicos, así como la ne- cesidad de grandes cantidades de imágenes de entrenamiento. Otra limitante sobre todo para su aplicación en lugares donde no existen recursos de cómputo potentes es la necesidad del uso de hardware de altas prestaciones para realizar los entrenamientos de las redes.
El aprendizaje supervisado (Bishop, 2006) es un procedimiento mediante el cual se deduce
una función a partir de los datos de entrenamiento, este hecho lo distingue del aprendizaje no supervisado, y permite aproximaciones que pueden aplicarse en una mayor variedad de con- textos. En López-Cabrera, et al. (2020) se realiza un estudio del estado del arte de los métodos más recientes empleados en la identificación de COVID-19 a partir de imágenes CXR. Se evi- dencia que la tendencia es a la aplicación de técnicas mediante las redes neuronales profundas. La mayoría de los resultados obtenidos son alentadores, pues reportan resultados muy buenos que llegan incluso a superar a los propios radiólogos aunque no convencen a estos (Laghi, 2020). Los autores de López-Cabrera, et al. (2020) profundizan en las peculiaridades de esta tarea y las características de las bases de datos tomadas para el entrenamiento de las redes así de cuáles son los factores que pueden estar provocando sesgos en ellos referidos fundamentalmente a la cantidad de datos, muestras de entrenamiento, los metadatos, y las características de los senso- res. Plantean la idea de que el empleo de métodos tradicionales de visión por computadoras y máquinas de aprendizaje (machine learning) pudiera conducir a modelos con mayor capacidad de generalización.
METODOLOGÍA
Algoritmo para la estimación automática del grado de afectación de los
pulmones por COVID-19 en imágenes CXR
La figura 1 presenta el esquema general del algoritmo propuesto el cual consta de 4 pasos prin- cipales: 1) evaluación de la calidad de la imagen; 2) mejoramiento de la imagen si es necesario;
3) segmentación de la región correspondiente a los pulmones y 4) clasificación de los píxeles de la imagen resultante y cálculo del índice. Las siguientes secciones explican en detalle cada uno de estos pasos.
Contexto de aplicación y características de los datos
Para lograr el mejor acercamiento posible al contexto de aplicación práctica del algoritmo propuesto, se construyó una base de datos de imágenes CXR de 3 hospitales que trabajan en el enfrentamiento a la pandemia de la COVID-19 en La Habana, Cuba. Las imágenes fueron tomadas en el periodo de marzo a diciembre de 2020. La base de datos está dividida en dos subconjuntos de imágenes. El subconjunto 1 consta de 333 imágenes de igual cantidad de pacientes, de ellos 179 imágenes de pacientes diagnosticados con COVID-19 y 154 imágenes de personas sanas. Las imágenes originales fueron obtenidas a partir del escaneo digital en formato jpg de las placas impresas en acetato y de los ficheros en formato Dicom obtenidos directamente de los equipos digitales de rayos x, para el trabajo experimental todas las imá- genes fueron convertidas a formato jpg.
El subconjunto 2 de la base de datos corresponde a un estudio longitudinal y consta de 77
imágenes de 10 pacientes con COVID-19, o sea, forman parte de 10 series temporales de entre 3 y 13 imágenes por cada paciente, tomadas en las unidades de terapia intensiva de dos hos- pitales de La Habana, Cuba. Todas las imágenes fueron obtenidas a partir del escaneo digital de las placas impresas en acetato a formato jpg.
Esta no es una base de datos pública y solo ha sido utilizada con fines de investigación bajo el consentimiento de las instituciones hospitalarias. Para esto, se llevó a cabo un proceso que incluye anonimizar los datos por parte de las instituciones hospitalarias por lo que los investi- gadores no tuvieron acceso a los datos biográficos de los pacientes. En el caso del subconjunto 2, aunque se proveyeron las descripciones de la evolución clínica de cada uno de los 10 pacien- tes, estas no poseen los datos de identidad de los mismos.
Evaluación de la calidad de las imágenes
En este trabajo proponemos un método de evaluación de la calidad de la imagen de rayos x de tórax que se basa en el cálculo de un índice de calidad (qindex). Este se obtiene a partir de la estimación de la nitidez de la imagen y del nivel de diversidad de la textura presente en la misma, utilizando una combinación del filtro de Kang y Park y una medida de la entropía de la imagen. La medida qindex propuesta es obtenida por la ecuación 1.
Donde kpk es el valor promedio de los pixeles de la imagen obtenida como resultado de la convolución de la imagen de rayos x de entrada con el kernel de Kang y Park. tkpk es el umbral estimado de kpk para obtener una imagen de calidad, en Garea-Llano, et al. (2018), los auto- res, a partir de sus resultados experimentales, recomiendan un umbral=15. ent es el valor de la entropía de la imagen. tent es el umbral estimado de ent con el cual es posible obtener una imagen de calidad.
La entropía o información promedio de una imagen se puede determinar aproximada- mente a partir del histograma de la imagen (González y Woods, 2018).
Para la definición del umbral de entropía (tent) realizamos un experimento para el cual creamos un conjunto de 300 imágenes CXR de buena calidad seleccionadas a partir de crite- rios de expertos en radiología
Para determinar el valor mínimo de entropía para una imagen de calidad. La distribución
de frecuencia de la entropía evidenció que las imágenes de CXR de buena calidad poseen una entropía mayor que 4, (en un rango de 4.3 a 5.6, con X-= 4.9 y s=0.65). por lo que proponemos
asumir este valor como el valor de tent.
La medida qindex puede alcanzar valores que dependen de los umbrales seleccionados para kpk y ent. De esta manera considerando los valores de los umbrales tkpk=15 obtenido experi- mentalmente en Garea-Llano, et al. (2018) y tent=4 obtenido experimentalmente por nosotros, el mínimo valor de qindex para obtener una imagen CXR de calidad será de 1, valores mayores denotaran a imágenes de mayor calidad y valores menores que 1 denotaran imágenes de baja calidad.
Luego de la evaluación de la calidad de la imagen de entrada el algoritmo propuesto esta- blece un paso condicional que permite mejorar la calidad de la imagen de entrada si esta pre- senta un qindex < 1. Para ello se escogió el método de ecualización de histograma adaptativo limitado por contraste (CLAHE) (Zuiderveld K., 1994) que ha dado buenos resultados en el mejoramiento de imágenes de rayos x (Koonsanit, et al., 2017). Este método permite mejorar la imagen incluso en las regiones que son más oscuras o más claras que la mayor parte de la imagen. Luego de aplicado el método CLAHE a las imágenes cuyo qindex es menor que 1 se logra el mejoramiento de la misma y se eleva el qindex a niveles mayores o cercanos a 1 (ver sección de resultados), lo que permite continuar los subsiguientes pasos del algoritmo pro- puesto.
Segmentación de los pulmones
Para el paso de segmentación de nuestro algoritmo proponemos un método de segmentación que se basa en la combinación de técnicas de procesamiento digital de imágenes. La ventaja de este método radica en que su uso es posible en entornos donde las capacidades de cómputo no son elevadas a la par de lograr una exactitud aceptable en el proceso de segmentación. El uso de este método permite una cierta estandarización de forma que la influencia de la segmenta- ción sea similar en todos los casos y no implique grandes diferencias en los índices obtenidos en análisis subsiguientes de la imagen ya segmentada. Tiene como primer paso la selección manual de la región de interés de los pulmones mediante un rectángulo (variante 1, cuando la imagen esta horizontalmente orientada en un ángulo entre 0 y 5 grados respecto a su eje vertical) o la selección manual de tres puntos fiduciales en la imagen correspondientes al extremo de la cla- vícula derecha, extremo de la clavícula izquierda y el punto más inferior del pulmón izquierdo (variante 2, se aplica cuando la imagen esta girada en más de 5 grados respecto a su eje vertical). A partir de la región de interés definida se realiza un corte de la imagen desechando aquellos elementos que quedan fuera de la misma. En el caso de la variante 1 como tercer paso se realiza el re-escalado de la imagen a un tamaño estándar, en la variante 2 se realiza una transformación
afín y re-escalado de la imagen a un tamaño estándar. El proceso de transformación afín per- mite rectificar la posición de la imagen respecto a su eje vertical. Una vez obtenida la imagen de la región de interés normalizada se realiza una operación lógica (and) entre esta y una máscara binaria promedio de los pulmones obtenida a partir de la segmentación manual de 300 imáge- nes de nuestra base de datos para finalmente obtener la imagen segmentada de los pulmones. La selección del método de segmentación se deja a criterio del usuario. En la sección de resultados se prueba el comportamiento de ambos métodos.
Clasificación supervisada de la imagen y cálculo del índice de afectación
de pulmones
En nuestra propuesta, para la clasificación de los pixeles de la imagen escogimos un algoritmo clásico de aprendizaje automático, el Random Forest. Este algoritmo crea múltiples arboles de decisión y los combina para obtener una predicción. En este algoritmo se agrega aleatoriedad adicional al modelo, mientras crecen los árboles, en lugar de buscar la característica más im- portante al dividir un nodo, busca la mejor característica entre un subconjunto aleatorio de características, esto da como resultado una amplia diversidad que generalmente resulta en un mejor modelo (Gelbowitz, 2021).
Las imágenes de rayos x de la región de los pulmones son imágenes en tonos de grises
donde en pacientes sanos se diferencian los elementos anatómicos que componen esta región donde se encuentran la masa pulmonar, los huesos de las costillas y clavículas. Por otro lado estudios radiológicos (Kanne, et al., 2020) de las afectaciones provocadas por la COVID-19 han determinado que las opacidades de vidrio esmerilado (GGO) y la consolidación con o sin agrandamiento vascular, engrosamiento septal interlobular y signo de broncograma aéreo son las afectaciones más comunes que se observan en las imágenes de rayos x de la región pul- monar. Estos elementos se manifiestan en el cambio de tonos de la región pulmonar de tonos oscuros para las regiones sanas del pulmón y tonos más claros para las regiones afectadas. Tomando en cuenta estos elementos en este trabajo proponemos utilizar como rasgo para la clasificación de la imagen los tonos de las regiones a clasificar, las cuales dividiremos en tres clases: pulmón sano, huesos y afectaciones.
Para el entrenamiento del clasificador se dividió en dos partes el subconjunto 1 de nuestra
base de datos de forma aleatoria, una primera parte de 180 imágenes se tomó como conjun- to de entrenamiento. Las imágenes comprenden 90 imágenes de pulmón sano y 90 imágenes de pulmón afectado por COVID-19. De este conjunto se tomaron de forma aleatoria 4500 muestras (pixeles), 1500 muestras de cada clase. La totalidad (100 %) de las muestras corres- pondientes a las afectaciones provocadas por la COVID-19 fueron tomadas de las imágenes de pacientes con la enfermedad, mientras que el 90 % de las muestras de las dos clases restantes (pulmón sano y huesos) corresponden a imágenes de personas sanas y el 10 % a pacientes con COVID-19. Como conjunto de prueba se designó al resto de las imágenes que comprenden el subconjunto. Una vez obtenido el clasificador este puede ser aplicado a nuevas imágenes para lograr su clasificación y el posterior cálculo del índice de afectación.
Tomando en cuenta que la clasificación de la imagen se desarrolla en cada píxel de la ima- gen y que como resultado de su aplicación es posible cuantificar la cantidad de pixeles per- tenecientes a cada clase (pulmón sano, huesos y afectaciones) y establecer una relación entre cada región clasificada de la imagen. Para ello proponemos el cálculo de este índice Iaf por la siguiente expresión (4):
Donde: P0, es la sumatoria de los pixeles clasificados como región afectada P1, es la sumatoria de los pixeles clasificados como región sana P2, es la sumatoria de los pixeles clasificados como región de huesos.
RESULTADOS Y DISCUSIÓN
El algoritmo propuesto fue integrado en 4 funciones básicas (evaluación de la calidad, mejo- ramiento, segmentación y clasificación) que componen el pipeline versión Beta implementado en lenguaje c++ utilizando además el conjunto de funcionalidades para el procesamiento de imágenes y visión por computadoras de la biblioteca OpenCv (https://opencv.org/).
Para la evaluación de la medida de calidad propuesta (qindex) se tomaron las 333 imágenes del subconjunto 1 de nuestra base de datos, y se calculó la calidad de las mismas mediante el índice qindex. Los resultados obtenidos muestran que en el caso de las imágenes de personas sanas, 43 (37%) presentan mala calidad, sin embargo, en las imágenes de personas con CO- VID-19 sucede lo contrario con 143 (80%) imágenes de mala calidad. Esto puede estar dado por el efecto que causan las afecciones del tipo como las opacidades de vidrio esmerilado en las imágenes con COVID-19 o el origen de una parte de estas imágenes que fueron obtenidas a partir del escaneo de las placas.
La aplicación del método de mejoramiento a las imágenes con qindex <1, mostró un au-
mento de la calidad de las imágenes y con un aumento del qindex para las imágenes de per- sonas sanas (X-=0.38, s=0.071) y personas con COVID-19 (X-=0.30, s=0.27) respectivamente.
En el caso de las imágenes de personas sanas, solo 5 imágenes quedaron con un qindex por debajo de 1 pero muy cercanos a este valor; mientras que las imágenes de personas con CO- VID-19 también aumentaron su calidad incluso en las 43 imágenes que quedaron con qindex menores que 1. Estos resultados muestran la utilidad del método de mejoramiento pues con su aplicación se garantiza que las imágenes que pasarán al proceso de clasificación tengan mejor calidad que las imágenes originales lo que puede redundar en mejores resultados en la clasificación.
Para la evaluación del método de segmentación propuesto se conformó de forma aleatoria
un subconjunto de imágenes de nuestra base de datos, a las cuales se les realizó la segmen- tación de forma manual por dos especialistas médicos para obtener los ground truth de sus máscaras de segmentación. Debido a la complejidad del proceso de segmentación manual y el
poco tiempo disponible por los especialistas, el subconjunto estuvo formado por 20 imágenes (10 normales y 10 COVID-19).
ground truth
sultado de la segmentación. -
En los resultados el método alcanza un valor E1 de (X=0.83, s=0.031) que el método au- tomático, sin embargo en este experimento no es posible conocer la influencia que este ten- dría sobre los resultados del proceso de clasificación, lo que sería un elemento a evaluar en el próximo experimento.
Para la evaluación del método de clasificación propuesto se tomó el conjunto de prueba conformado por las 153 imágenes que no fueron utilizadas en el conjunto de entrenamiento del clasificador: Este conjunto de prueba estuvo conformado por 77 imágenes de pacientes con COVID-19 y 76 de pacientes sanos. A estas se les aplicó el algoritmo propuesto. Previa- mente se realizó por parte de dos expertos un proceso de segmentación y etiquetado manual de las regiones afectadas por COVID-19 que permitió contabilizar la cantidad total de pixeles que conforman esta clase y como pixeles correspondientes a las clases pulmón sano y huesos al resto de los pixeles dentro de la región pulmonar.
A estas imágenes del conjunto de prueba se le aplicó la clasificación automática y se cal-
cularon las métricas de Sensibilidad y Especificidad, tomando en cuenta para cada clase los pixeles correctamente clasificados (TP), los clasificados como de esa clase pero que realmente pertenecen a otra clase (FP), los clasificados como de otra clase pero que pertenecen a la clase evaluada (FN) y los clasificados como de otras clases y que realmente lo son (TN). Las métri- cas fueron calculadas por las expresiones en (5). Se obtuvieron además las matrices de confu- sión promedio de cada clase.
Además, se realizó un sencillo proceso de validación cruzada para el experimento. La base de datos de prueba se dividió en dos subconjuntos y se llevó a cabo el proceso de prueba y en- trenamiento cruzado. En la tabla 1 se muestran las matrices de confusión, los valores de sen- sibilidad, especificidad y desviación estándar (S) obtenidos. Como puede observarse en todos los resultados los valores de sensibilidad y especificidad se mantienen altos lo que indica un buen desempeño del clasificador obtenido.
Por otro lado la presencia de pixeles falsamente clasificados como afectaciones se debe en buena parte a la similitud de los tonos de los huesos con los tonos que presentan las verdade- ras afectaciones dentro del área del pulmón (ver figura 2). Esto es un problema que pudiese ser solucionado o atenuado si la clasificación se realizara no etiquetando las clases píxel a pixel
sino asignando las etiquetas a regiones anatómicas del pulmón, por lo que es un aspecto que exploraremos en las futuras investigaciones.
Estudio de la relación entre el índice de afectación propuesto y la respuesta
de los pacientes a los protocolos y tratamientos
Para la realización de este experimento se tomó el subconjunto 2 de la base de datos consta de 77 imágenes de 10 pacientes con COVID-19 y forman parte de 10 series temporales de entre 3 y 13 imágenes por cada paciente tomadas en las unidades de cuidados intensivos de dos hos- pitales de La Habana, Cuba. Adicionalmente se tenía la descripción clínica de la evolución de cada paciente durante la estancia en la Unidad de Terapia Intensiva (UTI), donde se describen los síntomas al ingreso en la UTI, la evolución en cuanto a mejoramiento o empeoramiento del paciente en el tiempo y la necesidad o no de ventilación mecánica.
Para establecer esta posible relación se procesaron las imágenes de cada serie temporal por
el algoritmo propuesto calculando el valor del Iaf para cada imagen. Luego se realizó un pro- ceso de codificación de los valores de Iaf (Iaf Cod) y las descripciones clínicas de los pacientes en tres instantes de la serie de cada paciente (inicio (Iaf1), día de mayor empeoramiento (Iaf2), salida de la UTI (Iaf3)
El valor del Iaf codificado se inicia con el valor cero siempre, el valor 1 representa empeora- miento y -1 mejoría. De la misma forma se realizó la codificación de las descripciones clínicas de cada paciente mediante la siguiente codificación: Como primer valor a la descripción del primer día en la UTI se le asignó valor cero. Se tomó la descripción del día al que corresponde la radiografía de valor máximo de Iaf calculado y se le asignó valor 1 si el paciente presentó empeoramiento de su condición o mantuvo el mismo estado del día de ingreso, si el paciente
mejoró su estado se le asigna valor -1. Como tercer valor, a la descripción del día que corres- ponde a la última radiografía tomada en la UTI se le asigna valor 1 si el paciente presentó em- peoramiento de su condición o mantuvo el mismo estado del día al que corresponde a la ra- diografía de valor máximo y -1 si el paciente mejoró su estado. Como resultado se obtuvieron dos matrices que contienen los valores codificados. En la tabla 2 se presentan los resultados del proceso descrito para los 10 sujetos.
Para realizar la correlación de los valores Iaf con las descripciones clínicas de cada pacien- te se utilizó el coeficiente de correlación normalizada (Satendra, et al., 2020) que establece la correlación entre dos matrices. El valor de correlación calculado fue de 0.8 lo que indica para estos 10 casos una fuerte correlación entre el Iaf propuesto y la evolución de los pacientes.
En la figura 3 se muestran las gráficas de los 2 pacientes representativos de este subconjun- to, donde por el eje y se colocaron los valores de Iaf y por el eje x se colocaron los días trans- curridos en la UTI por este.
Estos resultados aunque muy limitados debido al número de pacientes de la base de datos nos permiten establecer una posible relación entre las variaciones del Iaf determinado por el algoritmo propuesto con la evolución y la respuesta de los pacientes, por lo que este hecho nos permite sugerir la hipótesis de que el índice propuesto puede ser un indicador de la efec- tividad de los tratamientos y protocolos aplicados en la recuperación de estos pacientes y una herramienta para la ayuda a la toma de decisiones para los intensivistas. Esta hipótesis debe ser comprobada en un estudio con mayor cantidad de pacientes y con la participación de es- pecialistas médicos.
CONCLUSIONES
En este trabajo se propone el índice Iaf de afectación de los pulmones en imágenes CXR en pacientes diagnosticados con COVID-19. El Iaf se obtiene a partir de un algoritmo que com- prende cuatro pasos fundamentales que comienza con la evaluación de la calidad de las imá- genes para lo cual se propone el índice de calidad qindex a partir del cual se realiza un proceso de mejoramiento de la imagen de forma selectiva. Seguidamente se realiza la segmentación de la región de los pulmones. Con la imagen segmentada se realiza la clasificación supervisada de la misma y se calcula el índice de afectación Iaf.
Los resultados alcanzados en los experimentos realizados en imágenes de pacientes sanos
y afectados por COVID-19 mostraron altos valores de sensibilidad y especificidad en la clasifi- cación. El estudio de la variación de los valores del índice Iaf en series de tiempo de imágenes de pacientes con COVID 19 ingresados en las UTI de hospitales de La Habana, Cuba, permi- tió sugerir la hipótesis de que el índice propuesto puede ser un indicador de la efectividad de los tratamientos y protocolos aplicados en la recuperación de estos pacientes
Como trabajos futuros nos proponemos investigar y evaluar los pasos de segmentación de la imagen y su clasificación bajo el enfoque de aprendizaje profundo por ser un área en pleno desarrollo con resultados muy prometedores en muchas de las tareas de visión por computadora.
Por otro lado nos proponemos realizar un estudio más amplio de correlación entre el índi- ce Iaf propuesto con la evolución y respuesta de los pacientes a los protocolos y tratamientos aplicados que nos permita comprobar la hipótesis formulada.
Agradecimientos
AGRADECIMIENTOS
Este trabajo forma parte del proyecto “Perfeccionamiento de protocolo de enfrentamiento al COVID-19 usando RX-Tórax como instrumento de diagnóstico y pronostico”, financiado por el Centro de Neurociencias de Cuba. Agradecemos la ayuda, de la Sociedad Cubana de Ima- genologia y de los Hospitales “Luis Díaz Soto” (Naval), Instituto de Medicina Tropical “Pedro Kouri” y “Salvador Allende” por su contribución a la conformación de las bases de datos de imágenes que nos permitieron desarrollar la investigación.
REFERENCIAS
Baratella E, Crivelli P, Marrocchio C, Bozzato AM, De Vito A, Madeddu G (2020). Severity of lung involvement on chest X-rays in SARS-coronavirus-2 infected patients as a possible tool to predict clinical progression: an observational retrospective analysis of the relationship between radiological, clinical, and laboratory data. J Bras Pneumol. 2020; 46(5):20200226.
Batista. J.A, Araujo-Filho. M., Sawamura Y., Nathan-Costa A., Cerri G.G. , Higa-Nomura C (2020). COVID-19 pneumonia: what is the role of imaging in diagnosis?. J Bras Pneumol. 2020;46(2):e20200114. https://dx.doi.org/10.36416/1806-3756/e20200114.
Bishop C.M. (2006), Pattern Recognition and Machine Learning. Springer.2006.
Borghesi A., Zigliani A., Masciullo R., Golem S., Maculotti P., Farina D., and Maroldi R (2020) . Radiographic severity index in COVID-19 pneumonia: relationship to age and sex in 783 Italian patients. Radiol Med. 2020 May 1: 1–4.
Chen F., Pan J., Han Y. An Effective Image Quality Evaluation Method of X-Ray Imaging Sys- tem. Journal of Computational Information Systems 7:4 (2011) 1278-1285.
Garea-Llano E, García-Vázquez M, Colores -Vargas JM, Zamudio-Fuentes LM, Ramírez-Acos- ta AA (2018). Optimized robust multi-sensor scheme for simultaneous video and image iris recognition. Pattern Recognition Letters 2018, 101: 44-45.
Gelbowitz A. (2021). Decision Trees and Random Forests Guide: An Overview Of Decision Trees And Random Forests: Machine Learning Design Patterns. Independently Published, 2021.
Gómez, O., Mesejo, P., Ibáñez, O. (2020). Deep architectures for high-resolution multi-organ chest X-ray image segmentation. Neural Comput & Applic 32, 15949–15963 (2020). ht- tps://doi.org/10.1007/s00521-019-04532-y
Gonzalez R.C., Woods R.E. (2018), Digital Image Processing, 4th edition, 2018, 8 Image Com- pression and Watermarking.
He L., Ren X., Gao Q., Zhao X., Yao B., Chao Y (2017)., The connected-component labeling problem: A review of state-of-the-art algorithms, Pattern Recognition, Volume 70, 2017, Pages 25-43, ISSN 0031-3203.
Huang C., Wang Y., Li X., Ren L., Zhao J., Hu Y., Zhang L., Fan G., Xu J., Gu X., Cheng Z., Yu T., Xia J., Wei Y., Wu W., Xie X., Yin W., Li H., Liu M., Xiao Y., Gao H., Guo L., Xie J., Wang G., Jiang R., Gao Z., Jin Q., Wang J., Cao B. (2020). Clinical features of patients infected with 2019 novel coronavirus in Wuhan, china. The Lancet, 395(10223), 2020. 1
Kanne J P., MD • Brent P. Little, MD • Jonathan H. Chung, MD • Brett M. Elicker, MD • Lo- ren H. Ketai, MD (2020). Essentials for Radiologists on COVID-19: An Update-Radiology Scientific Expert Panel. Radiology Vol. 296, No. 2.
Koonsanit K., Thongvigitmanee S., Pongnapang N. and Thajchayapong P (2017)., “Image en- hancement on digital x-ray images using N-CLAHE,” 2017 10th Biomedical Engineering International Conference (BMEiCON), Hokkaido, Japan, 2017, pp. 1-4, doi: 10.1109/BMEi- CON.2017.8229130.
Laghi, A. (2020). Cautions about radiologic diagnosis of COVID-19 infection driven by ar-ti- ficial intelligence. The Lancet Digital Health, 2(5), e225. https://doi.org/10.1016/S2589- 7500(20)30079-0
Liang W, Liang H, Ou L, Chen B, Chen A, Li C. (2020). Development and Validation of a Cli- nical Risk Score to Predict the Occurrence of Critical Illness in Hospitalized Patients With COVID-19. JAMA Intern Med. 2020; 180(8):1081-1089.https://doi.org/10.1001/jamainter- nmed.2020.2033
López-Cabrera, J. D., Portal Díaz, J. A., Orozco Morales, R., & Pérez Díaz, M. (2020). Revi- sión crítica sobre la identificación de COVID-19 a partir de imágenes de rayos x de tórax usando técnicas de inteligencia artificial. Revista Cubana De Transformación Digital, 1(3), 67–99. Recuperado a partir de https://rctd.uic.cu/rctd/article/view/103
Ming-Yen N., Lee Y. P. , Yang J., Yang F. , Li X. , Wang Hongx , Lui M.M. , Lo C. , Leung B. , Khong PL., Hui C. , Yuen K. , Kuo M.D. (2020) . Imaging profile of the COVID-19 infection: Radiologic findings and literature review. Radiology: Cardiothogracic Imaging, 2(1), 2020. 1
Monaco C.G., Zaottini F., Schiaffino S., Villa A., Della-Pepa G., Carbonaro L.A., Menicagli L., Cozzi A., Carriero S., Arpaia F., Di Leo G., Astengo D., Rosenberg I. and Sardanelli F.(2020). Chest x-ray severity score in COVID-19 patients on emergency department admission: a two-centre study. European Radiology Experimental (2020) 4:68 https://doi.org/10.1186/ s41747-020-00195-w
Otsu N. (1979). A threshold selection method from gray-level histograms. IEEE Trans. Sys., Man., Cyber. 9: 62-66.
Samajdar T., Quraishi M.I. (2015) Analysis and Evaluation of Image Quality Metrics. In: Man- dal J., Satapathy S., Kumar Sanyal M., Sarkar P., Mukhopadhyay A. (eds) Information Sys- tems Design and Intelligent Applications. Advances in Intelligent Systems and Compu- ting, vol 340. Springer, New Delhi. https://doi.org/10.1007/978-81-322-2247-7_38
Satendra P. S., Gaurav B., (2020). Chapter 1 - Perceptual hashing-based novel security fra- mework for medical images, Editor(s): Amit Kumar Singh, Mohamed Elhoseny, In Intelli- gent Data-Centric Systems, Intelligent Data Security Solutions for e-Health Applications, Academic Press, 2020, Pages 1-20, ISBN 9780128195116,https://doi.org/10.1016/B978-0- 12-819511-6.00001-7.
Schalekamp S, Huisman M, van Dijk RA, Boomsma MF, Freire Jorge PJ, de Boer WS (2020). Model-based Prediction of Critical Illness in Hospitalized Patients with COVID-19 [publi- shed online ahead of print, 2020 Aug 13]. Radiology. 2020; 202723.https://doi.org/10.1148/ radiol.2020202723
Sprawls P.(13 de Abril de 2021) Image Characteristics and Quality. In Physical Principles of Medical Imaging. Online, Resources for Learning and Teaching http://www.sprawls.org/ resources
Teixeira P.P, Loureiro-Irion K., Marchiori E. (2020). COVID-19: chest X-rays to predict clini- cal outcomes. Jornal Brasileiro de Pneumologia. vol.46 no.5 São Paulo, 2020. Epub Nov 02, 2020. http://dx.doi.org/10.36416/1806-3756/e20200464
Toriwaki J-I, Suenaga Y, Negoro T, Fukumura T (1973) Pattern recognition of chest X-ray ima- ges. Comput Vis Graph 2(3):252–271
Wechsler H, Sklansky J (1977) Finding the rib cage in chest radiographs. Pattern Recognition 9(1):21–30
Zhu J, Shen B, Abbasi A, Hoshmand-Kochi M, Li H, Duong TQ (2020). Deep transfer lear- ning artificial intelligence accurately stages COVID-19 lung disease severity on porta- ble chest radiographs. PLoS One. 2020; 15(7): e0236621. https://doi.org/10.1371/journal. pone.0236621
Zhu Y, Prummer S, Wang P, Chen T, Comaniciu D, Ostermeier M (2009). Dynamic layer se- paration for coronary DSA and enhancement in fluoroscopic sequences. In: MICCAI, pp 877–884
Zuiderveld K. (1994). “Graphics gems iv,” chapter Contrast Limited Adaptive Histogram Equa- lization, pp. 474–485. Academic Press Professional, Inc., San Diego, CA, USA, 1994.