Loading [MathJax]/jax/output/SVG/config.js

Modelo de aprendizaje automático para la predicción de calidad en modo estático-inactivo y modo móvil-conectado en redes LTE

A machine learning approach for quality prediction in idle-static mode and connected-mobile mode in LTE networks

Michael Curipallo
Escuela Politécnica Nacional, Ecuador
Gyna Pozo
Escuela Politécnica Nacional, Ecuador
Pablo Lupera-Morillo
Escuela Politécnica Nacional, Ecuador
Viviana Párraga
Escuela Politécnica Nacional, Ecuador

Revista de Investigación en Tecnologías de la Información

Universitat Politècnica de Catalunya, España

ISSN-e: 2387-0893

Periodicidad: Bianual

vol. 10, núm. 21, Esp., 2022

revista.riti@gmail.com

Recepción: Junio 06, 2022

Aprobación: Agosto 18, 2022



DOI: https://doi.org/10.36825/RITI.10.21.010

© Revista de Investigación en Tecnologías de la Información (RITI) 2022

Resumen: En este artículo, se obtienen modelos predictivos de la calidad de la señal en el modo inactivo y estático y de la velocidad de la conexión en el modo conectado y en movimiento en base a mediciones de campo de parámetros de radiofrecuencia de una red LTE realizadas en la ciudad de Quito, Ecuador. Los modelos se obtienen con la aplicación de la técnica de los árboles de decisión; dichos modelos permiten predecir en base a los parámetros de radiofrecuencia las zonas en las cuales se presentan niveles de señal y de velocidad de conexión deficientes, para la posterior aplicación de medidas correctivas o paliativas. De los resultados obtenidos en los dos escenarios se concluye que la técnica de los árboles de decisión es adecuada para el modo inactivo y estático con un nivel de precisión del 67% aproximadamente. El artículo finaliza con la propuesta de trabajos futuros a realizar.

Palabras clave: LTE, Machine Learning, Árbol de Decisión, Calidad de Conexión.

Abstract: In this paper, the main aims are to obtain a quality of signal prediction model in idle-static mode and a quality of connection prediction model in connected-mobile mode, for this, we apply machine learning technique to a real dataset collected from a LTE network deployed at Quito, Ecuador. The proposed models are capable to predict the conditions of low received signal strength and low data rate which is important to select the appropriate method that will most likely offer the highest quality of service. The proposed schemes based on decision tree improves in the idle-static mode and present an accuracy of 67% approximately when compared to the connected-mobile mode, and finally, we propose future works.

Keywords: LTE, Machine Learning, Decision Tree, Quality of Connection.

1. Introducción

Las redes de datos móviles siguen evolucionando con el tiempo a pasos agigantados, mejorando las capacidades y tecnologías para satisfacer los requerimientos de los usuarios [1]. LTE es una tecnología diseñada con la finalidad de aumentar la capacidad, la cobertura y la velocidad en comparación con los sistemas inalámbricos anteriores [2][3]. Actualmente, en el Ecuador se encuentra desplegada la red celular 4G LTE, permitiendo a millones de personas conectarse a Internet para subir o descargar archivos sin problemas en cortos instantes de tiempo. A pesar de contar con una red avanzada, actualmente la cantidad de usuarios que se asocian a una estación base es elevada, lo que conlleva a la saturación de la red, provocando cortes y retardos al momento de mantener una llamada, algo que implícitamente disminuye la calidad de servicio (QoS) que experimentan los propios usuarios. Lo anterior se manifiesta teniendo en cuenta que, en la actualidad, los usuarios presentan una alta dependencia de los dispositivos móviles para conectarse a la red, recibir llamadas o datos y acceder a Internet en todo momento, ya sea en conexiones inactivas o en modo conectado. En el presente artículo se analiza, mediante una de las técnicas de Machine Learning conocida como la de los árboles de decisión, el comportamiento de los parámetros de radiofrecuencia (RF) de la red LTE recolectados mediante mediciones de campo en la ciudad de Quito en dos escenarios. Las mediciones para la recolección de datos se realizaron con el uso de herramientas instaladas en equipos de usuario (UE) de características similares.

Además, este artículo presenta una breve revisión de referencias de literatura relacionadas con esta investigación, también se definen los parámetros RF utilizados, que son: RSRQ (Reference Signal Received Quality), RSSI (Received Signal Strength Indicator) y SNR (Signal to Interference Noise Ratio) y parámetros adicionales dependiendo de cada uno de los escenarios. En el primer escenario se analiza la variación de los parámetros RF de la red celular LTE cuando el teléfono móvil que realiza las mediciones de campo se encuentra en estado estático y sin la ejecución de ningún tipo de conexión (modo inactivo). En este escenario se registran mediciones en localizaciones específicas en el transcurso del tiempo. Mientras que en el segundo escenario se mantiene una conexión permanente con la red (modo conectado) y el UE se encuentra en movimiento. En este caso se recorrerán rutas específicas dentro de la zona centro – sur de la ciudad de Quito, considerando diferentes rangos de velocidades de movimiento y además se mantendrá una conexión permanente con la red mediante una descarga de archivos. A continuación, se presentan los resultados obtenidos y se detallan los valores de los parámetros de salida que se obtuvieron en cada escenario; para esto, se categoriza la calidad de la señal recibida y la calidad de la velocidad de conexión. Finalmente, se presentan las conclusiones.

2. Estado del arte

En la literatura existente se tienen estudios previos relacionados con la aplicación de técnicas de Machine Learning para el monitoreo y análisis de redes inalámbricas; por ejemplo, en [4], se comparan diferentes modelos de Machine Learning y se concluye que los árboles de decisión alcanzan un nivel de desempeño alto en el problema planteado. En dicho trabajo se analizan las mediciones de tráfico real de la red celular con la finalidad de detectar anomalías generadas por las aplicaciones que se ejecutan en los smartphones y para la predicción de la calidad de experiencia (QoE) [4].

En [5], el problema del monitoreo, la evaluación y la predicción de la calidad de experiencia en las redes de comunicaciones móviles se lo evidencia mediante mediciones de calidad de servicio (QoS) con el uso de terminales de usuario y mediante retroalimentaciones de los usuarios. En base a las mediciones realizadas y la aplicación de múltiples técnicas de Machine Learning supervisado, entre ellas árboles de decisión, se logra predecir con una exactitud de 91% el QoE y con un 98% la aceptabilidad del servicio en aplicaciones populares como Youtube y Facebook[5].

Además, se han realizado estudios como en [6] en donde se establece que, cuando la velocidad del móvil supera los 200 Km/h, la calidad de la conexión empieza a bajar rápidamente y a presentar problemas, debido al cambio de frecuencia Doppler, la selección y reelección de celda, la conmutación y la pérdida de penetración [6].

Por otro lado, el estudio en este artículo monitorea y detecta los cambios en las condiciones de conexión del modo inactivo en el transcurso del tiempo y las condiciones de comunicación en el modo conectado con un nivel medio de movilidad, en base a las mediciones de los parámetros de RF ejecutadas en la ciudad de Quito, Ecuador. A continuación, se definen los parámetros considerados.

2.1. Parámetros RF

En los escenarios considerados en el estudio se registran principalmente las mediciones de los siguientes parámetros: RSRQ (Reference Signal Received Quality), SNR (Signal-to-noise ratio), RSSI (Received Signal Strength Indicator) y algunas medidas adicionales que permitan el estudio específico de cada escenario.

En la Figura 1 se muestra un ejemplo de los datos recolectados en este estudio:

Ejemplo de una
muestra de los datos recolectados.
Figura 1.
Ejemplo de una muestra de los datos recolectados.

3. Materiales y métodos

3.1. Materiales

En consideración de los objetivos de las mediciones se decidió para el escenario en estado inactivo y estático realizar la recolección de datos con el uso de la aplicación NetMonitor Cell Signal Logging, mientras que para el escenario conectado y en movimiento se recolectan los datos con el uso de la aplicación G-NetTrack Pro.

Para la creación de los modelos de cada escenario se usó Rstudio, iniciando con el entrenamiento del modelo, todo esto mediante la técnica de Machine Learning de aprendizaje supervisado conocida como árboles de decisión. Mediante las técnicas de reglas basadas en partición se estableció reglas y condiciones basadas en los parámetros de entrada.

3.2. Método

Los datos recolectados en los dos escenarios se analizaron mediante la técnica de Machine Learning para la obtención de modelos que permitan caracterizar comportamientos especiales e identificar anomalías o aspectos relevantes a destacar. En la aplicación de la técnica se consideran los parámetros medidos como entradas a los modelos; mientras que, las salidas o parámetros a predecir dependen del escenario. En el escenario con mediciones en puntos estáticos se tiene como salida la calidad de señal recibida (intensidad) y para el escenario con mediciones en movimiento se tiene como salida la calidad de conexión (velocidad de conexión). Estos aspectos se detallan a continuación.

3.2.1. Modelo de aprendizaje en base a mediciones en el modo inactivo y en ubicaciones estáticas

La recolección de datos en este escenario se lo realizó con un teléfono celular en estado estático y sin la ejecución de ningún tipo de servicio. Para la recolección se empleó la aplicación NetMonitor Cell Signal Logging, misma que fue configurada para tomar datos cada segundo durante un mes. La recolección de datos se realizó en 4 puntos de una zona ubicada en el Centro-Sur de la ciudad de Quito, Ecuador que se muestra en la Figura 2; dichos puntos se encuentran alejados de las estaciones base que brindan cobertura a los usuarios del sector. Se debe mencionar que en cada uno de los puntos se registraron las mediciones durante una semana con una toma de muestras en cada segundo. Los puntos de estudio; a pesar de ser estáticos, mantenerse constantes las condiciones circundantes de propagación y encontrarse relativamente cerca de las estaciones base; presentan una variación notoria de los parámetros de la señal recibida, lo que permite pensar que dicho comportamiento se puede deber a la cantidad de usuarios conectados simultáneamente a la red en el transcurso del tiempo. Las mediciones se las realiza con la finalidad de determinar la calidad de la señal de la red móvil recibida en dicha zona en base al análisis del comportamiento de los parámetros de RF.

Zona de estudio para
mediciones en ubicaciones fijas.
Figura 2.
Zona de estudio para mediciones en ubicaciones fijas.

Lo presentado en este artículo propone un método para el monitoreo y análisis del funcionamiento de una red celular operativa; ya que, en base a las mediciones de parámetros de RF se detectan las particularidades en el comportamiento de los parámetros mediante la obtención de un modelo. El comportamiento de los parámetros se podría interpretar para detectar posibles deficiencias en el funcionamiento de la red. La técnica de aprendizaje aplicada es la de los árboles de decisión para clasificar los datos recolectados en mediciones de calidad excelente, media y mala con respecto al nivel de señal recibida.

El modelo de aprendizaje en este escenario se ha obtenido en base a la relación entre variables de entrada, tales como: RSSI, día y hora, con la variable de salida que en este caso es RSRQ [dB]. Al escoger de esta manera los parámetros se observa su variación en el transcurso del tiempo en cada uno de los puntos fijos para observar en qué instantes la calidad de la conexión se reduce. El parámetro de salida como se mencionó anteriormente es el RSRQ, el que a partir de los valores sugeridos en la Tabla 1, se ha categorizado en tres niveles de la calidad de la señal de la siguiente manera:

Tabla 1.
Categorización del parámetro de salida (RSRQ) [dB] en el primer escenario [7].
Categorización Rango
Excelente RSRQ >= -5
Media -9 <=RSRQ < -5
Mala RSRQ < -9

3.2.2. Modelo de aprendizaje en base a mediciones en el modo conectado y en movimiento.

La recolección de datos en este escenario se realizó manteniendo una comunicación permanentemente a la red celular, es decir, mediante la ejecución de una conexión de datos constante que en este caso de trató de una descarga de archivos. Para la recolección se utilizó la aplicación llamada G-NetTrack Pro, ya que otorga datos completos acerca de la red LTE, durante los recorridos y la ejecución de las mediciones los datos se recolectaron cada 3 segundos. Por otro lado, las velocidades del terminal móvil varían desde 1 Km/h hasta sobrepasar los 40 Km/h, esto se debe a que la velocidad máxima permitida dentro de la ciudad de Quito es de 50 Km/h. Para la recolección de los datos se realizan recorridos por tres rutas localizadas en el centro histórico de la ciudad de Quito, Ecuador. Las rutas recorridas se muestran en la Figura 3.

Rutas de estudio para conexiones en movimiento: (a) Ruta A de 1.60 Km; (b) Ruta
B de 1.20 Km; (b) Ruta C de 3.95 Km.
Figura 3.
Rutas de estudio para conexiones en movimiento: (a) Ruta A de 1.60 Km; (b) Ruta B de 1.20 Km; (b) Ruta C de 3.95 Km.

En el modelo a obtener se considera principalmente la influencia de la velocidad de movilidad del terminal con un valor máximo superior a los 50 Km/h, por lo que se podría pensar que la velocidad del terminal móvil no influiría en la calidad de la conexión a la red móvil, ya que son velocidades relativamente bajas. Se debe mencionar que la velocidad registrada varía por diferentes factores, como el tráfico vehicular, las señales de tránsito, las características de las calles y edificaciones. Al igual que en el escenario anterior, la técnica de aprendizaje aplicada es la de los árboles de decisión para clasificar los datos recolectados en mediciones de calidad excelente o alta, media o regular y mala o baja con respecto a la velocidad de conexión.

En este escenario, además de tomar en cuenta los parámetros mencionados en la sección 2 como parámetros de entrada, se considera la velocidad a la que se está moviendo el terminal móvil, ya que este nuevo parámetro es el que principalmente define el escenario actual. En este caso, el parámetro de salida es la velocidad de conexión en kbps que refleja la calidad del enlace con la red. En este estudio al estar utilizando aprendizaje supervisado por clasificación, la salida debe ser categórica, en este escenario, se tendrá una salida con tres posibles valores de acuerdo a un rango de las velocidades en kbps, como se muestra en la Tabla 2.

Tabla 2.
Categorización del parámetro de salida en el segundo escenario.
Rangos de velocidades de descarga [kbps] Categoría
Mayores a 5000 Excelente o alta
De 1000 a 5000 Regular o media
Menores a 1000 Mala o baja

4. Resultados

4.1. Modelo de aprendizaje obtenido de las mediciones en el modo inactivo con ubicaciones estáticas

Como se indicó anteriormente, se obtuvo un modelo en base a la técnica de los árboles de decisión de aprendizaje supervisado para clasificación, con un 80% del total de datos para el entrenamiento y el 20% para prueba. El modelo obtenido establece un nivel de la calidad de la señal recibida en base al registro temporal de los parámetros de radiofrecuencia; por lo cual, el árbol de decisión obtenido permitiría adicionalmente predecir la calidad de la señal recibida en la zona de estudio en base al reporte temporal de los parámetros de RF. En el modelo obtenido mediante el uso de la herramienta RStudio, presentado en la Figura 4, se muestra la probabilidad de cada categoría en el siguiente orden: excelente, mala y media. Se observa que se obtuvieron 19 nodos y 9 condiciones en el modelo de decisiones, en donde, del total de los datos un 63% corresponde a calidad media de señal recibida.

El modelo permite establecer las condiciones en las cuales se tienen niveles de señal excelente, mala y media. Entre las condiciones establecidas están determinados valores de RSSI, día de la semana y hora del día. Para las mediciones realizadas en los puntos estáticos de la zona específica de estudio se pueden identificar las condiciones que se presentan para cada una de las 3 categorías de calidad de la señal recibida que son las siguientes:

Calidad excelente:

Calidad mala:

Calidad media:

En la Tabla 4 se muestra la matriz de confusión obtenida. Al evaluar el modelo se obtuvo una precisión del 66.85%.

Modelo de aprendizaje para el escenario estático en modo
inactivo (figure caption).
Figura 4.
Modelo de aprendizaje para el escenario estático en modo inactivo (figure caption).

Tabla 4.
Matriz de confusión para el primer escenario.
Excelente Mala Regular/Media
Excelente 6961 1417 23125
Mala 1240 32337 114957
Regular/Media 2959 16716 284134

4.2 Modelo de aprendizaje obtenido de las mediciones en el modo conectado y en movimiento

Para la obtención del modelo se logró contar con 3296 datos que se dividieron con el mismo criterio que para el escenario anterior. En el modelo de entrenamiento obtenido con RStudio y que se presenta en la Figura 5 se tiene un árbol de decisión con 14 nodos, 7 condiciones y una profundidad de 6, en donde se observa que el 30% del total de datos corresponde a la calidad excelente, el 44% de calidad regular y el restante 26% de calidad mala; categorías que se refieren a la velocidad de conexión.

Modelo de
aprendizaje para el escenario en modo conectado y con el terminal en movimiento
(figure caption).
Figura 5.
Modelo de aprendizaje para el escenario en modo conectado y con el terminal en movimiento (figure caption).

Este modelo permite establecer las condiciones en las cuales se tienen velocidades de conexión categorizadas como excelente, regular y mala. Entre las condiciones consideradas están la velocidad de movimiento del terminal de usuario y los parámetros de RF, como son: RSRQ, RSSI y SNR.

Para el caso específico de los datos recolectados en las rutas recorridas para este escenario se pueden mencionar que las condiciones que se establecen en base al árbol de decisión obtenido son las siguientes:

Calidad excelente:

Calidad regular:

Calidad mala:

En la Tabla 5 se muestra la matriz de confusión obtenida para el escenario en movimiento. Al revisar la diagonal de la matriz de confusión se pueden observar que existen más aciertos que errores; sin embargo, se debe indicar que para este escenario la técnica de los árboles de decisión permite obtener un modelo que presenta una precisión del 53.48%, menor al obtenido en el escenario anterior.

Tabla 5.
Matriz de confusión para el segundo escenario.
Excelente Mala Regular
Excelente 47 14 138
Mala 9 64 95
Regular 22 29 242

4.3. Análisis y comparación de los escenarios

Es pertinente mencionar que los valores de los parámetros RSSI y RSRQ, obtenidos en los dos escenarios, se acercan a los valores teóricos planteados en [7] y [9] para las tres categorías (excelente, regular y mala), lo que confirma la consistencia de los resultados obtenidos. Sin embargo, se puede añadir que las diferencias entre los valores y las categorías establecidas en las referencias y los obtenidos en este estudio práctico se pueden deber a varios factores, como, por ejemplo: la cantidad de datos recolectados, la técnica aplicada, la exactitud de la herramienta para recolectar datos, entre otros.

A continuación, se comparan los dos escenarios con la finalidad de destacar aquellos factores más relevantes. En el caso del escenario con mediciones en ubicaciones estáticas y en el modo inactivo se observa que la calidad de la señal recibida en una misma localización depende del día de la semana y la hora del día, con la capacidad de establecer las condiciones temporales específicas en las cuales se manifiesta una categoría determinada de calidad de señal, en base a estos resultados se podrían aplicar medidas para mejorar la calidad solamente en determinados periodos de tiempo.

Para el escenario con mediciones en movimiento y en el modo conectado, la velocidad de conexión depende de la velocidad de movimiento del terminal de usuario, a pesar de que esta última no sea significativamente alta y se encuentre en un valor mayor a los 50 Km/h. En la zona de estudio se logra obtener que la velocidad de movimiento límite más probable para garantizar una velocidad de conexión excelente es de 27 Km/h, con lo cual se podrían localizar las rutas en las cuales se superan esas velocidades para aplicar en dichos sectores medidas correctivas o paliativas para mejorar la calidad de la conexión.

En los dos escenarios se comprueba que la calidad de la señal y la calidad de la velocidad de conexión se encuentran directamente relacionados con el valor del parámetro RSSI, aunque sus valores son diferentes dependiendo del escenario y de la categoría considerada.

5. Conclusiones

En este estudio mediante la aplicación de la técnica de los árboles de decisión se logran obtener los modelos que permiten en primera instancia caracterizar las condiciones en las cuales la calidad (intensidad) de la señal se encuentra en los niveles excelente, regular y mala en un escenario con el terminal de usuario en ubicaciones fijas y en el modo inactivo; y en segundo término, establecer las condiciones en las cuales la calidad de la conexión (velocidad de transmisión) alcanza niveles altos, medios y bajos en un escenario con el terminal en movimiento y en el modo conectado.

El método propuesto podría ser útil en las tareas de monitoreo de las redes de comunicación móvil, ya que permitiría detectar las condiciones en las cuales la calidad de la señal y de conexión se deterioran para aplicar medidas correctivas o paliativas que podrían ser introducidas solamente en determinados instantes de tiempo o ubicaciones, ahorrando de esta manera recursos de la red y disminuyendo el consumo de energía.

En base a los resultados obtenidos en las condiciones consideradas se observa que la técnica de los árboles de decisión es más adecuada para el escenario con mediciones en ubicaciones estáticas en el modo inactivo, ya que se alcanza una precisión del 67%, en comparación al escenario con mediciones en movimiento y en el modo conectado en donde la precisión llega a un valor de 53%.

En base a lo anterior, se propone en próximos estudios realizar mediciones en otros escenarios que incluyan condiciones de conexión con mayor nivel de semejanza, aumentar los parámetros de entrada considerados en las mediciones, aumentar la cantidad de datos recolectados y además aplicar otras técnicas de aprendizaje para comparar el desempeño de los modelos obtenidos.

6. Agradecimientos

Los Autores agradecen el apoyo de la Escuela Politécnica Nacional de Quito, Ecuador, para el desarrollo del proyecto de investigación PII-DETRI-2022-02 “Análisis del funcionamiento de las redes celulares en base a mediciones de campo y técnicas de Machine Learning (Caso de estudio ciudad de Quito)”.

7. Referencias

[1] Jha, S. K., Rokaya, R., Bhagat, A., Khan, A. R., Aryal, L., (2017). LTE Network: Coverage and Capacity Planning-4G Cellular Network Planning around Banepa. International Conference on Networking and Network Applications (NaNA), Kathmandu, Nepal. https://doi.org/10.1109/NaNA.2017.23

[2] Divya, R., Hüseyin, A. (2009). 3GPP – Long Term Evolution – A Technical Study. https://www.powershow.com/view/25041b-OWQ5M/3GPP_Long_Term_Evolution_A_Technical_Study_powerpoint_ppt_presentation.

[3] Ericsson. (2009). LTE – an introduction. Long Term Evolution (LTE) offers a superior user experience and simplified technology for next-generation mobile broadband. https://telecoms.com/files/2009/03/lte_overview.pdf

[4] Casas, P. (2018). Machine learning models for wireless network monitoring and analysis. IEEE Wireless Communications and Networking Conference Workshops (WCNCW), Barcelona, Spain. https://doi.org/10.1109/WCNCW.2018.8369024

[5] Casas, P., D’Alconzo, A., Wamser, F., Seufert, M., Gardlo, B., Schwind, A., Tran-Gia, P., Schatz, R. (2017). Predicting QoE in cellular networks using machine learning and in-smartphone measurements. Ninth International Conference on Quality of Multimedia Experience (QoMEX., Erfurt, Germany. https://doi.org/10.1109/QoMEX.2017.7965687

[6] Hou, Q., Zhou, Y. F., Peng, X., Zhang, L. (2014). Study of TD-LTE Coverage and Uplink/Downlink Power Budget in High-Speed Train. Applied Mechanics and Materials, 716-717, 117-1420. https://doi.org/10.4028/www.scientific.net/amm.716-717.1417

[7] Afroz, F., Subramanian, R., Heidary, R., Sandrasegaran, K., Ahmed, S. (2015). SINR, RSRP, RSSI and RSRQ Measurements in Long Term Evolution Networks. International Journal of Wireless & Mobile Networks, 7 (4), 113 − 123. http://dx.doi.org/10.5121/ijwmn.2015.7409

[8] Lin, C. C., Sandrasegaran, K., Mohd Ramli, H. A., Basukala, R. (2011). Optimized Performance Evaluation Of LLE Hard Handover Algorithm With Average RSRP Constraint. International Journal of Wireless & Mobile Networks (IJWMN), 3 (2), 1-16. http://dx.doi.org/10.5121/ijwmn.2011.3201

[9] Vukanic Stojanovic, I., Koprivica, M., Stojanovic, N., Neskovic, A. (2020). Analysis of the impact of network architecture on signal quality in LTE technology. Serbian Journal of Electrical Engineering, 17 (1), 95-109. http://dx.doi.org/10.2298/SJEE2001095S

Modelo de publicación sin fines de lucro para conservar la naturaleza académica y abierta de la comunicación científica
HTML generado a partir de XML-JATS4R