Uso de las aplicaciones de internet durante el primer año de la pandemia del COVID 19
Revista Científica y Tecnológica InGenio revista de la Facultad de Ciencias de la Ingeniería
Universidad Técnica Estatal de Quevedo, Ecuador
ISSN-e: 2697-3642
Periodicidad: Anual
vol. 5, núm. 2, 2022
Recepción: 06 Marzo 2022
Aprobación: 05 Mayo 2022
Resumen: En este artículo se realiza el estudio del uso de internet y de las aplicaciones que más se han utilizado durante el primer año de la pandemia del COVID 19 en Ecuador. Para el efecto, se utilizó la base de datos pública del Instituto Nacional de Estadística y Censos sobre la encuesta nacional multipropósito de hogares 2020, usando la sección de tecnologías de la información y comunicación. Se aplicaron los métodos multivariantes del análisis factorial y el análisis de componentes principales (PCA). Los componentes identificados explican un 83,3% de la varianza total y el test de KMO dio un valor de 0,925 que significa que el estudio es muy bueno, la prueba de Bartlett reportó un valor significativo menor a 0,05. Se obtuvo que los componentes principales que más influyen en el uso de la tecnología en tiempos de pandemia son Redes Sociales, Wifi, Bluetooth, Correo Electrónico, GPS y Descargas.
Palabras clave: Uso de internet, COVID-19, estadística multivariante, TIC.
Abstract: This article studies the use of the Internet and the applications that have been most used during the first year of the COVID 19 pandemic in Ecuador. For this purpose, the public database of the National Institute of Statistics and Census of the National Multipurpose Household Survey 2020 was employed, using the section on information and communication technologies. The multivariate methods of factor analysis and principal component analysis (PCA) were applied. The identified components explain 83.3% of the total variance and the KMO test gave a value of 0.925 which means that the study is very good, Bartlett's test reported a significant value less than 0.05. It was obtained that the principal components that most influence the use of technology in times of pandemic are Social Networks, Wi-Fi, Bluetooth, Email, GPS and Downloads.
Keywords: Use of Internet, COVID-19, multivariate statistics, ICT.
1. INTRODUCCIÓN
Uso de las aplicaciones de internet durante el primer año de la pandemia del COVID 19
La pandemia causada por el virus Covid-19 fue notificada por primera vez el 31 de diciembre de 2019. Los casos aumentaron de forma vertiginosa en diferentes países [1]. La organización Mundial de la Salud preocupada por el aumento de casos declaró la pandemia el 11 de marzo del año 2020. Este acontecimiento trajo como consecuencia que los gobiernos aplicaran algunas medidas sanitarias como el confinamiento que provocó una ruptura social alejando a las personas de sus familias y amigos e influyó en su vida laboral y social. Este alejamiento empujó a una nueva forma de acercamiento mediante el uso de la tecnología. El estrés generado por el confinamiento y el uso de herramientas tecnológicas basadas en internet lleva a considerar la importancia de las nuevas formas de comunicación en tiempos de crisis. El internet en este aspecto permitió que la comunicación a distancia acercara a las personas [2].
Las personas conectadas al internet han generado nuevos estilos de vida guiados por la mayor información que obtienen desde diferentes fuentes. La sociedad depende de los medios de comunicación que han determinado el cambio que hemos experimentado. China propició en los ciudadanos la búsqueda de información con servicios de mensajes cortos (SMS) e internet. En la crisis de salud pública china en el 2003 se crearon canales informativos. El internet fue una herramienta poderosa que desafiaba la información oficial durante la crisis de China [3].
El uso del internet ha creado cambios profundos en la manera de compartir datos y transmitir información. La proliferación de los sitios web, chats y redes sociales, crean una red enorme de personas conectadas independientemente de su ubicación geográfica [2]. La pandemia COVID-19 condujo a adoptar restricciones de contacto físico, lo que ha llevado a usar el internet como medio para obtener información alojadas en distintas fuentes. En Ecuador, el Instituto Nacional de Estadísticas y Censo (INEC) indica que el número de personas que usan el internet en el 2020 aumentó 11,5 puntos porcentuales a nivel nacional [4].
A partir de estos antecedentes, este trabajo tiene como objetivo identificar cómo usó el internet la población ecuatoriana durante la pandemia ocasionada por el virus COVID 19. La base de datos pública del Instituto Nacional de Estadísticas y Censos del Ecuador permitió obtener información a partir de la encuesta nacional multipropósito de hogares aplicada en el año 2020. La encuesta desde la sección de tecnologías de la información y comunicación contiene información del uso del internet a partir de 19455 registros. El estudio de los datos se realizó con un estudio multivariante aplicando los métodos del análisis factorial y de componentes principales (PCA).
2. METODOLOGÍA
2.1. Selección de Variables
El estudio se realizó con una base de datos pública -disponible en línea- en el sitio web del Instituto Nacional de Estadística y Censos (INEC). Esta base de datos contiene los resultados de la encuesta nacional multipropósito realizada a los hogares del Ecuador en el año 2020. Tuvo una cobertura urbana/rural sobre una muestra de 12.068 viviendas. Esta técnica de adquirir información es usada por [2] quien para obtener datos sobre el comportamiento del internet durante la pandemia se basó en una encuesta virtual creada por la Fundación Oswaldo Cruz (Fiocruz), en alianza con la Universidad Federal Estatal de Minas Gerais y la Universidad Estatal de Campinas.
La encuesta posee las siguientes secciones: 1. Información de los Miembros del Hogar, 2. Educación, 3. Características Ocupacionales, 4. Ingresos, 5. Actividad Física y Transporte, 6. Tecnología de la Información y Comunicación, 7. Victimización, 8. Calidad de los Servicios Públicos, 9. Información Ambiental, 10. Datos de la Vivienda y Hogar. La sección de la encuesta que se consideró para el estudio fue la correspondiente a las tecnologías de la información y comunicación con 19455 registros y se seleccionó un total de diez variables. Las variables seleccionadas son aquellas que se ajustaron al propósito del estudio y se realizó una limpieza de los datos de la encuesta para poder ordenar los componentes.
2.2. Análisis descriptivo
La investigación realizada es de tipo descriptiva, donde los componentes que determinan el uso del internet en tiempo de la pandemia por COVID-19 se los obtuvo desde el análisis estadístico descriptivo y exploratorio que permite conocer y comprender los datos, usando estadísticas de resumen y herramientas gráficas como las utilizadas por [5]. Se determinaron los porcentajes de: población dentro de los rangos que correspondan para el efecto, lugar de mayor frecuencia de uso del internet y razones de su uso. Finalmente, se usarán medidas de centralidad y dispersión aplicadas a las diez variables de investigación.
2.3. Análisis de Correlación de Variables
Para dar inicio al análisis multivariante se construyó la matriz de correlación. La correlación es un indicador usado para describir cuantitativamente la fuerza y dirección de la relación entre dos variables cuantitativas de distribución normal y ayuda a determinar la tendencia de dos variables a ir juntas, a lo que también se denomina covarianza [6]. Determinar la matriz de correlaciones es fundamental para validar el uso del análisis factorial y el análisis de componentes principales porque indica la existencia o no de multicolinealidad necesaria para la reducción de dimensiones. Las variables seleccionadas de la sección 7 de la encuesta multipropósito fueron utilizadas para construir la matriz de correlación.
2.4. Test de KMO y Bartlett
Antes de aplicar el método del análisis factorial exploratorio es necesario confirmar si es viable o no aplicarlo. Para el efecto, se usó dos pruebas: el índice de Kaizer-Meyer-Olkin (KMO) y la prueba de esfericidad de Bartlett. El test de Kaiser-Meyer-Olkin (KMO) mide la comparación de los coeficientes de correlación observados con los coeficientes de correlación parcial. Asume valores entre 0 y 1. Debe considerarse adecuado un coeficiente de KMO mayor a 0,6 [7]. El test Kaiser, Mayer y Olkin KMO empleado por [8] para investigar el vínculo entre la participación en línea utilizando Internet y sus impactos en la formación de capital social y el desarrollo comunitario, en la investigación se usó para evaluar el modelo factorial desde la relación de los coeficientes de correlación. La interpretación del coeficiente es la siguiente: Si KMO ≥ 0.9, excelente; KMO ≥ 0.8, muy bueno; KMO ≥ 0.7, bueno; KMO ≥ 0.6, regular; y, para valores de KMO < 0.5 se considera no apropiado. Por su parte, la prueba de Bartlett permite determinar si las varianzas entre varios grupos son iguales o no; a esto se le denomina homogeneidad de las varianzas y se considera que existe homogeneidad si se obtiene un valor menor de p<0,05. De la matriz de correlaciones que se ha obtenido, se procede a realizar las pruebas para validar el uso del análisis factorial exploratorio y de componentes principales.
2.5. Análisis Factorial Exploratorio
El análisis factorial exploratorio (AFE) de ítems es una de las técnicas frecuentemente aplicadas en estudios relacionados con el desarrollo y validación de test, porque es la técnica por excelencia que se utiliza para explorar el conjunto de variables latentes o factores comunes que explican las respuestas a los ítems de un test [9]. Trata de identificar grupos homogéneos -llamados también factores- que expliquen la configuración de las correlaciones dentro de un conjunto de variables observadas. Cada grupo homogéneo tienen un alto grado de correlación que conlleva a un significado común y que da lugar a la reducción de las dimensiones que pueden explicar la mayoría de la varianza observada en un conjunto de variables de la realidad observada. Para el caso de estudio, se necesitó identificar el uso de internet de la población ecuatoriana durante la pandemia del COVID-19.
2.6. Análisis de Componentes Principales
El Análisis de Componentes Principales (ACP) expresa un conjunto de variables en un conjunto de combinaciones lineales de factores no correlacionados entre sí. Este método permite representar los datos originales (individuos y variables) en un espacio de dimensión inferior del espacio original limitando al máximo la pérdida de información. El ACP se utiliza para la reducción de dimensionalidad y su aplicación destaca cuando existe un alto número de variables cuantitativas. Su uso permite obtener un sistema transformado de coordenadas denominadas componentes principales, combinación lineal de las primitivas [10]. Finalmente, se obtuvo las componentes que agrupan las aplicaciones más utilizadas en el primer año de la pandemia del COVID19 en el Ecuador.
2.7. Materiales
Los materiales utilizados en este trabajo son dos: La base de datos del Instituto Nacional de Estadística y Censos (INEC) que contiene los datos recogidos en la encuesta nacional multipropósito realizada a los hogares del Ecuador en el año 2020 [4]. La encuesta propone doce secciones: registros de los miembros del hogar; educación; características ocupacionales; uso del tiempo; actividad física y transporte; tecnologías de la información y comunicación; calidad de los servicios públicos; uso, confianza, satisfacción y funcionamiento de las instituciones públicas; cobertura de servicios; equipamiento del hogar; datos de la vivienda y hogar, y acceso y uso de servicios-productos financieros. La sección de interés para el estudio es la de tecnologías de la información y la comunicación. El análisis estadístico se llevará a cabo mediante el paquete estadístico SPSS V26.
3. RESULTADOS
Dentro del contexto de la salud mundial, la pandemia del COVID19 cambió algunas formas de interacción de la humanidad debido a las restricciones de movilidad y confinamiento que se tomaron con el afán de evitar una catástrofe de dimensiones inimaginables. El ser humano, como un ente social, se vio, en principio, aislado de su entorno familiar y social. Sin embargo, es justo en este instante que las tecnologías de la información y comunicación basadas en internet toman un rol preponderante. El Ecuador no estuvo exento de estos acontecimientos y dentro de este contexto también desarrolló el uso de estas tecnologías para mantener comunicación con sus familiares, círculo social y negocios. Entonces, se determ
3.1. Selección de Variables
El análisis de contenido de los diferentes modelos se plantea desde nueve dimensiones conceptuales con base en el uso del internet en tiempos de la COVID 19. Las dimensiones que se tomaron en cuenta están descritas en la tabla 1.
Variables | Siglas | Preguntas |
RedesSociales | RS | P1: ¿Utiliza en su teléfono celular: Redes Sociales? |
WifiBluetooth | WB | P2: ¿Utiliza en su teléfono celular: Wifi Bluetooth? |
MailCorreoElectronico | MC | P3: ¿Utiliza en su teléfono celular: mail, correo electrónico? |
GPS | GPS | P4: ¿Utiliza en su teléfono celular: GPS? |
Descargas | D | P5: ¿Utiliza en su teléfono celular: Descarga de juegos, música, etc.? |
UsoInternet | UI | P6: ¿Ha usado el Internet, desde cualquier lugar, en los últimos 12 meses? |
A1AlternativaUso | AU | P7: ¿Para qué servicios / actividades usó (…) el Internet: |
FrecuenciaUso | FU | P8: ¿En qué lugar uso el internet con mayor frecuencia? |
HorasInternet | HI | P9: ¿Cuántas horas en total dedicó al Internet? |
Rango_Edad | RE | P10: ¿Cuál es su rando de edad? |
3.2. Análisis descriptivo
La población estuvo constituida por 19455 registros de personas encuestadas, con una edad media de 33 ± 5. De acuerdo con el rango de edad de la figura 1, se encuentra que predomina el grupo de 55-65 años con un 34,02% y el de 25-54 años con 28,47%.
El lugar con mayor frecuencia para el uso del internet (figura 2) está distribuido de la siguiente manera: 53,68% pertenecen al hogar, 36,25% a otros lugares, 3,99% al lugar de trabajo, 3,79% a la casa de otras personas (pariente, amigo, vecino, etc.), 1,87% a centros de acceso público y 0,42% a instituciones educativas.
Se registraron en la encuesta varias alternativas del uso del internet (figura 3). Las personas emplean el internet para revisar información en la web y comunicación en general en un 47, 68%, Educación y aprendizaje que contempla el 12, 68% y entre las actividades de entretenimiento ver películas, escuchar música o revisar software y por razones de trabajo suman el 3,10.
Las variables usadas en la investigación, así como sus valores medios y de dispersión se encuentran detallados en la tabla 2.
Preguntas sección tecnologías de la información | Media | Desviación |
P1: ¿Utiliza en su teléfono celular: Redes Sociales? | 52,91 | 48,88 |
P2: ¿Utiliza en su teléfono celular: Wifi Bluetooth? | 52,95 | 48,86 |
P3: ¿Utiliza en su teléfono celular: mail, correo electrónico? | 53,16 | 48,75 |
P4: ¿Utiliza en su teléfono celular: GPS? | 53,37 | 48,60 |
P5: ¿Utiliza en su teléfono celular: Descarga de juegos, música, etc.? | 53,23 | 48, 70 |
P6: ¿Ha usado el Internet, desde cualquier lugar, en los últimos 12 meses? | 1,36 | 5,27 |
P7: ¿Para qué servicios / actividades usó (…) el Internet: | 6,33 | 5,27 |
P8: ¿En qué lugar uso el internet con mayor frecuencia? | 3,07 | 2,37 |
P9: ¿Cuántas horas en total dedicó al Internet? | 2,10 | 2, 45 |
P10: ¿Cuál es su rando de edad? | 3,29 | 1,43 |
3.3. Análisis de correlación de variables
Se realizó una matriz de correlación (tabla 3) que determina la asociación de las variables en el uso del internet en tiempos de pandemia Covid-19, con el rango de edad como agrupación. Los valores seleccionados en la matriz de correlaciones se hicieron mediante el criterio de 0,99 que representa la cantidad ideal en la correlación. Con base en este criterio, las variables que tiene una mayor asociación son RS y WB con un valor de 0,998. Le sigue la asociación de las variables WB y MC, WB y D, MC y GPS con un valor de 0,996. Las variables RS y MC, RS y D, WB y GPS, MC y D, GPS y D poseen un coeficiente de correlación de 0,995. El coeficiente de correlación entre RS y GPS es de 0,994 siendo este el menor de todos los valores.
RS | WB | MC | GPS | D | UI | AU | FU | HI | |
RS | 1,000 | ,998 | ,995 | ,994 | ,995 | ,668 | ,686 | ,660 | -,499 |
WB | 1,000 | ,996 | ,995 | ,996 | ,667 | ,684 | ,659 | -,499 | |
MC | 1,000 | ,996 | ,995 | ,665 | ,683 | ,658 | -,499 | ||
GPS | 1,000 | ,995 | ,664 | ,681 | ,656 | -,498 | |||
D | 1,000 | ,665 | ,682 | ,657 | -,498 | ||||
UI | 1,000 | ,949 | ,927 | -,641 | |||||
AU | 1,000 | ,887 | -,605 | ||||||
FU | 1,000 | -,624 | |||||||
HI | 1,000 | ||||||||
a. Determinante = 5,943E-12 |
3.4. Contraste en el modelo factorial
La prueba KMO (Kaiser, Meyer y Olkin) relaciona a los coeficientes de correlación con un valor de 0,925 por lo que se menciona que el test es muy bueno para el análisis factorial. El valor obtenido en Bartlett muestra que se puede aplicar el análisis factorial en el estudio debido a que los datos son homogéneos. En la tabla 4 se puede visualizar con detalle las pruebas KMO y Bartlett.
Pruebas de contraste en el modelo factorial | Valor | |
Medida Kaiser-Meyer-Olkin de adecuación de muestreo | ,925 | |
Prueba de esfericidad de Bartlett | Aprox. Chi-cuadrado | 502763,799 |
gl | 36 | |
Sig. | ,000 |
Según la matriz de varianza total explicada hay dos autovalores mayores que uno, lo que significa extraer dos componentes que explican un 83,256% de la variabilidad de los datos. En la tabla 5 se visualiza que por cada componente con autovalor mayor que uno, se encuentra la suma de cargas al cuadrado de la extracción que coincide con los autovalores al usar el método de PCA.
Componente | Autovalores iniciales | Sumas de cargas al cuadrado de la extracción | ||||
Total | % de varianza | % acumulado | Total | % de varianza | % acumulado | |
1 | 6,441 | 71,572 | 71,572 | 6,441 | 71,572 | 71,572 |
2 | 1,052 | 11,683 | 83,256 | 1,052 | 11,683 | 83,256 |
3 | ,977 | 10,855 | 94,110 | |||
4 | ,463 | 5,142 | 99,252 | |||
5 | ,049 | ,549 | 99,801 | |||
6 | ,007 | ,074 | 99,875 | |||
7 | ,005 | ,057 | 99,932 | |||
8 | ,004 | ,045 | 99,977 | |||
9 | ,002 | ,023 | 100,000 | |||
Método de extracción: análisis de componentes principales. |
El gráfico de sedimentación pierde la inclinación a partir del segundo autovalor hacia la derecha, por lo que se considera extraer los dos primeros componentes desechando aquellos que están desde el tercero hasta el noveno autovalor. Por otra parte, es necesario mencionar que en la figura 4 se muestran todos los posibles autovalores y no solo los de la matriz analizada.
En la matriz de componentes (tabla 6) se visualiza la solución factorial de las correlaciones entre las variables del estudio y cada componente. Comparando las saturaciones relativas de las variables, se aprecia que el primer componente está constituido por las variables RS, WB, MC, GPS y D. Todas estas variables saturan un único componente que constituyen un conjunto diferenciado en la matriz de correlaciones. Estos componentes reflejan los servicios que usan el internet en los hogares. El segundo componente está formado por una única variable que es HI independiente a los servicios que utilizan del internet.
Componente 1 | Componente 2 | |
RS | ,151 | ,184 |
WB | ,151 | ,185 |
MC | ,151 | ,186 |
GPS | ,151 | ,187 |
D | ,151 | ,186 |
UI | ,126 | -,400 |
AU | ,127 | -,366 |
HI | -,098 | ,435 |
RE | ,000 | -,544 |
La figura 5 representa cada uno de los componentes contenidos en la solución factorial. La figura muestra un diagrama de dispersión simple debido a que hay solo dos factores.
4. CONCLUSIONES
El análisis de componentes principales demostró que las variables con mayor asociación del componente 1 son las redes sociales, wifi, Bluetooth, correo electrónico, GPS y descargas. Este componente obtuvo un coeficiente de variación de 0,998 lo que significa que en las viviendas encuestadas tienen mayor uso del internet por medio del wifi para acceder a las redes sociales. Esto probablemente se deba a que los planes de los teléfonos celulares dejaron de ser prioridad debido a las restricciones de movilidad y confinamiento. Además, se usa el wifi y Bluetooth como medio de comunicación entre dispositivos. La matriz de varianza total explicada por medio de sus valores permite tomar una decisión para extraer los componentes con mayor variabilidad contenida en los datos.
REFERENCIAS
[1] M. C. A. T. Alcántara Trujillo, E. T. Caro Meza, M. B. Solis Llallico, y H. Lopez Gutierrez, «Niveles de satisfacción estudiantil en una facultad de ingeniería por la virtualización de la enseñanza durante la pandemia de COVID 19», Ciencia Latina, 5(3), 3723-3734, 2021.
[2] C.L. Szwarcwald, et al., "ConVid - Behavior Survey by the Internet during the COVID-19 pandemic in Brazil: conception and application methodology", Cad Saude Publica, Apr 30;37(3), 2021.
[3] M. Montaña Blasco, C. Ollé Castellà, M. Lavilla Raso, "Impact of the Covid-19 pandemic on media consumption in Spain". Revista Latina de Comunicación Social, 78(1), 155-167, 2020.
[4] INEC (Instituto Nacional de Estadísticas y Senso). (abril de 2021). Obtenido de https://www.ecuadorencifras.gob.ec/documentos/web-inec/Estadisticas_Sociales/TIC/2020/202012_Principales_resultados_Multiproposito_TIC.pdf
[5] B. Hidalgo Cajo, M. Gisbert Cervera, "Diseño y validación de un instrumento para evaluar la adopción de la tecnología digital en el profesorado universitario". Revista Campus Virtuales, 10(2), 51-67, 2021.
[6] I. Roy-García, R. Rivas-Ruiz, M. Pérez-Rodríguez, L. Palacios-Cruz, " Correlación: no toda correlación implica causalidad", Revista Alergia Mexico, 66(3), 354-360, 2019.
[7] M. L. Garmendia, "Análisis factorial: una aplicación en el cuestionario de salud general de Goldberg, versión de 12 preguntas", Rev Chil Salud Pública, Vol 11 (2), 57-65, 2007.
[8] Y. Yao, X. Zhou, "Impacts of the internet on perceptions of governance at the community level: the case of Jiangqiao Township in Shanghai", China. Public Administration and Policy: An Asia-Pacific Journal, 24(2), 165-181, 2021.
[9] S. Lloret-Segura, A. Ferreres-Traver, A. Hernández-Baeza, I. Tomás-Marco, “El análisis factorial exploratorio de los ítems: una guía práctica”, revisada y actualizada, anales de psicología, vol. 30, no 3, 1151-1169, 2014.
[10] D. Filho, A. Sant’Anna, "Principal component regression-based control charts for monitoring count data", The International Journal of Advanced Manufacturing Technology, 85, 1565-1574, 2016.