ARTÍCULOS
Criterios para la selección y aplicación de herramientas estadísticas en la investigación educativa
Criteria for the selection and application of statistical tools in educational research
Delectus
Instituto Nacional de Investigación y Capacitación Continua, Perú
ISSN-e: 2663-1148
Periodicidad: Semestral
vol. 2, núm. 1, 2019
Recepción: 01 Enero 2019
Aprobación: 01 Abril 2019
Resumen: En este artículo se ofrecen a los investigadores del área educativa algunos criterios que puedan facilitar la adecuada selección de herramientas estadísticas descriptivas y de inferencia, para el análisis de la información que se genera en esta importante área de investigación. Para ello, se efectuó una revisión de 40 proyectos ejecutados durante el año 2017, vinculados a un programa de maestría en Gestión de la Calidad en Educación. Estos se clasificaron, dependiendo del enfoque, diseño de investigación y alcance. Tomando en cuenta los objetivos de investigación de cada proyecto y su alcance, se determinó el requerimiento de análisis, lo que permitió formular recomendaciones para la utilización de herramientas estadísticas descriptivas y de inferencia, a partir de los casos más frecuentes. Se concluye que los criterios expuestos pueden dar respuesta a una gran variedad de casos que se presentan frecuentemente en este tipo de investigaciones.
Palabras clave: investigación educativa, herramientas estadísticas, criterios de selección.
Abstract: Criteria for the selection and application of statistical tools in educational research In this article, researchers are offered some criteria that can facilitate the adequate selection of descriptive and inference statistical tools for the analysis of the information generated in this important area of research. To this end, a review was made of 40 projects executed during the year 2017, linked to a master’s program in Quality Management in Education. These were classified, depending on the focus, research design and scope. Taking into account the research objectives of each project and its scope, the analysis requirement was determined, which allowed making recommendations for the use of descriptive and inference statistical tools, based on the most frequent cases. It is concluded that the exposed criteria can respond to a great variety of cases that frequently occur in this type of research.
Keywords: educational research, statistical tools, selection criteria.
Introducción
De acuerdo con los objetivos de cada estudio, la investigación realizada en el campo educativo puede estar enmarcada dentro de cualquiera de los paradigmas cualitativo, mixto o cuantitativo. En concordancia con Gil (2003), aún bajo el enfoque cualitativo, es posible la generación de categorías que conduzcan a la producción de información susceptible de ser analizada por medio de la estadística. Por tanto, resulta de gran relevancia para los investigadores en el campo educativo, asociar la escala de medida de las variables contempladas en su investigación, con la herramienta estadística apropiada, bien sea desde el punto de vista descriptivo o de inferencia.
“Pocas objeciones pueden hacerse a la idea de que la estadística es una herramienta fundamental para la investigación científica y esta afirmación es igualmente válida en el caso de la investigación educativa” (Gil, 2003). No obstante, se han señalado algunas limitantes en su aplicación, entre otras, asociadas al desconocimiento de las técnicas o a la violación de los supuestos requeridos por estas.
El uso de los métodos y técnicas estadísticas en la investigación educativa permite elevar la calidad, confiabilidad y pertinencia en la construcción de los nuevos conocimientos científicos en las ciencias de la educación y, por tanto, lograr un perfeccionamiento continuo de los sistemas educativos como lo demanda el desarrollo científico y técnico de la época en que vivimos (López y Perich, 2016).
Existen marcadas brechas en el ámbito de la investigación educativa en lo referente al dominio de la metodología estadística, bajo el enfoque cuantitativo. Mientras que López y Perich (2016), aún discuten el problema del escaso nivel de formación en estadística de los investigadores en educación, así como las falencias en el dominio de criterios básicos para el empleo de este tipo de herramientas; en contraste, Castro y Lizasoain (2012) reportan la discusión sobre la aplicación de las técnicas de modelización estadística en la investigación educativa, tales como minería de datos, modelos de ecuaciones estructurales y modelos jerárquicos lineales.
En ese sentido, el propósito del presente artículo es ofrecer a los investigadores en el área educativa, criterios que faciliten la selección de herramientas estadísticas descriptivas e inferenciales apropiadas para el correcto análisis de la información que se genera en esta importante área de investigación.
Metodología
La información base para el desarrollo de este artículo correspondió a una muestra de 40 proyectos de investigación ejecutados durante el año 2017, vinculados al programa de maestría en Gestión de la Calidad en Educación del Instituto de Postgrado de la Universidad Técnica del Norte, Ecuador.
En el marco del proceso de asesoría en metodología de investigación y estadística, los referidos proyectos se clasificaron en función del enfoque, diseño de investigación y alcance. Las variables e indicadores utilizados fueron catalogados de acuerdo con las escalas de medida descritas por Siegel (1990). A partir de los objetivos de investigación de cada proyecto y su alcance, se determinó el requerimiento de herramientas de análisis descriptivo (enfoque cualitativo, mixto y cuantitativo) y de inferencia (enfoque cuantitativo y mixto).
Con base en toda esta información, se procedió a establecer opciones de análisis estadístico, considerando:
Para el análisis descriptivo: selección de la escala de medida de la variable a ser analizada, estadístico de medida para tendencia central, dispersión y opción adecuada de gráfico o figura.
Para el análisis inferencial: identificación del caso específico de inferencia, para posteriormente aplicar los criterios de selección de la prueba estadística apropiada, descritos por Siegel (1990) que se resumen en la Figura 1. El primer criterio toma en cuenta el requerimiento de escala de medida que tiene la prueba estadística a ser aplicada. El segundo criterio es relacionado con las suposiciones que deben cumplirse para poder emplear la prueba estadística. Es posible que exista más de una prueba que permita contrastar la hipótesis de interés; en ese caso, la decisión recae sobre el criterio de la potencia.
La potencia de la prueba es la probabilidad de rechazar la hipótesis nula cuando esa hipótesis es realmente falsa (Canavos, 1988). En muchas investigaciones de simulación, se han comparado las funciones de potencia de pruebas estadísticas que cumplen un mismo objetivo. En este trabajo, se ofrece al lector la recomendación de la prueba estadística más potente en cada caso en particular, conforme a lo expuesto por Siegel (1990) y Siegel y Castellan (1995).
El ejemplo más frecuente para ilustrar lo expuesto es la prueba de t de Student para comparar dos muestras independientes. Esta se aplica a variables medidas en escala de intervalo y proporción, con el supuesto de que las muestras provengan de poblaciones normales independientes y con varianza común (Canavos, 1988). Cuando estos requisitos son satisfechos, tiene la mayor potencia entre todas las pruebas que permiten cumplir con el mismo objetivo (Hollander y Wolfe, 1973). Si la escala de medida no es la correcta (nominal u ordinal), si no hay independencia o las varianzas no son homogéneas, la prueba de t de Student puede conducir a inferencias inadecuadas.
Adicionalmente, para recomendar el uso de las herramientas y/o pruebas estadísticas en el presente escrito, se tomó en cuenta su disponibilidad en los programas estadísticos comúnmente utilizados en la investigación social.
Resultados
Los proyectos desarrollados bajo el enfoque cualitativo (26%), en su mayoría fueron abordados por medio de alguno de los siguientes diseños de investigación: narrativo, fenomenológico, etnográfico e investigación acción. Las investigaciones bajo el enfoque cuantitativo (27%) o mixto (47%) se correspondieron con alguno de los diseños de investigación: no experimental (de campo) o documental.
Los trabajos de índole cuantitativo o mixto frecuentemente consideraron variables e indicadores de diferente escala de medida, incluyendo variables cualitativas nominales u ordinales y variables cuantitativas en escala de proporción. Algunos proyectos con enfoque cualitativo generaron categorías nominales y ordinales.
En la Tabla 1, se presentan algunos ejemplos de variables e indicadores por escala de medida.
Variable | Categorías de respuesta | Escala de medida |
Valores que predominan en el hogar; | Respeto, responsabilidad, comprensión, comunicación, honestidad; | |
Responsable de las necesidades básicas del hogar; | Ambos padres, padre, madre, familiar, otro; | Nominal |
Conformidad del alumno con una estrategia de enseñanza-aprendizaje | Sí, no | |
Apreciación de los representantes sobre el trabajo de los directivos de una unidad educativa | Mala, regular, buena, muy buena. | |
Frecuencia con que acuden los padres a la unidad educativa | Nunca, anualmente, trimestralmente, mensualmente, semanalmente | Ordinal |
Nivel de dominio de los aprendizajes requeridos | ≤ 4 no alcanza 4,01 – 6,99 próximo a alcanzar 7 – 8,99 alcanza 9 – 10 Domina | |
Porcentaje de asistencia del alumnado Porcentaje de asistencia del profesorado Porcentaje de aprobación Porcentaje de contenidos impartidos Calificación de los estudiantes | Proporción |
Análisis descriptivo
El correcto análisis descriptivo de la información generada requiere considerar las escalas de medida referidas previamente y, de acuerdo con la finalidad de la representación de la información, se pueden emplear tablas, texto o gráficos (Figura 2).
En la Tabla 2, se ofrece un resumen de las opciones de estadísticos descriptivos aplicables por tipo de variable y escala de medida. Para variables medidas en escala nominal, el único estadístico de tendencia central es la moda. En las escalas superiores, se pueden aplicar los estadísticos de las escalas de medida de menor nivel.
Tipo de variable | Escala de medida | Ejemplos de estadísticas apropiadas | |
Tendencia central | Dispersión | ||
Cualitativa | Nominal | Moda | Distribución de frecuencias |
Ordinal | Moda Mediana | Distribución de frecuencias Percentiles (cuartiles, deciles, percentiles) Desviación mediana | |
Cuantitativa (Discreta o Continua) | Intervalo | Moda Mediana Media | Distribución de frecuencias Cuartiles, deciles, percentiles Desviación mediana Desviación estándar Coeficiente de variación |
Proporción |
Se aprecia claramente en la Tabla 2, que la media aritmética o promedio como medida de tendencia central y la desviación estándar como medida de dispersión son aplicables solo a variables cuantitativas (con escala de intervalo o proporción). En ambos casos, la obtención de estimados a partir de los datos obtenidos requiere la realización de operaciones algebraicas solo admisibles para variables cuantitativas (Conover, 1980). En los proyectos de investigación revisados, se observó en algunos casos el error de utilizar la media y desviación estándar, cuando empleaban números para la identificación de categorías en variables cualitativas ordinales.
También es importante considerar la escala de medida para la elaboración de gráficos. Las Figuras 3 y 4 ilustran ejemplos de uso adecuado de estas herramientas. Cuando en el eje de las abscisas (eje x) se tiene una variable nominal u ordinal siempre es recomendable el uso de gráficos de barra. Para la elaboración de gráficos de tendencia (líneas) es indispensable que la variable en el eje x sea de intervalo o proporción (Canavos, 1988). En los proyectos evaluados, se observó el error del empleo de gráficos de tendencia con variables cualitativas.
Una figura muy utilizada es la denominada gráfica de sectores o de “torta”, la cual es útil para la representación de porcentajes de ocurrencia de categorías de variables cualitativas, tal como se ilustra en la Figura 5. Es recomendable su uso para variables con pocas categorías. En caso contrario, pierde efectividad de representación ya que puede resultar confusa su percepción e interpretación.
El diagrama de caja y bigote (box and whisker plot) es una poderosa herramienta de descripción integral de información para variables por lo menos en escala ordinal (Tukey, 1977). Muestra simultáneamente medidas de tendencia central, posición y variabilidad, (Figura 6). Para un conjunto de datos, el valor mayor, está dado por la proyección del bigote superior sobre el eje “y”; el valor menor, por la proyección del bigote inferior.
El Q1 o primer cuartil, que es el valor por debajo del cual se encuentra el 25% de las observaciones, está simbolizado por el lado inferior de la caja. El Q2 (segundo cuartil o mediana) es el valor por debajo del cual está el 50% de los datos, se representa con la línea que divide en dos a la caja. El Q3 (tercer cuartil) es el valor por debajo del cual se encuentra el 75 % de las observaciones o por encima del que está el 25 % de los datos (línea superior de la caja). De manera gráfica, el largo de la caja y de los bigotes da idea de variabilidad. Además se puede obtener el recorrido inter cuartil tomando: Q3 – Q1. De esta forma, se tiene una caracterización global de los datos muy útil para establecer comparaciones como la que se ilustra en la Figura 5.
Análisis inferencial
Parte de los proyectos evaluados bajo el enfoque cuantitativo o mixto contemplaron diseños de investigación no experimental (de campo) o documental. Aunque ninguna de las investigaciones se abordó por vía del diseño de investigación experimental, es muy frecuente que para cualquiera de estos diseños de investigación (experimental y no experimental) se puedan presentar cualquiera de los casos de inferencia que se describen en la Figura 7, dependiendo de los objetivos de cada trabajo de investigación.
A continuación se describe cada uno de estos casos de inferencia con base en ejemplos de investigación en el área educativa:
Caso de una muestra. Hace referencia a las situaciones en las que se pretende describir una población o hacer inferencia con respecto a esta, a partir de una muestra tomada por medio de un procedimiento apropiado. Tal es el caso cuando se requiere conocer la percepción de los padres y representantes sobre el cumplimiento de los estándares de infraestructura para el mejoramiento de la calidad educativa en el nivel inicial en una unidad educativa. Habiendo definido las variables e indicadores requeridos, se podría simplemente describir en la muestra, con los estadísticos y herramientas adecuadas, la percepción de padres y representantes o plantear pruebas de hipótesis. En cualquier caso, la posibilidad de hacer afirmaciones sobre la población, a partir de la muestra requiere haber efectuado un muestreo probabilístico (Lohr, 2010).
En este artículo no se enfatiza en pruebas de inferencia para una muestra, debido a que la totalidad de los casos identificados en los proyectos de investigación a los que se hace referencia, fueron de alcance descriptivo.
Correlación. En investigaciones de alcance correlacional, el interés particular radica en tratar de establecer asociaciones entre características medidas a cada uno de los elementos de la muestra, para tratar de entender y explicar fenómenos. El primer coeficiente de correlación simple fue desarrollado por Pearson, por lo que el referido coeficiente tiene esa denominación (Canavos, 1988). Es frecuente el error en utilizar esta herramienta para establecer asociaciones de tipo lineal entre pares de variables, sin importar la escala de medida de estas, cuando en realidad está demostrado que el coeficiente de correlación de Pearson debe ser utilizado para variables en escala por lo menos de intervalo.
En la Tabla 3, se ofrecen algunas opciones de pruebas estadísticas apropiadas, con base al triángulo de decisión (ver Figura 1). Se aprecia que para determinar la asociación entre un par de variables, siempre la menor escala de medida involucrada define la prueba a ser utilizada. Por ejemplo, cuando esté una variable nominal involucrada, la prueba V de Cramer sería la opción correcta (De campos, 1983). Cuando se esté analizando una variable ordinal y otra de proporción, la prueba de rangos de Spearman sería la adecuada (Conover, 1980).
Escala de medida | Nominal | Ordinal | Intervalo y Proporción |
Nominal | V Cramer | V Cramer | V Cramer |
Ordinal | Spearman | Spearman | |
Intervalo y Proporción | Pearson |
Para ilustrar estos razonamientos, se plantea la iniciativa de establecer la posible asociación entre los valores que predominan en el hogar (respeto, responsabilidad, comprensión, comunicación, honestidad) y los problemas con alcohol y/o drogas de algún familiar (sí, no, en recuperación), correspondiente a los estudiantes de 8vo, 9no y 10mo de una unidad educativa. Ambas variables son nominales, por lo tanto la prueba adecuada sería la V de Cramer. Si en el mismo contexto se desea determinar si hay asociación o no entre los valores que predominan en el hogar y el nivel de confianza entre los estudiantes y sus padres (poco, regular, mucho) se tendría que utilizar nuevamente la V de Cramer ya que a pesar de que el nivel de confianza es ordinal, se está intentando asociar con una variable nominal como los valores predominantes en el hogar.
Caso de dos muestras relacionadas. Se conoce así a la situación de inferencia en la que se comparan dos grupos de observaciones, ambos provenientes de la misma muestra, de donde se desprende la relación a la que hace referencia la denominación. Por ejemplo, cuando se pretende evaluar el efecto de la implementación del modelo pedagógico intercultural en 6° año de una escuela de Educación Básica y para ese fin, en un mismo grupo o paralelo se efectúa una evaluación previa y otra posterior a la implementación, se está claramente en el caso de dos muestras relacionadas. La prueba estadística apropiada en este caso dependerá de la escala de medida de la variable considerada en la evaluación y del cumplimiento o no de los supuestos de la prueba de “t” Pareada (ver Tabla 4).
Caso de dos muestras independientes. En este escenario, se comparan dos grupos de observaciones provenientes de muestras tomadas en grupos (poblaciones) distintos, por lo que cada conjunto de datos puede ser considerado independiente del otro. Por ejemplo, cuando se plantea el objetivo de aplicar y evaluar un modelo instruccional con estrategias interactivas, para mejorar los aprendizajes en ciencias naturales de los estudiantes de octavo año de educación general básica superior en una unidad educativa y, para tal propósito, se seleccionan dos paralelos a uno de los cuales se aplica el nuevo modelo y con el otro se utiliza el modelo convencional, se tiene una estrategia enmarcada en el caso de dos muestras independientes. La prueba estadística apropiada dependerá, igual que en el caso anterior, de la escala de medida de la variable considerada en la evaluación y del cumplimiento o no de los supuestos de la prueba de “t” de Student (ver Tabla 4).
Para los casos de k muestras relacionadas y k muestras independientes, el criterio de dependencia o independencia es el mismo expuesto para los casos análogos de dos muestras, la diferencia estriba en el número de grupos que intervienen. En la Tabla 4, se ofrecen las diferentes opciones de prueba estadística, conforme a los criterios establecidos en el presente escrito.
Conclusiones
En este artículo se ofrece a los investigadores en el área educativa criterios que permiten la selección y aplicación de herramientas estadísticas descriptivas e inferenciales apropiadas para el análisis de información en esta importante área de investigación.
En virtud de la amplia gama de situaciones que se pueden presentar en la investigación educativa, no se abordan de manera exhaustiva todos los escenarios posibles de aplicación. Sin embargo, los criterios expuestos pueden dar respuesta a una gran variedad de casos que se presentan frecuentemente en este tipo de investigaciones.
Referencias
Antamba, L. (2015). Asistencia escolar. Estadística Educativa, Reporte de indicadores, 1(1) 9–16. Recuperado de https://educacion.gob. ec/wp-content/uploads/downloads/2016/01/Publicaciones/ PUB_EstadisticaEducativaVol1_mar2015.pdf
Berutti-Suárez, L., Pereira-González, L., Rodríguez-Balza, M. y Machado, W. (2019). Diseño estadístico en la caracterización fitoquímica de dos plantas medicinales para propuesta de nutracéutico. En M. Cevallos, R. Pazmiño, T. Sánchez, M. Naranjo, C. Segovia, A. Mina, H. Cadena, F. Garrido, J. Anaya, E. Monteros, J. Alvarado, M. Posso, K. Steinlechner, M. Rodríguez (Coord.). Libro de memorias del “VI Congreso de la Red Ecuatoriana de Universidades y Escuelas Politécnicas para Investigación y Posgrado (pp.1092-1097). Ibarra: Editorial UTN.
Canavos, G. C. (1988). Probabilidad y Estadística. Aplicaciones y métodos. México: McGraw – Hill Interamericana.
Castro, M. y Lizasoain, L. (2012). Las técnicas de modelización estadística en la investigación educativa: minería de datos, modelos de ecuaciones estructurales y modelos jerárquicos lineales. Revista española de pedagogía 70 (251), 131-148. Recuperado de https://dialnet.unirioja.es/servlet/articulo?codigo=3808359
Conover, W.J. (1980). Practical Nonparametric Statistics, (2 ed.). New York: John Wiley & Sons, Inc.
De Campos, H. (1983). Estatistica Experimental Nao Paramétrica, (4 ed.). Piracicaba, Brasil: Edicao. Universidade de Sao Paulo. Departamento de Matemática e Estatistica E.S.A. “Luiz de Queiroz”.
Gil, J. (2003). La estadística en la investigación educativa. Revista de Investigación Educativa. 21(1), 231-248. Recuperado de http:// revistas.um.es/rie/article/view/99191
Hollander, M. y Wolfe, D.A. (1973). Nonparametric Statistical Methods. New York: John Wiley & Sons, Inc.
López, P. y Perich, A. (2016). Uso de métodos y técnicas estadísticas en las investigaciones educativas. ROCA. Revista científico - educacional de la provincia Granma. 12 (2), 29 -37. Recuperado de http://revistas.udg.co.cu/index.php/roca/article/view/414.
Lohr, S. (2010). Sampling: Design and Analysis. United States: Brooks Cole, Cengage Learning.
Siegel, S. (1990). Nonparametric Statistics for the Behavioral Sciences. New York: McGraw-Hill Book Company.
Siegel, S. y Castellan, N. (1995). Estadística no paramétrica. Aplicada a las ciencias de la conducta, (4 ed.). México: Trillas.
Tukey, J. W. (1977). Exploratory Data Analysis, Reading, MA: Addison- Wesley.
Notas de autor