domingo, 6 de marzo de 2016

Uso R-Estudio Como Herramienta Estadistica

RStudio

RStudio es un entorno de desarrollo integrado (IDE) para R (lenguaje de programación) . Incluye una consola, editor de sintaxis que apoya la ejecución de código, así como herramientas para el trazado, la depuración y la gestión del espacio de trabajo.
La satisfacción es inmensa al poder analizar datos que en una tabla nos pueden decir una cosa (intuición) y cuando son llevados a esta herramienta lo confirmamos como un procedimiento científico que nos permite hacer nuestras propias conclusiones con margenes de errores insignificantes.
Esta herramienta me permite recoger los datos con verdadero criterio y luego analizarlo para poder influenciar en las actividades de mi entorno educativo.
RStudio como herramienta  hace ser mas analista y critico de aquellas informaciones que me llegan constantemente y me llevan a preguntarme el por que de los resultados.
Desarrollando las actividades evaluable T2 y T3 en la Maestría Universitaria Tecnología, Aprendizaje y Educación (MUTAE) y pudiendo utilizar RStudio como herramienta para el análisis de los datos puedo decir sin temor a equivocarme que es sumamente importante emitir comentarios con carácter científico.
Es importante a la hora de realizar cualquier análisis de los datos estadísticos hacer las siguientes operaciones.
  1. Carga de datos
  2. Filtrado de datos
  3. Representación gráfica
  4. Regresión lineal
  5. Análisis de diferencias entre grupos mediante t-student



[BT01-BT02] Tarea evaluable T3

Unos investigadores desarrollan un nuevo entorno virtual de aprendizaje basado en Google Apps. Para evaluar la incidencia de la utilización de este nuevo entorno en las calificaciones de los estudiantes, durante dos años se realiza un estudio de caso con dos grupos de estudiantes: un grupo de control que utiliza Moodle y un grupo experimental que utiliza Google Apps; el reparto de sujetos entre ambos grupos se realiza siguiendo un criterio de paridad de sexo.

1.- Observando los datos y reflexionado acera de la relación existente entre las variables calificación, grupo y sexo. A continuación el proceso y los resultados

a)


b)


c)




2.- Gráfica de interacción en Excel de las medias de las calificaciones combinando las variables grupo y sexo, es decir:Moodle-Male, Moodel-Female, GoogleApps-Male, GoogleApps-Female


a)




b)


c)

3.- Analizando si existen diferencias estadisticamente significativas en las calificaciones en función del grupo y del sexo. A continuación mostramos los siguientes pasos:


a) Utilizando la herramienta R Estudio procedemos a analizar los datos, primero creamos las variables según áreas a analizar


Aqui podemos ver la media de las calificaciones según los virtuales de aprendizaje.




Como podrán observar resaltado en el cuadro color rojo la media por sexo son iguales




Aplicando t.test como herramienta podemos observar en la gráfica mas arriba y resaltada en el recuadro color rojo que conseguimos como resultado un p-value de 1.683e-06


Conclusión

Después   de   comparar   los   resultados    en  cada uno de  los  años   se  puede   ver, que el Año 1 los  estudiantes   de Google Apps, obtuvieron mejores   notas y en el Año 2 vemos que no  hubo diferencia  significativa entre  ambos grupos, por lo tanto concluimos que es necesario ver otros factores  que incidieron para que   no  haya  diferencia significativa para  este año.       











[BT01-BT02] Tarea evaluable T2

Unos investigadores desarrollan un nuevo entorno virtual de aprendizaje basado en Google Apps. Para evaluar la incidencia de la utilización de este nuevo entorno en las calificaciones de los estudiantes, durante dos años se realiza un estudio de caso con dos grupos de estudiantes: un grupo de control que utiliza Moodle y un grupo experimental que utiliza Google Apps. Ver análisis de estos datos:

PASO 1, Datos colocados en la hoja Excel para ser analizado de forma genérica.

PASO 2, Para poder analizar los datos anteriores procedo a cargar en la interfaz R estudio el fichero de datos desde la cuadricula superior derecha (ver área señalada)


PASO 3, A continuación se abre una ventana en cuya parte derecha se muestra, por un lado, el contenido del fichero de texto que deseamos cargar, y por otro lado, la estructura de datos que se va a cargar en R a partir de dicho contenido según las opciones indicadas en la parte izquierda de ventana. 


PASO 4 FILTRADO DE DATOS
Para filtrar los sujetos por tipo entorno, escribimos los siguientes comandos en la consola como se puede apreciar en el área destacada en color verde:

















5. ANÁLISIS DE DIFERENCIAS ENTRE GRUPOS MEDIANTE t-student

















Por lo tanto, la red personal de un estudiante que utilizó el entorno Google Apps es 1.0 veces más grande que la red de un estudiante que utilizó el entorno Moodle. Esto no parece una cifra significativa equivalente a un p-value de 0.007427.

Partiendo de este resultado y mi percepcion por las diferencias basada en las medias, ahora lo que interesa saber es en qué medida las diferencias observadas entre grupos se deben o no al azar, de esta forma podre confirmar si el entorno de aprendizaje es un entorno diferenciador o no a la hora de que los estudiantes obtengan mejores calificaciones y establezcan redes personales de mayor tamaño.

Me auxiliare de la herramiento T.test para saber si las diferencias observadas entre grupos en la calificación final y el tamaño de red personal son numéricamente y basada en estadística  significativas. 


















Finalmente

Se puede ver en la imagen que la media para los estudiantes que utilizaron (Notas Moodle):6.25, mientras que los estudiantes (Notas Google Apps) tienen una media de 7.25, lo que es una diferencia de 1.0 puntos sobre 100. Para comprobar si  es estadísticamente    significativa nos  fijamos   en el  p-value= 0.007427.

Concluimos diciendo  que los   estudiantes   que   usaron  Google Apps   obtuvieron  mejor notas.