efdeportes.com

Perfeccionamiento del programa de la asignatura análisis de datos 

en la carrera de cultura física con la inclusión del método 

Bootstrap para estimar resultados deportivos

Improvement of the program of the subject analysis of data in the career of physical 

culture with the inclusion of the Bootstrap method for to estimate sport results

 

*Profesor Auxiliar de la Facultad de Ciencias Técnicas

Máster en Matemática Aplicada

**Profesora Titular de la Facultad de Agronomía

Doctora en Ciencias, UNAH

(Cuba)

MSc. José Antonio Pino Roque*

pino@unah.edu.cu

Dra. C. Mayra Arteaga Barrueta**

mayra@unah.edu.cu

MSc. Yolanda Sabín Rendón*

yolanda@unah.edu.cu

MSc. Vilma Toledo Dieppa*

vilma@unah.edu.cu

 

 

 

 

Resumen

          Cada día se gana más en experiencias y en nuevas formas de trabajo en lo que al tema de la universidad cubana se refiere. La asignatura Análisis de Datos se imparte en 1er año (2º semestre) del curso regular diurno (CRD) para la carrera de Licenciatura en Cultura Física. Como parte del perfeccionamiento del programa de la asignatura y la actualización de los contenidos que se imparten, se introducen los contenidos relacionados con los métodos intensivos por ordenadores, haciéndose hincapié en el Bootstrap. Todo parte del trabajo metodológico ejecutado por un equipo de docentes, un programa perfeccionado a partir de ideas iniciales y la aplicación de una estrategia pedagógica que motive a los estudiantes para su utilización en el procesamiento de datos relacionados con la Cultura Física. El empleo del software STIMA versión 1.0 para obtener resultados fue de gran satisfacción para los estudiantes, lo cual permitió una interacción del alumno con lo que aprende e hizo más amena, dinámica y atractiva la actividad que conduce el docente ante los educandos.

          Palabras clave: Estadística. Método intensivo bootstrap. Cultura Física.

 

Abstract

          Every day it is won more in experiences and in new work forms in what refers to the topic of the Cuban university. The subject Analysis of Data is imparted in 1er year (2do semester) of the day regular course (CRD) for the career of Licentiate in Physical Culture. As part of the improvement of the program of the subject and the bring up to date of the contents that are imparted, the contents related with the intensive methods are introduced by computers, being made stress in the Bootstrap. Everything leaves of the methodological work executed by a team of educational, a sophisticated program starting from ideas initials and the application of a pedagogic strategy that it motivates the students for their use in the prosecution of data related with the Physical Culture. The employment of the software STIMA version 1.0 to obtain results were of great satisfaction for the students, that which allowed the student's interaction with what learns and he/she made more interesting, dynamics and attractive the activity that drives the educational one before the students

          Keywords: Statistic. Intensive Method Bootstrap. Physical Culture.

 

Recepción: 10/09/2015 - Aceptación: 14/11/2015

 

 
EFDeportes.com, Revista Digital. Buenos Aires, Año 20, Nº 210, Noviembre de 2015. http://www.efdeportes.com/

1 / 1

Introducción

    La asignatura Análisis de Datos se imparte en el 1er año (2º semestre) de la carrera de Licenciatura en Cultura Física, con un total de 80 horas, precedida por la asignatura de Computación, la cual sienta las bases para el desarrollo de habilidades en la PC y el manejo de software que serán de utilidad para el desarrollo del pensamiento lógico de los estudiantes y su posterior aplicación con los paquetes estadísticos profesionales. Este enfoque computacional ha permitido imprimirle a la asignatura un carácter netamente aplicativo enfocado en el aprendizaje más que en la enseñanza mediante un sistema de tareas que permitan al alumno dar solución a problemas escogidos por él, siempre en el ámbito de la Cultura Física.

    El Análisis de Datos se interrelaciona con el resto de las disciplinas de la carrera y es una valiosa herramienta para la solución de problemas vinculados con las cuatro esferas de actuación del profesional, lo cual contribuye al desarrollo integral que se pretende lograr en los futuros egresados. Esta asignatura constituye por sus contenidos un sistema investigativo dentro del departamento ya que cierra el ciclo con Metodología de la Investigación. Lo antes planteado constituye la fundamentación teórica de la asignatura en el Plan de Estudios.

    Uno de los problemas fundamentales de la Estadística es la estimación de parámetros de la población. En ocasiones, los investigadores cuentan con pequeños tamaños de muestras, las cuales son únicas o muy difíciles de aumentar por el alto costo que esto implica. Es aquí donde el Método Bootstrap da solución a la problemática planteada para la estimación de parámetros de la población.

    Claro está, para series de datos que no verifiquen las hipótesis de ajuste a una curva Normal, los resultados obtenidos por métodos estadísticos que si se fundan en ellos, son menos de fiar, de ahí, que los métodos intensivos por ordenador, pueden resolver la mayoría de los problemas sin necesidad de suponer que los datos siguen una distribución Normal. Poder prescindir de las hipótesis de la distribución Normal es ya todo un hito en Estadística y los nuevos métodos utilizando las máquinas computadoras, posibilitan la exploración numérica de las mismas, dando libertad al estadístico para abordar problemas más complejos, sacando partido de una amplia gama de instrumentos estadísticos.

    Tras un análisis metodológico del colectivo de la asignatura y de profesores con experiencias en la docencia de pregrado, se propuso incorporar al programa de la asignatura Análisis de Datos los contenidos relacionados con la estimación de parámetros a través del método intensivo por ordenador Bootstrap y el uso de un software para procesar los datos, quedando perfeccionada una parte de la asignatura con temas de actualidad. En este trabajo se pretenden exponer aspectos generales sobre los métodos intensivos por ordenadores y la propuesta de programa de la asignatura con algunas consideraciones sobre los cambios realizados.

Desarrollo

Los Métodos de Estimación o Intensivos por Ordenadores

    Durante todos estos años han surgido nuevos Métodos Estadísticos que sacan partido de la gran velocidad de los ordenadores digitales y se cuenta con equipos de computación con un hardware que realizan un millón de operaciones aritméticas, con una fantástica capacidad de cálculo que facilita la aplicación de los denominados Métodos Intensivos por Ordenador.

    Dentro de los Métodos de Estimación o Intensivos por Ordenadores se encuentran el Jackknife (navaja), Validación Recíproca, Replicación Repetida y Equilibrada, el Bootstrap y otros más; todos ellos se apoyan en la utilización de los ordenadores.

    Bradley Efron en 1977 propone un método denominado Bootstrap, traducido como “autodocimante”, de muy sencilla descripción, pero imposible de utilizar en ese momento por la carencia de computadoras como las de hoy en día y debido al gran volumen de cálculo que es necesario realizar. El nombre de este método alude al viejo chiste de izarse a uno mismo tirando hacia arriba de los cordones de las botas y refleja el hecho de que a partir de una sola muestra, sin más ayuda, se generan otras muchas, de aquí que refleja la autosuficiencia del método (Peña, 1994). Este método también se conoce con el nombre de esfuerzo propio (Burquete y Burquete, 1990). El término de dócima o docimasia fue introducido por Cansado (1970), quien lo explica y justifica en su introducción a la famosa obra de H. Cramer “Métodos matemáticos de Estadística”.

    Este método autodocimante se ha aplicado en muchos problemas para los cuales la variabilidad de un estadístico no puede expresarse analíticamente.

    Diaconis y Efron (1990) plantean que investigaciones teóricas realizadas por Beran, Bickel y Freedman de la Universidad de California, en Berkeley; Singh de la Universidad de Rutgers y, Diaconis y Efron de la Universidad de Stanford, muestran que para la amplia gama de estadísticos, el intervalo de confianza asociado a la distribución Bootstrap y el asociado con la distribución de muestras reales poseen casi iguales amplitudes.

    Un problema típico en la estadística aplicada es la estimación de un parámetro desconocido . Todo investigador siempre se pregunta: ¿qué estimador se debe utilizar? y de haber utilizado en la selección un particular, ¿cuán seguro es este como estimador de ?

    El Bootstrap es una metodología general para responder la segunda pregunta (Efron y Tibshirani, 1985). Es un método que se basa en el uso de la computadora. El Bootstrap puede responder preguntas, las cuales son mucho más complicadas de responderlas a través del análisis tradicional estadístico.

    Según Efron (1982) trabajos teóricos realizados por él, ponen de manifiesto que la medida autodocimante de la precisión estadística proporciona resultados fiables en un abanico de situaciones muy amplio.

    El Bootstrap se diferencia del enfoque tradicional paramétrico en que emplea un gran número de cálculos repetitivos para estimar la forma de la distribución muestral del estadístico. Según Efron y Tibshirani (1993), este método puede considerarse como un tipo especial de simulación denominada simulación basada en datos, esto es, simulación a partir de una estimación de la población basada en los datos.

    El Método Bootstrap se ha ensayado en diferentes problemas (donde se conoce la respuesta exacta). Las estimaciones que proporciona son en este tipo de problemas suficientemente buenas y puede demostrarse matemáticamente que el método funciona igualmente bien en problemas similares. Luego, pueden ser diversos los problemas, donde se aplique el método autodocimante. Lo que en mucho de ellos se requiere, sin embargo, es una justificación teórica independiente de que la estimación autodocimante de la precisión estadística sigue siendo tan válida como lo era en problemas sencillos (Efron, 1981; Lepage y Billard, 1992).

    El método Bootstrap se usa para aproximar la distribución de los estimadores de los parámetros. Muchos autores (Lal, Pérez y Wertz, 1987; Pino 2000; y Pino, Arteaga, Sabín, García, Torres y Quintero, 2007) plantean que el mayor uso ha estado en la estimación de la media y la desviación estándar, además en la obtención de intervalos de confianza.

    Este método requiere de la utilización de ordenadores potentes para lograr programar un algoritmo práctico que permita correr datos y almacenar muestras ficticias, las que serán utilizadas para su procesamiento estadístico. En las bibliografías consultadas no aparecen orientaciones específicas sobre la creación de un algoritmo que pueda ser utilizado para la programación en un lenguaje de programación, lo mismo ocurre con los paquetes estadísticos consultados, como el SAS, Statgraphics Plus, SPSS y Statistics, ninguno hace referencia a dicho método autodocimante.

    Para facilitar el procesamiento de la información a través del método Bootstrap se confeccionó el sistema Stima en su versión 1.0. Este software brinda la posibilidad de obtener los estimadores más importantes de los parámetros poblacionales, utilizando el Método Intensivo por Ordenador Bootstrap. Es de muy fácil manejo por estar programado sobre ambiente Windows, lo que permite una buena interacción usuario-máquina. (Pino, Arteaga, Sabín y García, 2003)

    El desarrollo del sistema automatizado Stima versión 1.0 para el procesamiento del Método Intensivo por Ordenador Bootstrap cumple con los requerimientos del método, el cual puede ser utilizado para obtener parámetros bootstrap (media bootstrap , varianza bootstrap , desviación estándar bootstrap , coeficiente de variación bootstrap ).

2.     Programa analítico para la asignatura Análisis de Datos en la carrera de Cultura Física

    La asignatura Análisis de Datos se introduce en la carrera de la Licenciatura en Cultura Física; en los años 73-74, bajo la denominación de Estadística con el fin de facilitar al alumno el procesamiento y análisis de bases de datos proveniente de su futura actividad profesional.

    El Análisis de Datos se interrelaciona con el resto de las disciplinas de la carrera y es una valiosa herramienta para la solución de problemas vinculados con las cuatro esferas de actuación del profesional, lo cual contribuye al desarrollo integral que se pretende lograr en los futuros egresados. Esta asignatura constituye por sus contenidos un sistema investigativo dentro del departamento ya que cierra el ciclo con Metodología de la Investigación. Lo antes planteado constituye la fundamentación teórica de la asignatura en el Plan de Estudios.

    En el documento base del Plan de Estudio D (MES, 2003) se exponen las características principales que deben tener en cuenta para las transformaciones en este nivel, por las disciplinas y asignaturas. De todo un análisis detallado de este documento, se propuso un programa para esta asignatura optativa, se perfeccionó durante varios años y a continuación se brindan los aspectos generales (objetivos generales educativo e instructivos y plan temático), objetivos, conocimientos, habilidades (por temas, tipo de clase y evaluaciones), bibliografía de estudio, indicaciones metodológicas (y de organización) y los a lograr en nuestros educandos a través de esta asignatura.

Objetivo general de la asignatura

  • Aplicar en su actividad profesional conocimientos y actitudes orientadas al procesamiento y análisis de bases de datos vinculadas al proceso pedagógico de la actividad física, mediante el empleo de técnicas estadísticas y el auxilio de paquetes estadísticos computacionales, elevando con ello sus habilidades profesionales en el área de la Cultura Física.

Sistema de conocimientos

    La ciencia y la investigación. La información científica. Búsqueda, tratamiento, utilización y comunicación de la información científica. La investigación científica. La investigación en la actividad concreta de un profesional de la cultura física. El maestro (profesional) investigador. El cálculo aritmético, algebraico y geométrico elemental. Ecuaciones y funciones. Las variables. Tipos de variables y su medición. Datos. Base de Datos. Nuevas Tecnologías de la Información. Análisis Exploratorio. Probabilidad. Análisis confirmatorio.

Temas del programa

    En el programa de la disciplina se declaran como invariantes el Análisis Exploratorio, la Probabilidad y la Docimasia de Hipótesis. Una precisión de los contenidos en el programa lo constituyen estos temas. A continuación se relacionan los objetivos y contenidos por temas, así como el total de horas a utilizar en cada uno de ellos, para el caso de la variante presencial es de 80 horas.

Tema I. Análisis Exploratorio (20 horas)

Objetivo general

  • Establecer hipótesis estadísticas basadas en los objetivos del problema planteado y la estructura de la base de datos.

Contenidos del Tema I

  • Sumatorias. Escalas de Medición. Estadígrafos de posición y dispersión. Tabla de Frecuencias e Histograma. Diagrama de Caja y Bigotes.

Tema II. Probabilidad y variable aleatoria (10 horas)

Objetivo general

  • Familiarizarse con la base teórica necesaria para la docimasia de hipótesis.

Contenidos del Tema II

  • Fenómeno Aleatorio. Probabilidad. Variable Aleatoria. Clasificación de la variable aleatoria. Función de probabilidad densidad. Características numéricas de las Variables Aleatorias. Independencia Estadística. Distribuciones: Normal, X², T-student , Fischer.

Tema III. Dócimas (50 horas)

Objetivo general

  • Discriminar las dócimas a utilizar de acuerdo a los objetivos investigativos del problema, la estructura de los datos y las premisas de la dócima. Realizar las conclusiones en el proceso de la docimasia.

Contenidos del Tema III

  • Estimación puntual y por intervalos de confianza. Métodos intensivos por ordenadores. Concepto de distribución muestral. Hipótesis nula y alternativa. Errores. Dócimas paramétricas y no paramétricas.

Sistema de actividades principales a dominar

  • Determinar la Escala de Medición en que se encuentra una prueba y/o variable, cuya naturaleza sea conocida.

  • Saber importar los ficheros EXCEL a un Paquete Estadístico Computacional.

  • Dada una base de datos vinculada al proceso pedagógico de la actividad física.

    • Realizar la descripción estadística mediante tablas y gráficos de acuerdo a los objetivos investigativos y las características de las variables.

    • Representar mediante tablas resúmenes los resultados obtenidos, en la docimasia de las hipótesis planteadas.

    • Estimar e interpretar valores poblacionales a partir de resultados muestrales.

  • Dado un problema sencillo en la Cultura Física tomar decisiones y realizar las conclusiones de acuerdo a los objetivos Investigados planteados y la escala de las pruebas y las dócimas empleadas en el tratamiento del problema.

  • Expresar de forma oral y escrita los resultados obtenidos.

Orientaciones metodológicas y organizativas. Generales

  • El desarrollo en torno a la solución de problemas planteados por el alumno, que conduzcan al procesamiento y análisis de una base de datos provenientes de la Educación Física, el Deporte, la Recreación o la Rehabilitación, propiciando con esto la integración de los componentes académico, laboral e investigativo. Se propiciará el trabajo en equipos, de acuerdo a las condiciones existentes.

  • No debe limitarse el análisis de bases de datos cuya estructura y objetivos rebasen las dócimas planteadas en el programa ya que esto incrementará el adquirir conocimientos y habilidades independientes y el proceder creativo de los alumnos.

  • Las bases de datos donde se planteen tres o más repeticiones (momentos), en las mediciones de las variables es recomendable utilizar la vía Multivariada, debido a que, en este modelo, las premisas de la simetría compuesta y de la esfericidad no es usual que se cumplan, siendo necesarias para la validez del enfoque Univariado.

  • Fomentarse el rigor y la estética en la presentación de los resultados.

  • Será propósito permanente la utilización en todas las actividades docentes fuera y dentro del horario de clases, los métodos participativos de enseñanza.

  • La asignatura ofrece de por sí, un campo fértil para la aplicación de los programas directores de computación y formación científica, deberá trabajarse muy vinculados con los mismos de manera consecuente al semestre en que se cursará la asignatura.

  • Impulsar a los alumnos para la presentación de los trabajos en eventos científicos.

  • Uno de los objetivos de la asignatura es tratar de incentivar al estudiante con el medio ambiente, dirigiendo la actividad hacia un proceso docente sostenible. En una primera aproximación se tratará de que los problemas tratados en la asignatura, tengan un acercamiento hacia el medio ambiente, de forma tal que se considere no solo el aspecto del desarrollo Científico Técnico, como categoría independiente sino contextualizar a la misma mediante su inserción en la naturaleza y al hombre incidiendo en ella, de la forma más armoniosa posible. Para ello se utilizarán todos los momentos posibles. Particular hincapié se hará en el ahorro de recursos, el tiempo y el rigor, pero enfocado hacia el cuidado del hombre y del medio ambiente.

Indicaciones metodológicas por temas

Tema I. Análisis Exploratorio

  • Se sugiere iniciar el curso con una conferencia orientadora donde sean abordados los siguientes aspectos:

    • Relación de la asignatura con las asignaturas del año, del ejercicio de la profesión y en su futura actuación como profesional.

    • Orientación del trabajo de curso, su connotación y posibles particularidades. Responsabilidad que se asume en su realización.

    • Sistema de evaluación de la asignatura

  • Planificar encuentros periódicos con el fin de establecer una convergencia entre las propuestas planteadas por el alumno en cuanto al trabajo de curso y las características que se pretenden del mismo. Estos encuentros permitirán al docente tener una visión de las posibles dócimas a ser utilizadas en los trabajos por alumno y grupos de alumnos.

  • Se realizara un taller previo al trabajo de control como forma de aclaración de dudas para la evaluación.

  • Finalizar este tema con una evaluación a la que se le asigne un peso distintivo y en donde el alumno exponga los resultados alcanzados y la futura continuación del mismo.

Tema II. Probabilidad y variable aleatoria

  • Debe tenerse en cuenta que la premisa fundamental en el Tema Probabilidad y Variable Aleatoria es de servir de soporte teórico al tema siguiente, por lo que se tratará en la medida de lo posible, que los contenidos y la ejercitación estén enfocadas solamente con respecto al futuro trabajo en la docimasia de hipótesis.

  • Tarea extraclase donde se pondrán ejercicios vinculados a la Cultura Física para evaluarse de forma individual o por equipos.

Tema III. Docimasia de hipótesis

  • Se recomienda que los contenidos referentes a distribuciones muestrales, deban tener la misma tónica que los referidos en el tema II, esto es, garantizar un mayor entendimiento de la base teórica para la docimasia de hipótesis.

  • Resultará de suma importancia la preparación cuidadosa de la primera clase, en el tema de la docimasia de hipótesis estableciendo una interrelación con los dos temas anteriores.

  • Es importante la introducción del concepto de estimador insesgado y eficiente, así como el tratamiento a la estimación de parámetros poblacionales a partir de estadígrafos obtenidos con el trabajo de las muestras. Los métodos intensivos por ordenadores (Bootstrap) será otra opción.

  • Ser cuidadoso en el tratamiento de las premisas de las dócimas, lo que dará campo propicio para la utilización de las llamadas dócimas no paramétricas.

  • El desarrollo de talleres para el control y subsanación de errores para el trabajo final.

Valores a formar a través de la asignatura

  • Responsabilidad: Presentación y entrega en tiempo y forma de las actividades en el sistema de tareas.

  • Rigor: Selección adecuada y sólidos criterios en las técnicas empleadas, de acuerdo a las características de las Bases de Datos. y los objetivos propuestos.

  • Honestidad: Desterrar el falseo de la información primaria y presentar resultados veraces.

  • Creatividad: Al tener abierta todas las opciones para exhibir su poder creativo en el procesamiento, análisis y presentación de resultados.

  • Estética: Mediante la presentación de los trabajos con un nivel estético adecuado.

  • Crítica y autocrítica: En el proceso de presentación de los resultados ante las valoraciones de profesores y compañeros de clase, respeto hacia sus compañeros.

  • Cooperación: Entre los integrantes del equipo, en el aula.

  • Laboriosidad: Necesidad de sistematizar el trabajo con vistas a la entrega de tareas.

  • Cuidado del Medio Ambiente: Realizar procesamientos efectivos que propicien el ahorro de energía para contribuir a la durabilidad de los medios de cómputo disponibles.

    La asignatura es muy apropiada para el desarrollo de valores ya que se imparte en el primer año de la carrera, integrada a la disciplina contribuye a lograr en el futuro egresado una formación basada en el compañerismo la solidaridad el internacionalismo y el patriotismo, la relación que establece su actividad profesional cotidianamente pone de manifiesto una conducta de defensa de los principios ideopolíticos de nuestro proyecto social y del deporte revolucionario.

    Esta brinda herramientas para la vida profesional del licenciado en Cultura Física transformando, dentro de sus posibilidades, la realidad en que vive y se desarrollan en sus respectivas escuelas, centros de entrenamiento y comunidades en general y también en otros países que soliciten ayuda al nuestro, sobre la base de la consideración del hombre como un ser social único, contribuyendo con ello al desarrollo armónico del ser humano como centro de la biodiversidad.

    Para contribuir al desarrollo de los valores señalemos que esta tarea es responsabilidad de los diferentes profesores de la asignatura y del colectivo pedagógico del 1er año en general, sin perder de vista que se está formando a un único hombre y en el sistema de influencias que se ejerce sobre él, en este proceso de formación, debe existir coherencia entre todos los que participan en dicho proceso. Debe ser utilizado, además, un lenguaje común para facilitar la comprensión y adquisición de la terminología correspondiente y el empleo de métodos, procedimientos, contenidos y las formas más adecuadas para el trabajo educativo de acuerdo con los intereses y las características de los grupos.

Conclusiones

    Como resultados importantes de este trabajo se tiene que:

Bibliografía

Otros artículos sobre Educación Física

www.efdeportes.com/

EFDeportes.com, Revista Digital · Año 20 · N° 210 | Buenos Aires, Noviembre de 2015
Lecturas: Educación Física y Deportes - ISSN 1514-3465 - © 1997-2015 Derechos reservados