efdeportes.com
La Teoría de Respuesta al Item (TRI) en
la construcción de cuestionarios
en Psicología del Deporte

   
Universidad de Málaga
(España)
 
 
Antonio Hernández Mendo
mendo@uma.es  
Verónica Morales Sánchez
vomorales@uma.es  
Josefina Maíz Rodríguez
finamai@hotmail.com
 

 

 

http://www.efdeportes.com/ Revista Digital - Buenos Aires - Año 10 - N° 80 - Enero de 2005

1 / 1

    El uso de la metodología selectiva en Psicología es muy frecuente, los instrumentos mas utilizados en la investigación social son los elaborados en esta metodología. Al usar el concepto de Metodología Selectiva nos referimos a la adecuada selección de sujetos y variables, que, permite apuntar a la representatividad como la condición sine qua non de esta metodología (Delgado y Prieto, 1997).

    La Metodología Selectiva presenta una serie de características que le otorgan ventaja sobre otras metodologías, siguiendo a Anguera (2003) las podemos estimar en cinco características principales:

  1. La primera característica está referida a la elicitación de la respuesta, que implica la formulación de preguntas directamente a los sujetos seleccionados.

  2. La segunda característica sería el uso de instrumentos semi-estandarizados o estandarizados. Los instrumentos que se utilizan básicamente en metodología selectiva son: entrevista, cuestionario y pruebas estandarizadas (tests).

  3. El investigador selecciona las variables que le interesan. Estas variables (antecedente o predictora), de forma general, suelen tener la finalidad de conocer la relación que ejercen sobre otra variable (consecuente o criterio).

  4. Se intenta descubrir la posible relación de covariación existente entre las variables.

  5. La metodología selectiva es preferentemente nomotética, con la excepción de la entrevista. "La metodología selectiva se aplica extensivamente a un colectivo de individuos, en una amplia cobertura, pero desde un punto de vista intensivo se mantiene en una posición moderada en cuanto a la 'profundidad' de las respuestas" (Anguera, 2003).

    El uso de la metodología selectiva resulta adecuado cuando queremos generalizar los hallazgos de una muestra a una población o para obtener información con menor coste y mas facilidad de lo que se obtendría a través de otras fuentes.

    La Teoría de Respuesta al Ítem es uno de los campos con mayor proyección dentro del ámbito de la medida psicológica y de la educación. Lord (1980) señala que la Teoría de Respuesta al Ítem (TRI) no contradice las asunciones fundamentales de la Teoría Clásica de los Test (TCT) sino que hace asunciones adicionales que permitirán responder a las cuestiones que la TCT no podía.

    Aunque la TRI se muestra como un método capaz de enfrentarse a estas deficiencias o problemas planteados en la TCT, la facilidad conceptual y sencillez del cálculo hacen que hoy día siga siendo más atractivo y frecuente el uso de la TCT (Hamblenton y Jones, 1993).

    La TCT y la TRI son modelos que teóricamente se solapan para entender el funcionamiento del test más que competir entre ellos (Huling, Drasgow y Parsons, 1983b). La TRI hace suposiciones más fuertes que la TCT, en particular la suposición de la independencia local y la suposición de relaciones logísticas entre las contestaciones de los ítems y los rasgos subyacentes.

    Los modelos de la TRI tienen ventajas significativas sobre los modelos de la TCT, particularmente cuando estos tienen en cuenta la inclinación del test, haciendo diferencias en cuanto al género o la raza (Hambleton, 1989; Lord, 1980). Los conceptos claves de la TCT incluyen dificultad del ítem (proporción de participantes con una puntuación positiva o acertada) discriminación del ítem (la correlación del ítem con el resto del test), fiabilidad alpha, y los cortes óptimos son todos dependientes de las características de la muestra.

    El principal problema de la TCT es la invarianza de la medida, como apuntaba Thurstone (1928): "(...) las mediciones de un instrumento de medida deben ser independientes del objetos medidos", este inconveniente se refleja en dos problemas concretos (Bejar, 1983; Hamblenton y Swaminathan, 1985 y Muñiz, 1997):

  1. la medición de las variables psicológicas no es independiente del instrumento que se utiliza para medirla;

  2. las propiedades de los instrumentos no son independientes de los sujetos a los que se aplican.

    Esto tiene repercusiones cuando se pretende establecer equivalencias entre las puntuaciones de dos test diferentes que midan una misma variable, este es otro de los problemas de la Teoría Clásica de los Test. La TCT parte del supuesto de considerar la mayor parte de los casos de un test como una muestra seleccionada de un universo de ítems equivalentes unos a otros, que permiten ser considerados indicadores similares del constructo que medimos, de ahí que se pueda utilizar como procedimiento de puntuación la acumulación de puntos, lo que lleva a otra limitación de esta teoría, ya que una misma puntuación en un test puede deberse a distintos patrones de respuesta, y haciendo uso de la TCT no podemos analizar las interacciones entre los sujetos y los ítems, además el presuponer que todos los ítems son equivalentes implica que todos los sujetos utilizan las mismas operaciones mentales y para todos los ítems, el problema está en que no se tienen en cuenta las diferencias individuales ni la diferencia de dificultad de los ítems. Otra limitación que encuentra la TCT se debe a la fiabilidad del instrumento de medida, según esta teoría, la fiabilidad se reparte por igual a lo largo del test pero desde otros modelos se ha podido comprobar que no se mide con la misma fiabilidad en los distintos niveles de la variable.


Figura 1. Desventajas de la Teoría Clásica de los Test.

    Todas estas limitaciones y problemas impulsan el surgimiento de nuevos modelos, algunos de ellos no eran más que extensiones del modelo lineal de Spearman asumido en la TCT (como la Teoría de la Generalizabilidad) y otros surgen enmarcados dentro de un nuevo marco teórico, entre los que destaca la Teoría de Respuesta al Ítem (TRI), que permitirá solventar las limitaciones de la Teoría Clásica de los Test (Bejar, 1983; Hamblenton y Van der Linden, 1982; Martínez Arias, 1995 y Muñiz, 1996), aunque esta teoría no es reciente, su expansión se produce a partir de los años 80 con la difusión de los ordenadores, una herramienta que será imprescindible debido a la complejidad de los cálculos matemáticos.

    La TRI tiene como objetivo obtener mediciones que no varíen en función del instrumento utilizado, disponer de instrumentos de medida que no dependen de los objetos medidos, es decir, que sean invariantes respecto a los sujetos evaluados y avances técnicos como funciones de información de los ítems y del test, errores típicos de medida diferentes para cada nivel de la variable medida y el establecimiento de bancos de ítems con parámetros estrictamente definidos.

    Los modelos basados en la TRI relacionan a sujetos e ítems de modo interactivo lo que permite localizar al mismo tiempo en un continuo psicológico que representa a la variable a sujetos e ítems, el proceso de medición se puede representar como la localización de personas e ítems en una línea recta (Wright y Stone, 1979; Wright y Master, 1982). Así, la posición de las personas en la línea dependerá de sus respuestas a los ítems del test, del mismo modo los ítems tendrán distintas localizaciones dependiendo de su nivel de dificultad.

    El concepto básico de la Teoría de Respuesta al Ítem es la Curva Característica del Ítem (CCI), que es la función matemática que relaciona la probabilidad de acertar el ítem con la competencia del sujeto, (P ( ) con ( )). Se denomina CCI porque cada ítem se caracteriza por su curva.

    La principal diferencia con la TCT la encontramos en esta Curva Característica del Ítem, mientras que la TRI va a centrarse en las propiedades particulares de cada ítem, la TCT se dirige a las propiedades de la puntuación global en un test (X). La Curva Característica del Ítem es la probabilidad de acertar un ítem que solo depende de los valores de la variable medida por el ítem, de modo que los sujetos con distinta puntuación en la variable tendrá distintas probabilidades de superar un determinado ítem (Muñiz, 1997).

    En el eje de abscisas se representan los valores de la variable que mide el ítem y el eje de ordenadas la probabilidad de acertar el ítem (P ( )), de modo que la (P ( )) variará dependiendo de los valores de ( ) (nivel de competencia). A mayor nivel de competencia mayor probabilidad de acertar el ítem.

    Análisis cuidadosos del trazo de estas líneas pueden ayudar al menos de tres modos. Primero, pueden ayudar en la eliminación de ítems que no proporcionan información significativa sobre el rasgo de interés. Segundo, puede ser usado para seleccionar ítems que proporcionen la máxima discriminación en el rasgo. Tercero y quizás el de mayor significación, se pueden usar para identificar ítems prejuiciosos o, en la terminología más neutral de la TRI, función diferencial del ítem (DIF). La función diferencial del ítem ocurre cuando éste es más discriminativo, es más difícil o es más extremo en un grupo donde es comparado con otro: el que se consideren cuidadosamente el trazo de las líneas puede ayudar detectar prejuicios raciales, de género, etc., en un test.

    Aunque presente semejanzas, la CCI no es la regresión ítem-test (que consiste en hacer corresponder los valores del test con las proporciones de aciertos en un determinado ítem). Siguiendo a Muñiz (1997) podemos decir que la principal diferencia de la CCI y la regresión ítem-test es que en la CCI la variable que miden los ítems ( ) no es la puntuación que sacan los sujetos en ese test, aunque existe una relación, se podría decir que las puntuaciones de los sujetos en un test son una estimación del nivel de competencia pero no constituyen la escala .

    La CCI nunca podría ser una recta porque esto implicaría que para determinados valores del nivel de competencia ( ) existe una (P( )) negativa o mayor a 1, lo que es incompatible con los axiomas de la probabilidad, que establece su valor entre 0 y 1. De igual modo no podría tener una de ángulo recto porque los cambios en los seres humanos no se producen de forma brusca en un punto concreto. De modo, que generalmente estas curvas adoptan forma de S, que quiere decir que el cambio de fallar a acertar es gradual, esta curva se define a partir de tres parámetros: 1) parámetro a o índice de discriminación, 2) parámetro b o índice de dificultad y 3) parámetro c o probabilidad de acertar un ítem al azar.

    Los distintos modelos de CCIs están en función de los valores que adopten estos tres parámetros, adoptando una determinada función matemática para cada curva. A medida que se ubican más a la derecha en el eje de las abscisas significa que los ítems son más difíciles, ya que "b" aumenta.

    Otro supuesto que la TRI asume implícitamente en su formulación es la unidimensionalidad. Si el modelo es correcto, la probabilidad de acertar un ítem únicamente dependerá del nivel de competencia del sujeto, es decir, al tener los ítems y los sujetos valor en una única dimensión la respuesta a los ítems esta determinada fundamentalmente por el nivel de los sujetos en la variable.

    Para la comprobación de la unidimensionalidad de los ítems se someten a análisis factorial y se descartan los ítems que conforman factores periféricos, lo mismo se hace en análisis posteriores, hasta lograr un análisis en el que un factor explique la mayor parte de la varianza de los ítems (lo ideal seria encontrar un factor que la explique toda, algo que raramente ocurre).

    Por último, el cumplirse el supuesto de unidimensionalidad implica matemáticamente que existe independencia local entre los ítems, es decir, para un sujeto con un determinado nivel en el rasgo (unidimensionalidad) la respuesta a un ítem no esta asociada con las respuestas a los demás ítems. Así, puede expresarse la independencia local como la probabilidad de que un sujeto acierte un ítem es igual al producto de las probabilidades de acertar cada uno de ellos.

    Según el número de parámetros que se tengan en cuenta se hablara de un modelo u otro dentro de la TRI. Actualmente, los modelos más utilizados en la TRI son el modelo logístico de un parámetro, el logístico de dos parámetros y el logístico de tres parámetros. En el presente artículo se aborda únicamente el modelo logístico de un parámetro, el modelo de Rasch, este modelo es el más popular dentro de los modelos de la TRI, debido principalmente a su sencillez.

    En 1960 el matemático George Rasch propuso un modelo que permite solventar las deficiencias de la TCT, de modo que se construyeran pruebas más adecuadas y eficientes. Este modelo, conocido como el Modelo de Rasch, se fundamenta en:

  1. el atributo que se desea medir puede representarse en una única dimensión donde se sitúan conjuntamente ítems y personas.

  2. que el cociente entre la probabilidad de la respuesta correcta y la probabilidad de la respuesta incorrecta a un ítem es la función de la diferencia en el atributo en el nivel de la persona y el nivel el ítem. Así, cuando una persona responde a un ítem en su nivel de competencia, tendrá la misma probabilidad de dar una respuesta correcta que incorrecta, por lo que la dificultad del ítem será equivalente al nivel de competencia del sujeto. Del mismo modo, cuando la probabilidad de dar una respuesta correcta es mayor que la de dar una incorrecta la competencia del sujeto será mayor que la requerida por el ítem.

    El modelo de Rasch es un modelo sencillo y de fácil aplicación, que al representar en una única dimensión a sujetos e ítems, nos permite hallar la dificultad de los ítems y la probabilidad de que estos sean contestados con éxito. La localización del punto 0 de la escala es arbitrario, Rasch suele situar la dificultad media de los ítems en el punto 0, de modo que interpretar los parámetros de los sujetos (nivel de competencia) es bastante sencillo ya que si estos valores son mayores a 0 indican en una alta probabilidad de responder a los ítems de dificultad media.

    Los parámetros con el modelo de Rasch se estiman con el método de máxima verosimilitud, que consiste en determinar los parámetros que hacen más probable las respuestas observadas. En la estimación condicional se calcula la probabilidad de las respuestas observadas a los ítems para cada puntuación conjunta de los parámetros de los sujetos (nivel de competencia), asignándole a cada persona el valor del parámetro más probable para su patrón de respuesta. Este valor de estimador de máxima verosimilitud se calcula en el ordenador mediante el uso de programas Acer ConQuest (Wu, Adams & Wilson, 1998).

    El modelo de Rasch (1960), de entre los posibles en la TRI, destaca porque sobre otros modelos por una serie de características:


Figura 3.3. Características del modelo de Rasch.
  1. La medición conjunta, los parámetros de personas e ítems se expresan en las mismas unidades y se localizan en el mismo continuo, de lo que se deduce que: a) no todos los ítems miden la misma cantidad del constructo (por lo que, no se mantiene el supuesto de invarianza de los ítems defendida por la TCT) y b) la interpretación de las puntuaciones no se fundamentan en las normas del grupo, sino en la identificación de los ítems que la persona tiene una alta o baja probabilidad de resolver correctamente, así, si los sujetos tienen un nivel alto de competencia, se estimaran con mayor precisión los parámetros de los ítems difíciles.

  2. Objetividad específica (Rasch, 1977), una medida solo puede ser considerada válida y generalizable si no depende de las condiciones específicas con la que ha sido obtenida. Así, la puntuación de las personas no dependen de los ítems administrados.

  3. Propiedades del intervalo, a diferencias constantes entre sujetos e ítems le corresponde la misma probabilidad de una respuesta correcta, la métrica intervalar tiene gran importancia por ser condición necesaria para realizar análisis paramétricos (análisis de varianza, regresión, etc.) y por que garantiza la invarianza de las puntuaciones diferenciales a lo largo de un continuo.

  4. Especifidad del error típico de medida que permite cuantificar la cantidad de información con la que se mide en cada punto de la dimensión y seleccionar los ítems que permiten incrementar la información en regiones del atributo previamente especificada. Esto es una diferencia con la TCT supone que los test miden con la misma fiabilidad en todas las regiones de la variable, supuesto que desde otros modelos ha sido rechazado.


Un ejemplo en Psicología del Deporte

    En esta línea ya han sido publicados -en esta misma revista- otros trabajos (Maíz Rodríguez, 2004), acerca de la adaptación y baremación de cuestionario violentos. En este ejemplo, y entresacado del trabajo de Morales Sánchez (2004), vamos a considerar el análisis de dos escalas utilizadas para la evaluación de programadas de actividad física.

    Vamos a presentar un proyecto de optimización de las escalas utilizadas en la investigación de Morales Sánchez (2004), siguiendo para ello el trabajo de Prieto y Delgado (2003). En el ámbito de la Psicología -como se señalo anteriormente-, tradicionalmente, la construcción de escalas ha estado basada en la Teoría Clásica de Test (TCT). Esta teoría ha pesar de su sencillez, flexibilidad y difusión está repleto de limitaciones (Embretson y Hershberg, 1999). Una repuesta a estas limitaciones es el modelo propuesto por Rasch (1960).

    El modelo de Rasch (1960) es una de las propuestas dentro de la Teoría de Respuesta al Ítem (TRI). El modelo de Rasch (1960), tiene las siguientes características (Prieto y Delgado, 2003):

  1. El constructo que se pretende estimar puede representarse en una única dimensión, escalándose personas e ítems.

  2. Cuando un sujeto responde a un ítem equivalente a su umbral de competencia, la respuesta tiene la misma probabilidad para una respuesta errónea que para un acierto. Si la probabilidad de una respuesta correcta es mayor que la de una respuesta incorrecta, la competencia del sujeto será mayor que la requerida por el ítem. Por el contrario si la probabilidad de una respuesta correcta es menor que la incorrecta, la competencia del sujeto será menor que la requerida por el ítem.

  3. La localización del punto cero de la escala es arbitrario. En este modelo se suele situar en el punto en la dificultad media de los ítems.

  4. A pesar de que la escala está expresada en un logaritmo natural, es frecuente que sea multiplicado por la constante 1,7 con el fin de conseguir una distribución normal con media cero, desviación típica igual y un rango de distribución entre +/-3.

  5. El concepto de la TCT de fiabilidad es similar al de "Función de información del test" (TI), siendo el error típico de medida (SE) una función inversa al TI.

  6. Siguiendo el trabajo de Prieto y Delgado (2003), el modelo de Rasch (1960) presenta una serie de ventajas como son:

(a). Los sujetos y los ítems se expresan en las mismas unidades y se localizan en el mismo continuo. Esta propiedad le confiere un sentido más realista al modelo de Rasch (1960) que a la TCT acerca de la invarianza de los ítems, parece obvio que no todos los ítems estiman la misma cantidad de constructo.

(b). La propiedad expresada en el punto anterior además dota a este modelo de una gran riqueza diagnóstica al permitir analizar la interacción entre los ítems y los sujetos. La interpretación no se basa en normas de grupo sino en la identificación de los ítems que la persona tiene una alta o baja probabilidad de resolver correctamente.

(c). Rasch (1977) denominó objetividad específica, cuando la diferencia entre dos personas en un atributo no depende de las condiciones específicas con las que han sido obtenidas las medidas. Igualmente la diferencia entre dos ítems no depende de las personas específicas que se utilicen para cuantificarla. Si los datos se ajustan al modelo, las comparaciones entre personas son independientes de los ítems administrados y las estimaciones de los parámetros de los ítems no estarán influencias por la distribución de la muestra que se usa para la calibración.

(d). En este modelo sus escalas de medida tienen las características de las escalas de intervalo, esto es, a diferencias constantes entre sujetos e ítems le corresponde la misma probabilidad de respuesta correcta. Esta característica es de enorme valor pues permite usar con rigor los análisis paramétricos.

(e). La TCT asume que los tests miden con la misma fiabilidad en todas las zonas del constructo o variable. El modelo de Rasch no asume este supuesto tan poco verosímil, sino que permite cuantificar la cantidad de información con la que se mide en cada punto de la dimensión.

    En este epígrafe se presentan los resultados de un análisis de TRI bajo los supuestos del modelo de Rasch (1960). Para realizarlo se ha procedido a una recategorización de los resultados de las escalas a fin de convertirlos en respuestas dicotómicas. Los análisis han sido realizados con el programa informático QUEST (Adams y Khoo, 1996).

    A continuación aparecen los resultados de la Escala1 denominada "Respecto al profesor" del Inventario de Calidad en Programas de Actividad Física I.C.P.A.F. (Hernández Mendo, 2002). De estos resultados podemos considerar que la escala tiene una estructura adecuada y que sería conveniente, con el fin de simplificarla, eliminar de entre los ítems 3, 5 y 12, dos de ellos, ya que como indican los resultados estos tres ítems estiman la misma parte del constructo. También sería conveniente modificar o eliminar el ítem 7 ya que su INFIT es mayor de 1.30.

Análisis de la Escala 1 de Evaluación de Programas de Actividad Física



Análisis de la Escala 1 de Evaluación de Programas de Actividad Física

    A continuación aparecen los resultados de la Escala 2 denominada "Respecto a las instalaciones" del Inventario de Calidad en Programas de Actividad Física I.C.P.A.F. (Hernández Mendo, 2002). De estos resultados podemos considerar que la escala tiene una estructura adecuada. A efectos de simplificación, hay dos grupos de ítems, el grupo (a) compuesto por los ítems 1, 2, 4 y 10; y el grupo (b) compuesto por el 6 y el 11; del grupo (a) sería conveniente eliminar tres de los ítems y del grupo (b) uno, ya que como indican los resultados estos grupos de ítems estiman la misma parte del constructo.


Análisis Escala 2 de Evaluación de Programas de Actividad Física


    A continuación aparecen los resultados de la Escala 3 denominada "Respecto a las actividades". De estos resultados podemos considerar que la escala tiene una estructura adecuada. A efectos de simplificación, hay dos grupos de ítems, el grupo (a) compuesto por los ítems 1, 2, 4 y 10; y el grupo (b) compuesto por el 6 y el 11; del grupo (a) sería conveniente eliminar tres de los ítems y del grupo (b) uno, ya que como indican los resultados estos grupos de ítems estiman la misma parte del constructo.


Análisis Escala 3 Evaluación de Programas de Actividad Física


    En los resultados del análisis de la escala 4 con respecto a las relaciones con el personal y la información. De estos resultados podemos considerar que la escala tiene una estructura adecuada. A efectos de simplificación, hay dos grupos de ítems, el grupo (a) compuesto por los ítems 1 y 6; el grupo (b) compuesto por el 2 y el 11 y el grupo (c) compuesto por los ítems 10 y 13, sería conveniente eliminar uno de los ítems de cada grupo, ya que como indican los resultados estos grupos de ítems estiman la misma parte del constructo.


Análisis Escala 4 de Evaluación de Programas de Actividad Física


    A continuación aparecen los resultados del cuestionario SERVQUAL, (Parasuraman, Berry y Zeithaml, 1988; Parasuraman, Berry y Zeithaml, 1991; Parasuraman, Zeithaml y Berry, 1988).

    Compuesto por dos escalas, la primera es de las expectativas de los usuarios, la segunda de la percepciones de los usuarios. Hemos querido realizar dos tipos de análisis de las mismas escalas, en primer lugar hemos analizado las expectativas y las percepciones juntas, y en segundo lugar, hemos analizado por separado las expectativas y la percepciones. A continuación expondremos los resultados de estos análisis.


Expectativas y percepciones

    Hemos realizado en primer lugar el análisis de ambas escalas, para comprobar la simetría existente entre ellas, propuesta por los autores, ya comentada en los capítulos anteriores. En el análisis de las expectativas y percepciones, obtenemos los siguientes resultados:

  • Podemos considerar que no tiene una estructura adecuada ya que podemos apreciar grupos de ítems que se solapan entre ellos y por tanto no estiman parte del constructo.

  • Se solapan los ítems 1, 2, 23 (1)1 y 24 (2) pertenecientes a la misma dimensión de los Elementos Tangibles. Con estos ítems si existiría dicha simetría, entre las expectativas y las percepciones, para un buen ajuste de medida de la calidad, en cambio podríamos eliminar algunos para simplificarla y reconstruir otros ítems que cubran el espectro que no está estimado, esto puede ser generalizable a todos los grupos de ítems solapados.

  • Se solapan los ítems: 6, 8, 9, 26 (4), 28 (6), 30 (8), 31 (9) de la dimensión de Fiabilidad y con el ítem 18 de la dimensión Empatía. Se aprecia una simetría en los ítems 6, 8 y 9 en la dimensión de Fiabilidad y no con el ítem 4, solapándose todos ellos con otra dimensión diferente como es la de Empatía.

  • Se solapan los ítems: 4, 7, 29 (7) de la dimensión de Fiabilidad con los ítems 20, 40 (18) y 43 (21) de la dimensión de Empatía. En este grupo, apreciamos únicamente la simetría en el ítem 7, existiendo solapamiento entre las dimensiones Fiabilidad y Empatía.

  • Se solapan los ítems: 10, 13, 35 (13) de la dimensión de Capacidad de Respuesta con el ítem 15 de la dimensión de Seguridad y con el ítem 19 de la dimensión de Empatía. En este grupo de ítems podemos apreciar el solapamiento de tres dimensiones, capacidad de respuesta, empatía y seguridad y una simetría en el ítem 19.

  • Se solapan los ítems: 11, 34 (12) de la dimensión de Capacidad de Respuesta con los ítems 16, 17, y 37 (15) de la dimensión de Seguridad. En este grupo no apreciamos ninguna simetría y un solapamiento entre las dimensiones de capacidad de respuesta y seguridad.

  • Se solapan los ítems: 3 de la dimensión de Elementos Tangibles con los ítems 12, 33 (11) de la dimensión de Capacidad de Respuesta, con los ítems14, 36 (14), 38 (16) y 39 (17) de la dimensión de Seguridad. En este grupo apreciamos una simetría en el ítem 14 y un solapamiento entre las dimensiones de elementos tangibles, capacidad de respuesta y seguridad.




Gráfico 12.5. SERVQUAL. Expectativas y Percepciones.

    En el análisis de la escala, expectativas, reflejado en el gráfico 12.6, obtenemos los siguientes resultados:

  • Podemos considerar que no tiene una estructura adecuada ya que podemos apreciar grupos de ítems que se solapan entre ellos y por tanto no estiman parte del constructo.

  • Se solapan los ítems los ítems 1 y 2 pertenecientes a la misma dimensión de los Elementos Tangibles.

  • Se solapan los ítems: 6, 8, 9, de la dimensión de Fiabilidad y con el ítem 18 de la dimensión Empatía, podemos apreciar que no solo se solapan entre ellos sino que existe un solapamiento con otra dimensión distinta.

  • Se solapan los ítems: 4, 7 de la dimensión de Fiabilidad y con el ítem 20 de la dimensión de Empatía, al igual que en el grupo anterior podemos apreciar que no solo se solapan entre ellos sino que existe un solapamiento con otra dimensión distinta.

  • Se solapa los ítems 10 de la dimensión de Capacidad de Respuesta con los ítems 19, 21 y 22 de la dimensión de Empatía.

  • Se solapa los ítems 13 de la dimensión Capacidad de Respuesta con el ítem 15 de la dimensión Seguridad.

  • Se solapa el ítems 11 de la dimensión Capacidad de Respuesta con el ítem 16 de la dimensión Seguridad

  • Se solapa los ítems 14 y 17 de la dimensión Seguridad

  • Se solapa los ítems 3 y 12 de la dimensión Capacidad de Respuesta




Gráfico 12.6. SERVQUAL. Expectativas. +

    En el análisis de la escala, percepciones, reflejado en el gráfico 12.7, obtenemos los siguientes resultados:

  • Podemos considerar que no tiene una estructura adecuada ya que podemos apreciar grupos de ítems que se solapan entre ellos, e incluso pertenecientes a diferentes dimensiones y por tanto no estiman parte del constructo.

  • Se solapan el ítem 4 pertenecientes a la dimensión de los Elementos Tangibles con el ítem 7 de la dimensión de con los ítems 18,20 y 21 de la dimensión Empatía

  • Se solapan los ítems: 10 y 13 de la dimensión Capacidad de Respuesta

  • Se solapan los ítems 11 y 12 de la dimensión Capacidad de Respuesta con los ítems 14, 16, 17 de la dimensión Seguridad.




Gráfico 12.7. SERVQUAL. Percepciones

    Según los análisis presentados anteriormente podemos indicar una replanteamiento en la estructura del cuestionario SERVQUAL(Parasuraman, Berry y Zeithaml, 1988; Parasuraman, Berry y Zeithaml, 1991; Parasuraman, Zeithaml y Berry, 1988), debido a los grupos de ítems que se solapaban entre ellos e incluso con otras dimensiones distintas, tal vez podríamos elaborar un instrumento que especifique los factores que afectan a la evaluación del constructo de calidad en el ámbito de los servicios deportivos municipales. Con una estructura jerárquica que describa mejor el espectro dimensional del constructo de calidad y una propuesta tales como dimensiones técnicas, emocionales y tangibles, o simplemente en dimensiones tangibles e intangibles y que a su vez, cada una de ellas, se puedan dividir en otras más específicas establecidas con ítems más rigurosos, capaces de contemplar todo el espectro específico del servicio a evaluar. Sin olvidar que debe ser un instrumento pragmático, fácil de utilizar para los gerentes, el personal y cómodo para los usuarios, incluso que nos permita segmentar a los usuarios con expectativas similares respecto al servicio y que pueda diagnosticar las dimensiones de la calidad deficitarias para una mejora continua en el servicio

    Otras de las vías que podemos plantear es la Gestión de los servicios deportivas con mejoras en el desempeño laboral de los gerentes, el análisis del trabajo directivo en organizaciones deportivas, variables que puedan influir, las necesidades formativas del personal de la organizaciones deportivas (Morales Sánchez y Hernández Mendo, 2004ª, 2004b)..

    Analizar las Características de las instalaciones deportivas y de sus diferentes espacios deportivos para el buen uso de sus instalaciones. La satisfacción experimentada con diferentes aspectos de dichas instalaciones y las razones para hacer deporte a través del comportamiento de los usuarios, tal vez con el análisis de frecuencia de práctica deportiva, uso de instalaciones deportivas, implicación deportiva de los usuarios, demandas de los usuarios, etc.

    Dado que coexisten en el mismo momento temporal diferentes maneras de entender el deporte, practicantes de distintas edades, sexo, clase social es cada vez más complicado conocer el comportamiento deportivo de los ciudadanos y predecir cuáles van a ser sus motivos, actitudes y valores en el futuro, por ello, podemos estudiar las nuevas formas de práctica deportiva, nuevas actitudes hacia el deporte, nuevos motivos para hacer deporte, etc. Las cuales influyen en la demanda de nuevos servicios deportivos que se pueden implementar en los ya existentes.

    En definitiva podemos apreciar que el constructo de calidad en los servicios deportivos municipales, es de plena actualidad, que inspira numerosas y diversas líneas de investigación para todos aquellos interesados en este ámbito.

...Y ahora... ¿dónde vamos, señor?, dice el escudero...
¡ALTO!
¡ALTO...! He dicho alto, no he dicho fin. El poema no termina aquí.
Y el poema no es así tampoco.
Tiene que ser de otra manera.
¿Cómo?... No sé, pero no es así. Antes era más largo. Iba...
no sé adónde. ¿Adonde puede ir este poema?
Mañana tal vez mañana...
tal vez algún poeta, mañana.

León Felipe


Notas

  1. El número indicado en paréntesis es el correspondiente a la escala original de la escala de percepciones.

Referencias

  • Adams, R.J. y Khoo, S. (1996). Quest: The interactive test analysis system. Victoria: ACER.

  • Anguera, M.T. (1990). Metodología observacional. En J. Arnau, M.T. Anguera y J. Gómez, Metodología de la investigación en Ciencias del Comportamiento (pp. 125-236). Murcia: Universidad de Murcia.

  • Anguera,T. (2003). La Metodología selectiva en el deporte. En A. Hernández Mendo (Eds.), Psicologia del Deporte (vol.2): Metodología (pp. 43-76). Buenos Aires: Tulio Guterman (http:/ www.efdeportes.com).

  • Bejar, I.I. (1983). Introduction to Ítem Response Models and their assumptions. En R.K. Hamblenton (Ed.), Applications of ítem response theory. Vancouver: Educational Research Instiotute of British Columbia. Cap. 1. 1-23.

  • Delgado, A.R. y Prieto, G. (1997). Introducción a los métodos de investigación de la Psicología. Madrid: Pirámide.

  • Embretson, S.E. y Hershberger, S.L. (1999). The new rules ofmeasurement. Mahwah. New Jersey: LEA.

  • Hamblenton, R.K. y Jones, R.W. (1993). Comparison of classical test theory and ítem response theory and their applications to test development. Educational Measurement: Issues and Practice, 12 (3), 38-47.

  • Hamblenton, R.K. y Swaminathan, H. (1985). Item response theory: principles and applications. Boston: Kluwer Academic Publishers.

  • Hamblenton, R.K. y van der Linden, W.J. (1982). Advances in item response theory and applications: an introduction. Applied Psychological Measurement, vol. 6, Nº 4. 373-378.

  • Hernández Mendo, A. (2001). Un cuestionario para evaluar la calidad en programas de actividad física. Revista de Psicología del Deporte, 10, 179-196.

  • Lord, F.M. (1980). Applications of item response theory to practical testing problems. New Jersey: LEA.

  • Maíz Rodríguez, J. (2004). Adaptación y baremación de cuestionarios sobre comportamientos violentos. Lecturas: EF y Deportes. Revista Digital, 76, septiembre. http://www.efdeportes.com/efd79/violent.htm [Consulta: 13 de diciembre de 2004].

  • Martinez Arias, R. (1995). Psicometría: teoría de los test psicológicos y educativos. Madrid: Síntesis.

  • Morales Sánchez, V. (2003). Evaluación psicosocial de la calidad de los servicios municipales deportivos: aportaciones desde el análisis de variabilidad. Universidad de Málaga: Tesis doctoral http://www.efdeportes.com/efd72/munic.htm [Consulta: 13 de diciembre de 2004].

  • Morales Sánchez, V. y Hernández Mendo, A. (2004). Calidad y satisfacción en los servicios: conceptualización. Lecturas: EF y Deportes. Revista Digital, 73, junio. http://www.efdeportes.com/efd73/calidad.htm [Consulta: 31 de mayo de 2004].

  • Morales Sánchez, V. y Hernández Mendo, A. (2004). La calidad y su gestión. Lecturas: EF y Deportes. Revista Digital, 76, septiembre. http://www.efdeportes.com/efd76/calidad.htm [Consulta: 7 de septiembre de 2004].

  • Muñiz, J. (1996). Teoría clásica de los test. Madrid: Pirámide.

  • Muñiz, J. (1997). Introducción a la Teoría de Respuesta a los Ítems. Madrid: Pirámide.

  • Muñiz, J. (1997). Teoría de respuesta a los ítems. Madrid: Pirámide.

  • Parasuraman, A., Berry, L. y Zeithaml, V. (1988). SERVQUAL: A multiple-item sacale for measuring consumer perceptions of service quality. Journal of Retailing, 64, 12-40.

  • Parasuraman, A., Berry, L. y Zeithaml, V. (1991). Refinement and reassessment of the SERVQUAL scale. Journal of Retailing, 67, 420-450.

  • Parasuraman, A., Zeithaml, V. A. y Berry, L. L. (1988). SERVQUAL: A Multiple Item Scale for Measuring Consumer Perceptions of Service Quality. Journal of Ratailing, 12-40.

  • Prieto, G. y Delgado, A. (2003). Análisis de un test mediante el modelo de Rasch. Psicothema, 15 (1), 94-100.

  • Rasch, G. (1960). Probabilistic models for some intelligence and attainment test. Copenhague: The Danish Institute for Educational Research.

  • Rasch, G. (1977). On specific objectivity: An attempt at formalizing the request for generality and validity of scientific statements. En M. Glegvad (De.), The Danish Yearbook of Philosophy (pp. 59-94). Copenhagen: Munksgarrd.

  • Thurstone, L. L. (1928). Attitudes can be measured. American Journal of Sociology, 33, 529-554.

  • Wright, B.D. y Masters, G.N. (1982). Rating scale analysis. Chicago: Mesa Press.

  • Wright, B.D. y Stone, M. H. (1979). Best test desing. Chicago: MESA.

  • Wu, A., Adams, R.J. y Wilson, M. R. (1998). Acer ConQuest. Melbourne: Acer Press.

Otros artículos de Antonio Hernández Mendo
sobre Psicología del Deporte

  www.efdeportes.com/
http://www.efdeportes.com/ · FreeFind
   

revista digital · Año 10 · N° 80 | Buenos Aires, Enero 2005  
© 1997-2005 Derechos reservados