efdeportes.com

Cómo usar la observación en la psicología del deporte: principios metodológicos
Antonio Hernández Mendo y Maribel Molina Macías

http://www.efdeportes.com/ Revista Digital - Buenos Aires - Año 8 - N° 49 - Junio de 2002

3 / 4


3. Control de calidad de los datos

    Junto a lo ya tratado hasta aquí, hay dos temas de suma importancia en metodología observacional, como son los relativos a la fiabilidad y a los diseños observacionales. Por lo que respecta al primero de ellos y de acuerdo con Anguera (1990) y Blanco (1993), podemos afirmar que es difícil aislar conceptos como concordancia, fiabilidad y validez. Por lo que se refiere a la metodología observacional los tres serían diferentes formas de entender la fiabilidad. Por lo que podríamos definirlos como:

  1. Concordancia. Es una medida que indica el grado en que dos o más observadores están de acuerdo entre sí (concordancia interobservadores) o un observador consigo mismo (concordancia intraobservador), cuando se registran los mismos eventos mediante el mismo sistema de códigos. En este apartado podríamos citar la Concordancia consensuada, en la que se busca el acuerdo entre los observadores antes del registro (y no después), por lo que se realiza un único registro que tiene como gran ventaja el fortalecimiento del sistema de categorías. Este tipo de concordancia en observación está alcanzando elevadas cotas de uso dada sus indiscutibles ventajas.

  2. Fiabilidad. Existen, al menos, tres formas de contemplar la fiabilidad:

    1. Concordancia del observador, dos o más observadores independientes trabajando en el mismo espacio temporal y observando las mismas conductas.

    2. Desde la Teoría Psicométrica de la fiabilidad20, según la cual una puntuación se compone de una parte verdadera y una de error. Los procedimientos más comunes para estimar la parte de error son:

      • Fiabilidad inter o intracodificadores (obtención de dos puntuaciones separadas del mismo instrumento).

      • Fiabilidad de formas alternas (puntuaciones en dos partes del mismo instrumento).

      • Fiabilidad test-retest.

    3. Desde la Teoría de la generalizabilidad de Cronbach, Gleser, Nanda y Rajaratnam (1972) se asume la existencia de otras fuentes de variación distintas. Gracias al análisis multivariado se ha podido integrar cada una de las fuentes de variación en una estructura global.

  3. Validez. Como señala Anguera (en prensa), Cairns & Green (1979) se han referido a las principales fuentes de varianza en las puntuaciones de observación directa, destacando las características del observador, el sujeto observado, la situación de observación, etc. Por otra parte, no todos los tipos de validez son aplicables a la observación directa. La validez mantiene una estrecha relación con la fiabilidad y existe abundante literatura al respecto. De forma más clara podemos referirnos a:

    1. Validez de contenido: si las distintas manifestaciones del concepto, por ejemplo, "ataque" (en un sistema de juego de deporte de equipo o sociomotor), se hallan adecuadamente representadas en el sistema, lo cual requeriría que éste se hubiera construido deductivamente a partir de la conceptualización del constructo "ataque".

    2. Validez relativa al criterio: cuando las medidas obtenidas en la utilización de un instrumento reflejaran las diferencias entre programas de intervención, sujetos pertenecientes a grupos distintos en determinadas características, etc.

    3. Validez de constructo: siempre que se haya procedido deductivamente en la elaboración del sistema, y de la misma forma que en otras metodologías distintas de la observacional.

    4. Validez de tratamiento: cuando una medida contribuye al logro de mayores beneficios en una terapia o tratamiento en general, de forma que un diseño adecuado para evaluar la validez de tratamiento compararía la efectividad de dos programas idénticos de intervención en donde el único aspecto que variaría es que en solo uno de ellos se incluiría el sistema de observación.

    Hay otros tipos de validez, aunque de menor trascendencia en metodología observacional como son: la validez ecológica (Barker & Wright, 1955), la validez convergente y discriminante (Campbell & Fiske, 1959) y la validez incremental (Sechrest, 1963).


3.1. Concordancia convencional

    Existen numerosos criterios propuestos por diversos autores, y no siempre coincidentes, respecto a las distintas formas de hallar la concordancia (inter e intraobservadores).

    A modo de ilustración, Bakeman & Gottman (1987, 1989) se refieren tan solo al porcentaje de acuerdo, como el estadístico más frecuentemente utilizado en este sentido, y al kappa de Cohen, pero sin que se expliciten los criterios que llevaron a esta selección. Sackett (1978) afirma que se pueden utilizar, al menos, siete coeficientes de concordancia, que dependen de la escala a la que pertenecen los datos. Hartmann (1982) entiende que dependería de que se trate de datos categóricos o cuantitativos, pudiendo los primeros basarse en ocurrencias/no ocurrencias, correcto/incorrecto, o respuestas de signo, mientras que los segundos se referirían a frecuencia, tasa, latencia o duración de respuesta. Berk (1979) describe 22 índices distintos, y House, House & Campbell (1981) discuten una larga lista de procedimientos al efecto, además de otras muy variadas aportaciones, como Krippendorff (1980), Frick & Semmel (1978), y tantos otros. Por el contrario, otros autores, como Fassnacht (1982), de importantes aportaciones en diversos aspectos de la metodología observacional, no trata ya este tópico.

    En un trabajo monográfico sobre este tema, Salgado (1986) sistematiza los tipos de coeficientes en función de su naturaleza, tipo de datos sobre los que se aplica, y modalidad de fiabilidad que evalúan. De acuerdo con ello, a los datos cualitativos (nominales y ordinales) les correspondería un índice de concordancia, y a los cuantitativos un coeficiente de correlación (además de los coeficientes de correlación intraclase que derivan de la teoría de la generalizabilidad y que se obtienen a partir del análisis de varianza). A su vez, distingue entre los índices de acuerdo y de asociación para evaluar la concordancia, refiriéndose los primeros a la magnitud absoluta de tan solo un tipo de error, y los segundos al caso especial en que se corrige el acuerdo por tener en cuenta la proporción esperada por azar.

    Es un hecho cierto que no existe consenso sobre qué estadísticos permiten demostrar mejor la concordancia entre observadores, habiéndose barajado varios: Carácter categórico o cuantitativo de los datos, corrección del efecto del azar, etc. El desarrollo alcanzado en esta cuestión ha sido de tal magnitud que es imposible aquí su tratamiento en extensión. Sirva como ejemplo la referencia que se ha realizado con anterioridad acerca de la introducción o no de corrección por efecto del azar es un criterio taxonómico, recientemente se ha discutido (Zwick, 1988) que, entre los que incorporan dicha corrección, no todos la definen de igual forma, con las implicaciones que ello supone.

    En cualquier caso, queda constancia de que caben diversas taxonomías, todas ellas perfectamente justificables, que pretenden clarificar la multiplicidad de coeficientes existentes.


3.2. Concordancia consensuada

    Este tipo de concordancia cuenta cada vez con mayor protagonismo en metodología observacional. Se trata de lograr el acuerdo entre los observadores antes del registro (y no después, como hasta ahora se había considerado), lo cual puede conseguirse siempre que se disponga de la grabación de la conducta (mediante magnetófono, si sólo interesa conducta vocal y/o verbal, o en soporte magnético) y los observadores discuten entre sí a qué categoría se asigna cada una de las unidades de conducta. Sus ventajas son indiscutibles, y a la obtención de un registro único hay que añadirle un importante fortalecimiento del sistema de categorías (o, en general, del sistema de códigos), ya que quedan absolutamente perfiladas sus definiciones y los matices que deban añadirse.


3.3. Variables que afectan al grado de acuerdo

    Siguiendo el trabajo de Anguera (en prensa) podemos afirmar que la decisión acerca de la utilización de uno u otro de estos coeficientes que permiten conocer el grado de acuerdo, además de tener en cuenta las diferencias existentes entre ellos, deberá tomarse sabiendo que existen variables que modulan el grado de concordancia, y tanto en sentido positivo como negativo. Esencialmente se trata de las siguientes:

  1. Sistema complejo de codificación. Aumenta la dificultad, y, en consecuencia, el riesgo de errores de comisión (sustitución de un código correcto por otro incorrecto). Además, es muy frecuente que se produzca una falta de sincronía entre los observadores cuando el sistema es complejo o existe un número elevado de códigos, y especialmente si las conductas son fugaces.

  2. Tasa de ocurrencia. Salvo alguna excepción21, un aumento de la tasa de ocurrencia tiende a comportar una disminución del grado de acuerdo.

  3. Comprobaciones periódicas. Cuando los observadores saben que en algún momento se hará una comprobación (durante o al fin de la sesión, después de un número de sesiones, etc.), se ha demostrado repetidamente que aumenta el grado de concordancia. Por este motivo, podría arbitrarse un sistema de mantenimiento prolongado de una elevada concordancia mediante dichas comprobaciones periódicas.

  4. Fluctuaciones del observador. Dependen en unos casos de causas desconocidas, y en otros de características personales y/o de la propia situación de observación (influencia de personas ajenas, conocimiento entre observador y observado, naturaleza de la conducta que se observa, etc.), y siempre tienden a rebajar el grado de concordancia entre observadores.

  5. Medios técnicos de registro. Su influencia es claramente beneficiosa respecto a un mayor grado de concordancia entre observadores, tanto por la posibilidad de recobrar la información cuando se desee y ralentizarla, como por posibilitar una óptima precisión.

  6. Adiestramiento del observador. Es evidente que repercutirá en un aumento del grado de precisión, y consecuentemente en una mayor concordancia (aunque no se presupone en absoluto que lo inverso sea cierto). No obstante, la planificación debe realizarse correctamente, teniendo en cuenta que si se dispone de un equipo de observadores, se subdivide en dos grupos, y se monitoriza a cada uno de estos grupos por separado, aunque se sigan las mismas pautas, se tenderá a aumentar la concordancia interna entre los observadores que se monitorizaron conjuntamente, siendo dicha concordancia menos elevada entre los dos subgrupos de observadores.

  7. Tamaño del intervalo. Cuando se adopta la decisión de establecer intervalos de tiempo, deberá fijarse cuál es dicha longitud o tamaño de intervalo, tratando de evitar el error intraintervalo al fijar el mínimo. En general, a medida que aumenta la longitud del intervalo disminuye el grado de acuerdo, pero esta afirmación no debe tomarse en sentido estricto.


4. Análisis de datos

4.1. Tipos de datos

    A partir de un tema ya abordado como es el relativo a la toma de decisiones en cuanto a las unidades de observación se refiere, podemos tratar la clasificación de los tipos de datos. Esta clasificación obedece a un doble criterio: ocurrencia y base (Bakeman y Dabbs, 1976; Bakeman, 1978; Anguera, 1988; Anguera et al., 1993). De acuerdo con la ocurrencia los datos pueden ser secuenciales y concurrentes; atendiendo al criterio base se originan el evento y el tiempo. De la combinación de todos resultan cuatro tipo de datos:

    De acuerdo con Anguera (1988), en los Datos tipo I (secuenciales y evento-base) el observador recoge el orden de los eventos, no su duración. El sistema de categorías es mutuamente excluyente y por tanto sólo puede tener lugar una conducta cada vez.

    En los Datos tipo II (concurrentes y evento-base), al igual que en los anteriores, se recoge el orden de los eventos sin tener presente su duración, pero con la diferencia de que las categorías son mutuamente excluyentes intranivel y concurrentes internivel22; por tanto pueden ocurrir varios eventos al mismo tiempo. Son los datos que ofrecen una mayor dificultad para su análisis.

    Por el contrario, en los Datos tipo III (secuenciales y tiempo-base) se anota el orden de ocurrencia de los eventos y su duración. En este tipo de datos las categorías son mutuamente excluyentes. Por lo que respecta al tiempo, se puede conceptualizar como una secuencia de intervalos en los que la unidad de tiempo es menor o igual a la más corta de las conductas.

    En cuanto a los Datos tipo IV (concurrentes y tiempo-base) se recoge la duración de los eventos, pudiendo ocurrir éstos simultáneamente. Consecuentemente el sistema de categorías no es mutuamente excluyente.

    De acuerdo con lo anterior hay que señalar que el estudio de patrones concurrentes (conductas que co-ocurren y forman un patrón estable) se realiza a partir de los datos tipo IV (Bakeman y Dabbs, 1976; Bakeman, 1978; Anguera, 1988); sin embargo el estudio de patrones secuenciales (estudio de las conductas que preceden o siguen una respecto a otra, mantenimiento de un orden, ciclos repetitivos de una conducta criterio respecto a sí misma) se realiza con datos tipo I y III.

    Con el fin de transformar datos para realizar un análisis secuencial, es posible transformar datos con mayor información en otros datos que contienen menos. Así sabemos que, los datos tipo IV, son los que contienen mayor tipo de información, sobre secuencia, co-ocurrencia y tiempo físico. Los datos tipo III contienen información sobre secuencia y tiempo físico pero no sobre co-ocurrencia. Los datos tipo II ofrecen información sobre secuencia y co-ocurrencia, pero no sobre tiempo físico. Los datos tipo I contienen, únicamente, información sobre secuencia. Teniendo en cuenta estos datos podemos transformar, p.e., datos tipo II a tipo I, datos tipo III en datos tipo I, si prescindimos del tiempo físico. También es posible transformar datos tipo IV en datos tipo III.

    La finalidad de este tipo de datos fue proporcionar un estándar útil para el intercambio entre investigadores y para la elaboración de programas informáticos que analizasen dichos datos. La desventaja más patente es que obliga al investigador a ceñirse a una representación de datos que pueden no coincidir con los utilizados al recogerlos (Quera, 1993).

    Con el fin de solventar la desventaja descrita anteriormente Bakeman y Quera (1995) crearon el Sequential Data Interchange Standard, que potencia el intercambio entre investigadores y el desarrollo de software destinado al análisis secuencial con mayor énfasis que la tipología original de Bakeman (1978). Además, supone una reconceptualización de los datos basada, no tanto en la estructura conceptual de las unidades de conducta (existencia o no de mutua exclusividad y exhaustividad), sino en las técnicas de registro que se emplean habitualmente para recoger datos observacionales.

    La tipología de Bakeman y Quera (1995), da lugar a los siguientes tipos de datos: Event Sequential Data (ESD) o Eventos (Secuencias de Eventos), State Sequential Data (SSD) o Estados (Secuencias de Estados), Time Event Sequential Data o Secuencias de Eventos con duración e Interval Sequential Data o Secuencias de Intervalo.

  1. Secuencia de Eventos
    Las secuencias de eventos o Event Sequential Data (ESD) son series de códigos que representan las ocurrencias de unidades de conducta mutuamente excluyentes que son eventos o bien estados sin registro de duración. Existen dos clases de datos ESD, aquellos en los que ningún código puede repetirse inmediatamente después de sí mismo (ESD no repetibles) y aquellos en los que puede repetirse libremente (ESD repetibles). Estos datos se obtienen a través de un registro activado por transiciones (Quera,1991) y constituye el formato más simple, equivalente a los datos tipo I de Bakeman (1978).

        Un ejemplo de este tipo de datos puede ser el recogido en el siguiente fichero del programa SDIS-GSEQ (Bakeman y Quera, 1995):

        Al comienzo del fichero la palabra Event indica el tipo de dato que contiene el fichero. A continuación hay una declaración de los códigos que serán empleados y finaliza con un comentario entre signos de porcentajes (%).. Este fichero contiene cinco sesiones de observaciones, cada una de las cuales finaliza con un punto y coma (;) o con una barra inclinada (/), esta barra además indica que hay un cambio del sujeto de trascripción o que es el final de la sesión. Las tres primeras sesiones corresponden al nivel 1 de una cierta variable y las dos siguientes al nivel 2. Dentro del nivel 1 se incluyen sesiones correspondientes a dos sujetos, al primero corresponden las dos primeras sesiones (que acaban con "/") y al segundo la tercera. Las dos sesiones del nivel 2 corresponden a un único sujeto.

  2. Secuencias de Estados
    Siguiendo el trabajo de Quera (1993) y Bakeman y Quera (1995, 1996), las secuencias de estados (State Sequential Data, SSD) son series de códigos que representan las ocurrencias de unidades de conducta consideradas como estados. En la serie, cada código va seguido por la duración de la ocurrencia o bien por su tiempo de inicio, expresado en unidades de tiempo físico. Las unidades pueden formar uno o varios conjuntos de unidades EME. En el primer caso, cada sesión de observación se representa mediante una única serie de datos; en el segundo, por tantas series paralelas o simultáneas de datos como conjuntos EME. Los datos tipo III y los IV con unidades temporalmente exhaustivas son casos particulares del tipo SSD. Estos datos se obtienen mediante un registro activado por transiciones en el que se anota, o bien la duración de cada estado, o bien, más comúnmente, el momento de inicio del mismo.

        Considerando el mismo sistema de categorías que en el ejemplo anterior y que forman un sistema EME, a continuación figura el fichero SDIS correspondiente que contiene las siguientes secuencias de estados:

        En este ejemplo se presentan dos sesiones, correspondientes a un solo sujeto y no existe información sobre variables. La palabra State señala el tipo de datos y a continuación una declaración de los códigos utilizados; empleando la sintaxis SDIS, cada sistema de unidades EME se encierra entre paréntesis. El signo igual (=) separa el código de la unidad de conducta de su duración. Por tratarse de un sistema EME cada categoría empieza cuando ha acabado la precedente. Así, PIZO se inicia en 00:00 y termina en 10:29, PDIN se inicia en 10:30 y termina en 15:32. La sintaxis de SDIS emplea la convención de que la primera unidad de tiempo en una sesión es la unidad 00:00. La sintaxis SDIS acepta diversos formatos para expresar el tiempo, en el ejemplo precedente se utilizan dos puntos (:) para indicar que los dígitos que se encuentran a continuación se expresan en sesentavos del precedente.

        Las secuencias de estados pueden escribirse en un formato alternativo, haciendo constar los tiempos de inicio de cada unidad de conducta en lugar de sus duraciones. Las siguientes secuencias equivalen a las anteriores:

        El tiempo en que finaliza la sesión se indica al final de la secuencia precedido por una coma. Cuando se ha definido más de un sistema de categorías, las secuencias correspondientes a cada uno van separadas por el signo "&" dentro de cada sesión. A continuación se muestra el ejemplo propuesto por Quera (1993):

        En la primera línea se declaran dos sistemas EME y en cada una de las sesiones se escriben las secuencias concurrentes de uno y otro sistema. Hay que señalar que cada una de las secuencias concurrentes dentro de la misma sesión tiene igual duración.

  3. Secuencias Mixtas
        Según Quera (1993), Bakeman y Quera (1995, 1996) podemos considerar a este tipo de secuencias (Timed Event Sequential Data, TSD) como el tipo de datos más complejos y al contrario que los anteriores, carece de referente en la clasificación ofrecida por Bakeman (1978). En estas series de códigos se representan las ocurrencias de eventos o de estados, no necesariamente exhaustivos ni mutuamente excluyentes. Para construir la secuencia correspondiente, si se trata de un evento, irá seguido por su tiempo de ocurrencia (de forma puntual), por el contrario, si se trata de un estado, va seguido de su tiempo de inicio, o por su tiempo de finalización o por ambos, expresados siempre en unidades de tiempo físico. Estas secuencias pueden estar formadas por eventos, por estados o por una mezcla de ambos. La ordenación de los códigos se realiza atendiendo al tiempo de ocurrencia o de inicio, o bien al de finalización si el código sólo va acompañado por éste. A esto hay que añadir lo apuntado por Quera (1993, p.367): "Estos datos se obtienen asimismo mediante un registro activado por transiciones en el que se anota el tiempo de ocurrencia de las mismas, el cual suele requerir la ayuda de sistemas electrónicos como vídeos y computadoras".

        A continuación proponemos un ejemplo de secuencias mixtas:

        El ejemplo anterior se trata de una sola sesión con una duración de 5:45. Como en los anteriores ejemplos al comienzo del fichero se indica el tipo de datos del que se trata, en este caso "Timed". En este tipo de datos, la ocurrencia de un evento se indica mediante el código conductual correspondiente seguido del tiempo de ocurrencia (por ejemplo, PDIN,1:30). La ocurrencia de estados puede indicarse siguiendo varias estrategias: a) Incluyendo un guión a continuación del tiempo de inicio del estado (p.e., PDZD,1:57-), el tiempo de finalización de este estado es el que aparece a continuación en la secuencia (para este ejemplo el tiempo de finalización es 2:00). b) Otra de las opciones consiste en reseñar los tiempos de inicio y finalización del estado, separados por un guión (p.e., DECI,2:00-2:22). c) Finalmente, otra de las posibilidades es incluir el signo "+" antes del tiempo de inicio y señalar la finalización del estado en el lugar de la secuencia que corresponda precedido de un guión antes del tiempo de finalización (p.e., PIZO,+00:00... PIZO,-2:50). Este tipo de representación de los estados es apropiada cuando se trata de estados de larga duración o contextuales.

        Como afirma Quera (1993), los estados y los eventos representados en estas secuencias (TSD) pueden ser concurrentes como en el ejemplo propuesto. Las secuencias TSD puede contener sólo eventos o sólo estados y existe la posibilidad de transformar una secuencia TSD en una o varias secuencias concurrentes SSD, y viceversa. Podemos considerar las secuencias TSD y SSD como formas alternativas de representación de secuencias.

  4. Secuencias de Intervalo
        Al respecto de estos datos Quera (1993) señala que "a diferencia de los tipos anteriores, una secuencia de intervalos (Interval Sequential Data, ISD) se compone de bloques que representan intervalos de tiempo constante, los cuales pueden contener códigos que representan unidades de conducta que han sido registradas en los mismos de acuerdo con una de las tres técnicas más comunes de muestreo de tiempo (o registro activado por unidades de tiempo; Quera, 1991): muestreo instantáneo, de intervalo parcial y de intervalo total. Las unidades de conducta no han de ser necesariamente EME, y pueden o no estar organizadas en varias conjuntos EME. Cada intervalo puede contener desde ninguno a todos los códigos posibles, según la técnica de muestreo empleada y la estructura de las unidades de conducta. Este tipo de datos no tiene equivalente exacto en la tipología de Bakeman (1978), aunque podría asimilarse a unos datos tipo IV en los que cada combinación de unidades de conducta dura exactamente el mismo tiempo, igual a la longitud de intervalo empleada. Sin embargo, mientras que en los datos tipo IV las duraciones son verdaderas, en los TSD de la presencia de un código no puede deducirse su duración, debido a las características de muestreo de tiempo" (p.368).

        El ejemplo construido para ejemplificar este tipo de datos es:

         En este ejemplo cada uno de los intervalos está separado por una coma. Podemos observar como en el primer intervalo aparecen las categorías POSE DIND, en el segundo ocurren DIND TPBO DTRA, y así sucesivamente. El tipo de datos se especificará al comienzo del fichero a través de la palabra Interval, y a continuación figura reseñado la amplitud del intervalo (en este ejemplo 12 segundos). La comilla que aparece a continuación de la amplitud del intervalo indica (') que se trata de un muestreo de tiempo de intervalo parcial, dos comillas ('') indicarían muestreo de intervalo total y la ausencia de comillas señalaría muestreo momentáneo. Los intervalos en los que no ocurre ninguna de las categorías se representan por comas (p.e., ,, ). Cuando aparecen varios registros idénticos en intervalos sucesivos, se puede abreviar su representación mediante un asterisco y un número que indica la cantidad de intervalos que son iguales al inmediatamente anterior (p.e., DTRA GOAR DIND,*3 equivale a DTRA GOAR DIND, DTRA GOAR DIND, DTRA GOAR DIND o bien POSE,*4 se corresponde a POSE, POSE, POSE, POSE). El signo más (+), a continuación de un código (p.e. TPBO+ o bien DIND+), indica que la categoría se registró en ese intervalo y en los siguientes hasta el intervalo anterior a aquél en que aparece la misma categoría seguida de un guión (p.e., DIND- o bien TPBO-). Facilitándose de esta manera la representación del registro de códigos contextuales o de larga duración.


4.2. Resolución del diseño

    Por lo que se refiere a los diseños observacionales, Anguera (1990) los describe como una línea de investigación novedosa que ha surgido, en cierta manera, a raíz de las revisiones de la metodología observacional.

    La metodología observacional adoleció tradicionalmente de líneas de investigación en las cuales se pusieran a prueba las múltiples posibilidades de análisis de sus datos. Probablemente, el principal motivo se halla en la superficialidad con que se obtenían tales datos, y, por consiguiente, en su carácter inconsistente.

    En la actualidad, sin embargo, en plena década de los noventa, se sigue trabajando y avanzando en la configuración de los principales diseños observacionales, los cuales son de disposición no estándar en coherencia con el carácter sumamente flexible de la metodología observacional, y si además tenemos en cuenta una sustancial mejora que en la mayoría de los casos se pone en práctica en el proceso de sistematización y optimización de los datos23, es lógico que hayan surgido nuevas propuestas en lo que se refiere al análisis de datos.

    Por supuesto, existen muy diversos criterios que pueden establecerse en este punto de encrucijada. Aquí se propone un planteamiento en que se cruzan la dicotomía idiográfico/nomotético y la relativa a un registro puntual/seguimiento, lo cual facilita el deslinde de las direcciones básicas de análisis de datos observacionales (Anguera, 1985):

    Para situar los diseños (Anguera, 1985) plantea las dos dicotomías (idiográfico vs. nomotético y puntual vs. seguimiento) que originan cuatro cuadrantes, a través de los cuales podemos situar las diferentes direcciones básicas de análisis de datos observacionales, teniendo además en cuenta los distintos tipos de datos (datos I, II, III y IV o ESD, SSD, TSD y ISD) (Ver tabla siguiente24).

    Como se puede observar en la tabla anterior, las dos dicotomías dan origen a cuatro cuadrantes. El primero de ellos constituiría la situación óptima de la metodología observacional, el seguimiento de un estudio idiográfico I) Cuadrante idiográfico/puntual (diseños diacrónicos), en éste focalizaríamos la atención sobre una sola unidad (sea ésta un individuo, una interacción diádica o triádica o una línea de juego -delanteros o defensas), son los diseños diacrónicos. De esta forma se lleva a cabo un registro sistemático a partir del sistema de categorías elaborado a lo largo de un período de tiempo. Ahora bien, el concepto "seguimiento" presenta muchos matices, pues no es lo mismo que una evaluación acerca de los sistemas tácticos de un equipo se realice en un solo partido que a lo largo de los partidos de la primera vuelta. Sin que se emita ningún juicio valorativo acerca de una u otra de ambas posibilidades, está claro que cabe una amplia casuística en este cuadrante.

    Las modalidades de análisis cuantitativo que se pueden aplicar a los registros observacionales son muy variadas. Uno de los autores más prestigiosos en este ámbito, Sackett (1978) distingue entre análisis secuencial y análisis no secuencial, y la misma división se halla en Sackett & Landesman-Dwyer (1982). Como indica Quera (1987) en su revisión, en los procedimientos de análisis no secuencial se incluye generalmente un conjunto de técnicas de análisis, como el análisis factorial, de la varianza, discriminante, etc. (Gottman, 1978), que son comunes a medidas de diferentes procedencias, incluida la observación, pareciéndose restringir el uso de análisis multivariables a datos no secuenciales, aunque la distinción no resulta clarificadora.

    En una sistematización esquemática cabe recoger las siguientes posibilidades:

  1. Análisis de panel, cuando se dispone de información (registro puntual) en dos o tres puntos de tiempo. Por ej., evaluación de la eficacia de la línea de delanteros o defensas (mediante un índice de eficacia) de los jugadores de fútbol de primera división de una comunidad autónoma25. Este tiene un carácter exploratorio (Hagenaars, 1990).

  2. Análisis de tendencias, mediante la obtención de la recta de regresión, si el número de informaciones puntuales y periódicas de las que se dispone es al menos de tres. En el mismo ejemplo anterior, es mucho mejor conocer la tendencia, que tiene además capacidad predictiva, que un mero índice exploratorio sobre el cambio producido.

  3. Análisis de series de tiempo, siempre que se registre la correspondiente información puntual al menos durante cincuenta puntos de tiempo. Por ejemplo, evaluación de un tratamiento sobre autoestima en un jugador profesional de hockey sobre patines a partir de una sesión diaria de observación en el transcurso de los diez primeros partidos de la temporada. Su aplicación en el ámbito de metodología observacional es bastante restringida debido, en parte, a la necesidad de disponer de datos recogidos durante un largo número de sesiones, y también a la mayor complejidad de las herramientas estadísticas necesarias. El principal problema radica en cómo medir las variables cuantitativas que representan las conductas de los participantes. Una importante revisión del tema se halla en Gottman (1981), y se puede acceder a los correspondientes programas de ordenador en Williams & Gottman (1981).

  4. Análisis secuencial de retardos, que fue desarrollado por Sackett (1978, 1980, 1987) a partir de los antecedentes que se hallan en el trabajo de Bakeman & Brown (1977), y que en la actualidad ha alcanzado un importante desarrollo (Quera, 1993). Constituye la modalidad prototípica de análisis en este cuadrante, y en consecuencia, la técnica de análisis de datos que mejor responde al planteamiento de un diseño diacrónico. Se pretende la detección de la existencia de patrones de conducta, o configuraciones estables de comportamiento, a partir de los valores de las probabilidades observadas que sean estadísticamente excitatorios por superar los valores de las probabilidades esperadas, y una vez éstos han sido adecuadamente corregidos para dotarlos de mayor garantía (Anguera, 1983). Esta configuración más o menos estable de conducta que se puede obtener, haciéndola "aflorar" a partir del registro, equivale a un extracto altamente condensado de la información obtenida, siendo muy útil para una evaluación del comportamiento estudiado y un análisis de su evolución si se desea. El punto de partida es la hipótesis nula de que no existe dependencia entre los eventos secuenciales y, por tanto, que las diferentes conductas no se suceden, de forma eslabonada, con mayor cohesión que la que implicaría el mero azar.

    El programa ANSEC (Quera & Estany, 1984), modificado para dar lugar al ASR (Quera, 1985), es especialmente útil para llevar a cabo cualquiera de las modalidades de análisis secuencial de retardos. Finalmente, Bakeman y Quera (1995) han completado el programa SDIS, que supone un importante avance respecto a los anteriores.

    El segundo cuadrante no aporta información ya que no garantiza la cientificidad del estudio II) Cuadrante idiográfico/puntual. Una recogida de datos puntual y a partir de un solo sujeto no es capaz de proporcionar información mínimamente consistente con garantías científicas. En consecuencia, se trata del único cuadrante que no ofrece datos válidos para un posterior análisis.

    En el tercer cuadrante se estudia un grupo de sujetos de acuerdo con la aplicación simultánea de un grupo de categorías, son los diseños sincrónicos III) Cuadrante nomotético puntual (diseños sincrónicos). Son frecuentes las situaciones en las que es necesario conocer la distribución de un grupo de sujetos respecto a la aplicación simultánea de varios sistemas de categorías, así como la evaluación en varios niveles simultáneos de respuesta y que habrán dado lugar, lógicamente, a diversos sistemas de categorías.

    Según Bakeman y Gottman (1989), la estrategia de registro más adecuada es la de eventos clasificados de forma cruzada, de forma que no se requiere ningún tipo de continuidad entre eventos sucesivos, sino que resulta al ser aprehendidas secuencias conductuales que son clasificadas desde varias dimensiones, siendo el elemento clave, los sistemas de categorías aplicados concurrentemente. Por ejemplo, supongamos que se pidiera a los observadores que anotaran siempre que un jugador A ejecutase un tiro a portería; en principio, a alguien se le podría ocurrir que el resultado consistiría en un recuento de la frecuencia de los tiros, pero, sin embargo, se podría también solicitar a los observadores que anotaran qué estaba haciendo el jugador antes de realizar el tiro, qué posición ocupaba en el terreno de juego en relación a la pelota, y consecuencia resultante (gol, rechace, pérdida, etc.). Suponiendo que se definieran una serie de categorías exhaustivas y mutuamente excluyentes para cada uno de estos tres aspectos, el observador clasificaría el tiro de forma cruzada. Se trata, esencialmente, del mismo tipo de tarea que cuando se pide a un sujeto que clasifique una serie de objetos por la forma (círculos, cuadrados y triángulos), color (rojo, azul y verde), y material (madera, metal y plástico), pero con una diferencia fundamental, y es que en el caso del tiro los criterios presentan un orden natural temporal (circunstancia precedente, tiro y consecuencia), lo cual no ocurre en el segundo caso. En cada ocasión, dependerá de los criterios adoptados como base para los sistemas de categorías, dando lugar, respectivamente, al planteamiento de diseños longitudinales-transversales, en el primer caso, o transversales, en el caso del segundo, que es lo que nos interesa en este apartado. El registro de eventos de forma cruzada siempre resulta muy simple, presentándose los datos como tablas de contingencia, a partir de las cuales interesa saber si existe relación entre las variables, y cuál es la intensidad de la asociación. El análisis de datos cualitativos/categóricos se hallaba limitado, hasta hace poco más de dos décadas, al contexto de tablas de dos dimensiones, aplicándose la prueba ji-cuadrado para su estudio.

    Sin embargo, gracias a los esfuerzos pioneros de Bishop (1969), Fienberg (1977) y Goodman (1970, 1971), y posteriormente divulgado por Kennedy (1983), entre otros, se ha desarrollado el análisis de tablas de contingencia mediante modelos lineales logarítmicos, o análisis "log-linear", planteado en investigaciones de naturaleza simétrica (sólo interesa la presencia o ausencia de asociación entre las variables, sin direccionalidad u orden causal entre ellas), mientras que deberá aplicarse un análisis distinto (análisis "logit") si las investigaciones son de carácter asimétrico, y, por tanto, una variable asume el estatus de explicativa o independiente, y otra el de respuesta o dependiente, aunque es poco frecuente este tipo de investigación en metodología observacional, en que la ausencia de intervención lleva a la habitual inexistencia de variables independientes y dependientes.

    En el cuarto cuadrante IV) Cuadrante nomotético/seguimiento (diseños diacrónicos/sincrónicos) cabe realizar dos aproximaciones, por un lado al cuadrante 1 y por lo tanto realizar un estudio de la secuencialidad en paralelo de cada uno de los integrantes del grupo (cabría la posibilidad de estudiar un sujeto prototípico). La segunda posibilidad es llevar a cabo un acercamiento hacia el tercer cuadrante y realizar, igualmente, un estudio de la secuencialidad en paralelo de cada uno de los integrantes del grupo, pero no en una sola ocasión, sino en una sucesión de análisis puntuales cercanos en el tiempo, lo que implicaría un cuasi-seguimiento a lo largo del tiempo (Anguera, 1990); una sucesión de análisis puntuales cercanos en el tiempo, lo que implicaría un cuasi-seguimiento a lo largo del período de tiempo considerado. Es decir, en un momento inicial, y mediante un análisis log-lineal, se conoce cuál es la relación entre los diversos niveles de respuesta contemplados, operación que se repite, periódicamente o no, siempre que se juzgue relevante, y que puede llegar a realizarse, incluso, en cada una de las sucesivas sesiones de registro. Las enormes posibilidades de este diseño diacrónico/sincrónico permiten que se le pueda considerar como el más completo y óptimo para la evaluación del comportamiento, hasta el punto de que todos los demás serían variantes incompletas de este.

    El uso de esta metodología permite abordar uno de los problemas con los que se enfrentan los psicólogos en su intervención en el ámbito de los deportes sociomotores, el desconocimiento de los patrones de juego. La observación y el análisis secuencial (mediante la técnica de retardos) permite conocer la estructura del flujo comportamental por encima de lo que predice el azar y poder plantear objetivos realistas de optimización de los recursos de acción del deportista. También permite conocer la influencia de diversos factores como espacio, o la introducción de elementos nuevos en la acción de juego.

    De aquí la importancia de conocer los patrones de juego con el fin de plantear una Intervención Psicosocial que permite mejorar no solo los recursos de acción del deportista individual sino también la del grupo y, consecuentemente, permitirá determinar tanto la intervención sobre cada uno de los eslabones de la cadena conductual y el planteamiento de técnicas o estrategias que mejoren y optimicen los procesos del grupo, convirtiéndolo en un grupo eficaz.

    Otra de las aportaciones de la Metodología Observacional y del análisis secuencial al conocimiento del grupo es el relativo a su estructura. En la línea del sociograma propuesto por Moreno (1934) pero con las aportaciones realizadas por Santoyo (1994) y Castellano (2000), de esta manera podríamos (a) conocer como está estructurado el grupo, (b) en que medida la estructura grupal impuesta por la situación táctica se corresponde con la estructura del grupo natural (González, Ortega, Ortega Orozco, Rondán y Hernández Mendo, 1998). Además, el conocimiento de las estructuras comportamentales en la acción de juego nos permitirá el planteamiento de modelos matemáticos -con la ayuda de otras técnicas de análisis, como p.e. análisis Log-Linear (Losada y Hernández Mendo, 1998), Análisis de Varianza con datos categóricos (Hernández Mendo, Losada y Morales, 1998), Teoría de la Generalizabilidad (Blanco y Hernández Mendo, 1998)- que progresivamente faciliten el establecimiento de otros modelos funcionalistas o estructuralistas. Otros tipos de análisis deberían situarnos de forma cenital sobre el problema, ¿cómo los diversos tipos de influencia social o de liderazgo afectan a la estructura del grupo? ¿cómo diversos tipos de liderazgo o de influencia social afecta a la motivación del grupo? Etc.

    Como muestra de una posible intervención psicosocial en un grupo deportivo, posibilidad señalada con anterioridad, tomemos como ejemplo el siguiente patrón comportamental, que posee una estructura lineal hasta el tercer retardo en donde se produce una bifurcación polidiádica de grado 5:

     Estimado este patrón a partir del análisis secuencial, al que se le podrían añadir los resultados del análisis de coordenadas polares, hacemos una propuesta de intervención con el objetivo general de mejorar los recursos de acción globales del grupo deportivo. La propuesta podría quedar fijada como sigue:

    Por su parte, una de las más importantes ventajas que aporta otra de las técnicas, el análisis de coordenadas polares, es la de ofrecer resultados interpretables que muestren cómo en sucesivos momentos programados -de forma periódica o no, pero que responden a la perspectiva diacrónica- se obtiene una representación vectorial que suministra un mapa de relaciones entre la conducta focal y las demás categorías (Santoyo y Anguera, 1993; Anguera, Blanco y Losada, 1995; Anguera y Losada, en prensa), que, a su vez, puede ser punto de partida de ulteriores análisis. También puede suministrar una interpretación de la evolución temporal de las conductas relevantes para el estudio o investigación.


Notas

  1. Como señala Anguera (1993) la diferencia más notable estriba en un menor rango epistemológico, de lo cual derivan importantes consecuencias.

  2. No debemos olvidar que la importancia de los deportes de equipo viene determinado en gran medida por la ingente cantidad de recursos económicos que es capaz de mover y generar.

  3. El hockey sobre patines y el fútbol son deportes sociomotores de espacio compartido, en tanto que el voley es un deporte sociomotor de espacio no compartido.

  4. A este respecto recuérdese la final de la copa del Rey de 1995 entre el R.C. Deportivo de La Coruña y F.C. Valencia que debido a una intensa lluvia tuvo que ser suspendido. No obstante el juego desarrollado hasta ese momento estuvo muy condicionado por la lluvia.

  5. El reglamento (Escartín, 1993, p.48) no dice explícitamente que cuando el número de jugadores de uno o de ambos equipos sea de siete o menor deba de ser suspendido, pero en la Guía Universal de Arbitros se recomienda la suspensión pero lo deja a la apreciación de las respectivas Asociaciones Nacionales.
    Recientemente en un partido de la liga brasileña el árbitro en el primer tiempo expulso a cuatro jugadores. En el descanso el equipo hizo los tres cambios reglamentarios y al comenzar el segunda parte se lesiono uno de los jugadores teniendo que ser evacuado. El árbitro suspendió el partido. Cuando se reanudo el partido, otro día con el equipo al completo, este equipo ganó a su adversario en la tanda de penaltys.

  6. Antes ya se indicó que debería ser el menor posible.

  7. Los datos de los ejemplos que se utilizan a continuación han sido suministrados por el programa informático TRANSCRIPTOR v.2.1 a partir de una sesión observación real de hockey sobre patines.

  8. Los ejemplos utilizados pertenecen a los trabajos de Hernández et al., (1994, 1995).

  9. La utilización de estos ejemplos nos situa en la disyuntiva planteada por Anguera (1990) en cuanto a los eventos vs. estados.

  10. Recordamos que los valores ordinales solo permiten obtener la relación < > ellos, no admite otro tipo de relación.

  11. La sumatoria de las frecuencias de todas las categorías (o conductas) de una sesión es igual a la unidad.

  12. Cuando utilizamos la palabra intervalo nos referimos a los períodos regulares de tiempo en los que se haya segmentada una sesión de observación.

  13. La suma de las duraciones relativas de todas las categorías es igual a la unidad.

  14. Se considera el ataque, como ya quedó dicho, como una conducta estado o conducta molecular que comienza con una posesión y finaliza con un tiro a portería. Esta conducta tiene lugar cuando el equipo adversario tiene organizada su defensa.

  15. En prácticamente todos los deportes de equipo la duración del juego es fija, no contabilizando las detenciones del juego. El fútbol es quizás el único deporte que no hay una detención real del tiempo de juego y es el arbitro el que regula la duración del mismo. En voleibol el juego no está limitado por un imperativo temporal, el juego finaliza cuando uno de los equipos obtiene tres sets a su favor con una diferencia de dos set de diferencia o en caso de empate (2-2), el primero que consigue anotarse el último set por tie-break (ver apartado 2.1.4. Descripción de la situación).

  16. De acuerdo con Carreras (1993) las duraciones relativas y las frecuencias relativas no tienen por que estar necesariamente relacionadas, puede haber categorías (o conductas) de baja frecuencia relativa pero de alta duración relativa.

  17. En el trabajo de Anguera (1988) se conceptualiza la inobservalidad como el período de tiempo en el que un sujeto no puede ser observado. Esta inobservabilidad, de acuerdo con Anguera (en preparación) puede ser: Propia del sujeto observado, Impropia y Tecnológica. Esta clasificación de la inobservabilidad es manifiesta en los deportes de equipo en las siguientes situaciones:

    1. Inobservabilidad propia. Se observa a un sujeto y éste abandona del terreno de juego (p.e. por expulsión o por lesión).

    2. Inobservabilidad impropia. El observador, en una observación natural, a pesar de estar bien situado, las dimensiones del terreno de juego son excesivamente grandes (p.e. rugby, fútbol y sus distintas variantes anglosajonas y australianas, etc.) por lo que no puede percibir ciertas evoluciones o cuando al jugador observado se da la vuelta y da la espalda al observador.

    3. Inobservabilidad tecnológica. No se utilizan grabaciones propias y se recurre a las emitidas por una cadena de televisión. Los períodos de inobservabilidad se producen con la repetición de las jugadas más interesantes durante el transcurso del partido, cuando la cámara pierde la evolución del balón bien por que éste se sale del ángulo de visión o bien porque el realizador lleva a cabo una toma distinta a la del juego.
      También se produce cuando en grabaciones para deportes como los citados en el párrafo anterior no se utilizan cámaras zenitales que puedan retrasmitir tanto el contexto como el propio juego.

  18. En el Glosario que aparece en el reading dirigido por M.T.Anguera (Anguera et al., 1993) se define el AJUSTE POR INOBSERVABILIDAD como la "estimación de algunos valores correspondientes a medidas (como frecuencia, duración, frecuencia modificada, latencia) en disrupciones temporales, ocultación o inobservabilidad puntual del (de los) sujeto(s) observado(s) a causa de una esporádica ausencia de éste(os) o de la incorrecta ubicación del observador o del instrumento de registro, dada una baja oscilabilidad del curso de la conducta durante el período de inobservabilidad. Solo puede estimarse el ajuste cuando el período sea de corta duración" (pp.589).

  19. Se puede encontrar una detallada descripción en Anguera (1988, pp. 43-49).

  20. Cuando Anguera (1990) describe el Índice correlación líneal de Pearson como índice de fiabilidad cita su utilización en las siguientes circunstancias:

    1. Dos observadores en una sesión de forma simultánea (fiabilidad inter-observadores).

    2. Un observador registrando la misma sesión dos veces (fiabilidad intra-observador).

    3. Dos observadores registrando una misma sesión de observación en períodos distintos de tiempo (fiabilidad como homogeneidad).

    4. Dos observadores registrando dos sesiones de observación muy similares (fiabilidad como equivalencia).

    5. Un observador registrando dos sesiones de observación de dos períodos de tiempo distintos (fiabilidad como constancia o estabilidad).

  21. Puede ser un índice de concordancia de porcentaje de acuerdo cuando existe un concepto lato de intervalo de acuerdo que es independiente de la frecuencia.

  22. Esto se comprueba cuando se observan varios niveles/subniveles de respuesta. Por ejemplo cuando se observa conducta proxémica y conducta gestual, puede coocurrir ambos niveles de respuesta (gesticular y desplazarse). Son muy frecuentes y su análisis se hace viable mediante transformación a datos tipo I.

  23. Los programas informáticos PRACS (elaborado por J.M. Errasti y H. Rifá), TRANSCRIPTOR (elaborado por A. Hernández Mendo, R. Ramos, M. Peralbo y A. Risso) y CODEX (que se presenta en esta investigación, elaborado por M.T. Anguera, M.A. Bermúdez, A. Hernández, M. Peralbo y L.Zas) facilitan la labor de registro.

  24. Agradecemos a la Dra. M.T. Anguera el habernos facilitado este gráfico al respecto de los diseños observacionales.

  25. La posibilidad de llevar a cabo esta supuesta evaluación podría dar origen al replanteamiento de los sistema de juego o incluso en la forma de contratacción de los jugadores. En Cataluña podría evaluarse la línea de defensas del F.C Barcelona y la R.C. Espanyol. En Andalucia la línea de ataque de R.C. Betis y la del F.C. Sevilla. En Galicia cualquier línea entre R.C. Celta de Vigo, R.C. Deportivo de La Coruña y la S.D. Compostela de Santiago de Compostela.


Lecturas: Educación Física y Deportes · http://www.efdeportes.com · Año 8 · Nº 49   sigue Ü