Introducción a la psicometría
Psicometría. Concepto
La aproximación al concepto de Psicometría puede abordarse a través de distintos caminos:
El análisis etimológico: medida de la psique.
Un estudio de las definiciones dadas por expertos: La Psicometría es una disciplina metodológica, dentro del área de la Psicología, cuya tarea fundamental es la medición o cuantificación de las variables psicológicas con todas las implicaciones que ello conlleva, tanto teóricas (posibilidades y criterios de medición) como prácticas (cómo y con qué se mide).
Deducciones de la definición:
La Psicometría deberá ocuparse de la justificación y legitimación de la medición psicológica, para lo cual deberá:
desarrollar modelos formales,
validar los modelos desarrollados,
establecer las condiciones que permitan llevar a cabo el proceso de medición;
La Psicometría deberá también ocuparse de las implicaciones prácticas y aplicadas que dicha medición conlleva:
proporcionando los métodos necesarios,
construyendo los instrumentos necesarios.
La Psicometría no tiene un campo de aplicación específico, abarca a todos los campos de la Psicología.
La psicometría en el marco de la metodología
La Psicometría fue adscrita al área de la Metodología de las Ciencias del Comportamiento.
La Metodología estudia las estrategias y procedimientos que, de una forma más o menos estructurada, se utilizan para la obtención de los conocimientos que constituyen una disciplina científica.
Las Ciencias del Comportamiento son aquellas que estudian la “conducta” mediante la utilización del método científico, con el fin de encontrar estructuras generales o leyes.
Los contenidos de la Metodología de las Ciencias del Comportamiento se pueden agrupar en tres grandes bloques:
El dedicado a los Diseños de investigación: elección y especificación del procedimiento para la obtención de los datos relevantes a la hipótesis.
El dedicado al Análisis de los Datos: proporciona las técnicas necesarias para llevar a cabo el tratamiento estadístico de los datos.
La Psicometría: las reglas que van a permitir llevar a cabo el proceso de operativización de las variables que se quieren medir.
La medición psicológica
La Medición es un problema inherente al desarrollo de la Psicometría y de la Psicología científica.
Hoy en día la medición se toma, en general, como la asignación de números a entidades o eventos con el fin de representar sus propiedades y relaciones.
La polémica surgió cuando en lugar de querer medir atributos físicos, se intentaron medir atributos psicológicos. La mayoría de los atributos psicológicos son conceptos abstractos, constructos teóricos (variables latentes), cuya medición no puede llevarse a cabo de forma directa, sino que debe inferirse a través de la medición de una serie de conductas representativas de dicho constructo. Este tipo de medición suele llamarse medición por indicadores.
Otro problema es el de las unidades de medida que se van a utilizar a la hora de interpretar las puntuaciones. Hay dos formas fundamentales de abordar el problema:
La referida a las normas, que consiste en comparar los resultados obtenidos por el sujeto con los obtenidos por un grupo de sujetos que forman el llamado grupo normativo y que pertenecen a su misma población.
La referida a un criterio, que consiste en comparar los resultados obtenidos por el sujeto con el punto de corte establecido (punto crítico).
En la medición psicológica hay una serie de objetivos fundamentales:
estimar los errores aleatorios que conlleva toda medición (fiabilidad de las medidas) (Temas 4 y 5), y
garantizar que la misma no es algo inútil sino que sirve para explicar y predecir los fenómenos de interés (validez de las medidas) (Temas 6 y 7).
Origen y desarrollo de la psicometría
Se puede situar el origen de la Psicometría hacia la mitad del S. XIX (primera formulación de los problemas científicos en términos matemáticos), que se va a desarrollar a través de dos vías:
La Psicofísica, que permitió el escalamiento de estímulos, y
Los estudios acerca de las diferencias individuales, que posibilitaron el escalamiento de los sujetos.
En la Psicometría clásica se distinguía entre Escalamiento y Teoría de los Tests. En la actualidad esta distinción, aunque se mantiene por cuestiones didácticas, está superada gracias al desarrollo de nuevas teorías de la medición y de numerosas técnicas estadísticas comunes a ambas vertientes de la Psicometría.
Los métodos de escalamiento
El escalamiento es el campo de la Psicometría cuyo objetivo es la construcción de escalas de medida.
Hay dos supuestos básicos en todos los métodos:
la existencia de un continuo latente, subyacente, a lo largo del cual varían los objetos psicológicos que se van a escalar,
que los objetos psicológicos (sujetos, estímulos o respuestas) pueden situarse de forma ordenada a lo largo de ese continuo.
El Escalamiento de Estímulos
La respuesta de los sujetos es una respuesta subjetiva que nos va a permitir diferenciarlos y escalarlos.
El valor que se asigna a cada uno de ellos suele venir determinado por algún índice de tendencia central (media, mediana).
Los sujetos que han emitido juicios han actuado como instrumentos de medida.
Se denominan Métodos de Juicio (Fechner,Stevens,Thurstone)
El Escalamiento de Sujetos
Se utiliza una muestra representativa de sujetos.
Los estímulos son combinados de alguna manera para proporcionar una puntuación numérica para cada sujeto.
Se asume que los estímulos presentados son interpretados de la misma forma por todos los sujetos.
Los estímulos han actuado como instrumento de medida.
Se denominan Métodos de Respuesta (Thurstone,Likert,Osgood)
El Escalamiento simultáneo de Estímulos y Sujetos
Las variaciones encontradas en las respuestas se atribuyen tanto a los sujetos como a los estímulos.
(Guttman,Coombs)
Desarrollo de los métodos de escalamiento de estímulos
El origen de estos métodos está en el problema de cuantificar las relaciones existentes entre las características físicas de los estímulos y las sensaciones que dichos estímulos suscitan en los sujetos.
Métodos de Escalamiento Psicofísico
Ley de Weber
El incremento de magnitud que debe experimentar un estímulo para que el sujeto perciba que se ha producido un cambio, es una proporción constante de su magnitud inicial.
A este cambio mínimo de sensación la llama diferencia apenas perceptible
WEBER es el iniciador de los primeros estudios en la Psicofísica, que tiene por objeto el estudio de las relaciones entre los estímulos físicos y las sensaciones que dichos estímulos suscitan en los sujetos, así como las razones de esas relaciones.
Críticas a la ley de Weber:
Los estímulos de muy alta o muy baja intensidad no se ajustan bien a ella.
Tampoco lo hacen todos los sistemas sensoriales.
Modelo de Fechner
A partir de Weber , Fechner desarrolló una serie de métodos denominados métodos psicofísicos indirectos, que permitían elaborar unas escalas psicofísicas.
En el escalamiento psicofísico se tienen dos continuos: un continuo físico, a lo largo del cual varían los estímulos y un continuo psicológico, a lo largo del cual variarán las sensaciones que dichos estímulos producen en los sujetos.
Según Fechner la función que mejor representa la relación entre ambos continuos es una función logarítmica:
S’ = C. ln E + A
Supuestos del Modelo:
Asume la Ley de Weber
Asume que las d.a.p. son iguales,
Establece el punto 0 de la escala en el Umbral Absoluto.
El Umbral Absoluto es la magnitud física del estímulo que se requiere para que se produzca una sensación.
El Umbral Diferencial es el incremento mínimo, en la magnitud del estímulo, que se requiere para que el sujeto perciba un cambio en la sensación.
De ello se deduce que mientras la estimulación aumenta en progresión geométrica, la sensación lo hace en progresión aritmética.
Índices de Ajuste:
Una vez obtenidas las dos series de valores será necesario comprobar si la relación que existe entre ellas es la que postula FECHNER.
Para ello se transforman los valores del E a lnE y se introducen ambas series de valores (lnE y S) en la calculadora, en el Mode REG, lo que nos permitirá obtener los valores de A, de C y de RSlnE
Varios son los índices de ajuste:
Los errores de pronóstico: S – S’:
- cuanto más pequeños sean, mejor será el ajuste.
Error Cuadrático Medio: ECM = Varianza de los errores:
- cuanto mayor sea, peor será el ajuste.
Coeficiente de Correlación entre SlnE = SS’:
es un indicador del grado de ajuste de los datos a la función de Fechner
cuanto mayor sea, mejor será el ajuste,
varía entre 0 y 1
Coeficiente de Determinación R2:
es otro indicador del grado de ajuste
coincide su valor con la proporción de varianza de S explicada por lnE
1 – R2 representa la proporción de varianza no explicada.
Pero el problema fundamental está en la obtención experimental de los umbrales absoluto y diferencial.
Los Métodos Psicofísicos utilizan tres tipos fundamentales de tareas:
Medición de la Capacidad de Detección:
se mide a través del cálculo de los umbrales absolutos
la capacidad de reconocer una señal sobre fondo de ruido
Medición de la Capacidad de Discriminación:
se mide a través del cálculo de los umbrales diferenciales
detectar un cambio en la estimulación, que va a indicarnos que se produce un cambio cuantitativo en la sensación.
Medición de la Capacidad de hacer Estimaciones Subjetivas:
- comparar hasta qué punto las estimaciones subjetivas que realizan las personas acerca de las magnitudes de los estímulos se ajustan a sus magnitudes reales.
La Psicofísica de Fechner se ocupa de las dos primeras tareas. Fechner desarrolló tres métodos para estimar los umbrales absoluto y diferencial:
Método de los Límites (de los cambios mínimos)
Es el experimentador el que manipula la intensidad del estímulo
El sujeto se limita a emitir juicios (si, no, mayor, igual, menor)
Obtención del Umbral Absoluto:
Se presentan los estímulos en series ascendentes y descendentes, alternadas.
La tarea del sujeto es decir si detecta o no el estímulo (tarea de detección)
En cada serie se calcula la media de los valores del estímulo que corresponden al cambio de no detección a detección.
El Umbral Absoluto es la media de todas las medias, obtenidas a lo largo de los distintos ensayos (con la calculadora en el Mode SD).
Obtención del Umbral Diferencial:
El experimentador selecciona un estímulo estándar y junto a él va presentando estímulos de comparación.
La tarea del sujeto consiste en decir si el estímulo de comparación es mayor, igual o menor que el estímulo estándar (tarea de discriminación).
La presentación de los estímulos de comparación se realiza en series ascendentes y descendentes, alternadas.
Hay dos puntos de inflexión: el paso de “mayor” a “igual”, y el paso de “igual” a “menor”.
Se calcula la media total de los puntos de inflexión superiores y la media total de los puntos de inflexión inferiores.
El intervalo de incertidumbre es la diferencia de ambas medias.
El Umbral Diferencial es la mitad del intervalo de incertidumbre.
Método de Ajuste (del error promedio)
Es el propio sujeto el que va manipulando la intensidad de los estímulos hasta encontrar el valor de los umbrales.
Fechner lo utilizó con medidas visuales y táctiles.
Obtención del Umbral Absoluto:
A partir de un valor del estímulo, el sujeto va modificando su intensidad hasta que lo detecta o deja de percibirlo (tarea de detección).
El Umbral Absoluto será la media aritmética (o la media geométrica) de los valores obtenidos a lo largo de los distintos ensayos (con la calculadora en el Mode SD).
Obtención del Umbral Diferencial:
Se presenta un estímulo estándar con otro de comparación.
El sujeto va modificando la intensidad del estímulo de comparación hasta que considera que es igual que el estímulo estándar, anotando su intensidad (tarea de discriminación).
Después de una serie de ensayos, se obtendrá una distribución de frecuencias, que nos dirá el número de veces que cada uno de los estímulos ha sido considerado igual que el estímulo estándar.
El PIS = media de los valores de la anterior distribución (con la calculadora en el Mode SD)
Umbral Diferencial = Cuartil 3- Cuartil 1 de la anterior distribución; o también a la diferencia PIS –St (desviación típica de la anterior distribución).
Método de los estímulos constantes
- Este procedimiento asume que cuanto un estímulo se presenta a un mismo sujeto en repetidas ocasiones no siempre es percibido, y cuando lo percibe no siempre le produce la misma sensación (variabilidad perceptual).
Obtención del Umbral Absoluto:
Se fijan de antemano los valores del estímulo que se van a utilizar.
Se presentan al sujeto, aleatoriamente, a lo largo de varios ensayos.
El Umbral Absoluto es el valor del estímulo que ha sido detectado el 50 % de los casos (la Mediana).
Ello puede hacerse de dos formas: por Interpolación Lineal o Por mínimos cuadrados, en la distribución de frecuencias donde aparece el número de veces que ha sido percibido cada estímulo (tarea de detección).
Obtención del Umbral Diferencial:
Se fija un valor del estímulo como estándar y se eligen una serie de estímulos de comparación, cuyo valor estará situado simétricamente en torno al valor del estímulo estándar.
El sujeto debe responder si el estímulo de comparación es mayor, igual o menor que el estímulo estándar (tarea de discriminación).
Se forma una distribución de frecuencias donde aparezca el número de veces que cada estímulo ha sido considerado “mayor” que el estímulo estándar.
El Umbral Diferencial es la diferencia entre el percentil 75 y el percentil 25 de dicha distribución.
Ello puede hacerse de dos formas: por Interpolación lineal o Por mínimos cuadrados.
Críticas a la Ley de Fechner:
Los estímulos de muy alta o muy baja intensidad no se ajustan bien a ella
Tampoco lo hacen todos los sistemas sensoriales.
Modelo de Stevens
STEVENS realiza una reformulación de la Psicofísica fechneriana, proponiendo una función nueva, la Función Potencial:
R’ = q. En
Que también admite una transformación logarítmica:
Ln R’ = Ln q + n. Ln E
(Con la calculadora en el Mode REG, introduciendo los valores de LnE y LnR)
A los métodos de Stevens se les conoce como métodos directos de escalamiento, ya que los sujetos realizan estimaciones subjetivas, en lugar de tareas de detección o discriminación.
Stevens no basa sus mediciones ni en las d.a.p. ni en el concepto de umbral.
Asume la presencia de dos continuos: uno físico (estímulos) y otro psicológico (las respuestas), y establece que cuando el estímulo crece en proporciones iguales, la sensación aumenta, asimismo, en proporciones iguales.
El valor de “n” expresa la capacidad de discriminación de un sistema sensorial. Cuanto menor sea “n”, mayor será la capacidad de discriminación.
Supuestos del Modelo:
Asume la ley de Weber.
Asume que el incremento de la sensación es función lineal de la estimulación.
Índices de Ajuste:
Se utiliza su forma logarítmica.
Dados los valores de E y R, se calculan LnE y LnR, y se introducen en la calculadora en el Mode REG.
De ella podemos obtener los valores de “q”, “n”, “RlnElnR”, que es un índice de la bondad de ajuste del modelo.
Varios son los índices de ajuste:
Los errores de pronóstico: R – R’
- cuanto más pequeños sean, mejor será el ajuste.
Error cuadrático medio = ECM = Varianza de los errores:
- cuanto mayor sea, peor será el ajuste.
Coeficiente de Determinación R2lnElnR:
es otro indicador del grado de ajuste.
su valor coincide con la proporción de varianza de LnR explicada por LnE
1 – R2 representa la proporción de varianza no explicada.
Entre los métodos de escalamiento que utiliza Stevens podemos distinguir:
Métodos de emparejamiento de magnitudes
Modalidad cruzada:
Se utilizan dos continuos físicos diferentes.
La tarea del sujeto es emparejar uno con otro.
El sujeto manipula el estímulo que se le presenta hasta que lo ajusta a otro dado.
Estimación de magnitudes:
Se le presenta al sujeto un estímulo, que va a servir de estímulo estándar, a partir del cual habrá de estimar los valores del resto de estímulos.
Es decir, el sujeto empareja los números con los estímulos.
Producción de magnitudes:
La tarea es inversa al método anterior.
El experimentador presenta una serie de números, de forma aleatoria, uno a uno, y el sujeto manipula la intensidad del estímulo en base a los números presentados.
Métodos de Emparejamiento de Razones
Modalidad Cruzada:
- Se presentan al sujeto dos estímulos que guardan entre sí una determinada proporción y se le pide al sujeto que ajuste otros dos, pertenecientes a otro continuo, de manera que guarden entre sí la misma proporción.
Estimación de Razones:
Se le presentan al sujeto todos los pares de estímulos y su tarea consiste en hacer estimaciones de las razones que hay entre ellos, asignando un número que representa esa razón.
Se trata de ajustar razones numéricas a las razones entre los estímulos.
Producción de Razones:
Se conoce como Método de Fraccionamiento.
Se le presenta al sujeto un estímulo estándar y un proporción numérica.
La tarea del sujeto consiste en producir un estímulo que guarde con el estándar una proporción igual a la presentada.
Métodos de Emparejamiento de Intervalos
Por Modalidad Cruzada:
- Dados dos continuos divididos en intervalos, el sujeto habrá de emparejar los intervalos existentes entre los estímulos de un continuo con los intervalos del otro continuo.
Estimación de Magnitudes:
- Se le presenta al sujeto una serie de estímulos diferentes entre sí y se le pide que, mediante números, haga una estimación de las diferencias estimulares.
Producción de Magnitudes:
Se le presenta al sujeto dos estímulos y su tarea consiste en:
encontrar un estímulo intermedio (bisección), o
encontrar una serie de estímulos que dividen el intervalo entre los estímulos en más de dos mitades iguales (equisección), o
es una serie de intervalos distintos (multisección).
Escalas de Categorías:
Es uno de los métodos más utilizados, tanto en Psicología como en Sociología.
Consiste en asignar a una serie de categorías establecidas de antemano, los estímulos presentados.
Las categorías estarán ordenadas y sus límites serán fijos, salvo por error aleatorio.
Métodos de escalamiento psicológico
Surgieron al tratar de escalar estímulos que no variaban a lo largo de ningún continuo físico.
La figura más importante es Thurstone.
Desarrolló un modelo basado en:
la variabilidad perceptual de los sujetos, y
en la limitación que tienen los sujetos para percibir diferencias entre dos estímulos, cuando éstas son muy pequeñas.
Desarrolló dos modelos: la Ley del juicio comparativo y la Ley del juicio categórico.
A partir de Thurstone se desarrollaron otros modelos: Guttman(Tema 3) (Modelo del Escalograma), Coombs(no entra en el programa) (Modelo del Despliegue), etc,……
Origen y desarrollo de los tests
El intento de apreciar de forma sistemática las diferencias individuales llevó al Método de los Tests y a las distintas Teorías de los Tests.
China, Platón, Hipócrates, Huarte de San Juan.
Hubo que esperar a la mitad del S.XIX para que se desarrollaran procedimientos formalizados para la evaluación de las diferencias individuales: los tests.
Un Test es un instrumento de medición diseñado especialmente para estudiar de un modo objetivo y sistemático el nivel de los sujetos respecto a algún atributo, característica o dominio de conocimientos y, a partir de las puntuaciones que obtienen los sujetos en el test, poder analizar las diferencias existentes entre ellos.
Hay tres factores decisivos en el desarrollo de los tests:
La apertura del laboratorio antropométrico de Galtón en Londres.
El desarrollo de la correlación de Pearsón.
La interpretación que Spearman hace de ella.
Galton
Medio primo de Darwin.
Wundt no está de acuerdo con evolucionismo, lo que propició la separación entre Psicología Experimental y Psicología Diferencial.
Galton todavía creía que la medición de las características mentales estaba estrechamente relacionada con las características físicas.
Comenzó elaborando distribuciones de frecuencias: la distribución normal. Fue el primero en aplicar el concepto estadístico de distribución normal, la media, la mediana, varianza y correlación de datos psicológicos.
Construyó los primeros tests psicométricos, pero caracterizados por un fuerte carácter antropométrico, sensorial y motor.
Primeros tests mentales
Cattell utilizó por primera vez el término Tests Mental. Pero los tests, al igual que los de Galtón, tenían carácter sensorial y motor fundamentalmente.
Fue necesario llegar a finales del S. XIX para aceptar que estos tests que no medían la inteligencia.
Primeros tests de inteligencia
Binet fue el primero en darse cuenta de que era necesario centrarse en el estudio de los procesos mentales superiores.
Realizó, junto a Simón, la primera escala de inteligencia, que se ocupaba de la capacidad de comprensión y razonamiento de los niños.
La adaptación más conocida fue la realizada por Termán.
La finalidad inicial de la escala era detectar a los sujetos que presentaran algún tipo de retraso intelectual. Para poder interpretar las puntuaciones desarrolló el concepto de Edad Mental, que equivale a la edad cronológica de los más intelectualmente normales, cuya media en la escala es igual a la puntuación obtenida por el niño examinado.
Termán utiliza como medida de la inteligencia el concepto de Cociente Intelectual acuñado por Stern, que es igual a la Edad Mental dividida por le Edad Cronológica y multiplicado por 100.
Los tests colectivos
La entrada de Estados Unidos en la 1ª Guerra Mundial, y la necesidad de seleccionar y clasificar el contingente de personas disponibles, hizo que encargaran a Yerkes el diseño de las formas Alpha (para la población general) y Beta (para los reclutas analfabetos y para aquellos que no dominaban el inglés). Fue el comienzo de los Tests Colectivos.
Cattell fundó la primera empresa especializada en la publicación masiva de tests.
En 1938 apareció el Test de Wechsler para medir la inteligencia en adultos, y en 1949 la versión para niños Wisc.
¿Qué es lo que miden realmente los tests? ¿Existen realmente los rasgos que dicen medir los tests?.
Para dar respuesta a estas preguntas se desarrollaron el Coeficiente de Correlación de Pearson y las técnicas correlacionales conocidas como Análisis Factorial (Spearman).
La influencia del análisis factorial fue doble:
dio fundamentación teórica a la utilización de los tests
los resultados subrayan la importancia de estudiar otras aptitudes más específicas en el campo de la inteligencia.
Las baterías de aptitud múltiple
Su finalidad era proporcionar una medida de la posición de cada sujeto en un cierto número de rasgos.
Batería de Aptitudes Mentales de Thurstone.
Los tests de personalidad
KRAEPELIN es el precursor de los tests de personalidad.
El prototipo de cuestionario personalidad con carácter psicométrico es la Hoja de Datos Personales de Woodward.
De los primeros tests hay tres que han sobrevivido en la actualidad:
una serie desarrollada por Guiford y cols.
otra serie desarrollada por Cattell y cols.
se usan ambas en poblaciones normales,
están basadas en el análisis factorial,
están orientadas hacia los rasgos.
el MMPI de Hathaway y Mckinsky:
no utilizaba escalas derivadas del análisis factorial,
está orientada hacia una clasificación psiquiátrica.
Durante la primera mitad del S.XX se desarrollaron los Tests Proyectivos. Rorschach diseñó el primero el primero (Test de las Manchas de Tinta).
Su utilización ha ido disminuyendo por una serie de causas:
un aumento del escepticismo en torno a estos instrumentos,
el desarrollo de procedimientos alternativos,
la asociación de estas técnicas con el psicoanálisis.
A pesar de todo el Test de Rorschach sigue mostrando su utilidad.
La medición de intereses y actitudes
SVIB de Srong, la Escala de Preferencias de Kuder.
Respecto a las actitudes Thurstone desarrolló dos modelos: la Ley de Juicio Comparativo y la Ley del Juicio Categórico (Tema 3).
Años más tarde Likert elaboró otra técnica más fácil de elaborar que las de Thurstone (Tema 3).
Con el fin de medir el significado connotativo que determinados estímulos tienen para los sujetos, Osgood desarrolló el Diferencial Semántico (Tema 3).
Los tests referidos al criterio
Hasta los años 60 y 70 del S. XX los tests que se habían desarrollado servían para evaluar el grado de aptitud en un determinado rasgo, pero interpretando los resultados en relación a los que se habían obtenido en su grupo normativo (Tests referidos a las normas).
No servían para satisfacer la necesidad de averiguar si los sujetos habían alcanzado o no los objetivos mínimos a nivel educativo, inquietud surgida en las décadas mencionadas. Por ello se desarrollaron otros tipos de tests: Tests referidos al criterio. Se trataba de averiguar hasta qué punto los alumnos dominaban el contenido de determinadas materias.
GLASER fue el primero que distinguió entre ambas aproximaciones. Hay grandes diferencias entre los T.R.N. y los T.R.C.:
La finalidad de la evaluación:
En los T.R.N. el objetivo es poner de manifiesto las diferencias individuales en el rasgo medido.
En los T.R.C. el objetivo es estimar el rendimiento o conducta del sujeto en los objetivos que mide el test.
La construcción del test:
En los T.R.N. se suele recurrir a las teorías sobre el rasgo medido.
En los T.R.C. lo primero es especificar de una manera clara el dominio de contenidos que se quieren evaluar.
La forma de seleccionar los ítems:
En los T.R.N. los ítems deben poner de relieve las diferencias individuales, seleccionando ítems de dificultad media y alto poder discriminativo. (Tema 8)
En los T.R.C. los ítems se seleccionan en función de los objetivos y usos del test.
El significado de las puntuaciones:
En los T.R.N. la puntuación obtenida por los sujetos se considera un indicador de su puntuación verdadera en un rasgo latente. (Tema 4)
En los T.R.C. la puntuación es un estimador de la conducta o rendimiento del sujeto en el dominio. (Tema 5)
La interpretación de las puntuaciones:
En los T.R.N. la puntuación tiene significado únicamente con relación a los resultados del grupo normativo.
En los T.R.C. la puntuación tiene significado en términos absolutos.
Desarrollo de la teoría de los tests
Cuando se aplica un test a una muestra de sujetos se pueden plantear varias preguntas:
¿En qué medida las puntuaciones reflejan el nivel de cada sujeto en la característica medida?
¿Cómo estar seguros de que la puntuación obtenida es la que le corresponde a cada sujeto realmente?
¿Qué error está afectando a esas puntuaciones?
Analizar hasta qué punto las puntuaciones obtenidas por los sujetos en un test equivalen a sus puntuaciones verdaderas y cuál es la cuantía del error de medida, se realiza a través de la Fiabilidad de las puntuaciones (Temas 4 y 5)
La validez de las inferencias o conclusiones que se pueden sacar a partir de las puntuaciones, se estudia a través de la Validez de las puntuaciones (Temas 6 y 7)
Para dar respuesta a estos problemas se desarrolló un marco teórico, la Teoría de los Tests, que va a permitir establecer una relación funcional entre las variables observables (puntuaciones empíricas) y las variables inobservables (puntuaciones verdaderas).
Ello significa establecer una función matemática o modelo. Los que más incidencia han tenido han sido la Teoría de los Tests (T.C.T.) y la Teoría de Respuesta al Ítem (T.R.I.)
La TCT
Se desarrolló fundamentalmente a partir de las aportaciones de GALTON, PEARSON y SPEARMAN.
Gira en torno a tres conceptos: puntuaciones empíricas (X), puntuaciones verdaderas (V) y puntuaciones debidas al error (E). Entre ellas establece una relación lineal: X = V + E; es el Modelo Lineal de Spearman (Ver Tema 4)
El objetivo de la T.C.T. es estudiar el error de medida presente en cualquier medición realizada en el campo psicológico y educativo, para inferir (estimar) el nivel real de los sujetos en el rasgo que mide el test. Estos errores son aleatorios y pueden provenir de numerosas fuentes.
Se han realizado algunos intentos de sistematizar y clasificar el error en función de las posibles fuentes. El más ambicioso y global fue la Teoría de la Generalizabilidad de CRONBACH, que tiene en cuenta todas las posibles fuentes de error, e intenta diferenciarlas mediante la aplicación de los procedimientos clásicos de Análisis de Varianza.
La T.G. suele ser considerada más una extensión de la T.C.T. que un modelo alternativo.
La TRI
Tres críticas a la T.C.T.:
Que la puntuación obtenida dependía del conjunto de ítems o tests utilizados.
Que los estadísticos de los ítems (índice de dificultad, índice de discriminación), dependían de la muestra de sujetos utilizados.
La indiferenciación del error.
A la tercera crítica trata de dar respuesta la Teoría de la Generalizabilidad.
A las dos primeras trataron de dar respuesta Gulliksen y Lord con la formulación de la Teoría de Respuesta al Ítem, que proporciona una serie de modelos que asumen una relación funcional entre los valores de la variable que miden los ítems y la probabilidad de que los sujetos, en función de sus habilidades, acierten cada ítem (Curva Característica del Ítem). (Temas 10 y 11)
El desarrollo de estos modelos supuso un gran avance en la Teoría de los Tests. La necesidad de utilizar los ordenadores fue la causa de que su desarrollo no llegara hasta finales del S. XX.