¿QUÉ REQUISITOS DEBE CUBRIR
UN INSTRUMENTO DE MEDICIÓN?
Toda medición o
instrumento de recolección de los datos debe reunir dos requisitos
esenciales: confiabilidad y validez. La confiabilidad de un instrumento de medición se refiere al
grado en que su aplicación repetida al mismo sujeto u objeto,
produce iguales resultados. Por ejemplo, si yo midiera en este
momento la temperatura ambiental mediante un termómetro y me
indicara que hay 220C. Un minuto más tarde consultara
otra vez y el termómetro me indicara que hay 50C. Tres
minutos después observara el termómetro y ahora me indicara que
hay 400C. Este termómetro no sería confiable (su
aplicación repetida produce resultados distintos). Igualmente, si
una prueba de inteligencia la aplico hoy a un grupo de personas y
me proporciona ciertos valores de inteligencia; la aplico un mes
después y me proporciona valores diferentes, al igual que en
subsecuentes mediciones. Esa prueba no es confiable (analícense
los valores de la figura 9.1, suponiendo que los coeficientes de
inteligencia puedan oscilar entre 95 y 150). Los resultados no son
consistentes; no se puede “confiar” en ellos.
FIGURA 9.1
EJEMPLO DE RESULTADOS
PROPORCIONADOS POR
UN INSTRUMENTO DE
MEDICIÓN SIN CONFIABILIDAD
PRIMERA
SEGUNDA TERCERA
APLICACIÓN
APLICACIÓN APLICACIÓN
Martha
130 Laura 131 Luis
140
Laura
125 Luis 130 Teresa 129
Arturo
118 Marco 127
Martha 124
Luis
112 Arturo 120 Rosa
María 120
Marco
110 Chester 118 Laura 109
Rosa Maria
110 Teresa 118 Chester 108
Chester 108 Martha 115 Arturo 103
Teresa 107 Rosa María 107 Marco 101
La confiabilidad de un
instrumento de medición se determina mediante diversas técnicas,
las cuales se comentarán brevemente después de revisar el concepto
de validez.
La validez, en términos
generales, se refiere al grado en que un instrumento realmente
mide la variable que pretende medir. Por ejemplo, un instrumento
para medir la inteligencia válido debe medir la inteligencia y no
la memoria. Una prueba sobre conocimientos de Historia debe medir
esto y no conocimientos de literatura histórica. Aparentemente es
sencillo lograr la validez. Después de todo —como dijo un
estudiante— “pensamos en la variable y vemos cómo hacer preguntas
sobre esa variable”. Esto seria factible en unos cuantos casos
(como lo sería el “sexo” de una persona). Sin embargo, la
situación no es tan simple cuando se trata de variables como la
motivación, la calidad de servicio a los clientes, la actitud
hacia un candidato político y menos aun con sentimientos y
emociones, así como diversas variables con las que trabajamos en
ciencias sociales. La validez es una cuestión más compleja que
debe alcanzarse en todo instrumento de medición que se aplica.
Kerlinger (1979, p. 138) plantea la siguiente pregunta respecto a
la validez: ¿Está usted midiendo lo que usted cree que está
midiendo? Si es así, su medida es válida; si no, no lo es.
La validez es un concepto del
cual pueden tenerse diferentes tipos de evidencia (Wiersma, 1986;
Gronlund, 1985): 1) evidencia relacionada con el contenido, 2) evidencia relacionada con el criterio y 3) evidencia
relacionada con el constructo. Hablemos de cada una de ellas.
1) Evidencia
relacionada con el contenido
La validez de
contenido se refiere al grado en que un instrumento refleja un
dominio específico de contenido de lo que se mide. Es el grado en
que la medición representa al concepto medido (Bohrnstedt, 1976).
Por ejemplo, una prueba de operaciones aritméticas no tendrá
validez de contenido si incluye sólo problemas de resta y excluye
problemas de suma, multiplicación o división (Carmines y Zeller,
1979). 0 bien, una prueba de conocimientos sobre las canciones de
“Los Beatles” no deberá basarse solamente en sus álbumes Tet it
Be”y “Abbey Road”, sino que debe incluir canciones de todos sus
discos.
Un instrumento de
medición debe contener representados a todos los items del
dominio de contenido de las variables a medir. Este hecho se
ilustra en la figura 9.2.
2) Evidencia
relacionada con el criterio
La validez de
criterio establece la validez de un instrumento de medición
comparándola con algún criterio externo. Este criterio es un
estándar con el que se juzga la validez del instrumento (Wiersma,
1986). Entre los resultados del instrumento de medición se
relacionen más al criterio, la validez del criterio será mayor.
Por ejemplo, un investigador valida un examen sobre manejo de
aviones, mostrando la exactitud con que el examen predice qué tan
bien Un grupo de pilotos puede operar un aeroplano.
Si el criterio se fija
en el presente, se habla de validez concurrente (los
resultados del instrumento se correlacionan con el criterio en el
mismo momento o punto del tiempo). Por ejemplo, un cuestionario
para detectar las preferencias del electorado por los distintos
partidos contendientes, puede validarse aplicándolo tres o cuatro
días antes de la elección y sus resultados compararlos con los
resultados finales de la elección (si no hay fraude —desde
luego—).
Si el criterio se fija
en el futuro, se habla de validez predicativa. Por
ejemplo, una prueba para determinar la capacidad administrativa de
altos ejecutivos se puede validar comparando sus resultados con el
futuro desempeño de los ejecutivos medidos.
3) Evidencia
relacionada con el constructo
La validez de
constructo es probablemente 35 la más importante
sobre todo desde una perspectiva científica y se refiere al grado
en que una medición se relaciona consistentemente con otras
mediciones de acuerdo con hipótesis derivadas teóricamente y que
conciernen a los conceptos (o constructos) que están siendo
medidos. Un constructo es una variable medida y que tiene
lugar dentro de una teoría o esquema teórico.
Por ejemplo, supongamos
que un investigador desea evaluar la validez de constructo de una medición particular, digamos una escala de motivación
intrínseca: “el Cuestionario de Reacción a Tareas”, versión
mexicana (Hernández-Sampieri y Cortés, 1982). Estos autores
sostienen que el nivel de motivación intrínseca hacia una tarea
está relacionado positivamente con el grado de persistencia
adicional en el desarrollo de la tarea (v.g., los empleados con
mayor motivación intrínseca son los que suelen quedarse más tiempo
adicional una vez que concluye su jornada). Consecuentemente, la
predicción teórica es que a mayor motivación intrínseca, mayor
persistencia adicional en la tarea. El investigador administra
dicho cuestionario de motivación intrínseca a un grupo de
trabajadores y también determina su persistencia adicional en el
trabajo. Ambas mediciones son correlacionadas. Si la correlación
es positiva y sustancial, se aporta evidencia para la validez de
constructo del Cuestionario de Reacción a Tareas, versión
mexicana (a la validez para medir la motivación intrínseca).
La validez de
constructo incluye tres etapas:
1) Se
establece y especifica la relación teórica entre los conceptos (sobre la base del marco teórico).
2) Se
correlacionan ambos conceptos y se analiza cuidadosamente la
correlación.
3) Se
interpreta la evidencia empírica de acuerdo a qué tanto clarifica
la validez de constructo de una medición en particular.
El proceso de validación de un constructo está vinculado con la teoría. No
es posible llevar a cabo la validación de constructo, a menos que
exista un marco teórico que soporte a la variable en relación con
otras variables. Desde luego, no es necesaria una teoría sumamente
desarrollada, pero si investigaciones que hayan demostrado que los
conceptos están relacionados. Entre más elaborado y comprobado se
encuentre el marco teórico que apoya la hipótesis, la validación
de constructo puede arrojar mayor luz sobre la validez de un
instrumento de medición. Y mayor confianza tenemos en la validez
de constructo de una medición, cuando sus resultados se
correlacionan significativamente con un mayor número de mediciones
de variables que teóricamente y de acuerdo con estudios
antecedentes están relacionadas. Esto se representa en la figura
9.3.
Para analizar las
posibles interpretaciones de evidencia negativa en la validez
de constructo, se sugiere consultar a Cronbach y Meehí (1955)
y Cronbach (1984).
VALIDEZ TOTAL = VALIDEZ DE
CONTENIDO + VALIDEZ
DE CRITERIO + VALIDEZ DE CONSTRUCTO
Así, la validez de un
instrumento de medición se evalúa sobre la base de tres tipos de
evidencia. Entre mayor evidencia de validez de contenido, validez
de criterio y validez de constructo tenga un
instrumento de medición; éste se acerca más a representar la
variable o variables que pretende medir.
Cabe agregar que un
instrumento de medición puede ser confiable pero no necesariamente
válido (un aparato —por ejemplo— puede ser consistente en los
resultados que produce, pero no medir lo que pretende). Por ello
es requisito que el instrumento de medición demuestre ser confiable y válido. De no ser así, los resultados de la
investigación no los podemos tomar en seno.
