CÁLCULO DE LA VALIDEZ
La validez de contenido
es compleja de
obtener. Primero, es necesario revisar cómo ha sido utilizada la
variable por otros investigadores. Y en base a dicha revisión
elaborar un universo de ítems posibles para medir la variable y sus
dimensiones (el universo tiene que ser lo más exhaustivo que sea
factible). Posteriormente, se consulta con investigadores
familiarizados con la variable para ver si el universo es
exhaustivo. Se seleccionan los items bajo una cuidadosa evaluación.
Y si la variable tiene diversas dimensiones o facetas que la
componen, se extrae una muestra probabilística de ítems (ya sea al
azar o estratificada —cada dimensión constituiría un estrato—). Se
administran los ítems, se correlacionan las puntuaciones de los
ítems entre si (debe haber correlaciones altas, especialmente entre
ítems que miden una misma dimensión) (Bohrnstedt, 1976), y se hacen
estimaciones estadísticas para ver si la muestra es representativa.
Para calcular la validez de contenido son necesarios varios
coeficientes.
La validez de criterio
es más sencilla
de estimar, lo único que hace el investigador es correlacionar su
medición con el criterio, y este coeficiente es el que se toma como
coeficiente de validez (Bohmstedt, 1976). Esto podría representarse
así:

La validez de
constructo se
suele determinar mediante un procedimiento denominado “Análisis de
Factores”. Su aplicación requiere de sólidos conocimientos
estadísticos y del uso de un programa estadístico apropiado en
computadora. Para quien desee compenetrarse con esta técnica
recomendamos consultar a Harman (1967), Gorsuch (1974), Nie et al.
(1975), On-Kim y Mueller (1978a y 1978b) y Hunter (1980).
Asimismo, para aplicarlos se sugiere revisar a Nieetal. (1975),
Cooper y Curtis (197~) y —en español— Padua (1979). Aunque es
requisito conocer el programa estadístico para computadora. Esta
técnica se describe en la página 420.
¿QUÉ PROCEDIMIENTO SE SIGUE PARA CONSTRUIR UN INSTRUMENTO DE
MEDICIÓN?
Existen diversos tipos de
instrumentos de medición, cada uno con características diferentes.
Sin embargo, el procedimiento general para construirlos es
semejante. Antes de comentar este procedimiento, es necesario
aclarar que en una investigación hay dos opciones respecto al
instrumento de medición:
1) Elegir un
instrumento ya desarrollado y disponible, el cual se adapta a los
requerimientos del estudio en particular.
2) Construir un
nuevo instrumento de medición de acuerdo con la técnica apropiada
para ello.
En ambos casos es
importante tener evidencia sobre la confiabilidad y validez del
instrumento de medición.
El
procedimiento que
sugerimos para construir un instrumento de medición es el siguiente,
especialmente para quien se inicia en esta materia.
PASOS
a)
LISTAR LAS
VARIABLES
que se pretende medir u
observar.
b)
REVISAR SU DEFINICIÓN CONCEPTUAL Y COMPRENDER SU SIGNIFICADO. Por
ejemplo, comprender bien qué es la motivación intrínseca y qué
dimensiones la integran.
c)
REVISAR CÓMO HAN SIDO DEFINIDAS OPERACIONAL
-MENTE LAS VARIABLES,
esto es, cómo se ha medido cada variable. Ello implica comparar los
distintos instrumentos o maneras utilizadas para medir las variables
(comparar su confiabilidad, validez, sujetos a los cuales se les
aplicó, facilidad de administración, veces que las mediciones han
resultado exitosas y posibilidad de uso en el contexto de la
investigación).
d) ELEGIR EL INSTRUMENTO O LOS INSTRUMENTOS (YA DESARROLLADOS) QUE
HAYAN SIDO FAVORECIDOS POR LA COMPARACIÓN Y ADAPTARLOS AL CONTEXTO
DE LA INVESTIGACIÓN.
En este caso sólo deben
seleccionarse instrumentos cuya confiabilidad y validez se reporte.
No se puede uno fiar de una manera de medir que carezca de evidencia
clara y precisa de confiabilidad y validez. Cualquier investigación
seria reporta la confiabilidad y validez de su instrumento de
medición. Recuérdese que la primera varía de O a 1 y para la
segunda se debe mencionar el método
utilizado de validación y
su interpretación. De no ser así no podemos asegurar que el
instrumento sea el adecuado. Si se selecciona un instrumento
desarrollado en otro país, deben hacerse pruebas piloto más extensas
(véase el paso G). También, no debe olvidarse que traducir no es
validar un instrumento, por muy buena que sea la traducción.
O en caso de que no se
elija un instrumento ya desarrollado, sino que se prefiera construir
o desarrollar uno propio, debe pensarse en cada variable y sus
dimensiones, y en indicadores precisos e ítems para cada dimensión.
En este segundo caso,
debemos
asegurarnos de tener un suficiente número de ítems para medir todas
las variables en todas sus dimensiones. Ya sea que se seleccione un
instrumento previamente desarrollado y se adapte o bien, se
construya uno, éste constituye la versión preliminar de nuestra
medición. Versión que debe pulirse y ajustarse, como se verá más
adelante.
e)
INDICAR EL NIVEL DE MEDICIÓN DE CADA ÍTEM Y, por ende, EL DE LAS
VARIABLES.
Existen CUATRO NIVELES
DE MEDICIÓN ampliamente conocidos:
1. Nivel de
medición nominal. En este nivel se tienen dos o más categorías
del ítem o variable. Las categorías no tienen orden o jerarquía. Lo
que se mide es colocado en una u otra categoría, lo que indica
solamente diferencias respecto a una o más características.
Por ejemplo, la variable
sexo de la persona tiene sólo dos categorías: masculino y femenino
(si la variable fuera “práctica sexual” podría haber tal vez más,
pero sexo sólo tiene dos categorías). Ninguna de las categorías
tiene mayor jerarquía que la otra, las categorías únicamente
reflejan diferencias en la variable. No hay orden de mayor a menor.
Si les asignamos una
etiqueta o símbolo a cada categoría, éste exclusivamente identifica
a la categoría. Por ejemplo:
* = Masculino
z = Femenino
Si usamos numerales es lo
mismo:
Los números utilizados en
este nivel de medición tienen una función puramente de clasificación
y no se pueden manipular aritméticamente. Por ejemplo, la
afiliación religiosa es una variable nominal, si pretendiéramos
operarla aritméticamente tendríamos situaciones tan ridículas como
ésta:
1 = Católico
2 =
Judío 1+2=3
3 = Protestante
4 =
Musulmán Un católico + un judío =
protestante?
5 = Otros
No tiene sentido.
Las variables nominales
pueden incluir dos categorías (se les llama dicotómicas) o tres o
más categorías (se les llama categóricas). Ejemplos de variables
nominales dicotómicas sería el sexo y el tipo de escuela a la que se
asiste (privada-pública); y de nominales categóricas tendríamos a la
afiliación política (Partido A, Partido B,...), la carrera elegida,
la raza, el departamento o provincia o estado de nacimiento y el
canal de televisión preferido.
2. Nivel de
medición ordinal. En este nivel se tienen varias categorías,
pero además éstas mantienen un orden de mayor a menor. Las etiquetas
o símbolos de las categorías sí indican jerarquía. Por ejemplo, el
prestigio ocupacional en los Estados Unidos ha sido medido por
diversas escalas que ordenan a las profesiones de acuerdo con su
prestigio, por ejemplo:
Valor en la escala
Profesión
90
Ingeniero químico.
80
Científico de ciencias naturales
60
Actor
50
Operador de estaciones eléctricas
de potencia.
02
Manufactureros de tabaco.
90 es más que 80, 80 más
que 60, 60 más que 50 y así sucesivamente (los números —símbolos de
categorías— definen posiciones). Sin embargo, las categorías no
están ubicadas a intervalos iguales (no hay un intervalo común). No
podríamos decir con exactitud que entre un actor (60) y un operador
de estaciones de poder (50) existe la misma distancia —en
prestigio— que entre un científico de las ciencias naturales (80) y
un ingeniero químico (90). Aparentemente en ambos casos la distancia
es 10, pero no es una distancia real. Otra escala
clasificó el prestigio de dichas profesiones de la siguiente manera:
Valor en la
escala Profesión
98 Ingeniero
químico.
95 Científico de
ciencias naturales (excluyendo la Química).
84 Actor.
78 Operador de estaciones
eléctricas de potencia.
13 Manufactureros
de tabaco.
Aquí la distancia entre un
actor (84) y un operador de estaciones (78) es de 6, y la distancia
entre un ingeniero químico (98) y un científico de ciencias
naturales (95) es de 3.
Otro ejemplo sería la
posición jerárquica en la empresa:
Presidente
10
Vicepresidente
9
Director General
8
Gerente de Área
7
Subgerente o Superintendente
6
Jefe
5
Empleado A
4
Empleado B
3
Empleado C
2
Intendencia
1
Sabemos que el Presidente
(10) es más que el Vicepresidente (9), éste más que el Director
General (8), a su vez este último más que el Gerente (7) y así
sucesivamente; pero no puede precisarse en cada caso cuánto más.
Tampoco podemos utilizar las operaciones aritméticas básicas: No
podríamos decir que 4 (empleado A) + 5 (jefe) = 9
(Vicepresidente), ni que 10 (Presidente) ±5 (jefe) =2 (empleado C).
Seria absurdo, no tiene sentido.
3. Nivel de
medición por intervalos. Además de haber orden o jerarquía entre
categorías, se establecen intervalos iguales en la medición. Las
distancias entre categorías son las mismas a lo largo de toda la
escala. Hay intervalo constante, una unidad de medida.

Por ejemplo: Una prueba de
resolución de problemas matemáticos (30 problemas de igual
dificultad). Si Ana Cecilia resolvió 10, Laura resolvió 20 y Brenda
30. La distancia entre Ana Cecilia y Laura es igual a la distancia
entre Laura y Brenda.
Sin embargo, el cero (0)
en la medición, es un cero arbitrario, no es real (se asigna
arbitrariamente a una categoría el valor de cero y a partir de ésta
se construye la escala). Un ejemplo clásico en ciencias naturales es
la temperatura (en grados centígrados y Fahrenheit), el cero es
arbitrario, no implica que realmente haya cero (ninguna) temperatura
(incluso en ambas escalas el cero es diferente).
Cabe agregar que diversas
mediciones en el estudio del comportamiento humano no son
verdaderamente de intervalo (y. g., escalas de actitudes, pruebas
de inteligencia y de otros tipos), pero se acercan a este nivel y
se suele tratarlas como si fueran mediciones de intervalo. Esto se
hace porque este nivel de medición permite utilizar las
operaciones aritméticas básicas (suma, resta, multiplicación y
división) y algunas estadísticas modernas, que de otro modo no se
usarían. Aunque algunos investigadores no están de acuerdo en
suponer tales mediciones como si fueran de intervalo (pero estos
investigadores son minoría).
4. Nivel de medición
de razón. En este nivel, además de tenerse todas las
características del nivel de intervalos (intervalos iguales entre
las categorías y aplicación de operaciones aritméticas básicas y
sus derivaciones), el cero es real, es absoluto (no es
arbitrario). Cero absoluto implica que hay un punto en la escala
donde no existe la propiedad.

Ejemplos de estas mediciones
serían la exposición a la televisión, el número de hijos, la
productividad, las ventas de un producto y el ingreso.
Desde luego, hay variables que
pueden medirse en más de un nivel, según el propósito de medición.
Por ejemplo, la variable “antigüedad en la empresa”:
Nivel de
medición Categorías
— De razón En
días (0 a K días)
—
Ordinal Bastante
antigüedad
Regular antigüedad
Poca antigüedad
Es muy importante indicar el
nivel de medición de todas las variables e ítems de la
investigación, porque dependiendo de dicho nivel se selecciona uno
u otro tipo de análisis estadístico (por ejemplo, la prueba
estadística para correlacionar dos variables de intervalo es muy
distinta a la prueba para correlacionar dos variables ordinales).
Así, es necesario hacer una
relación de variables, ítems y niveles de medición.
f) INDICAR LA MANERA
COMO SE HABRÁN DE CODIFICAR LOS DATOS en cada ítem y variable.
CODIFICAR los datos significa asignarles un valor numérico
que los represente. Es decir, a las categorías de cada ítem y
variable se les asignan valores numéricos que tienen un
significado. Por ejemplo, si tuviéramos la variable “sexo” con sus
respectivas categorías, “masculino” y “femenino”, a cada categoría
le asignaríamos un valor. Éste podría ser:
Categoría Codificación (valor asignado)
— Masculino 1
—
Femenino 2
Así, Carla Magaña en la
variable sexo sería un “2”. Luis Gerardo Vera y Rubén Reyes serían
un “1”, Verónica Larios un “2” y así sucesivamente.
Otro ejemplo sería la variable
“horas de exposición diaria a la televisión”, que podría
codificarse de la siguiente manera:
Categoría
Codificación (valor asignado)
— No ve televisión 0
— Menos de una hora 1
— Una
hora 2
— Más de una hora, pero
menos de
dos 3
— Dos
horas 4
— Más de dos horas, pero
menos de
tres 5
— Tres
horas 6
— Más de tres horas, pero
menos de
cuatro 7
— Cuatro horas 8
— Más de cuatro horas
9
Es necesario insistir que cada
ítem y variable deberán tener una codificación (códigos
numéricos) para sus categorías. Desde luego, hay veces que un ítem
no puede ser codificado a priori (precodificado) porque es
sumamente difícil conocer cuáles serán sus categorías. Por
ejemplo, si en una investigación fuéramos a preguntar: ¿Qué opina
del programa económico que recientemente aplicó el Gobierno? Es
posible que las categorías encontradas podrían ser muchas más de
las que nos imaginemos y resultaría difícil predecir con precisión
cuántas y cuáles serán. En estos casos la codificación se lleva a
cabo una vez que se aplica el ítem (a posteriori). A lo
largo de este capítulo se profundizará en la forma de codificar y
sus implicaciones. Por el momento, lo importante es que se
comprenda el significado de codificar y que el instrumento de
medición, antes de aplicarse, debe ir precodificado hasta donde
sea posible (codificar los ítems cuyas categorías sean conocidas
de antemano).
La codificación es necesaria
para poder cuantitativamente analizar los datos (aplicar análisis
estadístico). A veces se utilizan letras o símbolos en lugar de
números (*, A, Z).
g) UNA VEZ QUE SE
INDICA EL NIVEL DE MEDICIÓN DE CADA VARIABLE E ÍTEM Y QUE SE
DETERMINA SU CODIFICACIÓN, SE PROCEDE A APLICAR UNA “PRUEBA
PILOTO” DEL INSTRUMENTO DE MEDICIÓN. Es decir, se aplica a
personas con características semejantes a las de la muestra o
población objetivo de la investigación.
En esta prueba se analiza si
las instrucciones se comprenden y si los items funcionan
adecuadamente. Los resultados se usan para calcular la
confiabilidad —y de ser posible la validez— del instrumento de
medición.
La prueba piloto se
realiza con una pequeña muestra (inferior a la muestra
definitiva). Los autores aconsejamos que cuando la muestra sea de
2000 más, se lleve a cabo la prueba piloto con entre 25 y’ 60
personas. Salvo que la investigación exija un número mayor.
h)
SOBRE LA BASE DE LA PRUEBA PILOTO, EL INSTRUMENTO DE MEDICIÓN
PRELIMINAR SE MODIFICA, AJUSTA Y SE MEJORA, LOS INDICADORES DE
CONFIABILIDAD Y VALIDEZ SON UNA BUENA AYUDA. Y ESTAREMOS EN
CONDICIONES DE APLICARLO.
Este procedimiento general para
desarrollar una medición debe —desde luego— adaptarse a las
características de los diferentes tipos de instrumentos de que
disponemos en el estudio del comportamiento, los cuales veremos a
continuación.
¿DE QUÉ TIPOS DE INSTRUMENTOS DE
MEDICIÓN O RECOLECCIÓN DE LOS DATOS DISPONEMOS EN LA INVESTIGACIÓN
SOCIAL?