Validacion de instrumentos de investigacion

«AÑO DE LA CONSOLIDACIÓN ECONÓMICA Y SOCIAL DEL PERÚ» «PEDRO MONGE CORDOVA» TEMA: ETAPAS DEL DESARROLLO EVOLUTIVO CURSO : INVESTIGACIÓN PROFESOR : CESAR SANCHEZ ALUMNOS : MAYOR SALAS CALEB les. «‘s ESP. PRIMARIA II JAUJA – 2010 VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS DE INVESTIGACION CONFIABILIDAD: La c investigación está ref contiene errores vari observaciones duran en cuando para una ida PACE 1 Gte mento de una medición cias entre que var(an de vez VALIDEZ: Es el procedimiento por el cual el instrumento mide realmente las variables que debe medir. ?QUÉ REQUISITOS DEBE CUBRIR UN INSTRUMENTO DE MEDICION? Toda medición o instrumento de recolección de los datos debe reunir dos requisitos esenciales: confiabilidad y validez. La confiabilidad de un instrumento de medición se refiere al grado en que su aplicación repetida al mismo sujeto u objeto, produce iguales resultados.

Por ejemplo, si yo midiera en este momento la temperatura ambiental mediante un termómetro y me indicara que hay 220C. Un minuto más tarde consultara otra vez y el termómetro me indicara que hay 50C. Tres minutos después observara el termómetro v ahora me indicara aue hav 400C. Este e la figura 1, suponiendo que los coeficientes de inteligencia puedan oscilar entre 95 y 150). Los resultados no son consistentes; no se puede «confiar» en ellos.

FIGURA 01: EJEMPLO DE RESULTADOS PROPORCIONADOS POR UN INSTRUMENTO DE MEDICION SIN CONFIABILIDAD PRIMERAAPLICACIÓN I SEGUNDA APLICACIÓN I TERCERA APLICACION I Martha 140 Laura 129 Arturo 124 Luis 120 Marco 1 og Rosa Marra 108 Chester 103 Teresa 101 130 | Laura 125 Luis 118 Marco 112 110 107 Rosa María 131 Luis 130 | Teresa 127 | Martha 120 | Rosa María 118 | Laura 1181 Chester 115 | Arturo 107 | Marco La confiabilidad de un instrumento de medición se determina ediante diversas técnicas, las cuales se comentarán brevemente después de revisar el concepto de validez.

La validez, en términos generales, se refiere al grado en que un instrumento realmente mide la variable que pretende medir. Por ejemplo, un instrumento para medir la inteligencia válida debe medir la inteligencia y no la memoria. una prueba sobre conocimientos de Historia debe medir esto y no conocimientos de literatura histórica. Aparentemente es sencillo lograr la validez. Después de todo —como dijo un estudiant 2 OF literatura histórica. Aparentemente es sencillo lograr la validez. Después de todo —como dijo un estudiante— «pensamos en la variable y vemos cómo hacer preguntas sobre esa variable».

Esto sena factible en unos cuantos casos (como lo seria el «sexo» de una persona). Sin embargo, la situación no es tan simple cuando se trata de variables como la motivación, la calidad de servicio a los clientes, la actitud hacia un candidato político y menos aun con sentimientos y emociones, así como diversas variables con las que trabajamos en ciencias sociales. La validez es una cuestión más compleja que debe alcanzarse en todo instrumento de medición que se aplica. Kerlinger (1979, p. 38) plantea la siguiente pregunta respecto a la validez: ¿Está usted midiendo lo que usted cree que está midiendo?

Si es así, su medida es válida; si no, no lo es. La validez es un concepto del cual pueden tenerse diferentes tipos de evidencia (Wiersma, 1 986; Gronlund, 1985): 1) evidencia relacionada con el contenido, 2) evidencia relacionada con el criterio y 3) evidencia relacionada con el constructo. Hablemos de cada una de ellas. 1) Evidencia relacionada con el contenido La validez de contenido se refiere al grado en que un instrumento refleja un domlnio especifico de contenido de lo que se mide. Es el grado en que la medición representa al concepto medido (Bohrnstedt, 1976). or ejemplo, una prueba de operaciones aritméticas no tendrá validez de contenido si incluye sólo problemas de resta y excluye problemas de suma, multiplicación o división (Carmines y Zeller, 1979). O bien, una prueba de conocimientos sobre las canciones de «Los Beatles» no deberá basarse solamente en sus álbumes Let it Be’Y «Abbey Road», sino que debe incluir canciones de todos su en sus álbumes Let it ge»y «Abbey Road», sino que debe incluir canciones de todos sus discos. 2) Evidencia relacionada con el criteno La validez de criterio establece la validez de un instrumento de medición comparándola con algún criterio externo.

Este criterio es un estándar con el que se juzga la validez del instrumento (Wiersma, 1986). Entre los resultados del instrumento de medición se relacionen más al criterio, la validez del criterio será mayor. Por ejemplo, un investigador valida un examen sobre manejo de aviones, mostrando la exactitud con que el examen predice qué tan bien un grupo de pilotos puede operar un aeroplano. Si el criterio se fija en el presente, se habla de validez concurrente los resultados del instrumento se correlacionan con el criterio en el mismo momento o punto del tiempo).

Por ejemplo, un cuestionario para detectar las preferencias del electorado por los distintos partidos contendientes, puede validarse aplicándolo tres o cuatro días antes de la elección y sus resultados compararlos con los resultados finales de la elección (si no hay fraude —desde luego—). Si el criterio se fija en el futuro, se habla de validez predicativa. Por ejemplo, una prueba para determinar la capacidad administrativa de altos ejecutivos se puede validar comparando us resultados con el futuro desempeño de los ejecutivos medidos.

Evidencia relacionada con el constructo 3) La validez de constructo es probablemente 35 la más importante sobre todo desde una perspectiva cientifica y se refiere al grado en que una medición se relaciona consistentemente con otras medlciones de acuerdo con hipótesis denvadas teóricamente y que conciernen a los conceptos (o constructos) que están siendo medidos. Un constructo es una varia conciernen a los conceptos (o constructos) que están siendo medidos. Un constructo es una variable medida y que tiene lugar entro de una teoría o esquema teórico. or ejemplo, supongamos que un investigador desea evaluar la validez de constructo de una medición particular, digamos una escala de motivacion intrínseca: «el Cuestionario de Reacción a Tareas», versión mexicana (Hernández-Sampieri y Cortés, 1982). Estos autores sostienen que el nivel de motivación intrínseca hacia una tarea está relacionado positivamente con el grado de persistencia adicional en el desarrollo de la tarea (v. g. , los empleados con mayor motivación intrínseca son los que suelen quedarse más tiempo adicional una vez que concluye u jornada).

Consecuentemente, la predlcción teórica es que a mayor motivación intrínseca, mayor persistencia adicional en la tarea. El investigador administra dicho cuestionario de motivación intrínseca a un grupo de trabajadores y también determina su persistencia adicional en el trabajo. Ambas mediciones son correlacionadas. Si la correlación es positiva y sustancial, se aporta evidencia para la validez de constructo del Cuestionario de Reacción a Tareas, versión mexicana (a la validez para medir la motivación intrínseca).

La valldez de constructo Incluye tres etapas: ) Se establece y especifica la relación teórica entre los conceptos (sobre la base del marco teórico). 2) Se correlacionan ambos conceptos y se analiza cuidadosamente la correlación. 3) Se interpreta la evidencia empírica de acuerdo a qué tanto clarifica la validez de constructo de una medición en particular. El proceso de validación de un constructo está vinculado con la teoría. No es posible llevar a cabo la validación de constructo, a menos que exista un marco s OF la teoría.

No es posible llevar a cabo la validación de constructo, a menos que exista un marco teórico que soporte a la variable n relación con otras variables. Desde luego, no es necesaria una teoría sumamente desarrollada, pero SI investigaciones que hayan demostrado que los conceptos están relacionados. Entre más elaborado y comprobado se encuentre el marco teórico que apoya la hipótesis, la validación de constructo puede arrojar mayor luz sobre la validez de un instrumento de medición.

Y mayor confianza tenemos en la validez de constructo de una medición, cuando sus resultados se correlacionan significativamente con un mayor número de mediciones de variables que teóricamente y de acuerdo con estudios antecedentes están relacionadas. Así, la validez de un instrumento de medición se evalúa sobre la base de tres tipos de evidencia. Entre mayor evidencia de validez de contenido, validez de criterio y validez de constructo tenga un instrumento de medición; éste se acerca más a representar la variable o variables que pretende medir.

Cabe agregar que un instrumento de medición puede ser confiable pero no necesariamente válido (un aparato —por ejemplo— puede ser consistente en los resultados que produce, pero no medir lo que pretende). por ello es requisito que el instrumento de medición demuestre ser confiable y válido. De no er así, los resultados de la investigación no los podemos tomar en seno. FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y VALIDEZ Hay diversos factores que pueden afectar la confiabilidad y la validez de los instrumentos de medición.

El primero de ellos es la improvisación. Algunas personas creen que elegir un instrumento de medlción o desarrollar uno es algo que puede tomarse a la ligera. Incluso algunos profeso 6 OF instrumento de medición o desarrollar uno es algo que puede tomarse a la ligera. Incluso algunos profesores piden a los alumnos que construyan instrumentos de medición de un día ara otro, o lo que es casi lo mismo, de una semana a otra. Lo cual habla del poco o nulo conocimiento del proceso de elaboración de instrumentos de medición.

Esta improvisación genera —casi siempre— instrumentos poco válidos o confiables y no debe existir en la investigación social (menos aún en ambientes académicos). Aun a los investigadores experimentados les toma tiempo desarrollar un instrumento de medición. Es por ello que los construyen con cuidado y frecuentemente están desarrollándolos, para que cuando los necesiten con premura se encuentren preparados para aplicarlos, pero no los improvisan.

Además, para poder construir un instrumento de medición se requiere conocer muy bien a la variable que se pretende medir y la teoría que la sustenta. Por ejemplo, generar —o simplemente seleccionar— un instrumento que mida la inteligencia, la personalidad o los usos y gratificaciones de la televisión para el niño, requiere amplios conocimientos en la materia, estar actualizados al respecto y revisar cuidadosamente la literatura correspondiente. El segundo factor es que a veces se utilizan instrumentos desarrollados en el extranjero que no han sido validados a nuestro contexto: cultura y tiempo.

Traducir un instrumento — un cuando adaptemos los términos a nuestro lenguaje y los contextualicemos— no es de ninguna manera (ni remotamente) validarlo. Es un primer y necesario paso, pero sólo es el principio. Por otra parte, hay instrumentos que fueron validados en nuestro contexto pero hace mucho tiempo. Hay instrumentos que hasta el lenguaje nos suena «arcalco». La pero hace mucho tiempo. Hay instrumentos que hasta el lenguaje nos suena «arcaico». Las culturas, los grupos y las personas cambian; y esto debemos tomarlo en cuenta al elegir o desarrollar un instrumento de medición.

Un tercer factor es que en ocasiones el instrumento resulta nadecuado para las personas a las que se les aplica: no es empático. Utilizar un lenguaje muy elevado para el respondiente, no tomar en cuenta diferencias en cuanto a sexo, edad, conocimientos, capacidad de respuesta, memoria, nivel ocupacional y educativo, motivación para responder y otras diferencias en los respondientes; son errores que pueden afectar la validez y confiabilidad del Instrumento de medlción.

Un cuarto factor que puede influir esté constituido por las condiciones en las que se aplica el instrumento de medición. Si hay ruido, hace mucho frío (por ejemplo en una encuesta de asa en casa), el instrumento es demasiado largo o tedioso, son cuestiones que pueden afectar negativamente la validez y la confiabilidad. Normalmente en los experimentos se puede contar con instrumentos de medición más largos y complejos que en los diseños no expermentales. por ejemplo, en una encuesta pública sería muy difícil poder aplicar una prueba larga o compleja.

Por otra parte, aspectos mecánicos tales como que si el instrumento es escrito, no se lean bien las instrucciones, falten páginas, no haya espacio adecuado para contestar, no se comprendan las instrucciones, también pueden influir de manera egativa. ¿COMO SE SABE SI UN INSTRUMENTO DE MEDICION ES CONFIABLE Y VALIDO? En la práctica es casi imposible que una medición sea perfecta. Generalmente se tiene un r. Desde luego, se trata de que este error sea el m . Es por esto que tiene un grado de error. Desde luego, se trata de que este error sea el mínimo posible.

Es por esto que la medición de cualquier fenómeno se conceptualiza con la siguiente fórmula básica: Donde «X» representa los valores observados (resultados disponibles), «t» son los valores verdaderos y «e» es el grado de error en la medición. Si no hay error de medición («e» es igual a ero), el valor observado y el verdadero son equivalentes. Esto puede verse claramente así: Esta situación representa el ideal de la medición. Entre mayor sea el error al medir, el valor que observamos (y que es en el que nos basamos) se aleja más del valor real o verdadero.

Por ejemplo, si medimos la motivación de un individuo y esta medición está contaminada por un grado de error considerable, la motivación registrada por el instrumento será bastante diferente de la motivación real que tiene ese individuo. Por ello es importante que el error sea reducido lo más posible. Pero, ¿cómo sabemos l grado de error que tenemos en una medición? Calculando la confiabilidad y validez. CALCULO DE LA CONFIABILIDAD Existen diversos procedimientos para calcular la confiabilidad de un instrumento de medición.

Todos utilizan fórmulas que producen coeficientes de confiabilidad. Estos coeficientes pueden oscilar entre O y 1 . Donde un coeficiente de O significa nula confiabilidad y 1 representa un máximo de confiabilidad (confiabilidad total). Entre mas se acerque el coeficiente a cero (O), hay mayor error en la medición. Esto se ilustra en la siguiente figura: Los procedimientos más utilizados para determinar la onfiabilidad mediante un coeficiente son: 1. Medida de estabilidad (confiabilidad por test-retest). En e mediante un coeficiente son: 1 . Medida de estabilidad (confiabilidad por test-retest).

En este procedimiento un mismo instrumento de medición (o ítems o indlcadores) es aplicado dos o más veces a un rmsmo grupo de personas, después de un periodo de tiempo. Si la correlación entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable. Se trata de una especie de diseño panel. Desde luego, el periodo de tiempo entre las mediciones es un factor a considerar. Si el periodo es largo y la variable susceptible de cambios, ello puede confundir la interpretación del coeficiente de confiabilidad obtenido por este procedimiento.

Y si el periodo es corto las personas pueden recordar cómo contestaron en la primera aplicación del instrumento, para aparecer como más consistentes de lo que son en realidad (Bohrnstedt, 1976). 2. Método de formas alternativas o paralelas. En este procedimiento no se administra el mismo instrumento de medición, sino dos o más versiones equivalentes de éste. Las versiones son similares en contenido, instrucciones, duración y otras características. Las versiones —generalmente dos— son administradas a un mismo grupo de personas dentro de un periodo de tiempo relativamente corto.

El instrumento es confiable si la correlación entre los resultados de ambas administraciones es significativamente positiva. Los patrones de respuesta deben variar poco entre las aplicaciones. 3. Método de mitades partidas (split-halves). Los procedimientos anteriores (medida de estabilidad y método de formas alternas), requieren cuando menos dos administraciones de la medición en el mismo grupo de individuos. En cambio, el método de mitades-partidas requiere sólo una aplicación de la medic