Curso Básico de Psicometría

Curso Bsico de PsicometraLa evaluacin Psicolgica y el mbito de aplicacin La evaluacin psicolgica es un proceso de toma de decisiones ya que el propsito ltimo es recomendar un camino de accin determinado en virtud de los objetivos perseguidos por la evaluacin. El psiclogo en este aspecto no es el que toma una decisin, sino que se realiza una recomendacin a partir del proceso que implica la toma de la evaluacin. Debe quedar claro que este proceso se caracteriza como una instancia consultiva, no decisoria, pero que a la larga implica una toma de decisin por otras personas distintas al evaluador. La evaluacin psicolgica puede ser aplicada en diferentes mbitos: mbito Forense; en este caso, ser el juez quien decida el curso de la accin a seguir en virtud de las recomendaciones que realiza el psiclogo mediante el Informe Psicolgico. El juez solicita al psiclogo algunos puntos de pericia para determinar si un sujeto es capaz de comprender la criminalidad de sus actos al momento de cometer el delito, o si alguien que haba sido vctima de un accidente de trnsito se evaluar el trastorno por estrs post traumtico. Con dicho informe el magistrado podr tomar una decisin concreta teniendo en cuenta los lo reportado en los puntos periciales evaluados en el proceso psicodiagnstico. mbito Educativo; quien solicite esta evaluacin podr ser un maestro, un director de escuela, un pap, una mam entre otros actores posibles. Y el motivo podra estar relacionado con disfunciones en el aprendizaje, trastornos en el comportamiento dentro de la escuela, dificultades en la integracin de los grupos de pares o docentes, entre otros. El psiclogo evaluador se unir toda la evidencia posible que lo lleve a poder formular un diagnstico de la situacin y una o varias recomendaciones alternativas dirigidas a solucionar o mejorar la dificultad que motiva la evaluacin, o a describir y recomendar intervenciones o programas acordes con los talentos o habilidades especiales detectadas. Luego sern esos diferentes actores involucrados los que debern adoptar o no la decisin a seguir segn las recomendaciones del psiclogo evaluador. mbito Laboral; El psiclogo es convocado para efectuar una recomendacin, en relacin con la promocin o seleccin de un candidato entre varios potenciales, o la deteccin de reas de vacancia que deben fortalecerse en un grupo de trabajo determinado para disear un plan de capacitaciones especfico. El psiclogo en este caso dar su opinin en relacin a las evaluaciones psicodiagnsticas, pero ser la empresa contratante la que tomar la ltima decisin de optar o no por las recomendaciones realizadas por el evaluador. mbito Clnico; Para algunos autores el proceso de evaluacin psicolgica se asimila al nombre de psicodiagnstico. El motivo de consulta est gatillado por algn malestar, sufrimiento, disfuncin, sintomatologa o por algn grado de invalidez constatado en el individuo, pareja familia o grupo. Con este motivo de consulta inicial, el

1

evaluador recoger toda la informacin posible vinculada al tema a tratar, de manera de poder identificar algunas recomendaciones, dirigidas a mejorar la situacin presente. Pero ser el propio evaluado y /o sus allegados quienes decidirn, concretamente, si seguirn las indicaciones dadas por el psiclogo. Y ms all de la visin tradicional, est tomando mucha relevancia el enfoque del paradigma positivista, que propone destacar y enfatizar los factores protectores con que las personas cuentan, perdindose de vista los aspectos disfuncionales, y resaltando los generadores de salud. Esto implica un nivel de anlisis personal, grupal y social. Evaluacin de Programas; Es otro mbito de aplicacin y se refiere al rea de trabajo en la que el psiclogo intenta determinar la eficacia de una intervencin, tratamiento o programa, por ejemplo la eficacia que ha tenido una campaa dirigida a modificar las actitudes hacia la integracin de personas con capacidades diferentes, o cambiar los comportamientos referidos al uso del preservativo en los individuos sexualmente activos, etc. En todos estos casos se habla de una intervencin, programa o tratamiento orientado a cambiar ciertas circunstancias que se desea alterar, y para ello debe efectuarse, al menos una evaluacin de la situacin antes de aplicar el programa, y otra despus de haberlo concluido, con miras a determinar si eso result eficaz, en trminos de lograr la modificacin pretendida y en los sentidos esperados. Esta disciplina se ejerce en el mbito de la investigacin, ms especficamente en los contextos de descubrimiento y de justificacin. La evaluacin psicolgica implica una instancia consultiva, en la que el psiclogo ser convocado para reunir toda la informacin o indicadores disponibles referidos a un problema, a una pregunta o a un tema dado, y en base a ello efectuar una o varias recomendaciones dirigidas a resolver o mejorar el problema o responder el interrogante aun sin resolucin, en la que la decisin estar en manos de otra persona- quien ha solicitado la evaluacin-. Se entiende por mbito de aplicacin de la psicologa y de la Evaluacin Psicolgica, aquellos contextos en los que puede desempearse el psiclogo, ejerciendo su rol profesional, aplicando conocimientos tcnicos que derivan de teoras y de investigaciones empricas. Por otro lado definimos como mbito de investigacin al contexto en el que la Psicologa se desarrolla como disciplina cientfica, generando nuevos conocimientos en forma permanente, los cuales sern transferidos, mediata o inmediatamente, al mbito de aplicacin. De all que hay un permanente interjuego entre el mbito de aplicacin y de investigacin de la psicologa, y ms especficamente el de la evaluacin psicolgica. Por lo tanto se podra decir que la Evaluacin Psicolgica es una tarea de la psicologa aplicada dirigida a la solucin de problemas personales, institucionales, grupales, comunitarios, sociales o ambientales. Y para desarrollar esta actividad resulta necesaria la aplicacin de un modelo terico que ser de utilidad para comprender o analizar el fenmeno concreto que es el objeto de nuestra atencin. Ello significa que entre las tareas implicadas en la evaluacin psicolgica se encuentran la categorizacin, comprensin, el Anlisis y la contrastacin de los datos referidos a los atributos del sujeto y/o de la situacin o interaccin que se est analizando.

2

El psiclogo evaluador podr posicionarse en diversos modelos tericos alternativos para interpretar el fenmeno que est estudiando o analizando, no existiendo un nico marco terico que sustente las conclusiones. Al respecto hay que mencionar que existen 3 tipos de modelos tericos alternativos en los que podemos basarnos: Los centrados en el sujeto; En estos modelos podemos ubicar al modelo mdicopsiquitrico, el psicoanaltico, o el de rasgos o atributos, y el fenomenolgico, entre los ms importantes. Los que ubican el nfasis en las variables situacionales; En estos encontramos el conductismo radical, los mediacionales y, fundamentalmente aquellos que jerarquizan las la influencia de variables intervinientes. Y los que colocan el acento en las interacciones entre el sujeto y el medio; En esta categora aparecen los modelos interaccinales, de condicionamiento, el estructuralismo cognitivista, el de las representaciones sociales, el estudio del afrontamiento y del procesamiento cognitivo, entre los ms representativos. Es por ello que se puede redefinir el concepto de evaluacin psicolgica como el proceso de toma de decisiones, siendo el objeto de esta rea de trabajo el estudio, anlisis y valoracin de las caractersticas de un sujeto, de sus formas de accin, reaccin e interaccin con los dems y con la realidad y con sus procesos de cambio. Desde esta perspectiva es preciso conceptualizar al individuo o al grupo como integrante de un sistema conformado por sujetos caracterizados como individualidades bio-psicosociales sometidas a procesos internos y externos que afectan y determinan recprocamente los modos de conducta entre el sujeto y la realidad. Y los efectos de los mismos se manifiestan en producciones o comportamientos de tipo fisiolgicos, motriz, emocional y/o cognitivo, en tanto que la totalidad de los factores se ven afectadas por la interaccin recproca. Por lo tanto no se puede pensar a la evaluacin psicolgica como una actividad que se reduce meramente al anlisis de productos o comportamientos separados de otras variables. Se caracteriza la forma de actuar del psiclogo en la tarea de evaluacin como integrada por varios pasos que se pueden dar en un desarrollo simultneo y/o sucesivos; as el especialista en el rea recabar informacin mediante diversas herramientas tcnicas que seleccionar cuidadosamente segn el objetivo de la evaluacin, organizar dicha informacin en un mapa conceptual que contemple la temporalidad y policausalidad de los fenmenos psquicos, formular hiptesis diagnsticas y explicativas acerca de la naturaleza y definicin de los procesos y productos involucrados en la evaluacin, que ir fortaleciendo o descartando segn avance en el anlisis del material recogido y contraste dichas hiptesis con los datos de la realidad, elaborar una sntesis del caso, y efectuar una o varias recomendaciones en trminos de cursos de accin sugeridos, que comunicar mediante una devolucin oral y/o un informe. Finalmente, de ser posible, realizar una evaluacin de control, seguimiento o anlisis de cambio, segn corresponda para validad en la prctica los resultados de la evaluacin. Para llevar a cabo su tarea de evaluacin, el psiclogo especialista recurrir a un arsenal de pruebas que le permitan recoger la informacin necesaria para llevar a cabo este proceso. Se refiere a las tcnicas Psicomtricas, proyectivas y las entrevistas diagnsticas,

3

que consta de la toma de contacto directo con el entrevistado y sus aspectos particulares, as como el propsito de la evaluacin.

Evaluacin Psicolgica y Psicometra; diferencias e interaccin En el mbito de la investigacin, la principal tarea del psiclogo es la generacin de nuevos conocimientos que sern transmitidos al mbito de aplicacin de la psicologa para la resolucin de problemas concretos. Es entonces que el especialista se desempear como investigador, utilizando las tcnicas de evaluacin psicolgicas como instrumento y recoleccin de datos, orientados a obtener la informacin emprica (proveniente de la realidad) que servir para corroborar o refutar hiptesis de trabajo. Ahora bien, existe otra insercin de psiclogo como investigador, y se refiere al especializarse en el diseo, construccin y adaptacin de tcnicas de evaluacin psicolgica. El investigador se especializar en el rea de la psicometra, donde los test ya no sern un medio para obtener informacin, sino un fin en s mismo. Ellos son, el producto de un desarrollo tecnolgico derivado de un modelo terico y su construccin ser, en s misma, un objetivo de investigacin. Por lo tanto se puede definir a la psicometra como la disciplina que tiene por finalidad el desarrollo de modelos (preferentemente) cuantitativos que permitan transformar o codificar los fenmenos o de los fenmenos o hechos en datos, diseando mtodos adecuados para la aplicacin de tales modelos con el fin de determinar las diferencias individuales de los sujetos en cuanto a sus atributos, sus propiedades o sus rasgos. Es importante destacar que los modelos psicomtricos formulados para explicar o comprender fenmenos, son en general de corte cuantitativo, pero no necesariamente esto es as en todos los casos. Es posible detectar y describir diferencias mediante el uso de conceptos operacionalizados en forma cualitativa, semicuantitativa u ordinal, o directamente cuantitativa. Para ello es necesario recurrir a los NIVELES DE MEDICIN desarrollados por Stevens. La medicin se caracteriza como un proceso de asignacin de nmeros o smbolos a atributos de los objetos, siguiendo una serie de reglas dirigidas a representar la presencia o ausencia del atributo medido, su calidad, jerarqua o cantidad. Conceptualizada de esta forma, una escala se define como un conjunto de nmeros o smbolos cuyas propiedades modelan propiedades empricas de los sujetos a los que esos nmeros o smbolos son asignados. Entonces la medicin se piensa como sinnimo de cuantificacin, pero a su vez en este nivel cuantitativo o mtrico, pueden distinguirse las escalas de intervalos y las escalas de cocientes o razones. Si bien ambas implican la nocin de cuantificacin conservan algunas diferencias. El nivel intervalar ( cuantitativo), supone la igualdad de intervalos entre nmeros; cada unidad de esta escala es exactamente igual a cualquier otra unidad, adems, al igual que en el nivel de medicin ordinal, no existe un punto cero absoluto, sino uno arbitrario (por ejemplo la temperatura expresada en grados, el punto cero de temperatura no indica ausencia del atributo).

4

Es posible efectuar en este nivel todas las operaciones aritmticas posibles, y por lo tanto, calcular todos los descriptivos previstos por la estadstica, cosa que no sucede en los niveles de medicin ordinal y nominal. Por ejemplo no pueden calcularse la media o promedio de atributos tales como aciertos o errores, sntomas presentes ausentes. El nivel de Medicin de cociente o razones ( cuantitativo) posee todas las caractersticas y facilidades nombradas para el nivel de intervalos, pero su punto cero no es arbitrario sino absoluto. Esto significa que no ha sido convencionalmente establecido, sino que verdaderamente implica ausencia del atributo medido (por ejemplo, la cantidad de hijos, 2, 4 o ninguno). Este nivel de razones implica, al igual que el de intervalos, cuantificacin, o sea, la posibilidad de efectuar todas las operaciones aritmticas y unidades iguales, pero agrega la distincin de poseer un cero absoluto que indica ausencia real del atributo, en tanto que el nivel intervalar es cero es arbitrariamente fijado. El nivel de escalamiento ordinal, jerrquico o semi-cuantitativo se refiere a aquel en que el nmero es utilizado para identificar cada categora, se usa para dar cuenta del ordenamiento o posicin del sujeto en el rasgo medido, sin implicar una unidad de medicin. De esta manera no se conoce la cantidad absoluta del atributo, sino que solamente se puede establecer qu sujetos se ubican en la misma categora, qu otras personas caen en la categora superior o inferior y qu categoras implican ms del atributo que otras (ejemplo, bajo nivel de instruccin, alto nivel de instruccin; escolaridad completa 1 escolaridad incompleta 2, etc.) Entonces este nivel de medicin permite efectuar un ordenamiento de los sujetos sin que sea posible establecer la cantidad absoluta del atributo medido, no implica una cuantificacin sino un ordenamiento, no hay una puntuacin. Este nivel de medicin, junto con el nivel intervalar suponen un establecimiento de un orden y el uso de intervalos, pero la diferencia entre ellos radica en que en el ordinal los intervalos no son necesariamente iguales ni suponen una unidad de medida. El nivel de medicin nominal o cualitativo alude a la presencia o ausencia de un atributo (ejemplo, sntoma presente o ausente). En este tipo de escala solamente se trata de establecer la presencia de un sujeto a una categora en virtud de un atributo dado que la determina, sin implicar una jerarqua entre los individuos. El nmero utilizado para identificar cada categora simplemente nombra o nomina sin indicar un ordenamiento entre los integrantes de esa clase. El hecho de que trabajemos con un nivel de medicin u otro se relacionar con el inters particular del evaluador, con las caractersticas de la variable que se est estudiando, y finalmente, con el tipo de escala al que el instrumento empelado (test) es capaz de llegar. As, en muchos casos es posible medir una misma variable en varios niveles de medicin.

5

Los Instrumentos Psicomtricos: Dentro del repertorio de pruebas disponibles para el evaluador, se pueden encontrar las tcnicas psicomtricas y las proyectivas, las cuales deben utilizarse en forma conjunta para integrar diferentes aspectos de la persona. Una tcnica, prueba, test, escala o instrumento psicomtrico puede definirse como un dispositivo o procedimiento en el que se obtiene una muestra de comportamiento de un examinado, en un dominio especfico, subsiguientemente evaluado y puntuado, usando procedimientos estandarizados, y que cuente con evidencia emprica sobre la validez y la confiabilidad de los resultados que arroja. Se refiere a un procedimiento que se ha tipificado de manera explcita, puntualizando especficamente un dispositivo o un mtodo de trabajo: Qu tipo de materiales debe utilizarse, qu consignas, qu tems o estmulos, en qu tiempos de administracin se trabajar, si habr o no tiempo lmite, de qu forma se entregar el material, qu actitud asumir el examinador frente al sujeto y frente a las vicisitudes de su desempeo., qu criterios se emplearn para puntuar los resultados, entre otras cuestiones previstas. Este conjunto de procedimientos se ha especificado y estandarizado al memento en que el test ha sido validado y se han calculado sus normas, las cuales deben respetarse en el mbito de la aplicacin. Si se mantiene constante el modo de administracin y puntuacin, entonces tambin se podr inferir que cualquier variacin dada estar determinada por diferencias en los sujetos mismos y no por alteraciones provenientes en el dispositivo de examen o de valoracin del rendimiento. Aqu es necesario tener presente la nocin de encuadre que hemos derivado del psicoanlisis, y que consiste en un propsito explcito de volver constantes ciertas condiciones, por ejemplo el lugar y la duracin de las sesiones, su frecuencia y costos, la regla de asociacin libre, para que el material surgido en estas sesiones sea resultado de contenidos estables o transitorios presentes en cada paciente, y no provenga de alteraciones en las coordenadas de encuadre mismo. Pero no solo los procedimientos se tipifican y se hacen constantes, sino que tambin se realiza lo propio con las formas de puntuacin y con las condiciones de interpretacin de las respuestas brindadas por lo examinados. El examinador debe mantenerse atento desde el primer contacto, y a lo largo de todo el proceso de evaluacin, a las caractersticas personales del evaluado: su edad, su sexo, sus variables de personalidad, su nivel educativo, su pertenencia a determinados grupos y subgrupos culturales, profesionales o religiosos, sus modalidades de contacto con las dems personas, sus limitaciones fsicas si las tuviera, su preferencias e intereses, sus habilidades, sus peculiaridades psquicas y biolgicas, entre otros muchos aspectos. En la toma de test, el examinado recibe una consigna que le indica qu se espera de l, qu se busca que haga (responder preguntas, armar un rompecabezas, etc.) y al responder a dichas instrucciones generar un conjunto de comportamientos que el evaluador registrar cuidadosamente. Las condiciones del test pretenden lograr que el examinado emita una serie de comportamientos reducidos en un rea especfica de todos

6

los comportamientos que habitualmente genera. Todo esto implica que un test no evala todo el comportamiento de una persona, sino una muestra de todos sus comportamientos posibles, reducidos a un rea especfica o dentro de un rea especfica. Esta restriccin estar dad por aquello que se quiere evaluar en concreto y desde qu marco terico se har o interpretar dicha evaluacin. La teora implica un recorte dado de la realidad. Pero para que pueda llevarse a cabo la aplicacin de un test es necesario que se aporten evidencias empricas sobre la validez y confiabilidad de los resultados arrojados por la misma; Es decir que se deben llevar a cabo estudios empricos que den idea al usuario de dos cuestiones bsicas, por un lado si el test mide o evala aquello que dice medir ( la validez), y por el otro, si aporta resultados o mediciones en las que se pueda confiar, con un error de medicin predecible y determinable ( confiabilidad). En el rea de la evaluacin psicolgica existen otras pruebas a las cuales se puede recurrir en el rea de evaluacin, ella son las tcnicas proyectivas y la entrevista diagnstica. Las tcnicas proyectivas deben su nombre al supuesto de que se basan en el principio de la proyeccin, y ste es uno de los mecanismos de defensa con el que contamos los seres humanos para hacer frente a la ansiedad, al estrs y a las situaciones conflictivas o crticas. Tal repertorio de recursos yoicos se va formando a la largo del ciclo vital y nos ayudan a afrontar situaciones de desintegracin que son vividas como amenazas para el yo. La proyeccin supone exteriorizar poner en el afuera o adjudicar a otros aquellos contenidos inconscientes y preconscientes que forman parte de nuestra personalidad profunda. Pero para que este mecanismo se d, es necesario que exista una situacin de poca estructuracin, que mantenga cierta ambigedad y que no se halle muy clara o estrictamente definida. Dentro de las tcnicas proyectivas ms utilizadas podemos ver el test proyectivo del Dibujo de una Persona. El test de dibujo de CASA-RBOL-PERSONA. El dibujo kinetico de la familia. Con respecto a la entrevista libre, tambin puede considerarse una especie de tcnica proyectiva puesto que se asemeja a la pgina en blanco de los dibujos, en que se proyectan los propios contenidos inconscientes. Todas las tcnicas proyectivas comparten las caractersticas de poseer poca estructuracin en estmulos y consignas, dejando bastante abierta las respuestas posibles que, potencialmente, son infinitas. En cambio las tcnicas psicomtricas no. Tambin comparten el hecho de que todas ellas tienen un marco terico en comn; el psicoanlisis. Otra de las diferencias que las tcnicas proyectivas y las psicomtricas mantienen es que las primeras proponen la evaluacin de la personalidad como un todo, mientras que las segundas aslan atributos diversos, valorndolos de uno por vez. Las tcnicas proyectivas brindan una visin ms global de la personalidad del sujeto, debe tenerse en cuenta que cada vez que se aslen elementos, esta diseccin siempre se efecta de manera artefactual y a los fines de lograr una mejor comprensin de los mismos., pero los atributos psquicos de los seres humanos no son distinguibles en el comportamiento observable. Su separacin es en todos los casos, un artificio para entenderlos mejor desde un modelo terico dado.

7

A diferencia de la proyectivas, las tcnicas psicomtricas cuentan con consignas, estmulos y alternativas de respuesta altamente estructuradas, a la vez que pueden fundamentarse en diversos marcos tericos, en los que el psicoanlisis en una de las alternativas posibles. Y ello es aso que porque las variables evaluadas no corresponden a la personalidad profunda sino ms bien se trata de elementos tales como la inteligencia, las habilidades, la ansiedad, etc. Desde este punto de vista algunos autores consideran a la entrevista dirigida o cerrada como una tcnica psicomtrica, debido a su alta estructuracin. En cambio en la entrevista libre, en la que el sujeto habla sin ninguna restriccin sobre aquello que desee y del modo en que lo desee, puede ser categorizada como una tcnica proyectiva. La entrevista es una herramienta indispensable de acercamiento al examinado, ya que permite acceder fcilmente a la problemtica o caractersticas del mismo, as como despejar dudas, aclarar puntos oscuros y corroborar o refutar diferentes hiptesis interpretativas que pudieran haber generado a partir de los resultados arrojados por las tcnicas. Los test, como operacionalizaciones de constructos tericos. Todo test se basa en un modelo dado, y ese marco terico que fundamenta la tcnica apela a diversos conceptos o constructos. Los constructos o conceptos son construcciones ideales formuladas por la mente humana para explicar determinados aspectos o fenmeno de la realidad , como por ejemplo, la nocin de ansiedad, donde diferentes fenmenos observados como manifestaciones orgnicas o fisiolgicas seran indicadores de un concepto terico y abstracto que las agrupa en un fenmeno que las contiene; la ansiedad. Entonces la ansiedad en s misma no es un observable, ni pasible de ser medida, sino que son sus manifestaciones o indicadores los observables. Por lo tanto una vez que se ha definido y descripto este fenmeno se procede a operacionalizarlo. Operacionalizar implica bajar su definicin abstracta a la empiria mediante la identificacin de indicadores observables que den cuenta de la ocurrencia de este fenmeno en la realidad, y de esta forma todo constructo terico implica una definicin conceptual y una operacionalizacin. Mientras la definicin terica se ocupa de examinar distinciones relevantes desde un modelo terico a partir del cual se define el concepto, la definicin operacional u operacionalizacin implicara la elaboracin de un listado de indicadores u observables empricos que den cuenta presencia o ausencia de dicho fenmeno en la realidad, o bien, el grado en que se registra su ocurrencia. Y mediante esa prueba emprica la teora se corroborar o no con los datos de la realidad. Siguiendo este razonamiento podemos entender los instrumentos psicomtricos como un conjunto de indicadores de un concepto o constructo terico, ese conjunto de indicadores observables o medibles son los tems, elementos reactivos del test, indicando que se habr operacionalizado en forma consistente con la teora. Los tems, elementos o reactivos de un test son la mnima unidad distinguible en l, consistente en cada una de las pequeas tareas o actividades que el individuo debe

8

realizar para responder a la consigna. Estas actividades pueden consistir en confeccionar un dibujo, encajar piezas, elegir la opcin correcta, preferida o la ms frecuente, copiar formas, etc. El total de los tems forman la escala o prueba. Tambin puede suceder que dentro de la variable evaluada puedan distinguirse dimensiones subyacentes, y en este caso varios tems forman parte de un sub-test o sub-prueba integrando una sub-escala. Dos o ms sub-escala forman la escala total o Instrumento Psicomtrico. Entonces, el enfoque psicomtrico supone la medicin de un rasgo, caracterstica o atributo de una persona, que estar operacionalizado de manera coherente con un marco terico que se ha tomado como fundamento. Adems se haya involucrado la nocin de escalamiento que implica el convertir o traducir las respuestas brindadas por lo sujetos a una puntuacin (que puede ser cuantitativa o cualitativa). Todas esas respuestas quedarn registradas en lo que se llama protocolo, que es justamente eso, un registro de las respuestas brindadas por el sujeto. Luego el examinador codificar esas respuestas segn el sistema tipificado en el manual, para, finalmente obtener una puntuacin global, desde el punto de vista estadstico y metodolgico, es un ndice, es decir una puntuacin construida que nos servir para resumir la serie de respuestas dadas por el sujeto. La medicin posible del constructo evaluado por la tcnica debe tener cierta estabilidad temporal, que puede ser elevada o baja, pero debe de existir un mnimo de ella para que la evaluacin tenga algn sentido. Otro problema que debe atenderse es que el instrumento sea realmente capaz de captar las diferencias individuales que existen entre las distintas personas en cuanto al rasgo o atributo medido, es decir discriminar. Este concepto se refiere a la poder diferenciar de forma adecuada entre los sujetos que poseen el atributo analizado en gran medida respecto de quienes lo posee en un grado ms bajo o directamente no lo poseen. Es por eso que la discriminacin en psicometra debe servir para captar diferencias individuales, puesto que ese es su sentido; dando informacin sobre las caractersticas nicas de un sujeto, aquellas que lo diferencian de los dems. El test debe tener estudios empricos que hayan arrojado evidencias sobre la validez y confiabilidad. Los estudios de Validez permiten conocer de qu manera el autor del test u otros investigadores aportaron evidencias empricas de que ese instrumento est evaluando lo que promete evaluar o est midiendo otras variables. El autor original u otros investigadores deben aportar pruebas de que lo que se promete medir efectivamente se est midiendo, que esa prueba mide ese constructo segn la teora que se ha propuesto como fundamento, y con indicadores ( tems) adecuados para efectuar una medicin ajustada. Por otra parte, la confiabilidad de las puntuacin obtenidas mediante el test alude a la confianza que podemos tener acerca de los resultados concretos que est prueba brinda al medir el constructo aludido. Este concepto involucra varios aspectos en su definicin, tales como la estabilidad temporal, la consistencia de sucesivas mediciones, la

9

consistencia interna de los tems del instrumento, los errores que se producen al medir, y tambin la homogeneidad de los reactivos al interior de la tcnica. El test, por otra parte contar con ciertas propiedades o caractersticas formales, y esto se refiere a los materiales utilizados, a la forma de administracin, al objetivo de la evaluacin, al tipo de respuesta, al formato, al uso del tiempo, y fundamentalmente a la base sobre la que se comparan las respuestas o el desempeo del sujeto. Refirindose ahora al objetivo de la pesquisa, puede hablarse de Test de diagnstico, que se refiere al poder brindar al usuario una evaluacin detallada y pormenorizada de una situacin, un atributo o un estado o rasgo dado; y test de screening, rastrillaje o despistaje se usan para detectar riesgo, es decir que dan una evaluacin poco detallada, preliminar y que debe profundizarse ( por ejemplo, en el caso que querer detectar personas en riesgo de padecer trastornos de alimentacin en una poblacin amplia, no es posible aplicar a tanta gente una batera completa de instrumentos en virtud de los tiempos, el esfuerzo y los costos involucrados.). Los test de despistaje y screening son breves y altamente sensibles, es ms, es importante que sean sensibles en demasa y pocos especficos, ya que deben reaccionar fcilmente ante los mnimos indicadores de riesgo potencial. Es preferible que se detecten casos falsos positivos, en los que luego, en una evaluacin ms profunda, no se compruebe riesgo o patologa, antes que se deje sin identificar casos verdaderamente positivos que, de otra manera, pasaran desapercibidos en virtud de la baja sensibilidad del test. Una vez localizados estos casos mediante el instrumento de despistaje, se vuelve a examinar a esos sujetos pero en esta oportunidad con tcnicas de diagnstico, que brindarn una informacin ms acabada y completa, permitiendo confirmar los resultados iniciales o descartarlos. Estos elementos de screening funcionan como un filtro que separa los elementos ms gruesos para que sean examinados en detalle mediante tcnicas diagnsticas, decidiendo a posteriori si existan razones de peso para seleccionarlos o si simplemente, se trat de un caso falso positivo. Las tcnicas de diagnstico darn informacin ms profunda y pormenorizada, sobre la variable que se est evaluando, sus tiempos de administracin y evaluacin sern, por ende mayores, pero permitirn arribar a una descripcin ms acabada, completada por una cierta cantidad de datos y detalles. De manera contraria las tcnicas de screening sern menos sensibles pero ms especficas. En cuanto a los materiales y medios utilizados se encuentran en el mercado test de lpiz y papel, materiales manipulables, de estmulo oral y respuesta oral, de estmulo grfico y respuesta oral o de estmulo oral y respuesta escrita, entre otras posibles. En referencia a la forma de administracin, puede decirse que existen dos grandes grupos de instrumentos; los de administracin individual y los autoadministrables. Los primeros requieren por el tipo de tarea implicada, la interaccin personalizada de un examinador con un examinado, en tanto que los autoadministrables estn especialmente diseados para que sus consignas, materiales y sus tems sean tan claros que el sujeto de las respuestas sin ayuda, o con una mnima gua del evaluador. Con respecto al objeto de la evaluacin, alude a un gran grupo de conceptos o variables al que pertenece aquel constructo que se quiere evaluar.

10

Tomando en cuenta el tipo de respuesta, las pruebas psicomtricas pueden dar diferentes tipos de respuestas; las dicotmicas, que es la que pone el examinado ante la obligatoriedad de decidir su respuesta entre dos opciones polares (verdadero-falso si no). De esta manera se debe suspender el pensamiento de tipo depende de la situacin, y forzarse a s mismo a escoger una respuesta. La respuesta Likert que implica un ordenamiento de las opciones segn un gradiente que va desde la mxima aceptacin al mximo rechazo. O viceversa. Tambin pueden plantearse por ejemplo, respuestas Likert en trminos de frecuencia de aparicin temporal de los comportamientos u otras alternativas de categorizacin posibles. El diferencial semntico, que es una forma de respuesta que prev una escala, generalmente de siete o de nueve puntos, en cuyos extremos se ubican dos adjetivos o expresiones con significados contrapuestos, y se solicita al examinado que marque en qu punto de ese continuo ubica su pareja con respecto a aquellas variables que se estn evaluando, en trminos de valorar significados posibles de ser atribuidos. En los test de resolucin de tareas especficas se pide al sujeto que realice una produccin determinada (copiar tarjetitas, dibujar bajo determinadas condiciones, formar figuras de cubos, resolver un laberinto o un rompecabezas, codificar nmeros arbigos en una simbologa especial que debe ser aprendida, recordar palabras y repetirlas etc. Esas respuestas suelen ms tarde re-codificarse segn criterios diversos, por ejemplo como xito o fallo, como respuesta completamente adecuada, parcialmente adecuada o inadecuada, entre otras variaciones posibles. Segn su formato, las tcnicas pueden dividirse en; Inventarios; que son listados de afirmaciones que el sujeto debe leer y responder, por ejemplo, segn opciones de verdadero o falso, o segn el gradiente en el que expresa el acuerdo o desacuerdo. Los cuestionarios en cambio son listados de preguntas que el sujeto debe responder segn formato preestablecido (si-no), segn el grado de conformidad o frecuencia con respecto a lo que se est interrogando. Las escalas, por su parte, suelen identificarse con algunos test de rendimiento que tienen un formato diferente de los inventarios o cuestionarios, y que se componen, por ejemplo de tareas que el sujeto debe resolver o de preguntas que debe contestar para reflejar algn conocimiento o destreza. Sin embargo todos los instrumentos psicomtricos son escalas dado que implican, como decamos antes, la nocin de escalamiento, que significa convertir las respuestas de los examinados a una puntuacin que las resumen. Las encuestas suelen tener un formato similar al de los inventarios y se utilizan para recolectar opiniones o actitudes de las personas sobre algn tema en especial, sobre un servicio o sobre costumbres y preferencias. Las entrevistas dirigidas son listados de preguntas preestablecidas que se hacen oralmente al sujeto en una administracin individual y que deben responderse oralmente, con la posibilidad de ampliar esas contestaciones por medio de comentarios y detalles. Finalmente las hojas de registro o protocolo de observacin son tambin formularios pre impresos que establecen qu aspectos especficos deben observarse en determinados comportamientos o interacciones, en los que el examinador u observador va codificando en una forma abreviada y rpida aquello atributos que son objeto de su evaluacin.

11

En cuanto al uso del tiempo, existen tcnicas que no fijan un lmite temporal para finalizar la tarea, otras en cambio establecen un lmite preciso de tiempo de respuesta, finalmente otros test permiten que se trabaje libremente pero se toman notas del tiempo para valorarlo en una forma determinada. Ahora bien, en la base sobre la que se valoran o comparan las respuestas o desempeo del sujeto evaluado, podemos clasificar los instrumentos psicomtricos en test normativos y test de criterios o de dominio. La primer modalidad de valoracin de los resultados corresponde a las tcnicas psicomtricas que se rigen por baremos o normas estadsticas. Ellos comparan el rendimiento o respuesta de una persona individual con el rendimiento promedio registrado por una muestra normativa o de tipificacin, es decir, por un grupo de individuos homogneos al examinado, segn edad, sexo, hbitat y otras condiciones que pudieran afectare a la variable evaluada. As el baremo o norma estadstica es un cuadro de doble entrada en el que se consignan el promedio de las puntuaciones obtenidas por la muestra de sujetos y su dispersin o desviacin tpica. Permite que el examinador valore el desempeo de un sujeto a la luz del desempeo promedio observado por sujetos semejantes a l. Los test de criterio o dominio, en cambio, no emplean normas para comparar el desempeo o respuesta del individuo, sino que las valora segn un criterio previamente establecido (ejemplo, si los sntomas de depresin coinciden con lo que establece el DSMIV o el CIE-10 Por ltimo, debe tenerse presente que todo instrumento tiene su sentido en tanto y en cuanto est enmarcado en un proceso de Evaluacin Psicolgica, cobrando valor e importancia en virtud del interjuego que sea posible establecer entre los resultados que arroje y el resto del material que se valorar, sin perder de vista el objetivo final de este proceso; La evaluacin Psicolgica, entendida como un proceso de toma de decisiones que funciona como una instancia consultiva, en tanto es solicitada por el interesado o por un tercero, para dar respuesta a alguna pregunta o consulta, o para indicar un curso de accin o solucin a algn problema. tica del Evaluador en Psicologa; Consideraciones Bsicas. En lneas generales se dir que el profesional que se desempee en el rea debe ser consciente de la influencia potencial que su trabajo puede tener en la vida de personas reales y concretas. La plena conciencia de cuanto se sabe y canto se ignora, de cuales son las reas de vacancia en sus conocimientos, sumandos a la actitud responsable y honesta, permitirn la capacitacin permanente y la derivacin de aquellos casos en los que no se est habilitado en virtud de limitaciones profesionales y/o personales. Por otro lado, hay que tener en cuenta cuales son los derechos de todo examinado; el tener acceso a la mejor atencin que podamos brindarle, ser tratado con el mayor de los respetos, poder dar el consentimiento informado para que la evaluacin sea realizad, trabajar en un clima ameno, cordial y relajado, tener acceso a los resultados y recomendaciones surgidos de la evaluacin en forma completa y adecuada a sus posibilidades intelectuales, emocionales y educativas, guardar los requisitos bsicos de

12

una estricta confidencialidad notificndole quines y de qu forma tendrn acceso a esos resultados, contar con la autorizacin explcita de los padres para realizar evaluaciones a menores o personas judicialmente insanas, con dificultades de comprensin o con patologas de alteracin en el juicio de realidad, entre otros recaudos. Todos los cuidados antes mencionados implican una actitud activamente tica. Es importante no olvidar las diferencias culturales resultantes de la diversidad poblacional en nuestro pas, el respeto por las peculiaridades culturales, religiosas, cosmovisiones, sexuales, sociales y de cualquier otra esfera del comportamiento humana, es la herramienta bsica para la asuncin de una postura abierta, humilde, emptica, contenedora hacia el otro, y carente de prejuicios, al menos con la menor cantidad de prejuicios posibles y siendo conscientes de ellos Estas cuestiones deben tenerse en cuenta a cada paso del proceso de evaluacin y por lo tanto, tambin en el momento de elegir la batera de instrumentos a ser utilizada, a la hora de administrarla y en el momento de puntuar los protocolos, al efectuarlas interpretaciones y tambin al comunicarlas a los interesados. La actitud correcta consiste en una postura de total vigilancia respecto de estos tpicos, ya que podemos estar trabajando con personas concretas y reales con especificidades macro o micro culturales que no hayamos detectado, y por lo tanto, tal vez estemos efectuando valoraciones que no corresponden a aquellas, y que estemos mirando la realidad desde nuestra perspectiva cultural y no desde la que corresponde al sujeto. Hay que prestar plena atencin a las caractersticas particulares de cada persona, aquellas que la hacen nica e irrepetible, para ello es importante mantener actualizados nuestros conocimientos sobre psicometra, tcnicas proyectivas, psicologa general, evolutiva, psiquiatra, etc. Nunca debe olvidarse que el examinado es un ser bio-psico-social, que posee por ende, las tres clases de componentes o atributo, sin perder de vista ninguno de ellos. Pensar en analizarlos separadamente ya implica una postura frente a la posibilidad de distinguirlos, ya que se trata de fenmenos que no tienen que ver con la forma en que stos se den en la realidad, sino con nuestra manera de conceptualizarlos y de aislarlos para entenderlos y estudiarlos mejor. Bla bla bla La validez y los instrumentos psicomtricos: En primer lugar, el sentido ltimo de las escalas psicomtricas es la capacidad de un instrumento (de sus tems) para captar diferencias individuales en la variable que est siendo medida, la determinacin de diferencias en un atributo dado entre las distintas personas. Si los tems de una prueba poseen una baja capacidad discriminativa, entonces, su utilidad se reduce considerablemente. Por ello los autores tienen la obligacin de proporcionar a los usuarios resultados empricos sobre tal poder discriminativo. Esto se refiere a la capacidad discriminativa de un instrumento psicomtrico. En segundo trmino, la confiabilidad de una prueba refiere a la confianza que podemos tener en los resultados que arroja, confianza que puede ser examinada desde varios aspectos, pero que principalmente se dirige a valorar cunto error existe en la medicin,

13

asumiendo que siempre se incluyen errores en la misma, ya que no es posible concebir medicin alguna que est completamente libre de error. En tercer lugar, debemos ocuparnos de la validez de la escala. Tradicionalmente se alude a la validez mediante la pregunta referida a qu mide la tcnica. Que un test haya sido nombrado como prueba de inteligencia o de memoria o de personalidad, no implica necesariamente que mida las variables que figuran en su denominacin. El autor debe proporcionar pruebas empricas (resultados verificados, verificables y replicables por otros investigadores) que demuestren que efectivamente se est midiendo la inteligencia y no la memoria, o la persistencia o cualquier otra variable no identificada, diferente de la que se pretende evaluar en el propsito explcito declarado en el manual del instrumento. Por lo tanto jams debe darse por sentado que la denominacin de la tcnica responde exactamente al constructo que se pretende evaluar. Debemos contar con pruebas empricas que lo hayan verificado, aportadas por los autores del test mismo, as como por otros investigadores que lo hayan analizado ulteriormente. Esos resultados sern uno de los fundamentos bsicos que contribuirn a asegurar la calidad de la tcnica que nos ocupe, dado que se refieren a uno de los atributos que certifican esta calidad; la validez de las puntuaciones que las pruebas permiten obtener. As, se comprueba que la validez de un instrumento se refiere a que esa herramienta sirva para medir aquello que intenta medir. El test debe medir el constructo que se ha propuesto o que ha prometido medir. Pero en la actualidad, ya no se habla solamente de capacidad de discriminar, su confiabilidad y validez, como instrumentos inherentes al test, ya que ello crea cierta sensacin de invariabilidad, de permanencia o de fijeza. Actualmente nos referimos a la confiabilidad y la validez de los resultados arrojados por el test, as como la capacidad discriminativa de sus tems en tales o cuales sujetos, que poseen tales o cuales caractersticas determinadas. Esto significa, en primer lugar, que la validez y la confiabilidad de los resultados no vienen dadas con el instrumento, sino que la validez y confiabilidad de los resultados no vienen dadas con el instrumento, sino que se hallan sujetas a ciertas condiciones, referidas especialmente a la variabilidad de la muestra de los sujetos que se ha utilizado para poder a prueba, justamente, la validez y confiabilidad de los resultados, as como la discriminacin de los tems que componen la escala. En segundo lugar, tambin quiere decir que los atributos vinculados a los resultados arrojados por el instrumento deben ser empricamente determinados mediante investigaciones cientficas meticulosamente planificadas y desarrolladas, a la vez que tales estudios deben ser replicados y/o rediseados a intervalos relativamente cortos, as como cada vez que la prueba se traslade de un contexto cultural a otro. Cuando un instrumento psicomtrico se estandariza, se trabaja este proceso de tipificacin con muestras de sujetos que renan caractersticas homogneas a las personas que se ha destinado esa prueba. Por ejemplo, si se trata de una escala para nios, la estandarizacin o tipificacin se realizar sobre una muestra infantil.

14

Ahora bien, en estadstica y psicometra se habla de una caracterstica especfica de la distribucin de puntuaciones obtenidas por la muestra de sujetos en un test, que es la variabilidad o dispersin de la misma, ya que las medidas de variabilidad indican si las puntuaciones o valores obtenidos por los distintos sujetos que componen la muestra estn prximos entre s, o si por el contrario se encuentran muy dispersos. De esta forma, si la variabilidad es pequea, este dato nos informa que la mayora de las puntuaciones se ubican cerca de la media o promedio. Por el contrario, si la dispersin es grande, podemos inferir que las puntuaciones se ubican dispersas en relacin a la media. Justamente esta variabilidad es la que afecta los resultados que se obtienen en estudios desarrollados para determinar la validez y la confiabilidad de las puntuaciones arrojadas por un test. Y es por esto tambin que la validez de las puntuaciones se encuentran influidas por la variabilidad de la muestra sobre la que esa validez se determina: No se registraran iguales resultados si se la compara con muestras cuyos rendimientos hayan sido muy similares entre s. Por lo tanto, el concepto de variabilidad muestral da cuenta de que los estudios de validez se efectan sobre muestras compuestas por personas reales, con respuestas y rendimientos concretos y reales, es que tales resultados de dichas investigaciones se encontrarn directamente afectados por esta caracterstica de la muestra de sujetos, la cual no es ni ms ni menos que el resultados del conjunto de atributos psquicos especficos y distintivos de un grupo de individuos dado: Estas diferencias, que parecen distinciones numricas extraas, no son ni ms ni menos que diferencias registradas en el rendimiento real observado por personas reales y que por lo tanto, afectarn los estudios que se hagan sobre tales sujetos. Distintos tipos de validez; Existen diversas nomenclaturas sobre los aspectos a ser tenidos en cuenta en relacin con el concepto de validez o, como se expresa hoy en da, con las diferentes evidencias de validez que pueden ser aportadas sobre los resultados arrojados por un instrumento psicomtrico dado. En lneas generales es posible distinguir cuatro grandes reas en las que pueden categorizarse las distintas implicaciones del trmino validez; el rea del contenido, el rea terica y el rea formal. 1. Aspectos de la validez vinculados con el contenido del test; se refiere a la las evidencias de validez de contenido, se basa en la verificacin de que la muestra de tems incluida en el test cubra, efectivamente, todos los aspectos o dimensiones relevantes de la variable en estudio a ser medida. Los reactivos o elementos que se han redactado o ideado para formar parte de un instrumento psicomtrico, son solo una muestra de todos los tems posibles, es decir, del universo de tems destinados a medir esa variable en particular. De todos los posibles, los finalmente incluidos debern integrar una muestra representativa de todos los tems posibles, guardando idnticos criterios de representatividad a los usados para resolver el muestreo de los sujetos con los que se trabajar para estandarizar el test ( los finalmente incluidos tienen que cumplir con el criterio fundamental de no haber descuidado ninguna de las dimensiones de la variable).

15

Esta tarea debe ser desempeada por los diseadores originales del instrumento y posteriormente controlada en aquella instancia que se conoce como juicio de experto, el cual est destinado a trabajar sobre los aspectos de la validez que se relacionan con el contenido de los tems. El juicio de experto es un procedimiento mediante el que los autores del test convocan a un pequeo grupo de expertos en el tema que se quiere evaluar mediante esa nueva escala, para que juzguen, en una primera aproximacin, la adecuacin de cada uno de los tems que se han formulado para formar parte del instrumento, en relacin a su coherencia o concordancia con alguna de las dimensiones propuestas por el autor en ese modelo terico. As, estos expertos, ayudados por una lista detallada de especificaciones que los autores, revisarn el contenido y la redaccin de cada tem y su adecuacin con respecto a cada dimensin prevista por la teora, efectuando crticas a alguno de ellos, mostrando su conformidad con respecto a otros, sugiriendo modificaciones en otros casos, y alertando sobre aquellos aspectos o dimensiones de la variable en cuestin que estuvieren menos representados en el total de elementos o hubieren sido descuidados en aquellas. Cada experto trabajar de en forma independiente y har llegar su evaluacin a los autores quienes, en un segundo momento, darn el dictamen de cada uno de los expertos en base al conjunto de todos los dictmenes recogidos, efectuando sobre los tems propuestos aquellas modificaciones que hayan sido sugeridas por la mayora. Los criterios a partir de los cuales los autores modificarn, reemplazarn o eliminarn tems, deber haber sido fijado de antemano y ser respetado a raja tabla, con el fin de evitar que la subjetividad de los creadores de la herramienta interfiera en demasa en ente proceso. As, este procedimiento implica vigilar activamente que todas las dimensiones de la variable a ser medida hayan sido debidamente cubiertas, con el peso y la importancia que la teora asigna a cada una de las mismas. Frecuentemente se califica este procedimiento de juicio de experto como un medio subjetivo de aportar evidencias de validez terica, pero al ser varios expertos, tambin esa subjetividad individual se ve disminuida. 2 Aspectos empricos de la validez vinculadas al criterio; Tambin se la llama validez emprica, ya que se rige por la experiencia, y en este punto ha y dos cuestiones a plantear. Por un lado aquello que se relaciona con que este tipo de evidencia de validez, como las anteriores, deben ser establecidas empricamente (en base a estudios de campo realizados con rigor metodolgico y sobre personas concretas). En segundo lugar, el trmino validez emprica remite a un tipo de evidencia que se vincula con el uso prctico (en virtud de qu informacin no aporta en concreto si lo administramos a un tipo de sujetos en particular). Por lo tanto, involucra una metodologa de investigacin que, necesariamente, trabajar utilizando lo que se conoce como criterio externo, y que es una medida de la misma variable que el instrumento intenta medir, pero obtenida de forma independiente de aqul. Ser esa medicin externa a la prueba la que nos

16

permitir verificar si la escala nos brinda una informacin semejante a la obtenida mediante esa medicin independiente o criterio externo. El criterio externo que se emplee para llevar a cabo esta investigacin deber estar sustentado en el mismo marco terico que el instrumento cuyos resultados se desean validar, y por ende, operacionalizar en forma similar. Validez Concurrente; Un evaluador buscar recabar cierta informacin acerca de determinados atributos del sujeto, en el menor tiempo posible, con el fin de responder determinadas preguntas relacionadas con un problema. Esto es as porque el evaluador busca estar seguro que el nuevo test, del que an no conoce su calidad, le permita acceder a esa cierta informacin o los mismos resultados que podra obtener por otros medios. Es decir que para verificar si estamos midiendo aquello que la escala pretende medir, adems de asegurarnos de que los pasos relativos a las evidencia de validez terica y de contenido hayan sido examinados, deberemos controlar tambin que se haya corroborado fehacientemente que puede medirse lo mismo. ,o casi lo mismo, que el test promete medir mediante un camino o criterio independiente al mismo test, externo a l. Es por ello que la validez emprica es tambin llamada valides de criterio. Por ejemplo, a la misma muestra de sujetos a la que se ha aplicado una prueba, se la har objeto de una observacin sumamente detallada y minuciosamente pautada, que funcionar como criterio externo, que deber ser determinada a priori con idnticos criterios que los utilizados para la construccin de la escala. Ellos significa que ambas vas de evaluacin ( tcnica y criterio externo) apuntarn, al menos hipotticamente, a medir la misma variable y segn el mismo modelos terico, ya que ambos han sido diseados con tal propsito. Se utilizar un coeficiente de correlacin para valorar el grado en que ambos caminos de evaluacin se hallan asociados, es decir, coinciden. El coeficiente de correlacin es un ndice que nos informa el grado de covariacin o asociacin entre variables, tratndose de una correlacin directa (de signo positivo) cuando ambas variables aumentan o disminuyen juntas, por ejemplo a mayor cantidad de trabajo, mayor cantidad de tiempo para terminarlo; y siendo la correlacin inversa (de signo negativo) cuando al aumentar una de las variables, la otra disminuye o viceversa, como por ejemplo, la antigedad del modelo de un auto y su precio, ms antiguo el auto menos se cotiza en el mercado. Independientemente del signo o sentido de la correlacin, el grado de asociacin entre las variables consideradas ser mayor cuanto ms se acerque su coeficiente a uno, y ser menor cuanto ms cerca de cero se ubique. A s una correlacin perfecta de +1 nos indicar una covariacin directa entre las variables, ya que ambas aumentan o disminuyen juntas, y perfecta porque las variables estn asociadas completamente en un 100% (ejemplo, ms invitados, ms tazas para servir caf). Una correlacin ser nula (= 0) cuando la asociacin entre variables sea inexistente (ejemplo, la cantidad de dinero que uno tiene en el banco y la cantidad de lunares en el cuerpo).

17

Existen correlaciones no perfectas cuando encontramos asociacin entre dos variables, cualquiera sea su signo, distintas a cero y distintas de uno. All hallaremos coeficientes por ejemplo de 0,90 o -0,90, que implica un alto grado de covariacin entre las variables (cercano a 1), o 0,15 o -0,15, que implica un grado bajo de asociacin entre las variables. De ninguna forma una correlacin, an la ms elevada, puede interpretarse como una variable determinando o causando a la otra, sino que simplemente se muestran la asociacin o correlacin entre ellas. En el caso de un estudio de validez concurrente, si el coeficiente de es positivo y elevado, estar indicando que ambas mediciones (criterio y escala) realizadas a una nica muestra de sujetos arrojan resultados muy similares, por lo que ser prcticamente lo mismo medir la variable deseada mediante la prueba o mediante el criterio, quedando a posteriori el proceso de validacin, y si se dispone de tiempo se podr utilizar la segunda va. Pero si se desea conocer estos resultados en un lapso muy breve y con menos esfuerzo, se administrar el test. De esta forma el estudio ha arrojado evidencias de validez emprica o de criterio, de tipo concurrente. Esto significa que tcnica psicomtrica y criterio concurren juntos, en un mismo sentido, arrojando idnticos resultados o muy similares. La nomenclatura tcnica de validez emprica designa rx y r simboliza el coeficiente de correlacin de Pearson x representa la puntuacin obtenida en el test por la muestra de sujetos y representa la puntuacin obtenida por esos mismos sujetos en el criterio Externo. Ahora bien, cuando aludimos al uso de un criterio externo en los estudios de validez concurrente, inmediatamente surge la pregunta prctica; si el test y criterio brindan informacin comparable para qu usar el primero, si con el segundo ya basta? La formulacin o eleccin de un criterio externo se relaciona con la necesidad inherente al diseo de investigacin que se plantea en un estudio que pretende aportar evidencia de validez emprica de los resultados a los que el instrumento conduce, pero ello no es obstculo para que en el mbito de aplicacin el usuario elija libremente aquella va de evaluacin que prefiera, en base a su modalidad de trabajo, a los tiempos, condiciones disponibles y al esfuerzo y cantidad de informacin resultante que est en condiciones de invertir y de procesar. Validez predictiva; La otra variante de validez emprica o de criterio es la validez predictiva. Comparte con la validez concurrente su pertenencia a la categora de validez emprica. Ambas son los dos tipos principales previstos en ella. Posee adems una lgica similar a la de la validez concurrente trabajando, con un criterio externo y un coeficiente de correlacin. La diferencia radica en que la validez concurrente se establece en y para el momento presente, el aqu y el ahora, con el fin de asegurar que la escala mide aquella variable que prometa medir; prueba y criterio externo deberan medir la misma variable para que se concluya que se han aportado evidencias de

18

validez concurrente. La validez predictiva, en cambio, trabaja a futuro y con un criterio externo a predecirse. Un estudio destinado a aportar evidencia de validez predictiva se basa en la idea de intentar verificar que el instrumento administrado en el presente, resulte un buen predictor de otra variable, relacionada tericamente con la que se ha medido pero distinta. Por ejemplo, se planifica usar una prueba de aprendizaje de contenidos verbales, y se vuelve indispensable para ello demostrar que el test de capacidad de aprendizaje de contenidos verbales administrados hoy, resulta un buen predictor del desempeo futuro del alumno. La diferencia entre la validez predicativa y la concurrente radica en que la primera el criterio se predice y es otra variable, mientras que en la concurrente el criterio se mide en el mismo momento o casi, en que se administra la prueba y es la misma variable evaluada por el instrumento, ero obtenida por medio de una medicin independiente a la prueba. Y lgicamente, en la predictiva se intenta predecir el criterio a futuro, en tanto que en la concurrente se intenta que concurran o coincida con los resultados de la escala en el mismo corte temporal. Pero la principal diferencia no se basa en el tiempo sino en los objetivos de la evaluacin, mientras que la concurrente es elegida cuando la prueba va a utilizarse para efectuar diagnsticos del estado actual, la predictiva lo ser cuando el instrumento busque predecir resultados futuros, es decir que el uso de la escala ser el criterio decisorio que permitir dirimir qu tipo de estudio de validacin se emplear. Un concepto a tener en cuenta en el tema de las evidencias de validez predictiva es el de validez incremental. Y se refiere a que puede haber evaluadores que tengan inters en establecer la probabilidad de predecir algn criterio a partir de una multiplicidad de test y no de uno solo, o a partir de varios predictores y no de un nico predictor. Cada test debera contar con evidencias sobre su validez incremental, entonces, implica conocer el grado en que cada predictor explica o predice algo de la medida del criterio que no estaba predicho por los otros test o predictores. Por ejemplo, si se quiere evaluar el rendimiento acadmico, ste podra predecirse a partir de resultados obtenidos en varios test, uno de razonamiento verbal, otro de razonamiento abstracto, y otro de ansiedad a los exmenes. Si solo se intenta predecir el rendimiento acadmico mediante el desempeo en el test de razonamiento verbal, el criterio podra ser estimado con un margen de probabilidad dado, pero si se agrega un segundo predictor, como puede ser el razonamiento abstracto, se incrementara el grado en que se predice el criterio rendimiento acadmico. Un nuevo predictor incrementa la capacidad de ese grupo de predictores para estimar el criterio. Validez Retrospectiva; Tambin es un aspecto de la validez emprica o de criterio, y se vincula con la correlacin verificada entre los resultados de un test administrado en un momento determinado y un criterio externo medido con antelacin a la aplicacin del instrumento psicomtrico. Este tipo de evidencias de validez adquieren

19

importancia en ciertos mbitos especficos, tales como la prevencin psicolgica en la salud pblica o en la clnica individual. 3 Aspectos de la Validez Vinculados con el Modelo terico que sustente la prueba; Los aspectos tericos de la validez se circunscriben a que los autores del test u otros investigadores sean capaces de aportar evidencias de que tal operacionalizacin ha sido efectuada de forma coherente con ese modelo terico y cubriendo todos los aspectos o dimensiones incluidos en l. Por un lado, los investigadores especializados en psicometra que se han ocupado de disear o de estudiar un test construido por otro investigador, debern aportar evidencias verificables de que ese instrumento mide efectivamente el constructo o variable que dice medir, es decir, que tal constructo ha sido adecuadamente operacionalizado en indicadores (tems del test) capaces de aportar mediciones adecuadas de los distintos aspectos o dimensiones de tal variable. Hay que analizar con minuciosidad el captulo de referente a las evidencias de validez recogidas por distintos autores en diversas muestras de sujeto. Para muchos autores, el tipo principal de evidencia de validez, la terica (tambin llamada estructural o de constructo) se dedicar a responder a la pregunta de si esta tcnica mide efectivamente aquello que dice medir, segn tal o cual modelos terico, y por lo tanto, si la misma es una adecuada operacionalizacin de un constructo terico dado, derivado de ese modelo. La validacin de constructo se define como un proceso continuo (durable en el tiempo), en tanto requiere de investigaciones desarrolladas y renovadas en forma permanente, por medio del que se realizan mltiples investigaciones con el fin de poner a prueba diferentes hiptesis sobre la estructura interna del constructo, as como de sus relaciones con otras variables o constructos. Tambin se la puede definir como el grado en que un test mide un constructo, en tanto es una buena operacionalizacin del mismo. La validacin del constructo implica la acumulacin gradual de diversas fuentes de informacin, por lo que no es posible considerarla como un proceso terminado, sino que necesita de constante actualizacin e investigacin. Existen varias formas para verificar que sea una operacionalizacin y por ende, es coherente con el modelo terico. Se pueden realizar; Estudios evolutivos, donde al evaluarse determinada variable, se podra demostrar mediante sus resultados que, por ejemplo a medida que la edad aumenta se incrementa tal habilidad. Este tipo de investigaciones evolutivas es uno de los mtodos ms sencillos para aportar evidencias sobre la validez terica de un test. Estudios clnicos, la cual presenta una lgica similar de razonamiento, cuando se usan estudios clnicos si el constructo evaluado implica algn tipo de patologa. Los diferentes aspectos de la validez se relacionan, y en muchos casos n mismo tipo de estudio podra brindar evidencias hacia ambas aristas del tema de la validacin de los resultados aportados por el instrumento. Todo uso emprico se vincula con el modelo terico (validez

20

de constructo), y a la inversa, todo resultado emprico que se obtenga impacta directamente en los cuestionamientos, refutaciones o confirmaciones que puedan hacerse sobre un modelo terico. Anlisis Factorial, que son el tipo de investigaciones ms comnmente empleados en nuestros das para aportar evidencias sobre la validez de constructo de los resultados brindados por un instrumento. El anlisis factorial es un procedimiento de anlisis multivalente de los datos que permite analizar la variable, por medio de un test en una muestra de sujetos dada, determinando que dimensiones podran aislarse en la misma. Se lo define como un mtodo de reduccin de datos, por el que es posible disminuir la cantidad de datos a ser analizados o tenidos en cuenta. Se maneja por medio del clculo de mltiples coeficientes de correlacin entre las respuestas de todos los sujetos incluidos en la muestra a cada uno de los tems del test. As se calcula la correlacin de las respuestas dadas por el grupo al tem 1 cada total de respuestas dadas a cada tem de la escala. Esto dar lugar a lo que se conoce como una matriz de correlaciones en la que podemos aislar en el test. Este clculo de mltiples factores implica, intentar conocer el grado de correlacin o covariacin que tiene el total de las respuestas emitidas por los sujetos, es decir, como se asocian los contenidos a los que ellos aluden. De esta forma aquellos elementos que hayan registrado entre si elevados grados de asociacin se agruparn bajo lo que se llama un factor, dimensin o variable latente. Cada uno de estos factores ser un grupo de tems que aludan a contenidos relacionados, cuya vinculacin o asociacin se ha verificado mediante la agrupacin de aquellos reactivos que guarden considerable asociacin entre s. Si la cantidad de factores aislados o identificados y sus contenidos coinciden con la cantidad e identificacin de las dimensiones previstas en la teora, entonces, podr decirse que el test es un adecuada operacionalizacin del tal marco terico, o bien que mide tal variable segn tal teora. Validez Convergente y Discriminante; En estos aspectos tericos de la validez de constructo, se pueden distinguir dos grandes aspectos; las evidencias de validez de convergente, que implica si se ha podido recoger evidencias de que el constructo medido por el instrumento converge en el mismo sentido que otra evidencia relacionada por similitud, que se verifica la relacin entre el constructo vinculado tericamente. Y las evidencias de validez discriminantes, se verifican cuando se obtengan coeficientes de correlacin relativamente bajos entre constructos diferentes del que se desea medir. Que el modelo ha concebido como relacionados tericamente pero con una frecuencia de aparicin conjunta en la realidad muy escasa.

21

Ambas evidencias de validez contribuyen a la validacin de algunos aspectos del modelo terico que la sustenta. 4 Aspectos de la validez vinculados con las caractersticas formales de la prueba; Se refiere a la validez aparente y tiene que ver con que el instrumento resulte vlido a los ojos del examinado, ya que si los materiales, la consigna, el estilo de respuesta o las condiciones propuestas para el examen dejan de aparecer como serias o adecuadas a su edad o sus caractersticas, podra suceder que los sujetos vieran afectada su actitud de respuesta, producindose un efecto contrario a lo deseado en aras del logro de un buen rapport. Sesgo y Error sistemtico; El concepto de sesgo se relaciona al de validez, y se define como un error constante o sistemtico como opuesto al aleatorio o azaroso que impide la medicin precisa e imparcial del constructo a evaluarse. Por accin de ese sesgo, la probabilidad de xito no es independiente del subgrupo poblacional al que pertenece el examinado. Ello significa que, aunque el instrumento haya sido estandarizado para un grupo poblacional dado, un subgrupo dentro de ese grupo mayor generar probablemente, respuestas atpicas o no exitosas, por accin de la pertenencia a ese subgrupo (concertada con la generacin de un error sistemtico) y no por otras razones. El error sistemtico puede estar dado por cualquier componente inherente a la prueba, como por ejemplo, los materiales, el sistema de respuesta, los contenidos, las consignas u otros. Se acumula porque se da siempre de la misma manera y en el mismo sentido. Y a partir de ello, el test mide distintos constructos o genera distintos pronsticos, funcionando en forma diferencial en grupos disimiles, por razones ajenas a la variable que la escala est destinada a medir. Por lo tanto un test que presenta sesgo y error sistemtico deja de arrojar resultados vlidos y por lo tanto el instrumento no mide aquel constructo que dice medir.

Las Puntuaciones de los Test; Ya se ha hecho referencia a los cuatro niveles de medicin de Stevens, como la asignacin de nmeros o smbolos a objetos o fenmenos siguiendo ciertas reglas. De acuerdo con esta definicin, los instrumentos de medicin psicolgica,, o sea, las pruebas psicomtricas, quedaron caracterizadas como aquellas que permiten relevar y/o procesar informacin psicolgica en nmeros. Pero conviene aqu distinguir entre palabras nmero y numeral. Los numerales son smbolos numricos, mientras que el nmero es la cantidad que estos smbolos representan. Si los signos numricos se asignan a las distintas modalidades que puede tener una variable no cuantitativa, estos smbolos solo funcionan como numerales, y ente caso no tiene sentido hacer operaciones matemticas entre ellos. Solo si los

22

numerales guardan una relacin fija cuantitativa entre ellos, permite realizar operaciones matemticas bsicas y se llamarn nmeros. Es decir que los numerales pueden representar cualidades o cantidades pudiendo distinguir; 1. Numerales nominales- que solo sirven para nombrar las distintas modalidades de la variable, y estara haciendo una medicin cualitativa, el cual le da lugar de nivel de medicin nominal. 2. Numerales ordinales- aqu se pueden posicionar las modalidades de las variables. A esta medicin se la denomina semi-cuantitativa, y el nivel de medicin es el ordinal. 3. Numerales Cardinales- aqu se cuantifican las modalidades de la variable y el numeral es el nmero. La medicin es cuantitativa, y de acuerdo con ello quedan definidos los niveles de medicin como de razones e intervalar, que solo difieren en la naturaleza de su cero, y por eso conjuntamente se los suele tratar como un nico nivel de medicin denominado escalar. Las reglas a las que refiere Stevens en su definicin apuntan a la existencia de un isomorfismo entre los nmeros y los fenmenos psicolgicos que se pretende medir. Y grado de isomorfismo que presenten definir las propiedades matemticas que podrn aplicarse ente esos nmeros, y verificarse empricamente entre los fenmenos psicolgicos por ellos representados. Medicin Psicolgica; Al realizar una medicin debe especificarse no solo el valor medido sino tambin el error con que este se calcula, el cual a su vez tiene relacin con la facilidad de acceso a la informacin sobre lo que quiere medirse. Desde este punto de vista las mediciones pueden clasificarse en; Directas- sern aquellas donde el fenmeno a medir pueda observarse a travs de los sentidos, se puede contar, calcular o bien se puede comparar lo que se desea medir con un objeto o fenmeno similar. Ej. El sexo de la persona, la cantidad de palabras que es capaz de recordar. Estos son ejemplos de medicin directa. Indirectas- el fenmeno a medir no puede evaluarse en forma directa sino que se hace necesario el uso de un instrumento para materializarlo y de ese modo asignarle nmeros. Dentro de los fenmenos psicolgicos de medicin indirecta conviene distinguir dos tipos; Los fenmenos tangibles; como suelen ser variables fsicas o psicofsicas (ejemplo, tiempo que tarda un sujeto en resolver un problema). Los fenmenos intangibles, es decir que se infiere su misma existencia de los indicadores que se le atribuyen en su operacionalizacin. En el caso de las mediciones indirectas de fenmenos tangibles al error que se podra cometer con una medicin directa se le debe agregar el error que introduce el instrumento. Por ejemplo, si se mide el tiempo que tarda un sujeto resolver un problema deber agregrsele el error del reloj o cronmetro. Todo instrumento que se agregue a una medicin es una posible fuente de error que deber contemplarse.

23

Cuando las mediciones son indirectas y de fenmenos intangibles el error se maximiza. Al error cometido por el instrumento deber agregrsele el producido por en su operacionalizacin y validacin. En referencia a los instrumentos cualitativos o semi-cualitativos, interesa destacar cuatro aspectos a tener en cuenta en su proceso de construccin: 1. Cmo operacionaliza el constructo; relevar cuales son las conductas o cogniciones observables que den cuenta del mismo indicador, y lo distinguen de otros. 2. Como fomenta que las conductas a evaluar se manifiesten, y cmo se les asignan nmeros (cuantificacin) que representen ya sea su intensidad o frecuencia o, al menos, su presencia ausencia. 3. Cmo operar con nmeros para lograr, en lo posible, uno o pocos que sean la expresin cuantitativa y/o cualitativa ms acabada posible del constructo que se pretende medir (cuantificacin de conjuntos de respuestas). 4. Como transformar los nmeros obtenidos en resultados que sean significativos para su interpretacin. Lo que se intentar es poder establecer cmo se cuantifican los conjuntos de respuestas obtenido lo que se denomina puntaje bruto, y cmo se lo valora a travs de los denominados puntajes transformados y los baremos. Puntaje Bruto- Una prueba psicomtrica incluye la nocin de escalamiento, definido como la posibilidad de convertir o traducir las respuestas brindadas por los sujetos a una puntuacin. Y para que el conjunto de los nmeros representen a la variable psicolgica pretendida, se asigna a cada uno de los tems un numeral. Y una vez asignados esos numerales, es deseable operar sobre ellos en forma tal de obtener otros nuevos que tengan una significacin ms robusta e isomorfa con la variable que se quiere evaluar. As se determin que un conjunto de respuestas estn evaluando la misma variable, podramos por ejemplo sumar los nmeros que les asignamos a cada una de ellas a fin de obtener un nuevo valor que represente el total de dicho conjunto. A este nuevo nmero que sintetiza y representa la cantidad/ cualidad/ frecuencia de la variable y que ha sido el resultado del proceso de medicin, se lo suele denominar puntaje bruto, crudo o directo. El puntaje bruto es, entonces, un nmero que representa una cuantificacin de la variable o constructo a medir, es el resultado de la escala de medicin. El nivel de medicin del puntaje bruto guarda relacin con el nivel de medicin que posean los tems a combinar y con la forma de hacerlo. El valor resultante de una combinacin de tems suele mejorar el nivel de medicin que tiene el tem aislado El nmero resultante de agrupar tems suele tener, al menos, el nivel de medicin de los tems con que se compuso, y con frecuencia los supera. El puntaje bruto suele ser poco claro para la evaluacin por parte del usuario de la tcnica, ya que si bien cuantifica o cualifica el constructo, por s mismo no ofrece suficiente informacin con respecto a la magnitud de la medida obtenida. Para comprender si el puntaje bruto es alto, bajo o intermedio, se requiere de un sistema de referencia externo, generalmente una comparacin con los valores que comnmente obtiene los dems sujetos. Lo que se estila hacer para valorar el puntaje bruto es compararlo con otros

24

valores que permitan contextualizarlo (ejemplo, se podra sacar el promedio de las palabras memorizadas al evaluar la capacidad de memoria). Cuando estos valores se utilizan para convertir los puntajes brutos en otros, a los ltimos se los conoce como Puntajes Transformados, los cuales no son el producto de una escala de medicin, sino que se trata de nuevos nmeros, fruto de la comparacin de los puntajes brutos con referencias poblacionales. Estos nuevos nmeros no expresan cunto de la variable puntu el examinado, sino cunto puntu en relacin a los dems. Esta reconversin de un puntaje bruto a uno transformado ya no es una medicin en el sentido de la asignacin de nmeros al fenmeno que se quiere medir, ahora se trata de una conversin del nmero que realmente cuantifica al constructo (puntaje bruto) en otro ms til para interpretar (puntaje transformado). A su vez los puntajes transformados pueden clasificarse en dos grandes tipos; las medidas de posicin y los puntajes estndar: Medidas de posicin; Lo ideal para establecer las comparaciones y valorar el puntaje obtenido por un sujeto es hacerlo con los puntajes de la poblacin,, y los valores obtenidos de esos puntajes se los denomina parmetros. Pero en la gran mayora de los casos es muy poco prctico lograr obtener los puntajes de toda la poblacin para realizar dicha comparacin, ya sea porque sta es muy numerosa o porque es muy caro el proceso, por eso es necesario recurrir subconjuntos de dicha poblacin llamado Muestreo. Al calcular los estadsticos de estas muestras, se puede estimar los parmetros, y lo ms importante para que estos parmetros estn adecuadamente estimados, es haberlos calculados con muestras representativas de la poblacin, y al respecto es importante poder tener conocimientos sobre la validez de los resultados que se obtienen, y con ello asegurarse que el sujeto a examinar sea similar a los que conformaron la muestra, para obtener resultados ms ajustados desde un punto de vista mtrico y reducir el error de medicin. Una vez que se ha seleccionado la muestra, se administrar el instrumento en cuestin a todos sus integrantes, y se calculan los resultados obtenidos por cada uno de los sujetos. Con esos puntajes se calculan los estadsticos y se estima los parmetros. Se representan en una tabla que permite la conversin de los puntajes brutos a puntajes transformados. Dicha tabla recibe el nombre de Normas estadsticas o baremos. A la cantidad de casos correspondiente a cada uno de los distintos puntajes se las denomina frecuencia o frecuencia absoluta (nmero de casos) de dicho puntaje. Y se denomina frecuencia relativa a la frecuencia absoluta dividida la cantidad total de datos que conforma la muestra. A la frecuencia relativa se la multiplica por 100., obteniendo entonces la frecuencia relativa porcentual. Una manera de mejorar el ordenamiento de los datos cuando se trabaja con una variable de nivel ordinario, intervalar o de cociente, es utilizar las frecuencias acumuladas. Para ello se ordenan los resultados de menor a mayor y se calcula la frecuencia obtenida por cada uno de ellos. Se llamar frecuencia acumulada a la frecuencia que tiene un determinado puntaje ms las frecuencias que tienen todos los resultados menores a l, es

25

decir que se calculan la cantidad de datos que se hallaron con el valor en cuestin o con valores inferiores. Todos los puntajes transformados llamados medidas de posicin se basan en las frecuencias acumuladas porcentuales. Los ms destacados en psicologa son el percentil, el decil y el cuartil. Como se ha visto, la mediana es el valor que divide al conjunto de los datos en dos mitades con la misma cantidad de datos. Si se deseara dividir la distribucin en 100 partes, en cada una de las cuales se encuentre la misma cantidad de casos, hacen falta 99 valores. Esos puntajes que dividen la distribucin en 100 partes con el 1% de los casos en cada una de ellas se denomina percentil., y expresa qu porcentaje de mediciones de la muestra tiene por debajo o en el mismo valor cada puntaje bruto. Los deciles son puntajes anlogos a los percentiles, pero en lugar de tener un rango de 99 posiciones, tiene, uno de 9. Estos nueve valores son aquellos que dividen a los datos en 10 conjuntos de igual cantidad, y se obtiene tambin de las frecuencias acumuladas. Hay pocas escalas de medicin que los utilicen, siendo la ms destacada en nuestro medio el test que evala los factores de la personalidad. Los cuartiles son otra medida de posicin pero menos usual en evaluacin psicolgica, ya que sirven para dar resultados muy gruesos. Dividen los resultados solo en cuatro agrupamientos de igual cantidad de datos. En general son medidas que son ms tiles para trabajar con datos estadsticos o tomar decisiones sobre muestras, que en la construccin de instrumentos de evaluacin. Puntajes Estndar; estos puntajes se obtienen mediante un clculo matemtico por el que logra comparar el puntaje bruto evaluado en un sujeto con el valor medio y el desvo estndar previamente calculados en una muestra. Para explicar el concepto de puntaje estndar se parte de la distribucin de frecuencia llamada normal o campana de Gauss, y se obtienen de una frmula matemtica aplicada a los puntajes brutos, a cada uno de estos le corresponde un nico puntaje estndar. Para obtener el puntaje medio, llamado media o promedio, es necesario, primero, administrar el instrumento a una muestra de sujetos y obtener los puntajes de cada uno de los individuos que la componen. La media se obtiene sumando todos los puntajes y dividiendo el resultado de esa suma por la cantidad de sujetos evaluados. Si al puntaje bruto obtenido por un sujeto se le resta el valor de la media, se obtiene un nuevo puntaje cuyo valor indica cun apartado del valor promedio est el puntaje bruto en cuestin. Este nuevo puntaje que combina el puntaje bruto con la media se denomina puntaje diferencial, y tiene la propiedad de que cuanto ms grande es su valor, mayor ser la distancia del puntaje bruto respecto del valor promedio; y tiene la propiedad de que cuando el puntaje bruto vale cero, ste coincide con la media. Si el puntaje bruto de un sujeto fuera superior al valor promedio, el puntaje diferencial que le corresponder ser de un valor positivo. Por el contrario, si el puntaje diferencial es negativo, indica que el puntaje bruto es inferior al puntaje medio. La ventaja del uso de los puntajes diferenciales con respecto a los puntajes brutos es que le informan si la medida est por encima o por debajo de la media con solo ver su signo, tambin indican, con su valor absoluto qu tan lejos est del valor promedio.

26

Puntaje Z; Para superar las limitaciones que tiene el uso de la media como cociente para dividir los puntajes diferenciales, se usa, entonces, otro estadstico que toma en cuenta la dispersin que tienen los valores respecto de la media. Para obtenerlo se parte de los puntajes diferenciales que indican la distancia que tiene cada puntaje bruto respecto de la media, y un promedio de ellos sera un forma razonable de obtener una medida de cun dispersos o alejados estn estos valores. Este estadstico recibe el nombre de desvo estndar o desvo tpico, y es la raz cuadrada del promedio de los puntajes diferenciales elevados al cuadrado. Es una medida que vara de acuerdo a cuan dispersos estn los puntajes brutos respecto de la media. Si el valor es muy pequeo implican mayor lejana de los puntajes brutos con respecto al promedio. El uso del puntaje z tiene gran difusin en los instrumentos de evaluacin psicolgica, y por lo tanto, conviene conocer, algunas de sus propiedades; Cuando el puntaje bruto es una medicin es igual al valor de la media, z valdr cero, Si su signo es positivo entonces el puntaje bruto con que se calcul es mayor a la media, y si es negativo, es menor a la misma. El puntaje z es el puntaje transformado, llamado puntaje estndar, que puede obtenerse a partir de un puntaje bruto, cuando se conocen la media y el desvo estndar de los puntajes obtenidos previamente en una muestra. Este puntaje es un nmero que puede ser positivo o negativo, e indica cuan cercano o alejado al valor promedio de la muestra est el puntaje bruto. Puntaje T; Si bien el puntaje z, comparado al puntaje bruto, aporta indudables ventajas para la interpretacin, el hecho de que sus valores suelan tener decimales y, adems, que arrojen puntajes con signo positivo y negativo, complican su facilidad de lectura. Entonces, para simplificar la interpretacin de los puntajes estndar, nmeros instrumentos utilizan variantes de z, que pueden calcularse con simples operaciones matemticas. El puntaje T no es ms que el puntaje z al que se lo ha multiplicado por 10 y se le ha sumado un valor de 50. De esta forma, un valor de z=0 se convierte en un puntaje T=50. Con los puntajes T se logran perfiles ms acotados y fciles de leer, eliminando zonas de puntaje muy poco frecuente que no agregan significacin psicolgica. Puntajes CI; Las escalas de Weschler de inteligencia, para nios y adultos, cuyas versiones actuales son el WISC-IV y el WAIS III, expresan sus resultados principales en puntajes transformados, tambin derivados de z, llamados Coeficientes Intelectuales (pueden ser verbales, de ejecucin o de la escala completa) y Puntajes ndice. Todos ellos comparten las mismas caractersticas como puntajes transformados, usando una media de 100 puntos y un desvo estndar de 15. Con estos valores definidos, la forma de obtener los CI y los puntajes ndice es anloga al puntaje T, cambiando las constantes de 50 por 100 y de 10 a 15. Un CI de 100 puntos indica que el examinado ha obtenido un valor medio, un CI 115 se corresponde a un puntaje z= 1, es decir, un desvo estndar por encima de la media. Al igual que en los puntajes T, los valores muy alejados de la media son harto infrecuentes, ms si se tiene en cuenta que el Cociente intelectual tiene una distribucin normal. Con el objetivo de facilitar la lectura de los CI, las escalas Wechsler proponen rangos o intervalos de interpretacin, que se seleccionaron teniendo en cuenta la frecuencia con la que los sujetos pueden obtener distintos valores CI.

27

Adems de estas escalas, existe otro Test de Inteligencia muy difundido, el Test de Stanford Binet, que utiliza tambin puntajes CI. Estos son similares a los propuestos en los test de Wechsler, ya que utiliza un valor medio de 100 puntos, pero con un desvo estndar de 16 puntos. Puntajes Equivalentes; Las escalas de Wechsler obtiene su valor de CI y de puntajes ndice de una combinatoria de puntajes obtenidos a travs de los distintos sub-test que las componen. Cada uno de esos sub-test puede administrarse en forma independiente de los otros, y como resultado de la puntuacin de cada uno de ellos se obtienen los correspondientes puntajes brutos que se han de convertir en un puntaje transformado. Cada uno de estos puntajes transformados es tambin una variante del puntaje z llamado puntaje equivalente, con una media de 10 puntos y un desvo estndar de 3. Para lograr esto se igualan los puntajes equivalentes a los puntajes z. Confiabilidad y Error de medicin; La elaboracin de una tcnica psicomtrica implica, no slo seleccionar adecuadamente el tipo de puntuaciones que el instrumento ha de brindar, es necesario tambin proveer evidencia emprica evidencia emprica sobre la calidad de las mismas, lo cual se lleva a cabo poniendo a prueba la consistencia y precisin de los puntajes (confiabilidad). La confiabilidad es un ndice de la calidad de la tcnica de evaluacin, a cargo de quien elabora y adapta el instrumento en cuestin. Es necesario destacar que toda medicin se halla fundamentada en un teora de la medicin, la cual analiza distintas propuestas para describir, categorizar y evaluar la calidad de las medidas, y que a su vez, tiene como objetivos tanto mejorar su utilidad y su precisin, como desarrollar nuevos mtodos en la obtencin de instrumentos de mayor calidad. La medicin en Psicologa se analiza desde la ptica de la llamada Teora Clsica de los Test (TCT), denominada tambin Modelo del Valor Esperado. La TCT es una teora til para describir la influencia de los errores de medida en las puntuaciones observadas u obtenidas a travs de instrumentos, y sus relaciones con las puntuaciones verdaderas, se basa en el modelo lineal de Spearman el cual trata de la incertidumbre o error inherente a cualquiera de las medidas realizadas mediante la aplicacin de un test. Desde esta teora al realizar mediciones a los test, hay dos supuestos presentes; - Por un lado, existen puntajes verdaderos que reflejan puntualmente la realidad, que miden de un modo exacto, sin erro. - Y por el otro, que siempre que realizan mediciones, pueden cometerse errores. Si bien estos dos supuestos parecen contradictorios, uno responde a una hiptesis de trabajo sustentada por un supuesto ideal, se refiere a la una probabilidad terica. Se supone entonces puntuaciones verdaderas, sin error, y al mismo tiempo se supone que se realiza una medicin concreta del fenmeno, lo ms probable es que se cometan errores. Entonces la distincin entre un puntaje teorizado, al que llamaremos verdadero, y otro concreto, al que llamaremos obtenido, es fundamental ya que uno de los objetivos ms

28

importantes de la Psicometra es determinar el valor real o puntuaciones verdaderas, la cual se define como lo que queda de la puntuacin observada u obtenida a travs del test, una vez eliminado los errores de medida. En las mediciones indirectas de fenmenos intangibles, el puntaje verdadero no puede ser concretamente calculado, dado su carcter ideal. Se trata de un concepto al que se intenta acceder y del cual slo puede inferirse su valor hipottico. Por esta razn, el objetivo de los estudios que se realizan sobre la precisin de las puntuaciones obtenidas a travs de un instrumento es controlar y calcular el margen de error. Los tipos de error; Una medicin, realizada a travs de un instrumento psicomtrico, puede estar influida por fuentes de error tan diferentes y variadas,

Curso Básico de Psicometría

Documents

Transcript of Curso Básico de Psicometría