UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE PSICOLOGÍA CARACTERÍSTICAS PSICOMÉTRICAS DE LA PRUEBA DE INTELIGENCIA GENERAL G-36 TESIS PARA OPTAR EL TÍTULO PROFESIONAL DE LICENCIADA EN PSICOLOGÍA CON MENCIÓN EN PSICOLOGÍA CLINICA AUTORA Córdova Almanza, Rosa Eve ASESORA Ortiz Morán, Mafalda Magdalena JURADO Livia Segovia, José Hector Castillo Gómez, Gorqui Baldomero Rivadeneyra De La Torre, Elvira Diaz López, David Eduardo LIMA – PERÚ 2018 DEDICATORIA Dedico esta tesis a mis padres, en especial a hermano por ser la gran fuente de soporte y motivación para mi superación profesional. Agradecimientos Mi especial aprecio a mi alma mater y a los profesores de la facultad de Psicología, por compartir sus valiosos conocimientos y por sus acertados consejos como profesionales. Un agradecimiento especial al Profesor José Livia quien influenció en la elección del tema de mi tesis y el apoyo necesario para la realización de la investigación así como su apoyo en mi formación profesional. Y a mí asesora, la profesora Mafalda Ortiz por su guía durante la elaboración de mi tesis y sus observaciones puntuales. A mi amiga la Licenciada Giuliana Salazar por revisar mi investigación y responder mis dudas. Características psicométricas de la prueba de inteligencia general G-36 en estudiantes pre-universitarios de lima Rosa Eve Córdova Almanza Universidad Nacional Federico Villarreal Resumen Se describe las características psicométricas del Test de inteligencia General – G36 en una muestra de 324 estudiantes pre universitarios del distrito de Lima. En el análisis de ítems se estudió los índices de dificultad y discriminación. Sobre los índices de discriminación de los 36 ítems se eliminan 2 ítems y de los 34 restantes presentan índices entre 0,201 y 0,435. En el análisis del índice de dificultad de los 36 ítems varían entre 0,94 y 0,07 con respeto a las categorías el 19 % son muy fáciles, 25% medianamente fáciles, el 25% en regular, 20% en medianamente difíciles y 19% en muy difíciles. Se estudió la validez de criterio tipo concurrente obteniendo coeficiente de correlación r = 0,367 y una p = 0,000 que evidencia una correlación significativa con el test de inteligencia BETA III. La confiabilidad fue analizada por el método de consistencia interna obteniendo un Alfa de Crombach de 0,778, mostrando adecuadas propiedades psicométricas. Palabras clave: Inteligencia, pre universitario, inteligencia general, confiabilidad, validez Psychometric characteristics of the test of general intelligence G-36 in pre- university students from Lima Rosa Eve Córdova Almanza Universidad Nacional Federico Villarreal Abstract Psychometric characteristics of General Intelligence Test described - G36 in a sample of 324 pre university district of Lima students. In the analysis of items the indices of difficulty and discrimination were studied. On the discrimination indexes of the 36 items 2 items are eliminated and the remaining 34 are indexed between 0,201 and 0,435. In the analysis of the index of difficulty of the 36 items vary between 0.94 and 0.07 with respect to the categories 19% are very easy, 25% are moderately easy, 25% in regular, 20% in medium difficult and 19 % in very difficult. We studied the validity of concurrent type criteria, obtaining a correlation coefficient r = 0,367 and a p = 0,000 that shows a significant correlation with the BETA III intelligence test. We studied the validity of concurrent type criteria, correlating significantly with the BETA III intelligence test. Reliability was analyzed by the internal consistency method, obtaining a Crombach's alpha of 0,778, showing adequate psychometric properties. Keywords: Intelligence, pre university, general intelligence, reliability, validity Índice Lista de tablas Lista de Figuras Introducción CAPÍTULO I: PLANTEAMIENTO DEL PROBLEMA 1.1. Planteamiento del problema 1 1.2. Objetivos 3 1.3. Justificación 3 1.4. Alcances y limitaciones 5 1.5. Definición de variables 6 CAPÍTULO II: MARCO TEÓRICO 2.1. Antecedentes 7 2.2. Conceptos de inteligencia 9 2.3. Teorías sobre la inteligencia 17 2.4. Teorías sobre la estructura de la inteligencia 19 2.5. Inteligencia general 29 2.6. Aspectos psicométricos 32 CAPÍTULO III: MÉTODO 3.1. Tipo de investigación 50 3.2. Diseño de investigación 50 3.3. Población 50 3.4. Muestra 50 3.5. Técnica de recolección de datos 52 3.6. Procedimiento 54 CAPÍTULO IV: RESULTADOS 4.1. Análisis de ítem 55 4.2. Validez psicométrica 58 4.3. Confiabilidad 59 4.4. Baremos 59 CAPÍTULO V: DISCUSIÓN 5.1. Conclusiones 62 5.2. Recomendaciones 62 Referencias 63 Anexos 71 LISTA DE TABLAS Tabla 1 – Frecuencias de los atributos que los expertos han utilizado para definir la inteligencia en 1921 y en 1986. 12 Tabla 2 – Puntos de corte de los valores del índice de discriminación y su interpretación 33 Tabla 3 - Porcentaje y edad de la muestra 51 Tabla 4 - Clasificación de los ítems de la prueba de inteligencia general G36 54 Tabla 5 - Índice de discriminación de la prueba de inteligencia general G36. 55 Tabla 6 – Índice de dificultad de la prueba de inteligencia general G36. 57 Tabla 7 - Validez concurrente del Test de inteligencia general G36 58 Tabla 8 - Consistencia interna de la prueba de inteligencia general G36 59 Tabla 9- Diferenciación de grupo de acuerdo a sexo y edad 59 Tabla 10- Baremos en percentiles del Test de inteligencia general G36 60 LISTA DE FIGURAS Figura 1 – Porcentaje de alumnos según género. 51 Figura 2 – Índice de discriminación de la prueba de inteligencia general G36. 56 Figura 3 – Índice de dificultad de la prueba de inteligencia general G36. 58 Introducción La evaluación es un proceso que se aplica en los diversos campos de la psicología, como la clínica, educativa, etc. así como en la medición de las variables psicológicas como el área cognitiva y de personalidad (Noronha y Vendramini, 2003). En contextos educativos permite la detección de casos con dificultades de aprendizaje, apoya la orientación vocacional y complementa la evaluación de los programas educativos. En contextos clínicos, permite ver las limitaciones y potencialidades del paciente a tratar, así como formular un plan terapéutico para su abordaje dentro de la terapia. Almeida, Guisande, Primi y Lemos (2008) señalan que el área cognitiva es una de las áreas más importantes dentro de la evaluación psicológica. Por este motivo, las pruebas de inteligencia son los instrumentos más utilizados por el psicólogo (Noronha y Vendramini, 2003). Sin embargo, para que las pruebas sean útiles y eficientes, deben someterse a estudios para probar sus cualidades psicométricas. Dentro de este contexto se analizan las características psicométricas de la prueba de inteligencia general G-36. El desarrollo de la investigación comprende 5 capítulos. En capítulo I se desarrolla el planteamiento del problema, los objetivos, la justificación, los alcances y limitaciones de la investigación, así como la definición de las variables. El capítulo II señala los antecedentes de una investigación, el marco teórico referidos a los conceptos de la inteligencia, las teorías que explican la naturaleza de la inteligencia, la estructura de la inteligencia y los aspectos psicométricos. En el capítulo III se señala el tipo de investigación, el diseño, la población y muestra, las técnicas de recolección de datos y el procedimiento de la investigación. Finalmente en los capítulos IV y V se presentaron los resultados y la discusión. 1 CAPÍTULO I PLANTEAMIENTO DEL PROBLEMA 1.1. Planteamiento del problema Desde que existe la psicología como disciplina, los psicólogos han planteado diferentes definiciones de inteligencia, así como métodos para medirla. Esto se ha considerado, incluso antes de que se comenzara a estudiar científicamente el concepto de inteligencia y su medición. Hoy se conoce que la inteligencia (o inteligencias) existen en todas las personas en mayor o menor grado. Las pruebas psicométricas o más conocidas como test psicológicos, han sido y son una herramienta fundamental para la labor del profesional psicólogo en cualquier ámbito laboral en el que se desempeñe. Dichas herramientas abarcan una gran variedad de campos de trabajo, algunos más aplicativos, como lo son la psicología clínica, la organizacional, la educativa, entre otras, y en especial para la investigación psicológica (Vargas, 2016) Aiken (2003) expone que las pruebas de inteligencia ayudan a identificar a los individuos de acuerdo a sus habilidades mentales, para diseñar programas a fin de tratarlos, entrenarlos y educarlos, como es el caso de personas con retardo mental o superdotado. Además, es usado en la evaluación de la efectividad de los tratamientos psicológicos e intervenciones en el medio ambiente. 2 Noronha y Vendramini (2003) señalan que las pruebas de inteligencia así como la de personalidad son los instrumentos más utilizados por el psicólogo, por su alta demanda por estos test. Sin embargo, para que las pruebas sean útiles y eficientes, deben someterse a estudios para probar sus cualidades psicométricas. Livia y Ortiz (2014) señalan como balance del proceso histórico se puede decir que el desarrollo de la medición psicológica en el Perú se encuentra en un grave problema, no se dispone de pruebas estandarizadas a nuestra realidad, además de carecer de una política de control que norme su uso adecuado y garantice la fiabilidad de los resultados. En nuestro medio existe un problema referido a la evaluación psicológica, puesto que existe una escasez de instrumentos de evaluación validados psicométricamente, tal como señalaban Livia y Ortiz (1996). En el año 2008, el Instituto Nacional de Salud Mental Honorio Delgado Hideyo Noguchi registro de 1051 instrumentos de evaluación de salud mental, de los cuales solo 237 han sido adaptados; esto indica que solo un 23% de instrumentos ha pasado por el proceso de adaptación psicométrica, mientras que un 32% corresponde a instrumentos creados y un 45% a aquellos que han sido aplicados. Asimismo, la investigación señaló que los constructos evaluados con más frecuencia son: personalidad, funciones cognitivas y familia, respectivamente. 3 Es por esto que se considera importante la adaptación y validación psicométrica de los instrumentos, con el fin de garantizar un uso adecuado de los mismos durante la labor de evaluación efectuada por el profesional psicólogo. Tomando en cuenta la importancia de la medición de inteligencia, y debido a que no existen estudios previos en nuestro país, se seleccionó el test de inteligencia G- 36 por ser una prueba rápida y fácil de aplicar, ante la cual nos planteamos la siguiente pregunta ¿Cuáles son las propiedades psicométricas de la prueba de inteligencia general G 36? 1.2. Objetivos 1.2.1. Objetivo general Establecer las propiedades psicométricas de la prueba de inteligencia general G- 36 1.2.2. Objetivo específico ➢ Realizar el análisis de ítems de la prueba de inteligencia general G-36 ➢ Evaluar la confiabilidad de la prueba de inteligencia general G-36 ➢ Determinar la validez de la prueba de inteligencia general G-36 ➢ Elaborar baremos de la prueba de inteligencia general G-36 1.3. Justificación El presente investigación ha sido elaborado con el fin de ayudar la labor del psicólogo en la evaluación de la inteligencia. Para tal efecto, resulta relevante contar con instrumentos adaptados para nuestra realidad. 4 Por ese motivo, la presente investigación tiene como objetivo establecer las propiedades psicométricas de la prueba de inteligencia general G-36. En ese sentido, este trabajo beneficiará al psicólogo que le permitirá contar con un instrumento de evaluación para medir la inteligencia en adolescentes y adultos. Cuando hablamos de evaluación psicológica, debemos tener en cuenta que abarca los diferentes ámbitos de la psicología: clínica, educativa, del trabajo y de las organizaciones, jurídica, neuropsicología o del deporte. Las pruebas o instrumentos estandarizados, son uno de los tres grandes ejes metodológicos con los que contamos los psicólogos para realizar una buena evaluación psicológica, junto con la entrevista y la observación de campo. Por este motivo, si queremos realizar una evaluación psicológica de calidad, los tests se convierten en una herramienta necesaria, y deben ser sometidos a un proceso riguroso de construcción y evaluación permanente, para que tengan niveles elevados de validez y fiabilidad (Fernández, 1996). Hay test que evalúan distintos tipos de inteligencia y que se combinan en el cociente intelectual. Esto es lo que pasa con las llamadas escalas Weschler. También los test pueden estar construidos para evaluar una sola capacidad general, como es el caso de los test de Raven. Andrés y Colom (1998; véase en Espinoza, 1999) resalta de la inteligencia su capacidad para predecir - por encima de cualquier otra medida - la eficacia del aprendizaje en cualesquiera que sean los ámbitos del mismo, tales como el rendimiento escolar, laboral, entre otros, convirtiéndolo en una herramienta imprescindible en labores de diagnóstico y de prevención. 5 En especial el factor g, este tiene una influencia considerable en cómo se desenvuelve una persona a lo largo de su vida. Al ser la medida de la inteligencia, el factor de predicción más eficaz que se conoce del desempeño individual en la escuela y en el trabajo, además de muchos otros aspectos del bienestar y del desarrollo vital. Sobre el empleo de test de inteligencia no verbal (Dos Santos, Noronha y Fernández, 2005), que permite su uso en poblaciones con bajo nivel educativo o con conocimiento limitado del idioma debido a su diseño; sin embargo, es poco investigado en nuestro medio, corroborándose por el número limitado de estudios en los que fue empleado. Sumado, que en nuestro país no disponemos de test estandarizados que nos den una medición confiable de la inteligencia general, pese a su importancia. Debido a estos factores, el test usado en este estudio, es el test de inteligencia general G-36, que corresponde a este tipo. 1.4. Alcances y limitaciones 1.4.1. Alcances ● La prueba de inteligencia G-36 puede ser aplicar a la población en general debido a que es libre de influencia cultural, donde el sujeto debe aplicar el razonamiento general para resolver una situación problemática. 1.4.2. Limitaciones ● Los baremos no pueden ser generalizados debido a que la muestra es no probabilística. 6 1.5. Definición de variables Inteligencia: Puntajes logrado en la prueba de inteligencia. Variable cuantitativa y su nivel de medición es ordinal. Estudiantes pre universitarios: Hombres o mujeres, en proceso de preparación para rendir un examen de admisión a la universidad. Variable cualitativa y su nivel de medición nominal. 7 CAPÍTULO II MARCO TEÓRICO 2.1. Antecedentes Livia (2014), validó la batería de pruebas de inteligencia para adolescentes con la finalidad de evaluar sus propiedades psicométricas. Lo aplicó a 450 estudiantes pre- universitarios y universitarios de una universidad. La muestra fue diferente para cada prueba, siendo 387 alumnos para el test de inteligencia BETA III, 317 estudiantes para el test de inteligencia general G 36 y 450 alumnos para la Batería de Pruebas de Raciocinio (BPR). Las correlaciones entre instrumentos fueron evaluadas en base a una muestra de 350 participantes. Los resultados señalaron que índice de dificultad en casi todas las pruebas fue de nivel fácil, la consistencia interna de cada uno de los test y de los subtest de la batería se ubicó en un intervalo de 0,74 a 0,88. Demostraron que los test de inteligencia que componen la batería son confiables y presentan validez de criterio tipo concurrente. Cajigas (2013) explora las propiedades psicométricas de la batería de pruebas de raciocinio BPR - 5 compuestas por cuatro sub tests: razonamiento abstracto, razonamiento verbal, razonamiento práctico, razonamiento numérico en una muestra total de 400 estudiantes pre-universitarios de una entidad estatal de lima. 8 Validez de criterio tipo concurrente, se obtuvo al correlacionarlo con la prueba de inteligencia no verbal BETA III, obteniendo el coeficiente de 0.24 para razonamiento abstracto, 0.22 para razonamiento verbal, 0.22 para razonamiento práctico, y 0.14 para razonamiento numérico, concluyendo que la batería presenta confiabilidad y validez concurrente. En el 2005, Dos Santos, Noronha y Fernandes estudiaron la validez convergente de las pruebas de inteligencia R1-B y G36. La muestra estuvo conformada por 78 estudiantes de secundaria, cuyas edades fluctúan entre 15 y 64 años (media = 36,84, SD = 10.10) de los cuales 27 eran mujeres y 51 eran varones, que representan del total de estudiantes el 34,6% y el 65.4% respectivamente. Los resultados mostraron una alta correlación entre las pruebas (r = 0,80), por lo tanto ambas pruebas miden el mismo constructo. En el año 2003, Boccalandro estudio la fiabilidad del test de inteligencia G36, en una muestra de 100 sujetos, compuesta por 75 del sexo masculino (75%) y 25 del sexo femenino (25%). Las edades de los sujetos fluctúan entre 16 y 66 años, con un edad promedio de 28,53 años. Además su grado de escolaridad, del 51% fue secundaria y el 49% fue superior. La fiabilidad fue obtenida por el método de consistencia interna, tipo mitades y homogeneidad. Por mitades, usaron la fórmula de Kuder-Richardon obteniendo un coeficiente de 0,823 y por homogeneidad emplearon la fórmula de Sperman-Brown obteniendo un coeficiente 0,825. Ambos resultados indican que la prueba posee un alto coeficiente de confiabilidad. 9 Boccalandro (2003), estudió la validez del test de inteligencia G36 en una muestra de 70 estudiantes, siendo 26 alumnos del sexo masculino (37,1%) y 44 alumnos del sexo femenino (62,9%). Las edades de los sujetos varían entre 17 y 48 años, con un edad promedio de 22,64 años. La validez de criterio tipo concurrente, fue obtenida al correlacionar con el test de Matrices Progresivas de Raven - Escala general. Donde la mitad de los sujetos realizó primero el test de inteligencia general G-36 y la otra mitad el Raven. El coeficiente de correlación de Pearson fue de 0,76 que indica que la correlación entre los resultados de los test es alta y estadísticamente significativa, por lo que podemos afirmar, que los dos test evalúan la inteligencia. 2.2. Conceptos de inteligencia En el año 1953, Wolff (véase en Prieto, Inciarte, Rincón y Bonilla, 2008) menciona que el término inteligencia deriva del latín intellegere, vocablo que significa “recolectar de entre”, es decir, recoger y separar cosas de un conjunto, operación que implica establecer relaciones, seleccionar y, por tanto, percibir y discernir. Santrock (2006, citado por Sánchez y Pirela, 2010) describe la inteligencia como la habilidad de solucionar problemas, así como la capacidad de adaptarse y aprender de las experiencias cotidianas de la vida. Morris y Maisto (2005) la enuncian como un término general relacionado con la habilidad o habilidades implicadas en el aprendizaje y la conducta adaptativa. 10 En el año 2004, Bueno estudio el concepto de inteligencia, mediante el análisis de los aspectos que caracterizan a la conducta inteligente, indicando las siguientes capacidades: ● Clasificar patrones. Se entiende por la capacidad que tiene el ser humano para clasificar todos los objetos y conceptos que maneja. Reconocer cuáles son los rasgos principales que lo asemejan a otros objetos o conceptos y considerarlos miembros de la misma clase, por tanto, adjudicarles un nombre que los identifique como grupo. ● La capacidad de modificar adaptativamente la conducta: Aprender. Cambiar la propia conducta en función de la experiencia es considerado como uno de los rasgos más importantes de la conducta inteligente. Cuanto más evolucionado esté un organismo dentro de la escala filogenética, más posibilidades tendrá de poder cambiar, adaptándose al medio. El hombre es quien en principio tiene más posibilidades, sin embargo, no todos los humanos tienen la misma capacidad de modificar su conducta. ● La capacidad de razonamiento deductivo. Este incluye la inferencia lógica. Cuando una persona maneja este tipo de pensamiento, utiliza parte de la información dada y no descubre nada que no esté ya implícito, es decir lo que hace es sacar una conclusión lógica de las premisas existentes. Por ejemplo, cuando afirmamos que “Todos los perros se llevan mal con los gatos. Blas es un perro. Por tanto, se lleva mal con los gatos”. ● La capacidad de razonamiento inductivo: Generalizar. Esta habilidad implica ir más allá de la información que uno percibe. Supone la capacidad de observar lo que nos rodea y descubrir las reglas que lo rigen, nos permite por tanto, hacer afirmaciones generales o universales. 11 ● La capacidad de desarrollar y utilizar modelos conceptuales. Los modelos conceptuales que elaboramos nos permiten interpretar el universo en el que vivimos. Para llegar a realizar estos modelos conceptuales necesitamos tanto de la deducción como de la inducción. Por ejemplo, si rueda una pelota por debajo del sofá y aparece por el otro extremo, aseguraremos que es la misma pelota (permanencia del objeto) y que mantiene las mismas características (invariabilidad de propiedades) de color forma, etc. ● La capacidad de entender. Se refiere a la habilidad para comprender o intuir algo (insight). En ocasiones parafraseando una idea, es decir, reformulando con nuestras propias palabras se puede considerar que la hemos entendido, sin embargo, en otras no, puede ser que entendamos “cómo” deben ser las fases de un proceso, pero algo muy distinto es entender el “porqué” de esas fases. Wechsler (1978, véase en Gonzáles, Aragon y Silva, 2000) considera a la inteligencia como la capacidad global de un individuo tiende para entender y enfrentar el mundo que lo circunda, concibiendo a la inteligencia como una entidad. Sternberg y Berg (1992) analizan los simposios de los años 1921 y 1986 en que un grupo de expertos señalan los rasgos propios de la inteligencia. En la tabla 1 se recogen y comparan 27 atributos, que aparecieron en las definiciones de inteligencia que dieron los expertos de dichos simposios. El reducido número de la frecuencia de cada atributo les hizo difícil un análisis estadístico formal, sin embargo hicieron algunas generalizaciones. Como se puede observar en la Tabla 1, los atributos tales como los componentes de nivel superior (razonamiento abstracto, representación, solución de problemas, toma de decisiones) se destacan en ambas listas. 12 Otros temas son recurrentes como la adaptación al medio ambiente y los procesos ejecutivos, sin que se haya llegado a criterios comunes para todos, uno de ellos es el de la naturaleza de la inteligencia. Hay quienes la conciben como algo único y otros como un conjunto de diversos atributos. La correlación de frecuencia de ambos conjuntos es 0,50 lo que indica una coincidencia moderada. Tabla 1 Frecuencias de los atributos que los expertos han utilizado para definir la inteligencia en 1921 y en 1986. 1986 1921 N % N % 1. Adaptación para entender eficazmente las exigencias del ambiente. 3 13 4 29 2. Procesos elementales (percepción, sensación, atención). 5 21 3 21 3. Metacognición (conocimiento acerca de la cognición). 4 17 1 7 4. Procesos ejecutivos 6 25 1 8 5. Interacción de procesos y conocimientos 4 17 0 0 6. Componentes de nivel superior (razonamiento abstracto, representación, solución de problemas, toma de decisiones) 1 2 50 8 57 7. Conocimiento 5 21 1 7 8. Aptitud de aprendizaje 4 17 4 29 9. Mecanismos fisiológicos 2 8 4 29 10. Conjunto de aptitudes (por ejemplo: espacial, verbal, auditiva) 4 17 1 7 11. Rapidez de procesamiento mental 3 13 2 14 12. Rendimiento automatizado 3 13 0 0 13. g 4 17 2 14 14. Manifestación en el mundo real (sociales, prácticas) 2 8 0 0 13 1986 1921 N % N % 15. Lo que es valorado por la cultura 7 29 0 0 16. Difícilmente definible; no es un único constructo 4 17 2 14 17. Un campo de escolaridad 1 4 0 0 18. Capacidades innatas 3 13 1 7 19. Constructos emocionales, motivacionales 1 4 1 7 20. Aptitudes estrictas académico-cognitivas 2 8 2 14 21. Diferencias individuales en competencia mental 1 4 0 0 22. Generación de ambiente basada en programación genética 1 4 0 0 23. Aptitud de afrontar lo nuevo 1 4 1 7 24. Alegría mental 1 4 0 0 25. Solamente importa su valor predictivo 0 0 1 7 26. Capacidad de inhibición 0 0 1 7 27. Expresiones de la conducta manifiesta (respuestas eficaces) 5 21 3 21 Nota: Sternberg y Detterman, 1992, p.188. (citado por Sternberg, y Berg, 1992) Por otra parte, Snyderman y Rothman en 1987 (Benatuil, 2007) encuestaron a más de 1000 especialistas en inteligencia y demostraron la existencia de consenso en la consideración de tres elementos centrales para la comprensión de la inteligencia, estos son: pensamiento abstracto, capacidad de solucionar problemas y capacidad de adquirir conocimientos. Asimismo los especialistas también destacaron la capacidad de adaptación al ambiente, la creatividad, las habilidades lingüísticas y matemáticas, el conocimiento general, la memoria y la rapidez mental como constitutivas de la inteligencia. Hasta ahora hemos ido caracterizando la inteligencia, por algunos de los aspectos que los distintos especialistas han ido indicando como rasgos de inteligencia en las personas que los poseen. Como hemos visto, sería muy arriesgado ceñirnos a una única definición de inteligencia y que toda la comunidad científica la aceptara como 14 válida. Bueno (2004) señala una serie de definiciones resaltantes, que son las siguientes: Terman: La capacidad de “desarrollar pensamientos abstractos”. Thorndike: “El poder de dar una buena respuesta a partir de la verdad o la realidad”. Colvin: “El aprendizaje o capacidad de aprender a adaptarse al medio”. Rudolf Pinter: “La modificabilidad general del sistema nervioso”. J. Peterson: “Un mecanismo biológico mediante el que se reúnen los efectos de una complejidad de estímulos y se les da cierto efecto unificado en la conducta”. H. Woodrow: Una “capacidad de adquirir”. M. E. Hagerty: “Grupo de complejos procesos mentales definidos tradicionalmente como la sensación, la percepción, la asociación, la memoria, la imaginación, el discernimiento, el juicio y el razonamiento”. Brown y Freench (1979): “La facultad de autodirigirse y de aprender en ausencia de una instrucción directa y completa”. Whimbey (1975): “Un acercamiento habitual aprendido a la solución de problemas”. Bereiter y Engelman (1966): “Habilidad en el análisis y reconstrucción mental de relaciones”. De Avila y Duncan (1985): La capacidad de emplear los conocimientos eficazmente: “lo que puede uno hacer con lo que uno sabe”. Gardner (1994): La inteligencia tiene que ver con la capacidad para resolver problemas y elaborar productos en un escenario natural y estimulante. (p.11) 15 En psicología, la definición del término inteligencia se ha caracterizado por una notable falta de consenso entre los expertos, debido a que constituye un fenómeno complejo, que no presta con facilidad a una definición conceptual. C. Gonzáles (2003) acota que debido a la intervención de tantos elementos, cuyo funcionamiento no está muy claro, dificulta una definición precisa y concisa de inteligencia. Por otro lado Wechsler, en el año 1978 (véase en González, Aragón, y Silva, 2000) considera a la inteligencia como la capacidad global de un individuo a entender y enfrentar el mundo que lo circunda, concibiendo a la inteligencia como una entidad global, eso es, multideterminada y multifacética en oposición a un rasgo definible de una manera única. Weachsler considera que no es una clase de habilidad total, sino que es algo que se infiere de aquellas habilidades que se manifiestan bajo diferentes circunstancias y condiciones, menciona que la información que se obtiene de las pruebas de inteligencia es importante, sólo en el sentido de que establece y refleja lo que se ha definido como la capacidad total para la conducta inteligente. En el año 1996 (Rigo y Donolo, 2013), el American Psychological Association (APA), convocó a un grupo de expertos los cuales estuvieron a cargo de Neisser para que se pronunciara sobre el tema de la inteligencia. Ellos señalan que los individuos difieren en su aptitud para comprender ideas complejas, adaptarse con eficacia al ambiente, aprender de la experiencia, razonar y para superar obstáculos. 16 Los conceptos de inteligencia son intentos de clarificar y organizar esta compleja serie de fenómenos. Aunque se ha logrado, una considerable claridad en algunas áreas, ninguna de las conceptualizaciones ha respondido todas las preguntas y ninguna de ellas recibe un apoyo universal. Cuando se preguntó dos docenas de teóricos por una definición de inteligencia, se propusieron dos docenas de definiciones distintas (Sternberg y Detterman, 1992). Estos desacuerdos no son motivo de desaliento. La investigación científica no puede empezar con definiciones totalmente aceptadas, aunque se puede llegar a ellas. Posteriormente Papalia y Olds (2004) utilizan el término de inteligencia para referirse a la constante interacción, entre las capacidades heredadas y las experiencias ambientales; cuyo resultado capacita al individuo para adquirir, recordar y utilizar sus conocimientos, entender conceptos concretos y eventualmente abstractos, comprender las relaciones entre los objetos, los hechos y las ideas, así como aplicarlo con el propósito específico para resolver los problemas de la vida cotidiana. Cohen y Swerdlik (2006, véase en Sánchez y Pirela, 2010) definieron la inteligencia como una capacidad multifacética que se manifiesta de diferentes maneras a lo largo del ciclo vital. Incluye las habilidades de adquirir y aplicar el conocimiento, razonar de manera lógica, planear de modo efectivo, hacer inferencias a partir de la percepción, realizar juicios sólidos y resolver problemas, comprender y visualizar conceptos, poner atención, ser intuitivo, encontrar con facilidad las palabras y pensamientos correctos, enfrentarse, ajustarse y aprovechar situaciones nuevas. 17 Además de las diversas definiciones presentadas, existen diferentes teorías sobre inteligencia, las cuales influyen significativamente en el contenido de los tests de inteligencia. 2.3. Teorías sobre la inteligencia Woolfolk (1999), indica que las primeras teorías sobre la naturaleza de la inteligencia, comprendían en uno o más de los siguientes temas: (1) la capacidad de aprender; (2) el conocimiento adquirido por la persona; y (3) la habilidad de adaptarse con éxito a situaciones nuevas y al ambiente en general. Existen múltiples teorías sobre el origen de la inteligencia cuyos planteamientos se pueden agrupar en tres: el biológico, el psicológico y el operativo (Hernández, 1991; Vernon, 1982; véase en C. Gonzáles, 2003). En el planteamiento biológico, acentúa el poder de la inteligencia como la habilidad de adaptación al medio, entendiendo esta como una capacidad adaptativa del organismo. En el psicológico, la inteligencia se concibe como la habilidad de aprender, es decir, se sitúa entre la base biológica y la adaptación o el resultado de la experiencia, el aprendizaje y los factores ambientales. Desde el planteamiento operativo, se describe como un conjunto de conductas observables y evaluables a través de los test y, por tanto, se define como lo que miden las pruebas de inteligencia. Entendido ello, se pasará a señalar algunas de las teorías más recientes que explican el origen de la inteligencia. 18 2.3.1. Teoría de Baron Baron (1985, véase en C. Gonzáles, 2003) define la inteligencia como el arte del pensamiento racional, un talento que no es innato sino aprendido. Es un autor claramente integrado en la corriente ambientalista de la inteligencia, que defiende que la inteligencia puede ser modificada por el ambiente y las características del contexto en el que se desarrolle el sujeto. Entre los defensores de este enfoque encontramos a Watson, Golffarb, Pasamanik, Spizt, Miller, Herber y Gerber y muchos otros. 2.3.2. Teoría de Jensen Jensen, afirmó que 80 por ciento de lo que miden las pruebas de inteligencia es heredado y que apenas 20 por ciento depende del ambiente del niño, por lo que los genes y no es la cultura y ni el ambiente los que determinan principalmente la inteligencia. Sostiene que la inteligencia, proviene del cerebro y se transmite por herencia, por lo tanto, tiene límites biológicos bien definidos que se establecen en el momento del nacimiento. Asimismo, señala que la inteligencia está determinada por la raza, y que la reserva de genes intelectuales de los negros es inferior a la de los blancos. En las investigaciones efectuadas en la década de 1960, los afroamericanos recibieron en promedio de 10 a 15 puntos menos en las pruebas que los blancos. La diferencia ha ido disminuyendo de manera paulatina en los últimos años. 19 En la actualidad, los investigadores sostienen que “los ajustes hechos, atendiendo a las diferencias económicas y sociales en la vida de los niños de razas blanca y negra, eliminan prácticamente las diferencias de las puntuaciones entre los dos grupos” (Brooks-Gunn y otros, 1996; véase en Craig y Baucum, 2009). En ese sentido, la corriente genética explica la inteligencia como un aspecto determinado por la herencia. Que se estable a lo largo de la existencia del individuo, existiendo muy poco, que la educación puede hacer para modificarla. Siendo Jensen un integrante indiscutible de esta corriente, podemos destacar también a Galton, Binet, Goddard, Binet, Goddard, Yerkes, Terman, Burt, Eysenck como defensores de esta teoría. 2.3.3. Teoría de Stanley y Benbow Estos autores se sitúan en un punto intermedio entre las dos posturas anteriores. Afirman que, la inteligencia no puede ser explicada únicamente desde la herencia, sin embargo los factores biológicos ejercen una influencia fundamental en dicho constructo. Otros autores como Weinberg en el año 1989, Plomin y DeFries en el año 1998 (Craig y Baucum, 2009) afirman que el desempeño de un niño en un test de CI depende casi por igual de los factores genéticos y ambientales. 2.4. Teorías sobre la estructura de la inteligencia Así como no existe un acuerdo en el origen de la inteligencia, tampoco existe una teoría única que explique su estructura. En ese sentido, tomaremos la clasificación de Domínguez Rodríguez (Bueno y Castanedo, 1998; véase en C. Gonzáles, 2003), que es la más relevante, porque propone dos grandes enfoques complementarios entre sí. 20 2.4.1. Enfoque psicométrico Las teorías que explican a la inteligencia como un conjunto de componentes o factores, son las llamadas psicométricas o diferenciales. Porque parten del estudio de las diferencias individuales de las personas. Siendo, estos factores constructos hipotéticos, que tienen como finalidad describir las fuentes subyacentes de las diferencias entre sujetos, que dan lugar a las diferencias individuales observadas en las puntuaciones de los tests. Todas las teorías incluidas en este enfoque analizan la estructura de la inteligencia, como una estructura de aptitudes o factores covariantes integrados en una jerarquía dinámica. Dichos factores pueden ser rasgos estables pero no fijos, y su nivel de eficacia depende de la integración entre la dotación genética y el ambiente del sujeto. Otra característica que comparten, es que utilizan los factores para entender y evaluar la inteligencia; sin embargo, variando, tanto el número como el orden. Dentro de este enfoque las teorías históricas más relevantes han sido: A. Teoría bifactorial de Spearman Morris y Maisto (2005) señalan que Spearman advirtió que las personas que son brillantes en un área, a menudo destacan también en otras áreas. La persona inteligente entiende las cosas con rapidez, toma decisiones adecuadas, se enfrasca en conversaciones interesantes y tienden a comportarse de manera inteligente en diversas situaciones. 21 Aunque es cierto que cada uno de nosotros es más rápido en algunas áreas que en otras, Spearman consideraba que esas diferencias eran simplemente formas en que se revela la misma inteligencia general subyacente. Spearman (1994, citado por C. Gonzáles, 2003) concibe la estructura de la inteligencia como un factor bifactorial. Es decir, se compone del factor general (g) y habilidades específicas (factor s). Teniendo en cuenta que estos dos factores siempre se encuentran presentes, la primera está considerada como la capacidad básica que permite al sujeto pensar de manera abstracta. Y la segunda, permite a la persona hacer frente a los rasgos característicos de una situación problemática. B. Teoría factorial de Thurstone También llamada Aptitudes Mentales Primarias. Esta explica la conducta inteligente a partir de 8 factores específicos, estos son: el factor espacial, el numérico, la comprensión verbal, la fluidez verbal, la precisión perceptiva, la memoria, el razonamiento inductivo y el razonamiento deductivo. Además señala que la inteligencia general no es un factor independiente, sino el perfil del sujeto en las diferentes aptitudes primarias. C. Teoría maestral de la inteligencia de Thomson Thomson afirma que la inteligencia es un conjunto de elementos distintos e independientes que no están ordenados ni organizados por factores o aptitudes. 22 Sino que cada actividad inteligente consiste en una muestra aleatoria de estos elementos, que no depende de aptitudes formadas de forma fija sino de aptitudes modificables. Su aporte ha sido importante para la concepción de la modificabilidad de la inteligencia, sin embargo, fue criticado por el hecho que los elementos psicológicos para una actividad inteligente se elijan al azar y de forma desordenada. D. Teoría multifactorial de Guiford Esta teoría aporta una estructura tridimensional y cúbica a la inteligencia. Definiendo la inteligencia como un conjunto sistemático de aptitudes o funciones, para procesar diferentes tipos de información de diversos modos. Además, Guilford (Woolfolk, 1999) propone la existencia de tres categorías o dimensiones básicas, o esferas de la inteligencia: las operaciones mentales o procesos de pensamiento; los contenidos o las cosas en que pensamos; y los productos o resultados finales de nuestro pensamiento. Las operaciones mentales se dividen en seis categorías: la cognición (reconocimiento de la información antigua y descubrimiento de la nueva), el pensamiento convergente (encontrar una respuesta), el pensamiento divergente (hallar varias soluciones posibles), la evaluación (juicios sobre precisión, valor, etc.), la memoria inmediata y la memoria a largo plazo. 23 Los contenidos se dividen en cinco categorías: los contenidos visuales, los contenidos auditivos, el significado de palabras, los símbolos y las conductas. Los productos son unidades, clases, relaciones, sistemas, transformaciones e implicaciones. Cabe resaltar que existen 180 combinaciones entre las operaciones, los contenidos y los productos (6 x 5 x 6). Según este punto de vista, llevar a cabo una tarea cognoscitiva consiste en realizar una operación mental sobre cierto contenido para obtener un producto. Por ejemplo, identificar el siguiente número de la secuencia 3, 6, 12, 24,... requiere una operación convergente (hay una sola respuesta correcta) sobre un contenido simbólico (números) para obtener como producto una relación (cada número es el doble del anterior). Este modelo de inteligencia amplía la noción de la naturaleza de la inteligencia, al añadir factores como el juicio social (la evaluación de la conducta de los otros) y la creatividad (el pensamiento divergente). Cuando se prueban estas diferentes habilidades, demuestran estar relacionadas, pero queda sin resolver el problema que explica las correlaciones positivas entre estas habilidades mentales que supuestamente son independientes. E. Teoría de Cattell Esta teoría define dos tipos de inteligencia: la inteligencia fluida y la inteligencia cristalizada. La inteligencia fluida que es la capacidad general básica, biológica y heredada, con la que nace el hombre, para adaptarse a situaciones nuevas sin necesidad de experiencia, aprendizaje o contenidos culturales. 24 Cattell y Horn (Woolfolk, 2006) señalan que este tipo de inteligencia se incrementa hasta la adolescencia, ya que se fundamenta en el desarrollo del cerebro, y posteriormente declina de manera gradual con la edad. Esta capacidad se considera independiente del aprendizaje, la experiencia y la educación. Además está constituida por tres factores de primer orden: la capacidad de visualización, la memoria y la velocidad cognitiva. En cambio, la inteligencia cristalizada se refiere a las capacidades cognitivas que se han aprendido o cristalizado gracias al aprendizaje y la cultura, que podría aumentar a lo largo de la vida, además incluye tanto las habilidades aprendidas y el conocimiento, como el vocabulario y los hechos. Está compuesto por tres factores de primer orden que pueden ser educados: comprensión verbal, capacidad para establecer relaciones semánticas y capacidad para evaluar la experiencia. Al utilizar la inteligencia fluida en la resolución de problemas, desarrollamos nuestra inteligencia cristalizada, no obstante, muchas tareas de la vida, como el razonamiento matemático, dependen tanto de la inteligencia fluida como de la cristalizada. Como se aprecia, en el enfoque psicométrico, compuesto por estas teorías y otras similares, se explica la estructura de la inteligencia, tratándola de medirla, pero no estudian los procesos mentales que hacen posible un comportamiento inteligente. 25 2.4.2. Enfoque cognitivo Este enfoque, estudia los aspectos del procesamiento de la información y pretende identificar, representar, conocer y justiciar la cadena de procesos o suceso mentales que se dan en la conducta inteligente (Beltran, 1995; citado por C. Gonzáles, 2003). Con el fin de estudiar dichos procesos mentales surgen los estudios cognitivos o componenciales, que tienden a la inteligencia como un conjunto de procesos dinámicos. Los cuales, se adquieren gracias a la interacción con el ambiente que permite aprender las estrategias necesarias para mejorar las habilidades cognitivas. Bajo este enfoque se destacan las siguientes teorías: A. Teoría de Carroll Carroll define una serie de componentes cognitivos para describir el procesamiento inteligente, argumentando que estos son los responsables del funcionamiento de la mente en la producción de respuestas inteligentes. Carroll (1997; citado por Woolfolk, 2006) identifica una habilidad general, algunas habilidades extensas (como las habilidades fluidas y cristalizadas, el aprendizaje y la memoria, la percepción visual y auditiva, la velocidad de procesamiento) y al menos, 70 habilidades específicas como el desarrollo del lenguaje, la capacidad de memoria y el tiempo de reacción simple. 26 B. Teoría de Brown Esta teoría dividió los procesos cognitivos en dos bloques: Procesos metacognitivos, concebidos como destrezas ejecutivas utilizadas para controlar el propio pensamiento (la planificación, el control, la contraste de ejecución de una estrategia, la revisión de la propia estrategia y valoración de la estrategia utilizada). Y los procesos cognitivos, entendidos como, destrezas no ejecutivas que hacen posible el pensamiento (no pertenecen al grupo de los procesos metacognitivos o son gobernados por ellos). C. Teoría triárquica de Stemberg Sternberg (1986, citado por Morris y Maisto, 2005) argumenta que la inteligencia humana abarca una amplia variedad de habilidades y que estas influyen en muchas áreas de nuestra vida. Además, Sternberg (1985, 2004; citado por Papalia, Wendkos y Duckin, 2009) identifica tres elementos o aspectos de la inteligencia: componencial (capacidad analítica), experiencial (discernimientos y originalidad) y contextual (pensamiento práctico). Los cuales detallaremos a continuación: ● El elemento componencial, es el aspecto analítico de la inteligencia y determina la eficiencia con la que las personas procesan la información. Le dice a las personas cómo resolver problemas, cómo monitorear soluciones y cómo evaluar los resultados. Además, según Craig y Baucum (2009) corresponde más o menos las capacidades medidas de las pruebas de CI (Cociente intelectual) comunes. 27 ● El elemento experiencial es intuitivo o creativo, determina la forma en que las personas abordan tareas novedosas o familiares. Permite a los sujetos comparar la información nueva con lo que ya saben, y crear formas novedosas de integrar hechos; en otras palabras, pensar con originalidad. ● El elemento contextual es práctico, describe la forma en que las personas se enfrentan a su ambiente. Es la capacidad para juzgar una situación y decidir qué hacer, ya sea adaptarse a ella, cambiarla o salirse de ella. Sternberg (1986; citado por C. Gonzáles, 2003) afirma que los elementos de las tres sub teorías están relacionados entre sí, y que las diferencias individuales en el procesamiento se deben a: a) El número, tipo y orden de componente que aplica el sujeto en el procesamiento b) Las reglas de combinación que utiliza para organizar o cambiar los componentes. c) El tiempo y la exactitud del procesamiento. D. Teoría de las inteligencias múltiples de Gardner Para Garder (1998, 1999; por Woolfolk, 2006) la inteligencia es la habilidad para resolver problemas, y crear productos o resultados que sean valorados por una cultura. Además, sostiene que el desarrollo de las inteligencias depende de tres grandes factores (Bueno, 2004). 28 El primer factor, es la dotación genética, los factores hereditarios e incluye los daños cerebrales ocurridos antes, durante o después del nacimiento. El segundo factor, es la historia personal que incluye las experiencias con los padres, profesores, iguales, etc. En tercer lugar, se encuentra el fondo cultural e histórico del lugar en el momento en el que se haya nacido, la educación recibida, etc. Además, Gardner (Papalia, et. al, 2009) estima que la inteligencia está compuesta por habilidades distintas, donde cada una de las cuales es relativamente independiente de las otras. Es difícil determinar con precisión cuántas inteligencias separadas existen, aun así Gardner menciona ocho: lógico matemática, lingüística (verbal), espacial, musical, cinestésica-corporal (movimiento), interpersonal (entender a los demás), intrapersonal (entenderse a sí mismo) y naturalista (observar y comprender los patrones y sistemas – naturales y hecho por el hombre). Posteriormente especuló que quizás haya una inteligencia existencial (Gardner, 1999; citado por Woolfolk, 2006), que considera habilidades para considerar preguntas trascendentes sobre el significado de la vida. Sin embargo, las diferentes culturas y épocas de la historia asignan distintos valores a las ocho inteligencias. Por ejemplo, la inteligencia naturalista resulta fundamentalmente en la cultura agrícola. 29 Otra imprecisión es que la teoría de las inteligencias múltiples refuta la idea de la inteligencia general (g) sin embargo este autor no niega la existencia de una habilidad general, pero cuestiona la utilidad de g como explicación para los logros del ser humano. 2.5. Inteligencia general Morris y Maisto (2005) refieren que Spearman indica que los individuos buenos en un área, frecuentemente destacan en otras áreas. Una persona inteligente comprende con rapidez, toma decisiones acertadas, sostiene conversaciones interesantes, en general, se comporta inteligentemente en una amplia variedad de situaciones. Además, que cada individuo puede ser más rápido en unas áreas más que en otras, producto de la manera como la misma inteligencia general se revela en diferentes actividades. Hogan (2004, citado por Sánchez y Pirela, 2010) considera a que Spearman como el creador de lo que se considera la primera teoría formal sobre la capacidad mental humana. Spearman basa su teoría al examinar las correlaciones entre una extensa variedad de pruebas que median las funciones sensoriales simples, considero que dichas correlaciones eran lo suficientemente elevadas para concluir que el desempeño en estas pruebas dependía mayoritariamente de una capacidad mental general. Y a esta capacidad general, la denominó g. Sin embargo, las correlaciones entre dichas pruebas no eran perfectas, ya que cada prueba poseía una varianza única o específica, independiente de g. Así que cada conjunto de pruebas poseía una serie de factores s y un factor g. 30 Debido a esos dos factores, Spearman la denominó teoría bifactorial; no obstante, el factor esencial de la teoría es g. Por ello, también se le conoce como la teoría de la inteligencia unifactorial o “de un solo factor”. Sobre el termino factor g, el propio Sperman (1927, citado por Espinoza, 1999) abogó para que el concepto no se tradujera por “inteligencia general”, ni “general”, ni mucho menos “inteligencia”, porque según el autor no podría captar adecuadamente lo que era para él un concepto estadístico-matemático. El factor g es un constructo hipotético mediante el cual se hace referencia a un conjunto de aptitudes que siempre se ponen de manifiesto en la resolución de tareas complejas. Según Spearman (1927; citado por F. Gonzáles, 2007), esas aptitudes constituyen el proceso psicológico que está en la base de los resultados obtenidos en los tests, que reflejan la existencia del factor g; esas aptitudes son: La primera, es la capacidad de introspección que permite al sujeto observar lo que ocurre en el interior de su mente. La segunda, es la capacidad de deducir las relaciones esenciales existentes entre dos o más ideas que se tienen en mente. Y la última, es la capacidad de deducir correlatos, cuando una persona tiene en su mente una idea y una relación, y logra concebir la idea inicial implícita en esa relación. 31 La inteligencia, según Spearman permite generar información nueva a partir de la existente y tiene tres leyes (Benatuil, 2007): a. Percepción de la experiencia: las personas tienen capacidad de observar lo que sucede en su propia mente. b. Inferencia de las relaciones: toda persona que posea en su cabeza dos o más ideas, tiene capacidad para descubrir las relaciones esenciales que hay entre las mismas. c. Inferencia de correlatos: toda persona que tenga en su cabeza cualquier idea acompañada de una relación, tiene capacidad de generar una idea correlativa Por esa razón, la mejor medida del factor g son los test de relaciones abstractas. Debido a la complejidad de la tarea favorece a que el sujeto desarrolle y manipule su actividad mental consciente; es lo complejo y nuevo de la tarea lo que obliga a la persona a manipular dicha información, para lo cual hace uso del conjunto de aptitudes denominadas factor g. El elemento crucial responsable del grado en que un test satura en g, es la cantidad de manipulación mental consciente desencadenada por la nueva información que presenta la tarea. No obstante si la persona desarrolla un grado de familiaridad con la tarea lo realizará en forma mecánica, entonces la ejecución de la tarea se correlaciona menos con el factor g. En el caso en que la solución de la tarea resulte por primera vez. El resultado que se obtiene de estos instrumentos, informa de la capacidad intelectual general que tiene una persona, pero no dice qué operaciones realiza el sujeto cuando resuelve una tarea que satura en g. 32 2.6. Aspectos psicométricos 2.6.1 Análisis de ítems De acuerdo a Abab, Garrido, Olea y Ponsoda (2006) los ítems del cuestionario o test son los que miden el constructo, variable o rango. Por lo que para saber si es “un buen medidor” se puede comprobar estadísticamente si obtenemos tres indicadores para cada ítem: a) El índice de dificultad, b) el índice de homogeneidad y, c) el índice de validez. A. Índice de discriminación El índice de homogeneidad también llamado índice de discriminación, como su nombre indica, entendemos como la capacidad de un ítem de distinguir entre las personas que tienen un buen rendimiento en el test, respecto a las que lo tienen un mal rendimiento. Se considera que un ítem es discriminativo cuando es capaz de diferenciar adecuadamente a los sujetos, con diferentes grados en las características que evalúa la prueba. El índice de discriminación se calcula para ítems de pruebas cognitivas y no cognitivas; un ítem puede discriminar entre sujetos que tiene un rendimiento alto o bajo en una área de conocimiento, entre sujetos introvertidos y extrovertidos, entre sujetos racista y no racista, entre sujetos a favor o en contra de la legalización de las drogas, etc. 33 La tabla 2, muestra los valores D (índice de discriminación) y su correspondiente interpretación. Asimismo, en la tabla se señalan las recomendaciones para cada uno de estos valores (Ebel, 1965 citado por Meneses, et. al 2013; Martínez, Hernández, y Hernández, 2014). Tabla 2 Puntos de corte de los valores del índice de discriminación y su interpretación Índice de discriminación Categoría Interpretación D≥ 0,40 Alta El ítem presenta un gran poder discriminativo 0,30 ≤ D ≤ 0,39 Aceptable Discriminación aceptable y no requiere revisión 0,20 ≤ D ≤ 0,29 Baja Discrimina poco y necesita una revisión. 0,10 ≤ D ≤ 0,19 Mala Ítem no adecuado, debe ser modificado o eliminados del test D ≤ 0,0 Inaceptable Ítem que deben eliminarse directamente En cambio, Guilford (1975, citado por López, 2009), señala el rango aceptable para el índice de discriminación un índice mínimo de 0.3 B. Índice de dificultad En las pruebas de habilidades o rendimiento (con ítems dicotómicos del tipo correcto/incorrecto) el índice de dificultad de cada ítem, es el porcentaje de personas que responden acertadamente al ítem analizado (Tornimbeni, Pérez y Olaz, 2008). 34 Para calcular la dificultad de un ítem, se divide simplemente el número de personas que contestó correctamente el ítem entre el número total de personas que contestó el ítem (correcta o incorrectamente). El índice de dificultad de los ítems tiene un rango de 0 a 1 y se simboliza como p. Un ítem cuyo p es 0 está indicando que ningún individuo lo contestó correctamente y un ítem con p igual a 1 es aquel que todos los individuos respondieron de manera correcta. Para Wood (1960, citado por Backhof, Larrazolo y Rosas, 2000) la dificultad de un ítem se entiende como la proporción de personas que responden correctamente un reactivo de una prueba. Entre mayor sea esta proporción, menor será su dificultad. Es decir que se trata de una relación inversa: a mayor dificultad del ítem, menor será su índice. Además, para Abab, et.al. (2006) al diseñar un cuestionario de rendimiento óptimo, al inicio se sitúan los ítems más fáciles (con mayor índice de dificultad); en la parte central, los de dificultad media (entre 0,30 y 0,70); y al final, los más difíciles (con menor índice de dificultad). Siendo, la mayor parte de los ítems deben ser de dificultad media. Escala de clasificación de la dificultad esperada en los ítems, según Backhof, et. al. (2000) es la siguiente:  5 % para ítems fáciles.  20 % para ítems medianamente fáciles.  50 % para ítems de dificultad media. 35  20 % para ítems medianamente difíciles.  5 % para ítems difíciles Según Aiken (2003, citado por Tornimbeni, et.al., 2008) cuando la selección de personas no es el propósito esencial, son deseables ítems con p entre 0,30 y 0,70, vale decir ni excesivamente difíciles ni fáciles. Por otro lado, Guilford (1975, citado por López, 2009), señala el rango aceptable para el índice de dificultad oscila entre 0.2 y 0.85. 2.6.2 Validez El término validez hace referencia a poner en evidencia que una prueba mida lo que realmente pretende medir, lo cual está relacionado al objetivo concreto de la prueba, para lo cual fue construida. La validez, aplicada a una prueba es un juicio o una estimación acerca de que tan bien la prueba mide lo que pretende medir en un determinado contexto (Jay y Swerdlik, 2006). Además, en la medida en que la validez de una prueba disminuye, debido a cambios en la cultura o en la época, en necesario que la validez de un instrumento sea probada de nuevo en diferentes periodos. Aiken (2003) señala que a diferencia de la confiabilidad, la cual es influida solo por los errores no sistemáticos de medición, la validez de una prueba es afectada tanto por los errores no sistemáticos como por los sistemáticos (constantes). 36 Por esa razón, una prueba puede ser confiable, sin ser válida, pero no puede ser válida sin ser confiable. La confiabilidad es una condición necesaria, pero no suficiente, para la validez. Messick (1980; citado por Livia y Ortiz, 2014) indica que ha habido muchos términos para referirse a los tipos de validez: convergente, discriminante, factorial, sustantiva, estructural, externa, de población, de tarea, temporal, ecológica aparente, intrínseca, por definición y lógica. Ante esta situación el American Psychological Association (APA) publicó un manual con recomendaciones técnicas para el uso y diagnóstico con pruebas psicológicas, indicando tres tipos de validez: Contenido, criterio y constructo (1954; citado por Alvarado y Santiesteban, 2006). En 1999 (Elosua, 2003) el APA, American Educational Research Association (AERA), y National Council on Measurement in Education (NCME) señalan los 3 tipos de validez. Existen varios procedimientos para determinar la validez de un test, los cuales no son excluyentes. A continuación analizaremos la validez de contenido, la validez relacionada con el criterio y la validez de constructo, ya que son las más usadas en el campo de la investigación. A. Validez de contenido Se refiere al examen sistemático del contenido del test, para determinar si comprende una muestra representativa de la forma de conducta que ha de medirse (F. Gonzáles, 2007). 37 Anastasi y Urbina (1998) señalan que este tipo de validez está muy relacionado a las pruebas de habilidad y rendimiento. Además, es necesario que presente un muestreo adecuado del universo de ítems, para asegurar que todos los ítems cubran en la proporción correcta los aspectos importantes del constructo que se desea medir. Asimismo, la validez de contenido según Escobar y Cuervo (2008) es que los ítems de un instrumento de medición deben ser relevantes y representativos del constructo. Por lo tanto, podemos definir la validez de contenido como el grado en el que los indicadores seleccionados (ítems) representan de forma correcta el constructo que se desea medir y dependerá del marco teórico que sirva de apoyo al investigador. Un método para evaluar la validez de contenido, fue elaborado por Lawshe (1975; citado por Jay y Swerdlik, 2006), se determina por el consenso entre evaluadores o jueces a cuán esencial puede ser un reactivo en particular. Sobre el juicio de expertos, Escobar y Cuervo (2008) señalan que es una opinión informada de personas con trayectoria en el tema, que son reconocidos por otros como expertos calificados en este, y que pueden dar información, evidencia, juicios y valoraciones. Algunos indicadores para definir a un experto son: la docencia, sus publicaciones, su experiencia laboral y las capacitaciones en el tema. 38 El criterio de jueces para contrastar la validez de los ítems, consiste en solicitar a personas expertas en el dominio que mide los ítems, si aprueban o desaprueban la inclusión de un ítem en la prueba. La cantidad de jueces puede ser 10 (Hyrkas, Appelquist-Schmidlechner y Oksa, 2003) o entre 2 a 20 expertos (Grant y Davis, 1997). Sobre la validez de contenido en las pruebas de inteligencia, Morris y Maisto (2005) hacen mención que las pruebas de inteligencia enfatizan ciertas habilidades más que otras, que no miden cada tipo de habilidad mental y que algunos test se concentran en ciertas habilidades que otras pruebas dejan fuera. Por esas razones, ninguna tiene una validez de contenido perfecta. B. Validez de criterio La definición clásica de la validez hace referencia a poner en evidencia que una prueba mida lo que realmente pretende medir, que está relacionado al objetivo concreto de la prueba para lo cual fue construida. Por otro lado Muñiz (2005) define la validez como el demostrar que las inferencias realizadas por un test fiable son correctas. Se considera que una prueba puede ser confiable, sin ser válida, pero no puede ser válida sin ser confiable. La fiabilidad es una condición necesaria, pero no suficiente para la validez. La validez relacionada con el criterio (Jay y Swerdlik, 2006) es un juicio de cuán adecuadamente puedes ser utilizada la puntuación de una prueba, para inferir la posición más probable de un individuo con respecto a cierta medida de interés. 39 Dos tipos de evidencias de validez se encuentran sumidas bajo el rubro de validez relacionada con el criterio es la validez concurrente y la validez predictiva. La validez concurrente, es el índice del grado en que se relaciona la puntuación de una prueba con alguna medida de criterio, obtenida al mismo tiempo (de manera concurrente) que la puntuación. La validez predictiva es un índice del grado en que la puntuación de una prueba predice alguna medida de criterio. Varias pruebas de inteligencia se correlacionan bien entre sí a pesar de las diferencias en su contenido, se evidencia porque las personas que obtienen puntuaciones altas en una prueba tienden a obtener puntuaciones altas en las otras. Sin embargo, el hecho de que las pruebas de inteligencia tienden a correlacionar entre sí no es evidencia suficiente de su validez, ya que es posible que las pruebas midan las mismas cosas, pero que éstas no sea el constructo inteligencia. Para demostrar que las pruebas son válidas, necesitamos una medida independiente de inteligencia, con la cual comparar las puntuaciones en la prueba de inteligencia. 40 La medida independiente más usada con este propósito es el aprovechamiento académico (Anastasi y Urbina, 1997; citado por Morris y Maisto 2005). La idea subyacente, es que las diferencias individuales en las calificaciones escolares deben reflejar diferencias individuales en inteligencia, al menos en cierta medida. Por ende, los estudiantes con buenas calificaciones deberían obtener puntuaciones elevadas en la Stanford-Binet y otras pruebas de inteligencia, mientras que el desempeño en esas pruebas de los estudiantes con malas calificaciones debería ser menor. En efecto así sucede, incluso los críticos más severos aceptan que las pruebas de inteligencia tienen una fuerte correlación con las calificaciones escolares. Las correlaciones entre las calificaciones y las pruebas de inteligencia por lo regular fluctúan entre 0.50 y 0.75 (Parker, Hanson y Hunsley, 1988; citado por Morris y Maisto, 2005). C. Validez de constructo Un constructo es una idea informada, científica y desarrollada como una hipótesis para describir o explicar el comportamiento. Por ejemplo inteligencia es un constructo que puede ser citado para describir porque un estudiante se desempeña bien en la escuela. Los constructos son rasgos inobservables, supuestos (subyacentes) a los que un desarrollador de pruebas puede recurrir para describir el comportamiento de la prueba o el desempeño del criterio evaluado en el test. 41 El investigador formula varias hipótesis del comportamiento esperado de quienes obtienen puntajes altos y bajos de la prueba. Estas hipótesis darán origen a una tentativa sobre la naturaleza del constructo para cuya medición fue diseñada la prueba. Si la prueba es una medida válida del constructo, quienes obtuvieron puntajes altos y quienes obtuvieron puntajes bajos se comportarán como lo predice en la teoría. Sin embargo, si los que obtuvieron puntajes altos y bajos no se comportan como se ha predicho, el investigador necesitará volver a examinar la naturaleza del constructo o las hipótesis acerca del mismo. Una posible razón de obtener resultados contrarios a los pronosticados por la teoría es que la prueba simplemente no mide ese constructo. Por lo que sería necesario volver a examinar la teoría y en algunos casos se revisa que procesos estadísticos fueron usados. Asimismo, la validez de constructo se evalúa mediante la acumulación de evidencia, y no es posible ningún índice cuantitativo único. Livia y Ortiz (2014) señalan que con el fin de determinar la validez de este tipo en una prueba psicológica es preciso examinar todo el caudal de evidencias que lo rodean, el tipo de reactivos que se incluyen, la estabilidad de las calificaciones, la homogeneidad de la prueba psicológica, su correlación con variables de otras pruebas y otros datos que iluminen el significado de las calificaciones. 42 Debido a que esta validez requiere de la acumulación de varios métodos, lo que es muy dificultoso para cualquier investigador, por lo que usualmente se recurre a uno de ellos. Según Jay y Swerdilk (2006) es posible emplear cierto número de procedimiento para obtener evidencia de la validez de una prueba, por ejemplo: ● La prueba es homogénea al medir un solo constructo. ● Las calificaciones de la prueba aumenta o disminuye, en función de la edad o el paso del tiempo o de una manipulación experimental como se predijo manera teórica. ● La calificación obtenida en la prueba luego de algún evento o por el simple paso del tiempo (es decir, calificaciones de pos prueba) difieren de las calificaciones de pre-prueba como se predijo de manera teórica. ● Las calificaciones obtenidas en la prueba por personas de grupos distintos varían como fue pronosticado por la teórica. ● Las calificaciones de la prueba se correlacionan con otras pruebas, de acuerdo como se predijo, según la base teórica del constructo en cuestión. Es conocida como validez convergente (Muñiz, 2003), se da cuando las correlación entre las medias de un rasgo, medido por distinto método es elevada, es decir, la media de un mismo rasgo convergen, aunque se hayan hecho por diferente método. 43 Karmel (1986, citado por Livia y Ortiz, 2014) describe la validez de constructo es la importante para toda clase de test psicológicos, siendo las técnicas y procedimientos más usados para determinarla, los siguientes: - Análisis factorial: Su propósito principal es el simplificar la descripción conductual reduciendo el número de categorías partiendo de una multiplicidad de variables de medición (test) hasta obtener unos cuanto rasgos. Identificados estos, se usan para describir la composición factorial de un test, por lo tanto un test puede identificarse tanto en términos de sus factores principales como del peso de cada factor. - Correlaciones con otros test: también llamada validez concurrente, donde el test construido recientemente se correlaciona con un test establecido, que mide el mismo constructo. Por ejemplo, el test Stanford – Binet, mide la inteligencia, por lo tanto una correlación alta entre la prueba nueva y el Stanford-Binet significara que aquel también mide inteligencia. Sobre la validez concurrente, Guilford (1950, citado por Boccalandro, 2003) señala que una correlación entre 0,70 y 0,90 se puede considerar una correlación “alta”, lo que surge cuando una prueba esta orienta a tomare una relación marcadamente (fuerte) entre las variables estudiadas. 2.6.3 Confiabilidad En lenguaje cotidiano, confiabilidad es sinónimo de seguridad y consistencia, denotando una valoración positiva. En el lenguaje de la psicometría, confiabilidad se refiere al atributo de consistencia en la medición. 44 También, Jay y Swerdlik (2006) acotan que solo denota algo que es consistente, sin que necesariamente sea bueno o malo. Por confiabilidad se entienden la seguridad y consistencia de las puntuaciones arrojadas por una determinada prueba. Por ejemplo, si una semana obtiene una puntuación de 110 en una prueba de inteligencia y una semana después califica 60 en la misma prueba o una equivalente, algo estaría mal. Es decir, la confiabilidad es la capacidad de una prueba para producir calificaciones consistentes y estables (Morris y Maisto, 2005). Para Tornimbeni, et. al. (2008), la confiabilidad puede entenderse como la exactitud o precisión de una medición, o el grado en el cual las puntuaciones de un test están libres de esos errores de medición. Esta precisión de las puntuaciones permite que éstas se mantengan constantes en diferentes circunstancias. En conclusión, según Livia (2014), podemos indicar que la confiabilidad es la exactitud de la medición, al margen de que uno esté realmente midiendo lo que se ha querido medir. Un instrumento será altamente confiable en la medida que exista ausencia relativa de errores de medición. Sobre la confiabilidad de una prueba, se expresa como un número decimal positivo que fluctúa entre 0.00 y 1.00, donde 0.00 indica una falta absoluta de confiabilidad y 1.00 indica una confiabilidad perfecta (Aiken, 2003). Según Nunnly (1978, citado por Ursini, Sánchez y Orendain, 2004) refiere que el nivel satisfactorio de confiabilidad va depender del uso de la test, por ejemplo si el test se encuentra en la primera etapa, que es la construcción del mismo podría 45 ser suficiente lograr una confiabilidad mínima entre 0.50 a 0.60, pero se debe buscar una mayor consistencia, es decir 0.90 lo que implicaría mayores esfuerzos para su estandarización, siendo necesario aumentar el número de ítems. Cuando una prueba esta orientada a toma de decisiones importantes una confiabilidad mínima debería estar entre 0.90 a 0. 95. En cambio, Anastasi (1977, citado por Boccalandro, 2003) considera deseables los coeficientes entre 0,80 y 0,90 en cambio para Kerlinger y Lee (2002, citado por Ursini, et.al., 2004) han establecido 0.70 como el límite entre confiabilidad aceptable y no aceptable. Igualmente, Muñiz (2003) tiene que sobrepasar como mínimo el 0,70 Según Meyer et al., 2001 (Morris y Maisto, 2005) señalan que son confiables son las pruebas de inteligencia, porque en lo general las calificaciones de las personas en las pruebas de inteligencia son bastante estables. Las estimaciones de confiabilidad pueden ser de 2 tipos, una por consistencia externa que evalúa la estabilidad de la escala dentro de las administraciones; y por consistencia interna, las cuales se explicará a continuación. A. Consistencia interna La consistencia interna permite evaluar el grado en que los ítems de un test están correlacionados entre sí. Si los diferentes ítems de una prueba que tienen una correlación positiva y como mínimo una correlación moderada, equivaldría a tener una correlación entre 0,4 a 0,7; dicho test sería homogéneo. Es decir, sería homogéneo en la medida que exista consistencia en la ejecución de todos los reactivos de la prueba. 46 Un test de alto grado de consistencia interna que equivaldría a tener una correlación mayor a 0,70; que nos permite conocer cómo se desempeña una persona con respecto a un ítem y nos permitirá predecir como lo hará con los demás ítems. Se debe señalar que la estimación de la consistencia interna es el resultado de la correlación promedio entre los ítems, pero también está influenciado por el número de los reactivos. Si un coeficiente es muy bajo, entonces podríamos decir que el test es muy corto o los ítems tienen muy poco en común (Nunnally, 1991). Los procedimientos que desarrollaremos a continuación requieren una única aplicación del test, debido a ello son los más utilizados. Los procedimientos usuales de cálculo de la fiabilidad como consistencia interna son el división por mitades y homogeneidad (Martínez, et.al., 2014). La división por mitades, se realiza al dividir un test en dos mitades, estas deben ser equivalentes para garantizar una adecuada consistencia interna. El grado de equivalencia de las dos mitades se puede evaluar calculando la correlación entre las puntuaciones de los sujetos en estas dos mitades. Así, la correlación entre las puntuaciones de un grupo de sujetos en las dos mitades en las que podemos dividir un test será un indicador del grado de consistencia interna de este, y por lo tanto de su fiabilidad. Este es el principio en el que se basa el método de las dos mitades, que presenta la ventaja respecto a los métodos anteriores porque solo requiere una sola aplicación del test a una muestra de sujetos. 47 A la hora de decidir cómo realizar esta partición del test en dos mitades, se recomienda divide el test en dos mitades, dejando los ítems pares en una mitad y los impares en la otra. Con este procedimiento se garantiza de manera más probable la equivalencia entre las dos mitades. Por Homogeneidad, es un método basado en la covariación entre los ítems, se basa en la consistencia de las puntuaciones a todos los reactivos de la prueba (Anastasi y Urbina, 1998). Si los ítems del instrumento correlacionan positivamente entre sí, éste será homogéneo. Por el contrario, la prueba será heterogénea si los reactivos no tienen una correlación positiva entre sí, aun cuando aparentemente estén midiendo el mismo rasgo. Podemos concluir que los coeficientes de homogeneidad (Brown, 1980) verifican la consistencia interna, comprobando la congruencia que cada ítem del test tiene con los restantes ítems. B. Consistencia externa: Evalúa la estabilidad del test dentro de las administraciones. Estos coeficientes de fiabilidad, se obtienen mediante un simple coeficiente de correlación, las cuales son el método test re-test, formas paralelas e inter evaluador. El método test re-test, es método que consiste en administrar un test en dos oportunidades a la misma muestra de sujetos, con un intervalo de tiempo entre las dos administraciones, y se calcula la correlación entre los puntajes obtenidos en la primera y segunda administración para comprobar el grado de 48 consistencia entre dos conjuntos de puntuaciones obtenidas independientemente. Son expresados en función de un coeficiente de correlación que expresa el grado de correspondencia o relación entre los dos conjuntos de puntuaciones (Anastasi y Urbina, 1998; citado por Tornimbeni, et. al, 2008). El método formas paralelas o también denominado formas equivalentes. Evaluar la consistencia interna al comprobar la estabilidad temporal de un conjunto de puntuaciones. El procedimiento básico consiste en administrar dos formas equivalentes de un test a un mismo grupo de individuos. En el caso de que este método se utilice para verificar la estabilidad, la administración de la segunda forma se realiza transcurrido un tiempo a partir de la administración de la primera forma, y posteriormente se correlacionan los resultados obtenidos. Según el APA, (1999, citado por Tornimbeni, et. al, 2008), para ser consideradas equivalentes, dos pruebas deben reunir ciertos requisitos, tales como tener las mismas características formales (cantidad de ítems, escala de respuesta, etc.) y estadísticas (tener medias y desviaciones estándar semejantes, coeficientes de correlación elevados entre ambas formas, etc.). El método Inter evaluador o llamado también estudios de concordancia, busca si un instrumento de medida es fiable (Argimon y Jiménez, 2004; citado por Livia y Ortiz, 2014). 49 Este tipo de confiabilidad consiste en la correlación de las puntuaciones de dos o más evaluadores que califican el mismo test o escala. También podemos decir que es el grado de concordancia entre los resultados de dos o más observadores independientes utilizando el mismo instrumento de medida en unos sujetos. 50 CAPÍTULO III MÉTODO 3.1. Tipo de investigación El tipo de estudio corresponde al no experimental, porque se realizó sin manipular deliberadamente la variable inteligencia general. Se observó el fenómenos tal como se dio en su contexto natural, para analizarlo (The SAGE Glossary of the Social and Behavioral Sciences, 2009, citado por Hernández, Fernández, y Baptista, 2014). Asimismo, Kerlinger y Lee (2002, Hernández, Fernández, y Baptista, 2006) señalan que una investigación no experimental no se tiene control directo sobre las variables, ni se puede influir sobre ellas, porque ya sucedieron, al igual que sus efectos. 3.2. Diseño de investigación El diseño es psicométrico según Montero y León (2007) por que estudia la validez y confiabilidad de la prueba de inteligencia G-36. 3.3. Población La población estuvo conformada por 600 alumnos de ambos sexos que asistían a la academia pre universitario en el cercado de Lima 3.4. Muestra La muestra fue no probabilística, seleccionándose con un tipo de muestreo por contingencia (Elorza, 2000). 51 La muestra estuvo conformada por 324 alumnos cuyas edades fluctúan entre 16 a 31 años, siendo el promedio de edad del grupo de 18,84 y la moda de 17 años de los cuales el 63% fueron mujeres y el 37 % varones (Figura 1) Figura 1. Porcentaje de alumnos según género La edad de la muestra está conformada por 2 etapas de vida, adolescentes de 15 19 años y adultos de 20 a 25 años (Ministerio de Salud del Perú, 2012). El mayor porcentaje de la muestra corresponde a los adolescentes (72%) y menor a los adultos (28%) (Tabla 3). Tabla 3 Porcentaje y edad de la muestra. Edad N % 15 - 19 años 234 72 20 - 25 años 90 28 Total 324 100 203 63% 121 37% Femenino Masculino 52 3.5. Técnica e instrumento de recolección de datos El instrumento de medición fue el G-36 que mide la inteligencia general. El autor del instrumento es Boccalandro (2003), empleándose su quinta edición. El test se compone de 36 elementos con 6 alternativas de respuesta, teniendo una puntuación máxima de 36 puntos. La prueba comprende las etapas de vida adolescentes o adultos, la forma de administración es grupal o individual, pudiendo ser el tiempo de administración hasta 45 minutos. La prueba presenta elementos en orden creciente de dificultad, que incluye el raciocinio por analogía y comprensión de la relación de identidad, analogía de tipo numérico con suma, resta y cambio de posición, y la analogía espacial con cambio de posición. En el año 2003, Boccalandro estudio la fiabilidad del test de inteligencia G36, en una muestra de 100 sujetos, compuesta por 75 del sexo masculino (75%) y 25 del sexo femenino (25%). Las edades de los sujetos fluctúan entre 16 y 66 años, con un edad promedio de 28,53 años. Además su grado de escolaridad, del 51% fue secundaria y el 49% fue superior. La fiabilidad fue obtenida por el método de consistencia interna, tipo mitades y homogeneidad. Por mitades, usaron la fórmula de Kuder-Richardon obteniendo un coeficiente de 0,823 y por homogeneidad emplearon la fórmula de Sperman-Brown obteniendo un coeficiente 0,825. Ambos resultados indican que la prueba posee un alto coeficiente de confiabilidad. 53 Boccalandro (2003), estudió la validez del test de inteligencia G36 en una muestra de 70 estudiantes, siendo 26 alumnos del sexo masculino (37,1%) y 44 alumnos del sexo femenino (62,9%). Las edades de los sujetos varían entre 17 y 48 años, con un edad promedio de 22,64 años. La validez de criterio tipo concurrente, fue obtenida al correlacionar con el test de Matrices Progresivas de Raven - Escala general. Donde la mitad de los sujetos realizó primero el test de inteligencia general G-36 y la otra mitad el Raven. El coeficiente de correlación de Pearson fue de 0,76 que indica que la correlación entre los resultados de los test es alta y estadísticamente significativa, por lo que podemos afirmar, que los dos test evalúan la misma variable. En el año 1966, el análisis de ítems se estudió en 500 candidatos, de los cuales 459 fueron del sexo masculino (91%) y 41 fueron del sexo femenino (8,2%). Las edades de los sujetos varias entre 14 a 45 años, siendo la edad el 70% de los candidatos entre 18 y 29 años. Para medir el grado de discriminación de cada ítem fue obtenido por el coeficiente de correlación punto-biserial que variaron de 0,17 hasta 0,67. Además, 16 ítems de los 36 ítems alcanzaron valores superiores al 0,51. La forma de plantear las preguntas se agrupan en 6 grupos, donde cada grupo tiene una dificultad mayor que el anterior, pero las dificultades fueron graduadas de tal forma que el problema inicial en cada grupo fuese de menor dificultad que el ítem precedente. Con eso se pretendía motivar a las personas que encuentran dificultades crecientes en el test a continuar respondiendo (Tabla 4). 54 Tabla 4 Clasificación de los ítems de la prueba de inteligencia general G36. Categoría Inferencia Ítems A Comprensión de relación de identidad simple 1 y 2 B Compresión de relación de identidad junto a un raciocinio por analogía 3,4,6,8,12 C Raciocinio por analogía envolviendo cambio de posición 10,11,20,2,22,30,31 y 32 D Raciocinio por analogía de tipo numérico, suma y/o sustracción 5,7,9,13,14,15,16,17,1 8,19,24,26,28,33,35 E Raciocinio por analogía de tipo numérico envolviendo cambio de posición, suma y saturación 23,25,27 y 36 F Raciocinio por analogía de tipo espacial (descomponer un todo en sus partes, envolviendo cambio de posición) 29 y 34 3.6. Procedimiento Se coordinó con los encargados del centro pre universitario, acordando que la administración de los instrumentos seria en 2 sesiones y en forma colectiva. Se evaluó la calidad de los instrumentos aplicados, procediéndose al análisis estadístico de los datos con el paquete estadístico SPSS versión 22. 55 CAPÍTULO IV RESULTADOS 4.1. Análisis de ítem 4.1.1. Índice de discriminación El test consta de 36 ítems, cuyos índice de discriminación (ID) fluctúan entre 0,201 y 0,435. De los cuales, 2 ítems (ítem 22 y 30) están para eliminar debido a que su índice de discriminación está por debajo de 0,10. Asimismo, se encontró que 5 ítems (ítem 12, 13, 29, 35 y 36) debe ser modificado o eliminados del test, debido a que su índice de discriminación se encuentra entre 0,10 y 0,20 (tabla 5) Tabla 5 Índice de discriminación de la prueba de inteligencia general G36. Ítems Media Varianza I.D. Categoría Ítems Media Varianza I.D. Categoría 01 ,93 ,07 ,222 Baja 19 ,67 ,22 ,302 Aceptable 02 ,94 ,05 ,219 Baja 20 ,56 ,25 ,411 Alta 03 ,84 ,13 ,310 Aceptable 21 ,58 ,24 ,288 Baja 04 ,92 ,07 ,201 Baja 22 ,07 ,07 -,113 Inaceptable 05 ,86 ,12 ,222 Baja 23 ,31 ,21 ,216 Baja 06 ,98 ,03 ,338 Aceptable 24 ,44 ,25 ,287 Baja 07 ,88 ,11 ,370 Aceptable 25 ,48 ,25 ,224 Baja 08 ,88 ,10 ,350 Aceptable 26 ,34 ,22 ,330 Aceptable 09 ,85 ,13 ,341 Aceptable 27 ,28 ,20 ,220 Baja 10 ,83 ,14 ,299 Baja 28 ,67 ,22 ,358 Aceptable 11 ,70 ,21 ,382 Aceptable 29 ,09 ,08 ,169 Mala 12 ,64 ,23 ,128 Mala 30 ,14 ,12 ,054 Inaceptable 13 ,76 ,18 ,157 Mala 31 ,54 ,25 ,286 Baja 14 ,85 ,12 ,289 Baja 32 ,44 ,25 ,319 Aceptable 15 ,51 ,25 ,277 Baja 33 ,45 ,25 ,310 Aceptable 16 ,45 ,25 ,263 Baja 34 ,29 ,21 ,279 Baja 17 ,61 ,24 ,347 Aceptable 35 ,23 ,18 ,186 Mala 18 ,67 ,22 ,435 Alta 36 ,13 ,11 ,157 Mala 56 En la figura 2 se observa los índices de dificultad de los ítems, donde se aprecia que el ítem 18 es el ítem que mejor discrimina y los ítem 22 y 30 deben ser eliminados. Figura 2. Índice de discriminación de la prueba de inteligencia general G36 4.1.2. Índice de dificultad Se encontró que el índice de dificultad de los ítems presenta valores entre 0,94 y 0,07. De los 36 ítems, el 19 % tienen categoría de muy fáciles, 25% medianamente fáciles, el 25% en regular, 20% en medianamente difíciles y 19% en muy difíciles (tabla 6) -0.20 -0.10 0.00 0.10 0.20 0.30 0.40 0.50 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 Ín d ic e d e d is cr im in a ci ó n Ítems 57 Tabla 6 Índice de dificultad de la prueba de inteligencia general G36. Ítems Índice de dificultad Categoría 01 ,93 Muy fácil 02 ,94 Muy fácil 03 ,84 Medianamente fácil 04 ,92 Muy fácil 05 ,86 Medianamente fácil 06 ,98 Muy fácil 07 ,88 Medianamente fácil 08 ,88 Medianamente fácil 09 ,85 Medianamente fácil 10 ,83 Medianamente fácil 11 ,70 Medianamente fácil 12 ,64 Media 13 ,76 Medianamente fácil 14 ,85 Medianamente fácil 15 ,51 Media 16 ,45 Medianamente difícil 17 ,61 Media 18 ,67 Media 19 ,67 Media 20 ,56 Media 21 ,58 Media 22 ,07 Muy difícil 23 ,31 Medianamente difícil 24 ,44 Medianamente difícil 25 ,48 Medianamente difícil 26 ,34 Medianamente difícil 27 ,28 Muy difícil 28 ,67 Media 29 ,09 Muy difícil 30 ,14 Muy difícil 31 ,54 Media 32 ,44 Medianamente difícil 33 ,45 Medianamente difícil 34 ,29 Muy difícil 35 ,23 Muy difícil 36 ,13 Muy difícil 58 En la figura 3 se observa como se distribuyen los porcentajes entre las diversas categorías. Figura 3. Porcentaje del índice de dificultad según categorías de la prueba de inteligencia general G-36 4.2. Validez psicométrica Se estudió la validez de criterio tipo concurrente. Se relacionó el test de inteligencia general G-36 con el test de inteligencia Beta III. Se encontró que su correlación es positiva y altamente significativa (r = 0,367; p = 0,000), lo que evidencia que ambos instrumentos miden el mismo constructo (tabla 7). Tabla 7 Validez concurrente del Test de inteligencia general G36. Test de inteligencia Beta r Sig. Test de inteligencia G36 ,367 ,000 19% 25% 25% 20% 19% 0 5 10 15 20 25 30 Muy fácil Medianamente fácil Media Medianamente difícil Muy difícil P o rc e n ta je Muy fácil Medianamente fácil Media Medianamente difícil Muy difícil 59 4.3. Confiabilidad El test de inteligencia general G-36, fue analizado con el tipo de confiabilidad de consistencia interna por el método de homogeneidad, encontrándose que el coeficiente de confiabilidad alfa de Crombach obtuvo un valor mayor a 0,70 lo cual señala que el test presenta confiabilidad (tabla 8). Tabla 8 Confiabilidad de consistencia interna de la prueba de inteligencia general G36. 4.1. Baremos Se elaboró los baremos por percentiles, para toda la muestra en general debido a que no existen diferencias por grupo de estudio de acuerdo a edad o sexo (tabla 9) Tabla 9 Diferenciación de grupo de acuerdo a sexo y edad Característica Categoría Media DE t p Sexo Femenino 20,68 5,107 -,742 ,459 Masculino 21,12 4,979 Edad 15 - 19 años 20,50 5,012 -1,969 ,05 20 - 25 años 21,73 5,090 Coeficiente Valor Alfa de Crombach ,778 60 Los percentiles se clasificación en 3 categorías (tabla 10). Tabla 10 Baremos en percentiles del Test de inteligencia general G36. Categorías Percentiles Puntuación Bajo 25 0 - 18 Promedio 50 19 – 23 Alto 75 24 – a más Los percentiles por puntajes se encuentran en el anexo 1. 61 CAPÍTULO V DISCUSIÓN La inteligencia para Sternberg y Berg (1992), es la capacidad de adaptación que explica las diferencias que observamos entre las personas cuando éstas resuelven problemas, razonan y/o toman decisiones. Spearman (Morris y Maisto, 2005) advirtió que las personas que son brillantes en un área, a menudo destacan también en otras áreas. La persona inteligente entiende las cosas con rapidez, toma decisiones adecuadas, se enfrasca en conversaciones interesantes y tienden a comportarse de manera inteligente en diversas situaciones. En el presente estudio, se logró evidenciar que el test de inteligencia G-36 presenta las características psicométricas de validez y confiablidad. En relación a la validez, el ter de inteligencia G-36, obtuvo validez tipo concurrente al correlacionar con el test de inteligencia Beta III. Este resultado se confirma con otras investigaciones donde el test de inteligencia ha relacionado positivamente con el test R1-B (Dos Santos, Noronha y Fernandes, 2005). Asimismo, Livia (2014) lo relaciona con el test Beta III obteniendo una correlación significativa. Así como, Canijas (2013) que relaciona el test Beta III con la batería de pruebas de raciocinio BPR – 5. Con relación a la confiabilidad del test G-36 se encontró que presenta confiabilidad por consistencia interna, observándose resultados similares al estudio de Livia (2014) y Boccalandro (2003) donde muestran la confiabilidad del test. 62 Con respecto al análisis de ítems, el índice de discriminación, en nuestro estudio se encontró que los índices de discriminación de la prueba de inteligencia G-36 fluctúan entre 0,201 a 0,435. Con respecto al análisis de ítems por el índice de dificultas. Se encontraron 5 categorías, que varían de muy fáciles a muy difíciles, a diferencia del estudio de Livia (2014) que señala 3 categorías que son fáciles, media y difíciles. Asimismo, Backhof, et. al. (2000) señalan un determinado porcentaje de índice de dificultada para cada uno de las 5 categorías. El cual no se ha logrado demostrar en el presente estudio. Los baremos son expresados en percentiles, la categoría bajo los puntajes se encuentren entre 0 a 18, para la categoría promedio entre 19 y 23, finalmente para la categoría alto de 24 a más. 5.1. Conclusiones ● Los ítems del test presentan aceptables de discriminación y dificultad. ● El test de inteligencia G-36 presenta confiabilidad por consistencia interna. ● El test de inteligencia G-36 presenta validez de criterio tipo concurrente. ● Se elaboraron los baremos por percentiles obteniendo 3 categorías. 5.2. Recomendaciones ● Aplicar la prueba en otras etapas de vida. ● El estudio se realice con una muestra probabilística. ● Complementar el estudio psicométrico con otros tipos de validez y confiabilidad. 63 Referencias Abab, F., Garrido, J., Olea, J. y Ponsoda, V. (2006) Introducción a la psicometría: Teoría clásica de los test y teoría de la respuesta al ítem. Universidad Autónoma de Madrid Aiken, L. (2003) Test psicológicos y evaluación (Undécima edición). México: Person Education. Almeida, L., Guisande, M., Primi, R. y Lemos, G. (2008) Contribuciones del factor general y de los factores específicos en la relación entre inteligencia y rendimiento escolar. European Journal of Education and Psychology, 1 (3), pp 5-16 Recuperado de en http://www.redalyc.org/pdf/1293/129318720001.pdf Alvarado, J. y Santiesteban, C. (2006) Validez en la medición psicológica. España: UNED Anastasi, A. y Urbina, S. (1998) Test psicológicos. México: Prentice hall. Ardila, R (2010) Inteligencia. ¿Qué sabemos y qué nos falta por investigar?. Revista de la Academia Colombiana de Ciencias Exactas, Físicas y Naturales, 35 (134), pp 87-103. Recuperado de http://www.scielo.org.co/pdf/racefn/v35n134/v35n134a09.pdf Backhof, E., Larrazolo, N. y Rosas, M. (2000) Nivel de dificultad y poder de discriminación del Examen de Habilidades y Conocimientos Básicos (EXHCOBA). Revista Electrónica de Investigación Educativa, 2 (1). Recuperado de http://redie.uabc.mx/redie/article/view/15/1145 64 Benatuil, D (2007) La inteligencia práctica como predictor del rendimiento exitoso de cadetes militares (Tesis doctoral, Universidad de Palermo). Recuperado de http://dspace.palermo.edu/dspace/bitstream/handle/10226/1287/Benatuil%20Deni se%20Tesis.pdf;jsessionid=27D22B3C4BE3088CDFBBBCC99F138F62?sequenc e=1 Bueno, A. (2004) El programa de mejora de la inteligencia p.a.t. (pensamiento, aprendizaje y transferencia) y las transferencias al currículo. (Tesis doctoral). Universidad complutense de Madrid. Obtenido de http://biblioteca.ucm.es/tesis/edu/ucm-t28430.pdf Brown, F. (1980) Principios de la medición en psicología y educación. México: Manual Moderno. Boccalandro, E. (2003) G36: teste não-verbal de inteligência (5ta edición). São Paulo: Vetor. Cajigas, H. (2013) Propiedades psicométricas de la batería de pruebas de raciocinio bpr- 5 en estudiantes pre-universitarios de una entidad estatal de lima (Tesis de licenciatura), Universidad Nacional Federico Villarreal, Lima. Cohen, R. y Swerdlink, M. (2006), Pruebas y Evaluación Psicológicas (Sexta Edición). España: Editorial McGraw-Hill Interamericana. Craig, G. y Baucum. D. (2009) Desarrollo psicológico (9na Edición). México: Pearson educación. 65 Delgado, A., Escurra, L., Bulnes, M. y Quesada, R. (2001) Estudio psicométrico del test de Matrices Progresivas de Raven forma avanzada en estudiantes universitarios. Revista de Investigación en Psicología, 4, (2). Recuperado de http://www.researchgate.net/publication/266445599_ESTUDIO_PSICOMETRIC O_DEL_TEST_DE_MATRICES_PROGRESIVAS_DE_RAVEN_FORMA_AV ANZADA_EN_ESTUDIANTES_UNIVERSITARIOS Dos Santos, A., Boulhoca, A. y Vendemiatto, B. (2009) Inteligência e compreensão em leitura de adolescentes em situação de risco social. Paradígma, 30, (2), pp. 113- 124. Recuperado de http://www.scielo.org.ve/scielo.php?script=sci_arttext&pid=S1011- 22512009000200008&lng=es&nrm=iso Dos Santos, A.; Noronha, A. y Fernandes, F. (2005) Test de inteligencia Test Forma R1- B y G36: evidencias de validez convergente Estudios de Psicología (Natal), 10(2), 191-197. Recuperado de http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1413- 294X2005000200005&lng=en&tlng=en. 10.1590/S1413-294X2005000200005 Elorza, H. (2000). Estadística para las Ciencias Sociales, del comportamiento y de la salud (3ra edición). México: Cengage Learning. Escobar, J. y Cuervo, A. (2008) Validez de contenido y juicio de expertos: una aproximación a su utilización. Avances de medición, 6, 27-36 Elosua, P (2003) Sobre la validez de los tests. Psicothema, 20 (2), 315-321. Recuperado http://www.psicothema.com/pdf/1063.pdf 66 Espinoza, M. (1999) Revisión del libro: Ciencia y política de la inteligencia en la sociedad moderna. Psicotema, 449 – 451 Recuperado http://www.psicothema.com/pdf/222.pdf Fernández, R. (1996) Introducción a la evaluación Psicológica. Madrid: Pirámide. Grant, J. y Davis, L. (1997). Selecion and use of content experts for instrument development. Forus on Quatitative Methods, 20 (3), 269-274 Gonzáles, C. (2003) Factores determinantes del bajo rendimiento académico en educación secundaria. (Tesis doctoral). Universidad Computense de Madrid. Recuperado de http://biblioteca.ucm.es/tesis/edu/ucm-t27044.pdf Gonzáles, F. (2007) Instrumentos de evaluación psicológica. La Habana: Editorial Ciencias Médicas González, Mª del Rosario, Aragón, L., y Silva, A. (2000) Baremación del test de inteligencia factor «G» de Cattell en la zona metropolitana de la ciudad de México. Psicothema, 12 (2), 275-278. Recuperado de http://www.psicothema.com/pdf/564.pdf Hernández, R., Fernández, C. y Baptista, M. (2006). Metodología de la investigación (4ta edición). México D. F.: Mc Graw Hill. Hernández, R., Fernández, C. y Baptista, M. (2014) Metodología de la investigación (6ta edición). México D. F.: Mc Graw Hill. Hyrkas, K., Appelquist-Schmidlechner, K. y Oksa, L. (2003) Validating an instrument for clinical supervisión using an expert panel. International Joursal of Nursing Studies, 40, 619-625 67 Instituto Nacional de Salud Mental Honorio Delgado Hideyo Noguchi (2008). Base de Datos de Instrumentos de evaluación de Salud Mental y Psiquiatría. Anales de Salud Mental, 19(1), 17-21. Jay, R. y Swerdlik, M. (2006) Pruebas y evaluación psicológica. Introducción a las pruebas y a la medición. (Sexta edición) México: McGraw-Hill Livia, J. (2014). Validez de constructo y confiabilidad de una batería de pruebas de inteligencia en estudiantes de una universidad pública de Lima: una comparación entre la teoría clásica de los test y la teoría de respuesta al ítem. (Tesis inédita de doctorado en psicología), Universidad Nacional Federico Villarreal, Lima. Livia, J. y Ortiz, M. (1996). Los test psicológicos en el Perú: investigación, uso y abuso. Revista Psicología Actual, 8, 23–32. Livia, J. y Ortiz, M. (2014) Construcción de Pruebas psicométricas: Aplicaciones a las ciencias sociales y de la salud. Perú: Editorial universitaria López, (2009) Construcción y validación de una prueba para medir conocimientos matemáticos. Horizonte Pedagógico, 11 (1), 29-37. Recuperado de https://www.google.com.pe/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad =rja&uact=8&ved=0ahUKEwjkz- jG2pjWAhXHOCYKHRNtBAcQFgglMAA&url=https%3A%2F%2Fdialnet.uniri oja.es%2Fdescarga%2Farticulo%2F4892966.pdf&usg=AFQjCNEA3i5QFkHz5v1 vPTabQJFdMS4uqw 68 Sánchez, M. (2006) Inteligencia emocional, inteligencia cognitiva y rendimiento académico en alumnos de la facultad de psicología. (Tesis de maestría). Universidad autónoma de Nuevo León. Recuperado de http://eprints.uanl.mx/1964/1/1020154717.PDF Sánchez, M. y Pirela, L. (2010) Propiedades psicométricas de la prueba de inteligencia Otis en estudiantes de Educación mención Orientación. Omnia, 16(1), 100-120. Obtenido de http://www.redalyc.org/articulo.oa?id=73715016006 Rigo, D. y Donolo, D. (2013) Tres enfoques sobre inteligencia: un estudio con trabajadores manuales. Estudos de Psicologia (Campinas), 30(1), 39-48. Obtenido de http://www.scielo.br/pdf/estpsi/v30n1/05.pdf Papalia, D. y Olds, S. (2004). Psicología. México: McGraw-Hill Interamericana. Papalia, D., Wendkos, S. y Duckin, R. (2009). Psicología del desarrollo: De la infancia a la adolescencia (11 Edición). México: McGraw-Hill Prieto, D.; Inciarte, J.; Rincón, C. y Bonilla, E. (2008) Estudio del coeficiente emocional en estudiantes de medicina. Revista chilena de neuro-psiquiatría, 46 (1), 10-15. Recuperado de http://www.scielo.cl/pdf/rchnp/v46n1/art02.pdf Martínez, M. R., Hernández, M. J y Hernández, M. V (2014) Psicometría. Madrid: Alianza Meneses, J., Barrios, M., Bonillo, A., Cosculluela, A., Lozano, L., Turbany, J. y Valero, S. (2013) Psicometría. Barcelona: Editorial UOC Ministerio de Salud del Perú (2012) Modelo de Atención Integral de Salud. Recuperado de http://www.minsa.gob.pe/portal/servicios/susaludesprimero/mais/mais.asp 69 Morris, C. y Maisto, A. (2005). Introducción a la psicología. (Duodécima Edición) México: Pearson Montero, I., & León, O. (2007). A guide for naming research studies in Psychology. International Journal of Clinical and Health Psychology, 7, 847-862. Muñiz, J. (2003). Teoría Clásica de los Tests. Madrid: Pirámide. Muñiz, J. (2005) La validez desde una óptica psicométrica. Jornadas en Internet sobre Teorías conductuales y Test psicológicos. España: Universidad de Sevilla Noronha, A. y Vendramini, C. (2003) Parâmetros Psicométricos: Estudo Comparativo entre Testes de Inteligência e de Personalidade. Psicologia: Reflexão e Crítica, 16(1), 177-182. Recuperado de http://www.scielo.br/pdf/prc/v16n1/16809.pdf Nunnally, J (1991) Psychometrictheory. New York: McGraw-Hill Sternberg, R. y Berg, C (1992) Integracion cuantitativa. Definciones de intelgiencia: una comparación de los simposioas de 1921 y de 1986. En Sternberg, A. y Detterman, (Eds.) ¿Qué es la inteligencia? Enfoque actual su naturaleza y definición (185- 194). Madrid: Ediciones Pirámide Tornimbeni, S.; Pérez, E. y Olaz, F. (2008) Introducción a la psicometría. México: Paidos Ursini, S., Sánchez, G., y Orendain, M. (2004). Validación y confiabilidad de una escala de Actitudes hacia las Matemáticas y hacia las Matemáticas Enseñadas con Computadora. Educación Matemática, 16 (3), 59-78. Recuperado de http://www.redalyc.org/html/405/40516304/ Vargas, F. (2016) Reseña de libro: Construcción de pruebas psicométricas: aplicaciones a las ciencias sociales y de la salud. Revista Digital de Investigación en Docencia 70 Universitaria, 10, (2). Recuperado de http://www.scielo.org.pe/scielo.php?pid=S2223- 25162016000200009&script=sci_arttext Woolfolk, A (1999) Psicología educativa (Séptima edición). Barcelona: Pearson Woolfolk, A. (2006) Psicología educativa (Novena edición). México: Pearson educación 71 ANEXOS Baremos del test de inteligencia G-36 PD Percentil 6 1 8 1 9 1 10 1 11 6 12 6 13 8 14 11 15 14 16 17 17 23 18 30 19 38 20 43 21 51 22 58 23 68 24 76 25 81 26 88 27 93 28 97 29 98 30 99 31 100 72 Test de inteligencia G-36 Nombres ………………………………………………….. Apellidos …………………………………………………… Edad …………………………………………………… Sexo M F Fecha ……./ ……./ …… Centro de estudios …………………………………………………….. 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108