UNIVERSIDAD NACIONAL FEDERICO VILLAREAL 
FACULTAD DE PSICOLOGÍA 
 
CARACTERÍSTICAS PSICOMÉTRICAS DE LA PRUEBA DE 
INTELIGENCIA GENERAL G-36  
 
TESIS PARA OPTAR EL TÍTULO PROFESIONAL DE 
LICENCIADA EN PSICOLOGÍA CON MENCIÓN EN 
PSICOLOGÍA CLINICA 
AUTORA 
Córdova Almanza, Rosa Eve 
ASESORA 
Ortiz Morán, Mafalda Magdalena 
JURADO 
Livia Segovia, José Hector 
Castillo Gómez, Gorqui Baldomero 
Rivadeneyra De La Torre, Elvira 
Diaz López, David Eduardo 
 
LIMA – PERÚ 
2018  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
DEDICATORIA 
Dedico esta tesis a mis padres, en 
especial a hermano por ser la gran 
fuente de soporte y motivación para mi 
superación profesional.  
 
 
 
 
 
 
 
 
 
 
Agradecimientos 
 
Mi especial aprecio a mi alma mater y a los profesores de la facultad de Psicología, por 
compartir sus valiosos conocimientos y por sus acertados consejos como profesionales. 
Un agradecimiento especial al Profesor José Livia quien influenció en la elección del 
tema de mi tesis y el apoyo necesario para la realización de la investigación así como su 
apoyo en mi formación profesional. Y a mí asesora, la profesora Mafalda Ortiz por su 
guía durante la elaboración de mi tesis y sus observaciones puntuales.  
A mi amiga la Licenciada Giuliana Salazar por revisar mi investigación y responder mis 
dudas.  
 
 
 
  
 
 
 
 
 
 
 
Características psicométricas de la prueba de inteligencia general G-36 en 
estudiantes pre-universitarios de lima 
Rosa Eve Córdova Almanza  
Universidad Nacional Federico Villarreal 
Resumen 
Se describe las características psicométricas del Test de inteligencia General – G36 en 
una muestra de 324 estudiantes pre universitarios  del distrito de Lima. En el análisis de 
ítems se estudió los índices de dificultad y discriminación. Sobre los índices de 
discriminación de los 36 ítems se eliminan 2 ítems y de los 34 restantes presentan índices 
entre 0,201 y 0,435. En el análisis del índice de dificultad de los 36 ítems varían entre 
0,94 y 0,07 con respeto a las categorías el 19 % son muy fáciles, 25% medianamente 
fáciles, el 25% en regular, 20% en medianamente difíciles y 19% en muy difíciles. Se 
estudió la validez de criterio tipo concurrente obteniendo coeficiente de correlación  r = 
0,367 y  una p = 0,000 que evidencia una correlación significativa con el test de 
inteligencia BETA III. La confiabilidad fue analizada por el método de consistencia 
interna obteniendo un Alfa de Crombach de 0,778, mostrando adecuadas propiedades 
psicométricas. 
  
Palabras clave: Inteligencia, pre universitario, inteligencia general, confiabilidad, validez 
 
  
 
 
 
 
 
 
 
Psychometric characteristics of the test of general intelligence G-36 in pre-
university students from Lima 
Rosa Eve Córdova Almanza  
Universidad Nacional Federico Villarreal 
Abstract 
 
Psychometric characteristics of General Intelligence Test described - G36 in a sample of 
324 pre university district of Lima students. In the analysis of items the indices of 
difficulty and discrimination were studied. On the discrimination indexes of the 36 items 
2 items are eliminated and the remaining 34 are indexed between 0,201 and 0,435. In the 
analysis of the index of difficulty of the 36 items vary between 0.94 and 0.07 with respect 
to the categories 19% are very easy, 25% are moderately easy, 25% in regular, 20% in 
medium difficult and 19 % in very difficult. We studied the validity of concurrent type 
criteria, obtaining a correlation coefficient r = 0,367 and a p = 0,000 that shows a 
significant correlation with the BETA III intelligence test. We studied the validity of 
concurrent type criteria, correlating significantly with the BETA III intelligence test. 
Reliability was analyzed by the internal consistency method, obtaining a Crombach's 
alpha of 0,778, showing adequate psychometric properties. 
 
Keywords:  Intelligence, pre university, general intelligence, reliability, validity 
 
  
 
 
 
 
Índice 
Lista de tablas 
Lista de Figuras 
Introducción 
 
CAPÍTULO I: PLANTEAMIENTO DEL PROBLEMA 
1.1. Planteamiento del problema 1 
1.2. Objetivos 3 
1.3. Justificación 3 
1.4. Alcances y limitaciones 5 
1.5. Definición de variables 6 
 
CAPÍTULO II: MARCO TEÓRICO 
2.1. Antecedentes 7 
2.2. Conceptos de inteligencia 9 
2.3. Teorías sobre la inteligencia 17 
2.4. Teorías sobre la estructura de la inteligencia 19 
2.5. Inteligencia general 29 
 
 
 
 
2.6. Aspectos psicométricos 32 
 
CAPÍTULO III: MÉTODO 
3.1. Tipo de investigación 50 
3.2. Diseño de investigación 50 
3.3. Población 50 
3.4. Muestra 50 
3.5. Técnica de recolección de datos 52 
3.6. Procedimiento 54 
 
CAPÍTULO IV: RESULTADOS 
4.1. Análisis de ítem 55 
4.2. Validez psicométrica 58 
4.3. Confiabilidad 59 
4.4. Baremos 59 
 
 
 
 
 
 
CAPÍTULO V: DISCUSIÓN 
5.1. Conclusiones 62 
5.2. Recomendaciones 62 
Referencias 63 
Anexos 71  
 
 
 
 
LISTA DE TABLAS 
 
Tabla 1 – Frecuencias de los atributos que los expertos han utilizado para definir la 
inteligencia en 1921 y en 1986. 12 
Tabla 2 – Puntos de corte de los valores del índice de discriminación y  
 su interpretación 33 
Tabla 3 - Porcentaje y edad de la muestra 51 
Tabla 4 - Clasificación de los ítems de la prueba de inteligencia general G36 54 
Tabla 5 -  Índice de discriminación de la prueba de inteligencia general G36. 55 
Tabla 6 – Índice de dificultad de la prueba de inteligencia general G36. 57 
Tabla 7 - Validez concurrente del Test de inteligencia general G36 58 
Tabla 8 -  Consistencia interna de la prueba de inteligencia general G36 59 
Tabla 9- Diferenciación de grupo de acuerdo a sexo y edad 59 
Tabla 10- Baremos en percentiles del Test de inteligencia general G36 60 
  
 
 
 
 
LISTA DE FIGURAS 
 
Figura 1 – Porcentaje de alumnos según género. 51 
Figura 2 – Índice de discriminación de la prueba de inteligencia general G36. 56 
Figura 3 – Índice de dificultad de la prueba de inteligencia general G36. 58 
  
 
 
 
 
Introducción 
 
La evaluación es un proceso que se aplica en los diversos campos de la psicología, como 
la clínica, educativa, etc.  así como en la medición de las variables psicológicas como el 
área cognitiva y de personalidad (Noronha y Vendramini, 2003).  
En contextos educativos permite la detección de casos con dificultades de aprendizaje, 
apoya la orientación vocacional y complementa la evaluación de los programas 
educativos.  
En contextos clínicos, permite ver las limitaciones y potencialidades del paciente a tratar, 
así como formular un plan terapéutico para su abordaje dentro de la terapia. 
Almeida, Guisande, Primi y Lemos (2008) señalan que el área cognitiva es una de las 
áreas más importantes dentro de la evaluación psicológica. Por este motivo, las pruebas 
de inteligencia son los instrumentos más utilizados por el psicólogo (Noronha y 
Vendramini, 2003).  
Sin embargo, para que las pruebas sean útiles y eficientes, deben someterse a estudios 
para probar sus cualidades psicométricas. Dentro de este contexto se analizan las 
características psicométricas de la prueba de inteligencia general G-36. 
El desarrollo de la investigación comprende 5 capítulos. En capítulo I se desarrolla el 
planteamiento del problema, los objetivos, la justificación, los alcances y limitaciones de 
la investigación, así como la definición de las variables. 
El capítulo II señala los antecedentes de una investigación, el marco teórico referidos a 
los conceptos de la inteligencia, las teorías que explican la naturaleza de la inteligencia, 
la estructura de la inteligencia y los aspectos psicométricos.  
 
 
 
 
 
En el capítulo III se señala el tipo de investigación, el diseño, la población y muestra, las 
técnicas de recolección de datos y el procedimiento de la investigación. Finalmente en 
los capítulos IV y V se presentaron los resultados y la discusión. 
 
 
1 
 
CAPÍTULO I 
PLANTEAMIENTO DEL PROBLEMA                   
1.1. Planteamiento del problema 
Desde que existe la psicología como disciplina, los psicólogos han planteado 
diferentes definiciones de inteligencia, así como métodos para medirla.  
Esto se ha considerado, incluso antes de que se comenzara a estudiar 
científicamente el concepto de inteligencia y su medición. Hoy se conoce que la 
inteligencia (o inteligencias) existen en todas las personas en mayor o menor grado. 
Las pruebas psicométricas o más conocidas como test psicológicos, han sido y son 
una herramienta fundamental para la labor del profesional psicólogo en cualquier 
ámbito laboral en el que se desempeñe. Dichas herramientas abarcan una gran 
variedad de campos de trabajo, algunos más aplicativos, como lo son la psicología 
clínica, la organizacional, la educativa, entre otras, y en especial para la 
investigación psicológica (Vargas, 2016) 
Aiken (2003) expone que las pruebas de inteligencia ayudan a identificar a los 
individuos de acuerdo a sus habilidades mentales, para diseñar programas a fin de 
tratarlos, entrenarlos y educarlos, como es el caso de personas con retardo mental o 
superdotado. Además, es usado en la evaluación de la efectividad de los 
tratamientos psicológicos e intervenciones en el medio ambiente. 
 
 
 
 
 
2 
 
Noronha y Vendramini (2003) señalan que las pruebas de inteligencia así como la 
de personalidad son los instrumentos más utilizados por el psicólogo, por su alta 
demanda por estos test. Sin embargo, para que las pruebas sean útiles y eficientes, 
deben someterse a estudios para probar sus cualidades psicométricas. 
Livia y Ortiz (2014) señalan como balance del proceso histórico se puede decir que 
el desarrollo de la medición psicológica en el Perú se encuentra en un grave 
problema, no se dispone de pruebas estandarizadas a nuestra realidad, además de 
carecer de una política de control que norme su uso adecuado y garantice la 
fiabilidad de los resultados. 
En nuestro medio existe un problema referido a la evaluación psicológica, puesto 
que existe una escasez de instrumentos de evaluación validados psicométricamente, 
tal como señalaban Livia y Ortiz (1996).  
En el año 2008, el Instituto Nacional de Salud Mental Honorio Delgado Hideyo 
Noguchi registro de 1051 instrumentos de evaluación de salud mental, de los cuales 
solo 237 han sido adaptados; esto indica que solo un 23% de instrumentos ha pasado 
por el proceso de adaptación psicométrica, mientras que un 32% corresponde a 
instrumentos creados y un 45% a aquellos que han sido aplicados. 
Asimismo, la investigación señaló que los constructos evaluados con más 
frecuencia son: personalidad, funciones cognitivas y familia, respectivamente. 
 
 
 
 
 
3 
 
Es por esto que se considera importante la adaptación y validación psicométrica de 
los instrumentos, con el fin de garantizar un uso adecuado de los mismos durante la 
labor de evaluación efectuada por el profesional psicólogo. 
Tomando en cuenta la importancia de la medición de inteligencia, y debido a que 
no existen estudios previos en nuestro país, se seleccionó el test de inteligencia G-
36 por ser una prueba rápida y fácil de aplicar, ante la cual nos planteamos la 
siguiente pregunta ¿Cuáles son las propiedades psicométricas de la prueba de 
inteligencia general G 36? 
1.2. Objetivos 
1.2.1. Objetivo general 
Establecer las propiedades psicométricas de la prueba de inteligencia general G-
36 
1.2.2. Objetivo específico 
➢ Realizar el análisis de ítems de la prueba de inteligencia general G-36 
➢ Evaluar la confiabilidad de la prueba de inteligencia general G-36  
➢ Determinar la validez de la prueba de inteligencia general G-36 
➢ Elaborar baremos de la prueba de inteligencia general G-36 
1.3. Justificación 
El presente investigación ha sido elaborado con el fin de ayudar la labor del 
psicólogo en la evaluación de la inteligencia. Para tal efecto, resulta relevante contar 
con instrumentos adaptados para nuestra realidad.  
 
 
 
4 
 
Por ese motivo, la presente investigación tiene como objetivo establecer las 
propiedades psicométricas de la prueba de inteligencia general G-36. 
En ese sentido, este trabajo beneficiará al psicólogo que le permitirá contar con un 
instrumento de evaluación para medir la inteligencia en adolescentes y adultos. 
Cuando hablamos de evaluación psicológica, debemos tener en cuenta que abarca 
los diferentes ámbitos de la psicología: clínica, educativa, del trabajo y de las 
organizaciones, jurídica, neuropsicología o del deporte. 
Las pruebas o instrumentos estandarizados, son uno de los tres grandes ejes 
metodológicos con los que contamos los psicólogos para realizar una buena 
evaluación psicológica, junto con la entrevista y la observación de campo. 
Por este motivo, si queremos realizar una evaluación psicológica de calidad, los 
tests se convierten en una herramienta necesaria, y deben ser sometidos a un proceso 
riguroso de construcción y evaluación permanente, para que tengan niveles 
elevados de validez y fiabilidad (Fernández, 1996). 
Hay test que evalúan distintos tipos de inteligencia y que se combinan en el cociente 
intelectual. Esto es lo que pasa con las llamadas escalas Weschler. También los test 
pueden estar construidos para evaluar una sola capacidad general, como es el caso 
de los test de Raven. 
Andrés y Colom (1998; véase en Espinoza, 1999) resalta de la inteligencia su 
capacidad para predecir - por encima de cualquier otra medida - la eficacia del 
aprendizaje en cualesquiera que sean los ámbitos del mismo, tales como el 
rendimiento escolar, laboral, entre otros, convirtiéndolo en una herramienta 
imprescindible en labores de diagnóstico y de prevención.  
 
 
5 
 
En especial el factor g, este tiene una influencia considerable en cómo se 
desenvuelve una persona  a lo largo de su vida. Al ser la medida de la inteligencia, 
el factor de predicción más eficaz que se conoce del desempeño individual en la 
escuela y en el trabajo, además de muchos otros aspectos del bienestar y del 
desarrollo vital. 
Sobre el empleo de test de inteligencia no verbal (Dos Santos, Noronha y 
Fernández, 2005), que permite su uso en poblaciones con bajo nivel educativo o 
con conocimiento limitado del idioma debido a su diseño; sin embargo, es poco 
investigado en nuestro medio, corroborándose por el número limitado de estudios 
en los que fue empleado.  
Sumado, que en nuestro país no disponemos de test estandarizados que nos den una 
medición confiable de la inteligencia general, pese a su importancia. Debido a estos 
factores, el test usado en este estudio, es el test de inteligencia general G-36, que 
corresponde a este tipo.  
1.4. Alcances y limitaciones 
1.4.1. Alcances            
● La prueba de inteligencia G-36 puede ser aplicar a la población en general 
debido a que es  libre de influencia cultural, donde el sujeto debe aplicar el 
razonamiento general para resolver una situación problemática. 
1.4.2. Limitaciones 
● Los baremos no pueden ser generalizados debido a que la muestra es no 
probabilística. 
 
 
6 
 
1.5. Definición de variables 
Inteligencia: Puntajes logrado en la prueba de inteligencia. Variable cuantitativa y 
su nivel de medición es ordinal. 
Estudiantes pre universitarios: Hombres o mujeres, en proceso de preparación para 
rendir un examen de admisión a la universidad. Variable cualitativa y su nivel de 
medición  nominal.  
 
 
7 
 
CAPÍTULO II 
MARCO TEÓRICO 
2.1. Antecedentes 
Livia (2014), validó la batería de pruebas de inteligencia para adolescentes con la 
finalidad de evaluar sus propiedades psicométricas. Lo aplicó a 450 estudiantes pre-
universitarios y universitarios de una universidad. La muestra fue diferente para 
cada prueba, siendo 387 alumnos para el test de inteligencia BETA III, 317 
estudiantes para el test de inteligencia general G 36 y 450 alumnos para la Batería 
de Pruebas de Raciocinio (BPR).  
Las correlaciones entre instrumentos fueron evaluadas en base a una muestra de 
350 participantes. Los resultados señalaron que índice de dificultad en casi todas 
las pruebas fue de nivel fácil, la consistencia interna de cada uno de los test y de los 
subtest de la batería se ubicó en un intervalo de 0,74 a 0,88.  
Demostraron que los test de inteligencia que componen la batería son confiables y 
presentan validez de criterio tipo concurrente.  
Cajigas (2013) explora las propiedades psicométricas de la batería de pruebas de 
raciocinio BPR - 5 compuestas por cuatro sub tests: razonamiento abstracto, 
razonamiento verbal, razonamiento práctico, razonamiento numérico en una 
muestra  total de 400 estudiantes pre-universitarios de una entidad estatal de lima.  
 
 
 
 
 
8 
 
Validez de criterio tipo concurrente, se obtuvo al correlacionarlo con la prueba de 
inteligencia no verbal BETA III, obteniendo el coeficiente de 0.24 para 
razonamiento abstracto, 0.22 para razonamiento verbal, 0.22 para razonamiento 
práctico, y 0.14 para razonamiento numérico, concluyendo que la batería presenta 
confiabilidad y validez concurrente. 
En el 2005, Dos Santos, Noronha y Fernandes estudiaron la validez convergente de 
las pruebas de inteligencia R1-B y G36. La muestra estuvo conformada por 78 
estudiantes de secundaria, cuyas edades fluctúan entre 15 y 64 años (media = 36,84, 
SD = 10.10) de los cuales 27 eran mujeres y 51 eran varones, que representan del 
total de estudiantes el 34,6% y el 65.4% respectivamente.  
Los resultados mostraron una alta correlación entre las pruebas (r = 0,80), por lo 
tanto ambas pruebas miden el mismo constructo. 
En el año 2003, Boccalandro estudio la fiabilidad del test de inteligencia G36, en 
una muestra de 100 sujetos, compuesta por 75 del sexo masculino (75%) y 25 del 
sexo femenino (25%). Las edades de los sujetos fluctúan entre 16 y 66 años, con un 
edad promedio de 28,53 años. Además su grado de escolaridad, del 51% fue 
secundaria y el 49% fue superior.  
La fiabilidad fue obtenida por el método de consistencia interna, tipo mitades y 
homogeneidad. Por mitades, usaron la fórmula de Kuder-Richardon obteniendo un 
coeficiente de 0,823  y por homogeneidad emplearon la fórmula de Sperman-Brown 
obteniendo un coeficiente 0,825. Ambos resultados indican que la prueba posee un 
alto coeficiente de confiabilidad.  
 
 
 
9 
 
Boccalandro (2003), estudió la validez del test de inteligencia G36 en una muestra 
de 70 estudiantes, siendo 26 alumnos del sexo masculino (37,1%) y 44 alumnos del 
sexo femenino (62,9%). Las edades de los sujetos varían entre 17 y 48 años, con un 
edad promedio de 22,64 años.  
La validez de criterio tipo concurrente, fue obtenida al correlacionar con el test de 
Matrices Progresivas de Raven - Escala general. Donde la mitad de los sujetos 
realizó primero el test de inteligencia general G-36 y la otra mitad el Raven.  
El coeficiente de correlación de Pearson fue de 0,76 que indica que la correlación 
entre los resultados de los test es alta y estadísticamente significativa, por lo que 
podemos afirmar, que los dos test evalúan la inteligencia. 
2.2. Conceptos de inteligencia 
En el año 1953, Wolff (véase en Prieto, Inciarte, Rincón y Bonilla, 2008) menciona 
que el término inteligencia deriva del latín intellegere, vocablo que significa 
“recolectar de entre”, es decir, recoger y separar cosas de un conjunto, operación 
que implica establecer relaciones, seleccionar y, por tanto, percibir y discernir.  
Santrock (2006, citado por Sánchez y Pirela, 2010) describe la inteligencia como la 
habilidad de solucionar problemas, así como la capacidad de adaptarse y aprender 
de las experiencias cotidianas de la vida.  
Morris y Maisto (2005) la enuncian como un término general relacionado con la 
habilidad o habilidades implicadas en el aprendizaje y la conducta adaptativa. 
 
 
 
 
10 
 
En el año 2004, Bueno estudio el concepto de inteligencia, mediante el análisis de 
los aspectos que caracterizan a la conducta inteligente, indicando las siguientes 
capacidades: 
● Clasificar patrones. Se entiende por la capacidad que tiene el ser humano para 
clasificar todos los objetos y conceptos que maneja. Reconocer cuáles son los 
rasgos principales que lo asemejan a otros objetos o conceptos y considerarlos 
miembros de la misma clase, por tanto, adjudicarles un nombre que los 
identifique como grupo.  
● La capacidad de modificar adaptativamente la conducta: Aprender. Cambiar la 
propia conducta en función de la experiencia es considerado como uno de los 
rasgos más importantes de la conducta inteligente. Cuanto más evolucionado 
esté un organismo dentro de la escala filogenética, más posibilidades tendrá de 
poder cambiar, adaptándose al medio. El hombre es quien en principio tiene 
más posibilidades, sin embargo, no todos los humanos tienen la misma 
capacidad de modificar su conducta. 
● La capacidad de razonamiento deductivo. Este incluye la inferencia lógica. 
Cuando una persona maneja este tipo de pensamiento, utiliza parte de la 
información dada y no descubre nada que no esté ya implícito, es decir lo que 
hace es sacar una conclusión lógica de las premisas existentes. Por ejemplo, 
cuando afirmamos que “Todos los perros se llevan mal con los gatos. Blas es 
un perro. Por tanto, se lleva mal con los gatos”. 
● La capacidad de razonamiento inductivo: Generalizar. Esta habilidad implica 
ir más allá de la información que uno percibe. Supone la capacidad de observar 
lo que nos rodea y descubrir las reglas que lo rigen, nos permite por tanto, hacer 
afirmaciones generales o universales. 
 
 
11 
 
● La capacidad de desarrollar y utilizar modelos conceptuales. Los modelos 
conceptuales que elaboramos nos permiten interpretar el universo en el que 
vivimos. Para llegar a realizar estos modelos conceptuales necesitamos tanto 
de la deducción como de la inducción. Por ejemplo, si rueda una pelota por 
debajo del sofá y aparece por el otro extremo, aseguraremos que es la misma 
pelota (permanencia del objeto) y que mantiene las mismas características 
(invariabilidad de propiedades) de color forma, etc. 
● La capacidad de entender. Se refiere a la habilidad para comprender o intuir 
algo (insight). En ocasiones parafraseando una idea, es decir, reformulando con 
nuestras propias palabras se puede considerar que la hemos entendido, sin 
embargo, en otras no, puede ser que entendamos “cómo” deben ser las fases de 
un proceso, pero algo muy distinto es entender el “porqué” de esas fases. 
 
Wechsler (1978, véase en Gonzáles, Aragon y Silva, 2000) considera a la 
inteligencia como la capacidad global de un individuo tiende para entender y 
enfrentar el mundo que lo circunda, concibiendo a la inteligencia como una entidad. 
Sternberg y Berg (1992) analizan los simposios de los años 1921 y 1986 en que un 
grupo de expertos señalan los rasgos propios de la inteligencia. En la tabla 1 se 
recogen y comparan 27 atributos, que aparecieron en las definiciones de 
inteligencia que dieron los expertos de dichos simposios.  
El reducido número de la frecuencia de cada atributo les hizo difícil un análisis 
estadístico formal, sin embargo hicieron algunas generalizaciones. Como se puede 
observar en la Tabla 1, los atributos tales como los componentes de nivel superior 
(razonamiento abstracto, representación, solución de problemas, toma de 
decisiones) se destacan en ambas listas.  
 
 
12 
 
 
Otros temas son recurrentes como la adaptación al medio ambiente y los procesos 
ejecutivos, sin que se haya llegado a criterios comunes para todos, uno de ellos es 
el de la naturaleza de la inteligencia. Hay quienes la conciben como algo único y 
otros como un conjunto de diversos atributos. La correlación de frecuencia de 
ambos conjuntos es 0,50 lo que indica una coincidencia moderada. 
Tabla 1 
Frecuencias de los atributos que los expertos han utilizado para definir la 
inteligencia en 1921 y en 1986. 
 1986 1921 
  N % N % 
1. Adaptación para entender eficazmente las 
exigencias del ambiente. 3 13 4 29 
2. Procesos elementales (percepción, sensación, 
atención). 5 21 3 21 
3. Metacognición (conocimiento acerca de la 
cognición). 4 17 1 7 
4. Procesos ejecutivos 6 25 1 8 
5. Interacción de procesos y conocimientos 4 17 0 0 
6. Componentes de nivel superior (razonamiento 
abstracto, representación, solución de problemas, 
toma de decisiones)  
1
2 50 8 57 
7. Conocimiento 5 21 1 7 
8. Aptitud de aprendizaje 4 17 4 29 
9. Mecanismos fisiológicos 2 8 4 29 
10. Conjunto de aptitudes (por ejemplo: espacial, 
verbal, auditiva) 4 17 1 7 
11. Rapidez de procesamiento mental 3 13 2 14 
12. Rendimiento automatizado 3 13 0 0 
13. g 4 17 2 14 
14. Manifestación en el mundo real (sociales, 
prácticas) 2 8 0 0 
      
   
 
 
 
13 
 
  1986 1921 
  N % N % 
15. Lo que es valorado por la cultura 7 29 0 0 
16. Difícilmente definible; no es un único constructo 4 17 2 14 
17. Un campo de escolaridad 1 4 0 0 
18. Capacidades innatas 3 13 1 7 
19. Constructos emocionales, motivacionales 1 4 1 7 
20. Aptitudes estrictas académico-cognitivas 2 8 2 14 
21. Diferencias individuales en competencia mental 1 4 0 0 
22. Generación de ambiente basada en programación 
genética 1 4 0 0 
23. Aptitud de afrontar lo nuevo 1 4 1 7 
24. Alegría mental 1 4 0 0 
25. Solamente importa su valor predictivo 0 0 1 7 
26. Capacidad de inhibición 0 0 1 7 
27. Expresiones de la conducta manifiesta (respuestas 
eficaces) 5 21 3 21 
Nota: Sternberg y Detterman, 1992, p.188. (citado por Sternberg, y Berg, 1992) 
Por otra parte, Snyderman y Rothman en 1987 (Benatuil,  2007) encuestaron a más 
de 1000 especialistas en inteligencia y demostraron la existencia de consenso en la 
consideración de tres elementos centrales para la comprensión de la inteligencia, 
estos son: pensamiento abstracto, capacidad de solucionar problemas y capacidad 
de adquirir conocimientos. 
Asimismo los especialistas también destacaron la capacidad de adaptación al 
ambiente, la creatividad, las habilidades lingüísticas y matemáticas, el 
conocimiento general, la memoria y la rapidez mental como constitutivas de la 
inteligencia. 
Hasta ahora hemos ido caracterizando la inteligencia, por algunos de los aspectos 
que los distintos especialistas han ido indicando como rasgos de inteligencia en las 
personas que los poseen. Como hemos visto, sería muy arriesgado ceñirnos a una 
única definición de inteligencia y que toda la comunidad científica la aceptara como 
 
 
14 
 
válida. Bueno (2004) señala una serie de definiciones resaltantes, que son las 
siguientes: 
Terman: La capacidad de “desarrollar pensamientos abstractos”. 
Thorndike: “El poder de dar una buena respuesta a partir de la verdad 
o la realidad”. Colvin: “El aprendizaje o capacidad de aprender a 
adaptarse al medio”. Rudolf Pinter: “La modificabilidad general del 
sistema nervioso”. J. Peterson: “Un mecanismo biológico mediante el 
que se reúnen los efectos de una complejidad de estímulos y se les da 
cierto efecto unificado en la conducta”. H. Woodrow: Una “capacidad 
de adquirir”. M. E. Hagerty: “Grupo de complejos procesos mentales 
definidos tradicionalmente como la sensación, la percepción, la 
asociación, la memoria, la imaginación, el discernimiento, el juicio y 
el razonamiento”. Brown y Freench (1979): “La facultad de 
autodirigirse y de aprender en ausencia de una instrucción directa y 
completa”. Whimbey (1975): “Un acercamiento habitual aprendido a 
la solución de problemas”. Bereiter y Engelman (1966): “Habilidad en 
el análisis y reconstrucción mental de relaciones”. De Avila y Duncan 
(1985): La capacidad de emplear los conocimientos eficazmente: “lo 
que puede uno hacer con lo que uno sabe”. Gardner (1994): La 
inteligencia tiene que ver con la capacidad para resolver problemas y 
elaborar productos en un escenario natural y estimulante. (p.11) 
 
 
 
 
 
15 
 
En psicología, la definición del término inteligencia se ha caracterizado por una 
notable falta de consenso entre los expertos, debido a que constituye un fenómeno 
complejo, que no presta con facilidad a una definición conceptual. C. Gonzáles 
(2003) acota que debido a la intervención de tantos elementos, cuyo funcionamiento 
no está muy claro, dificulta una definición precisa y concisa de inteligencia. 
Por otro lado Wechsler, en el año 1978 (véase en González, Aragón, y Silva, 2000) 
considera a la inteligencia como la capacidad global de un individuo a entender y 
enfrentar el mundo que lo circunda, concibiendo a la inteligencia como una entidad 
global, eso es, multideterminada y multifacética en oposición a un rasgo definible 
de una manera única.  
Weachsler considera que no es una clase de habilidad total, sino que es algo que se 
infiere de aquellas habilidades que se manifiestan bajo diferentes circunstancias y 
condiciones, menciona que la información que se obtiene de las pruebas de 
inteligencia es importante, sólo en el sentido de que establece y refleja lo que se ha 
definido como la capacidad total para la conducta inteligente.  
En el año 1996 (Rigo y Donolo, 2013), el American Psychological Association 
(APA), convocó a un grupo de expertos los cuales estuvieron a cargo de Neisser 
para que se pronunciara sobre el tema de la inteligencia.  
Ellos señalan que los individuos difieren en su aptitud para comprender ideas 
complejas, adaptarse con eficacia al ambiente, aprender de la experiencia, razonar 
y para superar obstáculos.  
 
 
 
 
16 
 
Los conceptos de inteligencia son intentos de clarificar y organizar esta compleja 
serie de fenómenos. Aunque se ha logrado, una considerable claridad en algunas 
áreas, ninguna de las conceptualizaciones ha respondido todas las preguntas y 
ninguna de ellas recibe un apoyo universal.  
Cuando se preguntó dos docenas de teóricos por una definición de inteligencia, se 
propusieron dos docenas de definiciones distintas (Sternberg y Detterman, 1992). 
Estos desacuerdos no son motivo de desaliento. La investigación científica no 
puede empezar con definiciones totalmente aceptadas, aunque se puede llegar a 
ellas. 
Posteriormente Papalia y Olds (2004) utilizan el término de inteligencia para 
referirse a la constante interacción, entre las capacidades heredadas y las 
experiencias ambientales; cuyo resultado capacita al individuo para adquirir, 
recordar y utilizar sus conocimientos, entender conceptos concretos y 
eventualmente abstractos, comprender las relaciones entre los objetos, los hechos y 
las ideas, así como aplicarlo con el propósito específico para resolver los problemas 
de la vida cotidiana. 
Cohen y Swerdlik (2006, véase en Sánchez y Pirela, 2010) definieron la inteligencia 
como una capacidad multifacética que se manifiesta de diferentes maneras a lo largo 
del ciclo vital. Incluye las habilidades de adquirir y aplicar el conocimiento, razonar 
de manera lógica, planear de modo efectivo, hacer inferencias a partir de la 
percepción, realizar juicios sólidos y resolver problemas, comprender y visualizar 
conceptos, poner atención, ser intuitivo, encontrar con facilidad las palabras y 
pensamientos correctos, enfrentarse, ajustarse y aprovechar situaciones nuevas. 
 
 
 
17 
 
Además de las diversas definiciones presentadas, existen diferentes teorías sobre 
inteligencia, las cuales influyen significativamente en el contenido de los tests de 
inteligencia. 
2.3. Teorías sobre la inteligencia 
Woolfolk (1999), indica que las primeras teorías sobre la naturaleza de la 
inteligencia, comprendían en uno o más de los siguientes temas: (1) la capacidad de 
aprender; (2) el conocimiento adquirido por la persona; y (3) la habilidad de 
adaptarse con éxito a situaciones nuevas y al ambiente en general. 
Existen múltiples teorías sobre el origen de la inteligencia cuyos planteamientos se 
pueden agrupar en tres: el biológico, el psicológico y el operativo (Hernández, 
1991; Vernon, 1982; véase en C. Gonzáles, 2003).  
En el planteamiento biológico, acentúa el poder de la inteligencia como la habilidad 
de adaptación al medio, entendiendo esta como una capacidad adaptativa del 
organismo.  
En el psicológico, la inteligencia se concibe como la habilidad de aprender, es decir, 
se sitúa entre la base biológica y la adaptación o el resultado de la experiencia, el 
aprendizaje y los factores ambientales.  
Desde el planteamiento operativo, se describe como un conjunto de conductas 
observables y evaluables a través de los test y, por tanto, se define como lo que 
miden las pruebas de inteligencia.  
Entendido ello, se pasará a señalar algunas de las teorías más recientes que explican 
el origen de la inteligencia. 
 
 
18 
 
2.3.1. Teoría de Baron 
Baron (1985, véase en C. Gonzáles, 2003) define la inteligencia como el arte del 
pensamiento racional, un talento que no es innato sino aprendido. Es un autor 
claramente integrado en la corriente ambientalista de la inteligencia, que defiende 
que la inteligencia puede ser modificada por el ambiente y las características del 
contexto en el que se desarrolle el sujeto. Entre los defensores de este enfoque 
encontramos a Watson, Golffarb, Pasamanik, Spizt, Miller, Herber y Gerber y 
muchos otros. 
2.3.2. Teoría de Jensen 
Jensen, afirmó que 80 por ciento de lo que miden las pruebas de inteligencia es 
heredado y que apenas 20 por ciento depende del ambiente del niño, por lo que 
los genes y no es la cultura y ni el ambiente los que determinan principalmente la 
inteligencia. Sostiene que la inteligencia, proviene del cerebro y se transmite por 
herencia, por lo tanto, tiene límites biológicos bien definidos que se establecen en 
el momento del nacimiento.  
Asimismo, señala que la inteligencia está determinada por la raza, y que la reserva 
de genes intelectuales de los negros es inferior a la de los blancos.  
En las investigaciones efectuadas en la década de 1960, los afroamericanos 
recibieron en promedio de 10 a 15 puntos menos en las pruebas que los blancos. 
La diferencia ha ido disminuyendo de manera paulatina en los últimos años. 
 
 
 
 
19 
 
En la actualidad, los investigadores sostienen que “los ajustes hechos, atendiendo 
a las diferencias económicas y sociales en la vida de los niños de razas blanca y 
negra, eliminan prácticamente las diferencias de las puntuaciones entre los dos 
grupos” (Brooks-Gunn y otros, 1996; véase en Craig y Baucum, 2009). 
En ese sentido, la corriente genética explica la inteligencia como un aspecto 
determinado por la herencia. Que se estable a lo largo de la existencia del 
individuo, existiendo muy poco, que la educación puede hacer para modificarla. 
Siendo Jensen un integrante indiscutible de esta corriente, podemos destacar 
también a Galton, Binet, Goddard, Binet, Goddard, Yerkes, Terman, Burt, 
Eysenck como defensores de esta teoría. 
2.3.3. Teoría de Stanley y Benbow 
Estos autores se sitúan en un punto intermedio entre las dos posturas anteriores. 
Afirman que, la inteligencia no puede ser explicada únicamente desde la herencia, 
sin embargo los factores biológicos ejercen una influencia fundamental en dicho 
constructo. Otros autores como Weinberg en el año 1989, Plomin y DeFries en el 
año 1998 (Craig y Baucum, 2009) afirman que el desempeño de un niño en un test 
de CI depende casi por igual de los factores genéticos y ambientales. 
2.4. Teorías sobre la estructura de la inteligencia 
Así como no existe un acuerdo en el origen de la inteligencia, tampoco existe una 
teoría única que explique su estructura. En ese sentido, tomaremos la clasificación 
de Domínguez Rodríguez (Bueno y Castanedo, 1998; véase en C. Gonzáles, 
2003), que es la más relevante, porque propone dos grandes enfoques 
complementarios entre sí.  
 
 
20 
 
2.4.1. Enfoque psicométrico 
Las teorías que explican a la inteligencia como un conjunto de componentes o 
factores, son las llamadas psicométricas o diferenciales. Porque parten del estudio 
de las diferencias individuales de las personas. Siendo, estos factores constructos 
hipotéticos, que tienen como finalidad describir las fuentes subyacentes de las 
diferencias entre sujetos, que dan lugar a las diferencias individuales observadas 
en las puntuaciones de los tests.  
Todas las teorías incluidas en este enfoque analizan la estructura de la inteligencia, 
como una estructura de aptitudes o factores covariantes integrados en una 
jerarquía dinámica. Dichos factores pueden ser rasgos estables pero no fijos, y su 
nivel de eficacia depende de la integración entre la dotación genética y el ambiente 
del sujeto.   
Otra característica que comparten, es que utilizan los factores para entender y 
evaluar la inteligencia; sin embargo, variando, tanto el número como el orden. 
Dentro de este enfoque las teorías históricas más relevantes han sido: 
A. Teoría bifactorial de Spearman 
Morris y Maisto (2005) señalan que Spearman advirtió que las personas que 
son brillantes en un área, a menudo destacan también en otras áreas. La persona 
inteligente entiende las cosas con rapidez, toma decisiones adecuadas, se 
enfrasca en conversaciones interesantes y tienden a comportarse de manera 
inteligente en diversas situaciones.  
 
 
 
 
21 
 
Aunque es cierto que cada uno de nosotros es más rápido en algunas áreas que 
en otras, Spearman consideraba que esas diferencias eran simplemente formas 
en que se revela la misma inteligencia general subyacente. 
Spearman (1994, citado por C. Gonzáles, 2003) concibe la estructura de la 
inteligencia como un factor bifactorial. Es decir, se compone del factor general 
(g) y habilidades específicas (factor s). Teniendo en cuenta que estos dos 
factores siempre se encuentran presentes, la primera está considerada como la 
capacidad básica que permite al sujeto pensar de manera abstracta. Y la 
segunda, permite a la persona hacer frente a los rasgos característicos de una 
situación problemática. 
B. Teoría factorial de Thurstone 
También llamada Aptitudes Mentales Primarias. Esta explica la conducta 
inteligente a partir de 8 factores específicos, estos son: el factor espacial, el 
numérico, la comprensión verbal, la fluidez verbal, la precisión perceptiva, la 
memoria, el razonamiento inductivo y el razonamiento deductivo. Además 
señala que la inteligencia general no es un factor independiente, sino el perfil 
del sujeto en las diferentes aptitudes primarias. 
C. Teoría maestral de la inteligencia de Thomson 
Thomson afirma que la inteligencia es un conjunto de elementos distintos e 
independientes que no están ordenados ni organizados por factores o aptitudes.  
 
 
 
 
22 
 
Sino que cada actividad inteligente consiste en una muestra aleatoria de estos 
elementos, que no depende de aptitudes formadas de forma fija sino de 
aptitudes modificables.  
Su aporte ha sido importante para la concepción de la modificabilidad de la 
inteligencia, sin embargo, fue criticado por el hecho que los elementos 
psicológicos para una actividad inteligente se elijan al azar y de forma 
desordenada. 
D. Teoría multifactorial de Guiford 
Esta teoría aporta una estructura tridimensional y cúbica a la inteligencia. 
Definiendo la inteligencia como un conjunto sistemático de aptitudes o 
funciones, para procesar diferentes tipos de información de diversos modos. 
Además, Guilford (Woolfolk, 1999) propone la existencia de tres categorías o 
dimensiones básicas, o esferas de la inteligencia: las operaciones mentales o 
procesos de pensamiento; los contenidos o las cosas en que pensamos; y los 
productos o resultados finales de nuestro pensamiento. 
Las operaciones mentales se dividen en seis categorías: la cognición 
(reconocimiento de la información antigua y descubrimiento de la nueva), el 
pensamiento convergente (encontrar una respuesta), el pensamiento divergente 
(hallar varias soluciones posibles), la evaluación (juicios sobre precisión, valor, 
etc.), la memoria inmediata y la memoria a largo plazo.  
 
 
 
 
23 
 
Los contenidos se dividen en cinco categorías: los contenidos visuales, los 
contenidos auditivos, el significado de palabras, los símbolos y las conductas. 
Los productos son unidades, clases, relaciones, sistemas, transformaciones e 
implicaciones. Cabe resaltar que existen 180 combinaciones entre las 
operaciones, los contenidos y los productos (6 x 5 x 6). 
Según este punto de vista, llevar a cabo una tarea cognoscitiva consiste en 
realizar una operación mental sobre cierto contenido para obtener un producto. 
Por ejemplo, identificar el siguiente número de la secuencia 3, 6, 12, 24,... 
requiere una operación convergente (hay una sola respuesta correcta) sobre un 
contenido simbólico (números) para obtener como producto una relación (cada 
número es el doble del anterior).  
Este modelo de inteligencia amplía la noción de la naturaleza de la inteligencia, 
al añadir factores como el juicio social (la evaluación de la conducta de los 
otros) y la creatividad (el pensamiento divergente). Cuando se prueban estas 
diferentes habilidades, demuestran estar relacionadas, pero queda sin resolver 
el problema que explica las correlaciones positivas entre estas habilidades 
mentales que supuestamente son independientes. 
E. Teoría de Cattell 
Esta teoría define dos tipos de inteligencia: la inteligencia fluida y la 
inteligencia cristalizada.  
La inteligencia fluida que es la capacidad general básica, biológica y heredada, 
con la que nace el hombre, para adaptarse a situaciones nuevas sin necesidad 
de experiencia, aprendizaje o contenidos culturales.  
 
 
24 
 
Cattell y Horn (Woolfolk, 2006) señalan que este tipo de inteligencia se 
incrementa hasta la adolescencia, ya que se fundamenta en el desarrollo del 
cerebro, y posteriormente declina de manera gradual con la edad.  
Esta capacidad se considera independiente del aprendizaje, la experiencia y la 
educación. Además está constituida por tres factores de primer orden: la 
capacidad de visualización, la memoria y la velocidad cognitiva.  
En cambio, la inteligencia cristalizada se refiere a las capacidades cognitivas 
que se han aprendido o cristalizado gracias al aprendizaje y la cultura, que 
podría aumentar a lo largo de la vida, además incluye tanto las habilidades 
aprendidas y el conocimiento, como el vocabulario y los hechos.  
Está compuesto por tres factores de primer orden que pueden ser educados: 
comprensión verbal, capacidad para establecer relaciones semánticas y 
capacidad para evaluar la experiencia. 
Al utilizar la inteligencia fluida en la resolución de problemas, desarrollamos 
nuestra inteligencia cristalizada, no obstante, muchas tareas de la vida, como 
el razonamiento matemático, dependen tanto de la inteligencia fluida como de 
la cristalizada. 
Como se aprecia, en el enfoque psicométrico, compuesto por estas teorías y otras 
similares, se explica la estructura de la inteligencia, tratándola de medirla, pero no 
estudian los procesos mentales que hacen posible un comportamiento inteligente. 
 
 
 
25 
 
2.4.2. Enfoque cognitivo 
Este enfoque, estudia los aspectos del procesamiento de la información y pretende 
identificar, representar, conocer y justiciar la cadena de procesos o suceso 
mentales que se dan en la conducta inteligente (Beltran, 1995; citado por C. 
Gonzáles, 2003).  
Con el fin de estudiar dichos procesos mentales surgen los estudios cognitivos o 
componenciales, que tienden a la inteligencia como un conjunto de procesos 
dinámicos.  
Los cuales, se adquieren gracias a la interacción con el ambiente que permite 
aprender las estrategias necesarias para mejorar las habilidades cognitivas. 
Bajo este enfoque se destacan las siguientes teorías: 
A. Teoría de Carroll 
Carroll define una serie de componentes cognitivos para describir el 
procesamiento inteligente, argumentando que estos son los responsables del 
funcionamiento de la mente en la producción de respuestas inteligentes.  
Carroll (1997; citado por Woolfolk, 2006) identifica una habilidad general, 
algunas habilidades extensas (como las habilidades fluidas y cristalizadas, el 
aprendizaje y la memoria, la percepción visual y auditiva, la velocidad de 
procesamiento) y al menos, 70 habilidades específicas como el desarrollo del 
lenguaje, la capacidad de memoria y el tiempo de reacción simple. 
 
 
 
26 
 
B. Teoría de Brown 
Esta teoría dividió los procesos cognitivos en dos bloques: Procesos 
metacognitivos, concebidos como destrezas ejecutivas utilizadas para controlar 
el propio pensamiento (la planificación, el control, la contraste de ejecución de 
una estrategia, la revisión de la propia estrategia y valoración de la estrategia 
utilizada). Y los procesos cognitivos, entendidos como, destrezas no ejecutivas 
que hacen posible el pensamiento (no pertenecen al grupo de los procesos 
metacognitivos o son gobernados por ellos). 
C. Teoría triárquica de Stemberg 
Sternberg (1986, citado por Morris y Maisto, 2005) argumenta que la 
inteligencia humana abarca una amplia variedad de habilidades y que estas 
influyen en muchas áreas de nuestra vida.  
Además, Sternberg (1985, 2004; citado por Papalia, Wendkos y Duckin, 2009) 
identifica tres elementos o aspectos de la inteligencia: componencial 
(capacidad analítica), experiencial (discernimientos y originalidad) y 
contextual (pensamiento práctico).  
Los cuales detallaremos a continuación: 
● El elemento componencial, es el aspecto analítico de la inteligencia y 
determina la eficiencia con la que las personas procesan la información. 
Le dice a las personas cómo resolver problemas, cómo monitorear 
soluciones y cómo evaluar los resultados. Además, según Craig y 
Baucum (2009) corresponde más o menos las capacidades medidas de 
las pruebas de CI (Cociente intelectual) comunes. 
 
 
27 
 
● El elemento experiencial es intuitivo o creativo, determina la forma en 
que las personas abordan tareas novedosas o familiares. Permite a los 
sujetos comparar la información nueva con lo que ya saben, y crear 
formas novedosas de integrar hechos; en otras palabras, pensar con 
originalidad. 
● El elemento contextual es práctico, describe la forma en que las personas 
se enfrentan a su ambiente. Es la capacidad para juzgar una situación y 
decidir qué hacer, ya sea adaptarse a ella, cambiarla o salirse de ella. 
 
Sternberg (1986; citado por C. Gonzáles, 2003) afirma que los elementos de 
las tres sub teorías están relacionados entre sí, y que las diferencias individuales 
en el procesamiento se deben a: 
a) El número, tipo y orden de componente que aplica el sujeto en el 
procesamiento 
b) Las reglas de combinación que utiliza para organizar o cambiar los 
componentes. 
c) El tiempo y la exactitud del procesamiento. 
D. Teoría de las inteligencias múltiples de Gardner 
Para Garder (1998, 1999; por Woolfolk, 2006) la inteligencia es la habilidad 
para resolver problemas, y crear productos o resultados que sean valorados por 
una cultura. Además, sostiene que el desarrollo de las inteligencias depende de 
tres grandes factores (Bueno, 2004). 
 
 
 
28 
 
El primer factor, es la dotación genética, los factores hereditarios e incluye los 
daños cerebrales ocurridos antes, durante o después del nacimiento.  
El segundo factor, es la historia personal que incluye las experiencias con los 
padres, profesores, iguales, etc. En tercer lugar, se encuentra el fondo cultural 
e histórico del lugar en el momento en el que se haya nacido, la educación 
recibida, etc. 
Además, Gardner (Papalia, et. al, 2009) estima que la inteligencia está 
compuesta por habilidades distintas, donde cada una de las cuales es 
relativamente independiente de las otras.  
Es difícil determinar con precisión cuántas inteligencias separadas existen, aun 
así Gardner menciona ocho: lógico matemática, lingüística (verbal), espacial, 
musical, cinestésica-corporal (movimiento), interpersonal (entender a los 
demás), intrapersonal (entenderse a sí mismo) y naturalista (observar y 
comprender los patrones y sistemas – naturales y hecho por el hombre).  
Posteriormente especuló que quizás haya una inteligencia existencial (Gardner, 
1999; citado por Woolfolk, 2006), que considera habilidades para considerar 
preguntas trascendentes sobre el significado de la vida. 
Sin embargo, las diferentes culturas y épocas de la historia asignan distintos 
valores a las ocho inteligencias. Por ejemplo, la inteligencia naturalista resulta 
fundamentalmente en la cultura agrícola.  
 
 
 
 
29 
 
Otra imprecisión es que la teoría de las inteligencias múltiples refuta la idea de 
la inteligencia general (g) sin embargo este autor no niega la existencia de una 
habilidad general, pero cuestiona la utilidad de g como explicación para los 
logros del ser humano. 
2.5. Inteligencia general 
Morris y Maisto (2005) refieren que Spearman indica que los individuos buenos en 
un área, frecuentemente destacan en otras áreas. Una persona inteligente comprende 
con rapidez, toma decisiones acertadas, sostiene conversaciones interesantes, en 
general, se comporta inteligentemente en una amplia variedad de situaciones. 
Además, que cada individuo puede ser más rápido en unas áreas más que en otras, 
producto de la manera como la misma inteligencia general se revela en diferentes 
actividades. 
Hogan (2004, citado por Sánchez y Pirela, 2010) considera a que Spearman como 
el creador de lo que se considera la primera teoría formal sobre la capacidad mental 
humana. 
Spearman basa su teoría al examinar las correlaciones entre una extensa variedad 
de pruebas que median las funciones sensoriales simples, considero que dichas 
correlaciones eran lo suficientemente elevadas para concluir que el desempeño en 
estas pruebas dependía mayoritariamente de una capacidad mental general. Y a esta 
capacidad general, la denominó g.  
Sin embargo, las correlaciones entre dichas pruebas no eran perfectas, ya que cada 
prueba poseía una varianza única o específica, independiente de g. Así que cada 
conjunto de pruebas poseía una serie de factores s y un factor g.  
 
 
30 
 
Debido a esos dos factores, Spearman la denominó teoría bifactorial; no obstante, 
el factor esencial de la teoría es g. Por ello, también se le conoce como la teoría de 
la inteligencia unifactorial o “de un solo factor”.  
Sobre el termino factor g, el propio Sperman (1927, citado por Espinoza, 1999) 
abogó para que el concepto no se tradujera por “inteligencia general”, ni “general”, 
ni mucho menos “inteligencia”, porque según el autor no podría captar 
adecuadamente lo que era para él un concepto estadístico-matemático.  
El factor g es un constructo hipotético mediante el cual se hace referencia a un 
conjunto de aptitudes que siempre se ponen de manifiesto en la resolución de tareas 
complejas.  
Según Spearman (1927; citado por F. Gonzáles, 2007), esas aptitudes constituyen 
el proceso psicológico que está en la base de los resultados obtenidos en los tests, 
que reflejan la existencia del factor g; esas aptitudes son: 
La primera, es la capacidad de introspección que permite al sujeto observar lo que 
ocurre en el interior de su mente. 
La segunda, es la capacidad de deducir las relaciones esenciales existentes entre dos 
o más ideas que se tienen en mente.  
Y la última, es la capacidad de deducir correlatos, cuando una persona tiene en su 
mente una idea y una relación, y logra concebir la idea inicial implícita en esa 
relación. 
 
 
 
 
31 
 
La inteligencia, según Spearman permite generar información nueva a partir de la 
existente y tiene tres leyes (Benatuil, 2007): 
a. Percepción de la experiencia: las personas tienen capacidad de observar lo 
que sucede en su propia mente. 
b. Inferencia de las relaciones: toda persona que posea en su cabeza dos o más 
ideas, tiene capacidad para descubrir las relaciones esenciales que hay entre 
las mismas. 
c. Inferencia de correlatos: toda persona que tenga en su cabeza cualquier idea 
acompañada de una relación, tiene capacidad de generar una idea correlativa 
Por esa razón, la mejor medida del factor g son los test de relaciones abstractas. 
Debido a  la complejidad de la tarea favorece a que el sujeto desarrolle y manipule 
su actividad mental consciente; es lo complejo y nuevo de la tarea lo que obliga a 
la persona a manipular dicha información, para lo cual hace uso del conjunto de 
aptitudes denominadas factor g.  
El elemento crucial responsable del grado en que un test satura en g, es la cantidad 
de manipulación mental consciente desencadenada por la nueva información que 
presenta la tarea. No obstante si la persona desarrolla un grado de familiaridad con 
la tarea lo realizará en forma mecánica, entonces la ejecución de la tarea se 
correlaciona menos con el factor g.  
En el caso en que la solución de la tarea resulte por primera vez. El resultado que 
se obtiene de estos instrumentos, informa de la capacidad intelectual general que 
tiene una persona, pero no dice qué operaciones realiza el sujeto cuando resuelve 
una tarea que satura en g. 
 
 
32 
 
 
2.6. Aspectos psicométricos 
2.6.1 Análisis de ítems 
De acuerdo a Abab, Garrido, Olea y Ponsoda (2006) los ítems del cuestionario o 
test son los que miden el constructo, variable o rango. Por lo que para saber si es 
“un buen medidor” se puede comprobar estadísticamente si obtenemos tres 
indicadores para cada ítem: a) El índice de dificultad, b) el índice de 
homogeneidad y, c) el índice de validez. 
A. Índice de discriminación 
El índice de homogeneidad también llamado índice de discriminación, como 
su nombre indica, entendemos como la capacidad de un ítem de distinguir entre 
las personas que tienen un buen rendimiento en el test, respecto a las que lo 
tienen un mal rendimiento. 
Se considera que un ítem es discriminativo cuando es capaz de diferenciar 
adecuadamente a los sujetos, con diferentes grados en las características que 
evalúa la prueba. 
El índice de discriminación se calcula para ítems de pruebas cognitivas y no 
cognitivas; un ítem puede discriminar entre sujetos que tiene un rendimiento 
alto o bajo en una área de conocimiento, entre sujetos introvertidos y 
extrovertidos, entre sujetos racista y no racista, entre sujetos a favor o en contra 
de la legalización de las drogas, etc. 
 
 
 
33 
 
La tabla 2, muestra los valores D (índice de discriminación) y su 
correspondiente interpretación. Asimismo, en la tabla se señalan las 
recomendaciones para cada uno de estos valores (Ebel, 1965 citado por 
Meneses, et. al 2013; Martínez, Hernández, y Hernández, 2014). 
Tabla 2 
Puntos de corte de los valores del índice de discriminación y su interpretación 
Índice de 
discriminación 
Categoría Interpretación 
D≥ 0,40 Alta El ítem presenta un gran poder 
discriminativo 
0,30  ≤ D ≤ 0,39 Aceptable Discriminación aceptable y no requiere 
revisión 
0,20 ≤ D ≤ 0,29 Baja Discrimina poco y necesita una 
revisión. 
0,10 ≤ D ≤ 0,19 Mala Ítem  no adecuado, debe ser 
modificado o eliminados del test 
D ≤ 0,0 Inaceptable Ítem que deben eliminarse 
directamente 
 
En cambio, Guilford (1975, citado por López, 2009), señala el rango aceptable 
para el índice de discriminación un índice mínimo de 0.3 
B. Índice de dificultad 
En las pruebas de habilidades o rendimiento (con ítems dicotómicos del tipo 
correcto/incorrecto) el índice de dificultad de cada ítem, es el porcentaje de 
personas que responden acertadamente al ítem analizado (Tornimbeni, Pérez y 
Olaz, 2008).  
 
 
34 
 
 
Para calcular la dificultad de un ítem, se divide simplemente el número de 
personas que contestó correctamente el ítem entre el número total de personas 
que contestó el ítem (correcta o incorrectamente).   
El índice de dificultad de los ítems tiene un rango de 0 a 1 y se simboliza como 
p. Un ítem cuyo p es 0 está indicando que ningún individuo lo contestó 
correctamente y un ítem con p igual a 1 es aquel que todos los individuos 
respondieron de manera correcta. 
Para Wood (1960, citado por Backhof, Larrazolo y Rosas, 2000) la dificultad 
de un ítem se entiende como la proporción de personas que responden 
correctamente un reactivo de una prueba. Entre mayor sea esta proporción, 
menor será su dificultad. Es decir que se trata de una relación inversa: a mayor 
dificultad del ítem, menor será su índice. 
Además, para Abab, et.al. (2006) al diseñar un cuestionario de rendimiento 
óptimo, al inicio se sitúan los ítems más fáciles (con mayor índice de 
dificultad); en la parte central, los de dificultad media (entre 0,30 y 0,70); y al 
final, los más difíciles (con menor índice de dificultad). Siendo, la mayor parte 
de los ítems deben ser de dificultad media. 
Escala de clasificación de la dificultad esperada en los ítems, según Backhof, 
et. al. (2000) es la siguiente: 
 5 % para ítems fáciles. 
 20 % para ítems medianamente fáciles. 
 50 % para ítems de dificultad media. 
 
 
35 
 
 
 
 20 % para ítems medianamente difíciles. 
 5 % para ítems difíciles 
Según Aiken (2003, citado por Tornimbeni, et.al., 2008) cuando la selección 
de personas no es el propósito esencial, son deseables ítems con p entre 0,30 y 
0,70, vale decir ni excesivamente difíciles ni fáciles. 
Por otro lado, Guilford (1975, citado por López, 2009), señala el rango 
aceptable para el índice de dificultad oscila entre 0.2 y 0.85.  
2.6.2 Validez 
El término validez hace referencia a poner en evidencia que una prueba mida lo 
que realmente pretende medir, lo cual está relacionado al objetivo concreto de la 
prueba, para lo cual fue construida.  
La validez, aplicada a una prueba es un juicio o una estimación acerca de que tan 
bien la prueba mide lo que pretende medir en un determinado contexto (Jay y 
Swerdlik, 2006).  
Además, en la medida en que la validez de una prueba disminuye, debido a 
cambios en la cultura o en la época, en necesario que la validez de un instrumento 
sea probada de nuevo en diferentes periodos. 
Aiken (2003) señala que a diferencia de la confiabilidad, la cual es influida solo 
por los errores no sistemáticos de medición, la validez de una prueba es afectada 
tanto por los errores no sistemáticos como por los sistemáticos (constantes).  
 
 
36 
 
 
Por esa razón, una prueba puede ser confiable, sin ser válida, pero no puede ser 
válida sin ser confiable. La confiabilidad es una condición necesaria, pero no 
suficiente, para la validez. 
Messick (1980; citado por Livia y Ortiz, 2014) indica que ha habido muchos 
términos para referirse a los tipos de validez: convergente, discriminante, 
factorial, sustantiva, estructural, externa, de población, de tarea, temporal, 
ecológica aparente, intrínseca, por definición y lógica.  
Ante esta situación el American Psychological Association (APA) publicó un 
manual con recomendaciones técnicas para el uso y diagnóstico con pruebas 
psicológicas, indicando tres tipos de validez: Contenido, criterio y constructo 
(1954; citado por Alvarado y Santiesteban, 2006).  
En 1999 (Elosua, 2003)  el APA,  American Educational Research Association 
(AERA), y National Council on Measurement in Education (NCME) señalan los 
3 tipos de validez. 
Existen varios procedimientos para determinar la validez de un test, los cuales no 
son excluyentes. A continuación analizaremos la validez de contenido, la validez 
relacionada con el criterio y la validez de constructo, ya que son las más usadas 
en el campo de la investigación. 
A. Validez de contenido 
Se refiere al examen sistemático del contenido del test, para determinar si 
comprende una muestra representativa de la forma de conducta que ha de 
medirse (F. Gonzáles, 2007).  
 
 
37 
 
 
Anastasi y Urbina (1998) señalan que este tipo de validez está muy relacionado 
a las pruebas de habilidad y rendimiento. Además, es necesario que presente 
un  muestreo adecuado del universo de ítems, para asegurar que todos los ítems 
cubran en la proporción correcta los aspectos importantes del constructo que se 
desea medir.  
Asimismo, la validez de contenido según Escobar y Cuervo (2008)  es que los 
ítems de un instrumento de medición deben ser relevantes y representativos del 
constructo. 
Por lo tanto, podemos definir la validez de contenido como el grado en el que 
los indicadores seleccionados (ítems) representan de forma correcta el 
constructo que se desea medir y dependerá del marco teórico que sirva de 
apoyo al investigador. 
Un método para evaluar la validez de contenido, fue elaborado por Lawshe 
(1975; citado por Jay y Swerdlik, 2006), se determina por el consenso entre 
evaluadores o jueces a cuán esencial puede ser un reactivo en particular.  
Sobre el juicio de expertos, Escobar y Cuervo (2008) señalan que es una 
opinión informada de personas con trayectoria en el tema, que son reconocidos 
por otros como expertos calificados en este, y que pueden dar información, 
evidencia, juicios y valoraciones.  
Algunos indicadores para definir a un experto son: la docencia, sus 
publicaciones, su experiencia laboral  y las capacitaciones en el tema.  
 
 
 
38 
 
El criterio de jueces para contrastar la validez de los ítems, consiste en solicitar 
a personas expertas en el dominio que mide los ítems, si aprueban o 
desaprueban la inclusión de un ítem en la prueba. La cantidad de jueces puede 
ser 10 (Hyrkas, Appelquist-Schmidlechner y Oksa, 2003) o entre 2 a 20 
expertos (Grant y Davis, 1997). 
Sobre la validez de contenido en las pruebas de inteligencia, Morris y Maisto 
(2005) hacen mención que las pruebas de inteligencia enfatizan ciertas 
habilidades más que otras, que no miden cada tipo de habilidad mental y que 
algunos test se concentran en ciertas habilidades que otras pruebas dejan fuera. 
Por esas razones, ninguna tiene una validez de contenido perfecta. 
B. Validez de criterio 
La definición clásica de la validez hace referencia a poner en evidencia que una 
prueba mida lo que realmente pretende medir, que está relacionado al objetivo 
concreto de la prueba para lo cual fue construida.  
Por otro lado Muñiz (2005) define la validez como el demostrar que las 
inferencias realizadas por un test fiable son correctas.  
Se considera que una prueba puede ser confiable, sin ser válida, pero no puede 
ser válida sin ser confiable. La fiabilidad es una condición necesaria, pero no 
suficiente para la validez. 
La validez relacionada con el criterio (Jay y Swerdlik, 2006) es un juicio de 
cuán adecuadamente puedes ser utilizada la puntuación de una prueba, para 
inferir la posición más probable de un individuo con respecto a cierta medida 
de interés.  
 
 
39 
 
 
Dos tipos de evidencias de validez se encuentran sumidas bajo el rubro de 
validez relacionada con el criterio es la validez concurrente y la validez 
predictiva. 
La validez concurrente, es el índice del grado en que se relaciona la puntuación 
de una prueba con alguna medida de criterio, obtenida al mismo tiempo (de 
manera concurrente) que la puntuación.  
La validez predictiva es un índice del grado en que la puntuación de una prueba 
predice alguna medida de criterio.  
Varias pruebas de inteligencia se correlacionan bien entre sí a pesar de las 
diferencias en su contenido,  se evidencia porque las personas que obtienen 
puntuaciones altas en una prueba tienden a obtener puntuaciones altas en las 
otras.  
Sin embargo, el hecho de que las pruebas de inteligencia tienden a 
correlacionar entre sí no es evidencia suficiente de su validez, ya que es posible 
que las pruebas midan las mismas cosas, pero que éstas no sea el constructo 
inteligencia.  
Para demostrar que las pruebas son válidas, necesitamos una medida 
independiente de inteligencia, con la cual comparar las puntuaciones en la 
prueba de inteligencia.  
 
 
 
 
40 
 
 
La medida independiente más usada con este propósito es el aprovechamiento 
académico (Anastasi y Urbina, 1997; citado por Morris y Maisto 2005). La idea 
subyacente, es que las diferencias individuales en las calificaciones escolares 
deben reflejar diferencias individuales en inteligencia, al menos en cierta 
medida.  
Por ende, los estudiantes con buenas calificaciones deberían obtener 
puntuaciones elevadas en la Stanford-Binet y otras pruebas de inteligencia, 
mientras que el desempeño en esas pruebas de los estudiantes con malas 
calificaciones debería ser menor. En efecto así sucede, incluso los críticos más 
severos aceptan que las pruebas de inteligencia tienen una fuerte correlación 
con las calificaciones escolares.  
Las correlaciones entre las calificaciones y las pruebas de inteligencia por lo 
regular fluctúan entre 0.50 y 0.75 (Parker, Hanson y Hunsley, 1988; citado por 
Morris y Maisto, 2005). 
C. Validez de constructo 
Un constructo es una idea informada, científica y desarrollada como una 
hipótesis para describir o explicar el comportamiento. Por ejemplo inteligencia 
es un constructo que puede ser citado para describir porque un estudiante se 
desempeña bien en la escuela. 
Los constructos son rasgos inobservables, supuestos (subyacentes) a los que un 
desarrollador de pruebas puede recurrir para describir el comportamiento de la 
prueba o el desempeño del criterio evaluado en el test.  
 
 
41 
 
 
El investigador formula varias hipótesis del comportamiento esperado de 
quienes obtienen puntajes altos y bajos de la prueba. Estas hipótesis darán 
origen a una tentativa sobre la naturaleza del constructo para cuya medición 
fue diseñada la prueba. 
Si la prueba es una medida válida del constructo, quienes obtuvieron puntajes 
altos y quienes obtuvieron puntajes bajos se comportarán como lo predice en 
la teoría.  
Sin embargo, si los que obtuvieron puntajes altos y bajos no se comportan como 
se ha predicho, el investigador necesitará volver a examinar la naturaleza del 
constructo o las hipótesis acerca del mismo. 
Una posible razón de obtener resultados contrarios a los pronosticados por la 
teoría es que la prueba simplemente no mide ese constructo. Por lo que sería 
necesario volver a examinar la teoría y en algunos casos se revisa que procesos 
estadísticos fueron usados. 
Asimismo, la validez de constructo se evalúa mediante la acumulación de 
evidencia, y no es posible ningún índice cuantitativo único. Livia y Ortiz (2014) 
señalan que con el fin de determinar la validez de este tipo en una prueba 
psicológica es preciso examinar todo el caudal de evidencias que lo rodean, el 
tipo de reactivos que se incluyen, la estabilidad de las calificaciones, la 
homogeneidad de la prueba psicológica, su correlación con variables de otras 
pruebas y otros datos que iluminen el significado de las calificaciones. 
 
 
 
42 
 
Debido a que esta validez requiere de la acumulación de varios métodos, lo que 
es muy dificultoso para cualquier investigador, por lo que usualmente se 
recurre a uno de ellos.  
Según Jay y Swerdilk (2006) es posible emplear cierto número de 
procedimiento para obtener evidencia de la validez de una prueba, por ejemplo: 
● La prueba es homogénea al medir un solo constructo. 
● Las calificaciones de la prueba aumenta o disminuye, en función de la edad 
o el paso del tiempo o de una manipulación experimental como se predijo 
manera teórica. 
● La calificación obtenida en la prueba luego de algún evento o por el simple 
paso del tiempo (es decir, calificaciones de pos prueba) difieren de las 
calificaciones de pre-prueba como se predijo de manera teórica. 
● Las calificaciones obtenidas en la prueba por personas de grupos distintos 
varían como fue pronosticado por la teórica. 
● Las calificaciones de la prueba se correlacionan con otras pruebas, de 
acuerdo como se predijo, según la base teórica del constructo en cuestión. 
Es conocida como validez convergente (Muñiz, 2003), se da cuando las 
correlación entre las medias de un rasgo, medido por distinto método es 
elevada, es decir, la media de un mismo rasgo convergen, aunque se hayan 
hecho por diferente método. 
 
 
 
 
 
43 
 
Karmel (1986, citado por Livia y Ortiz, 2014) describe la validez de constructo 
es la importante para toda clase de test psicológicos, siendo las técnicas y 
procedimientos más usados para determinarla, los siguientes:  
- Análisis factorial: Su propósito principal es el simplificar la descripción 
conductual reduciendo el número de categorías partiendo de una 
multiplicidad de variables de medición (test) hasta obtener unos cuanto 
rasgos. Identificados estos, se usan para describir la composición factorial 
de un test, por lo tanto un test puede identificarse tanto en términos de sus 
factores principales como del peso de cada factor. 
- Correlaciones con otros test: también llamada validez concurrente, donde 
el test construido recientemente se correlaciona con un test establecido, 
que mide el mismo constructo. Por ejemplo, el test Stanford – Binet, mide 
la inteligencia, por lo tanto una correlación alta entre la prueba nueva y el 
Stanford-Binet significara que aquel también mide inteligencia. 
 
Sobre la validez concurrente, Guilford (1950, citado por Boccalandro, 2003) 
señala que una correlación entre  0,70 y 0,90 se puede considerar una correlación 
“alta”, lo que surge cuando una prueba esta orienta a tomare una relación 
marcadamente (fuerte) entre las variables estudiadas. 
2.6.3 Confiabilidad 
En lenguaje cotidiano, confiabilidad es sinónimo de seguridad y consistencia, 
denotando una valoración positiva. En el lenguaje de la psicometría, confiabilidad 
se refiere al atributo de consistencia en la medición.  
 
 
44 
 
También, Jay y Swerdlik (2006) acotan que solo denota algo que es consistente, 
sin que necesariamente sea bueno o malo. 
Por confiabilidad se entienden la seguridad y consistencia de las puntuaciones 
arrojadas por una determinada prueba. Por ejemplo, si una semana obtiene una 
puntuación de 110 en una prueba de inteligencia y una semana después califica 60 
en la misma prueba o una equivalente, algo estaría mal.  
Es decir, la confiabilidad es la capacidad de una prueba para producir 
calificaciones consistentes y estables (Morris y Maisto, 2005).  
Para Tornimbeni, et. al. (2008),  la confiabilidad puede entenderse como la 
exactitud o precisión de una medición, o el grado en el cual las puntuaciones de 
un test están libres de esos errores de medición. Esta precisión de las puntuaciones 
permite que éstas se mantengan constantes en diferentes circunstancias. 
En conclusión, según Livia (2014), podemos indicar que la confiabilidad es la 
exactitud de la medición, al margen de que uno esté realmente midiendo lo que se 
ha querido medir.  
Un instrumento será altamente confiable en la medida que exista ausencia relativa 
de errores de medición. 
Sobre la confiabilidad de una prueba, se expresa como un número decimal 
positivo que fluctúa entre 0.00 y 1.00, donde 0.00 indica una falta absoluta de 
confiabilidad y 1.00 indica una confiabilidad perfecta (Aiken, 2003).  
Según Nunnly (1978, citado por Ursini, Sánchez y Orendain, 2004) refiere que el 
nivel satisfactorio de confiabilidad va depender del uso de la test, por ejemplo si 
el test se encuentra en la primera etapa, que es la construcción del mismo podría 
 
 
45 
 
ser suficiente lograr una confiabilidad mínima entre 0.50 a 0.60, pero se debe 
buscar una mayor consistencia, es decir 0.90 lo que implicaría mayores esfuerzos 
para su estandarización, siendo necesario aumentar el número de ítems.  
Cuando una prueba esta orientada a toma de decisiones importantes una 
confiabilidad mínima debería estar entre 0.90 a 0. 95. En cambio, Anastasi (1977, 
citado por Boccalandro, 2003) considera deseables los coeficientes entre 0,80 y 
0,90 en cambio para Kerlinger y Lee (2002, citado por Ursini, et.al., 2004) han 
establecido 0.70 como el límite entre confiabilidad aceptable y no aceptable. 
Igualmente, Muñiz (2003) tiene que sobrepasar como mínimo el 0,70  
Según Meyer et al., 2001 (Morris y Maisto, 2005) señalan que son confiables son 
las pruebas de inteligencia, porque en lo general las calificaciones de las personas 
en las pruebas de inteligencia son bastante estables. 
Las estimaciones de confiabilidad pueden ser de 2 tipos, una por consistencia 
externa que evalúa la estabilidad de la escala dentro de las administraciones; y por 
consistencia interna, las cuales se explicará a continuación.  
A. Consistencia interna 
La consistencia interna permite evaluar el grado en que los ítems de un test 
están correlacionados entre sí. Si los diferentes ítems de una prueba que tienen 
una correlación positiva y como mínimo una correlación moderada, equivaldría 
a tener una correlación entre 0,4 a 0,7; dicho test sería homogéneo.  
Es decir, sería homogéneo en la medida que exista consistencia en la ejecución 
de todos los reactivos de la prueba.  
 
 
 
46 
 
Un test de alto grado de consistencia interna que equivaldría a tener una 
correlación mayor a 0,70; que nos permite conocer cómo se desempeña una 
persona con respecto a un ítem y nos permitirá predecir como lo hará con los 
demás ítems.  
Se debe señalar que la estimación de la consistencia interna es el resultado de 
la correlación promedio entre los ítems, pero también está influenciado por el 
número de los reactivos.  
Si un coeficiente es muy bajo, entonces podríamos decir que el test es muy 
corto o los ítems tienen muy poco en común (Nunnally, 1991). 
Los procedimientos que desarrollaremos a continuación requieren una única 
aplicación del test, debido a ello son los más utilizados. Los procedimientos 
usuales de cálculo de la fiabilidad como consistencia interna son el división por 
mitades y homogeneidad (Martínez, et.al., 2014).  
La división por mitades, se realiza al dividir un test en dos mitades, estas deben 
ser equivalentes para garantizar una adecuada consistencia interna. El grado de 
equivalencia de las dos mitades se puede evaluar calculando la correlación 
entre las puntuaciones de los sujetos en estas dos mitades.  
Así, la correlación entre las puntuaciones de un grupo de sujetos en las dos 
mitades en las que podemos dividir un test será un indicador del grado de 
consistencia interna de este, y por lo tanto de su fiabilidad. 
Este es el principio en el que se basa el método de las dos mitades, que presenta 
la ventaja respecto a los métodos anteriores porque solo requiere una sola 
aplicación del test a una muestra de sujetos. 
 
 
47 
 
 
A la hora de decidir cómo realizar esta partición del test en dos mitades, se 
recomienda  divide el test en dos mitades, dejando los ítems pares en una mitad 
y los impares en la otra. Con este procedimiento se garantiza de manera más 
probable la equivalencia entre las dos mitades. 
Por Homogeneidad, es un método basado en la covariación entre los ítems, se 
basa en la consistencia de las puntuaciones a todos los reactivos de la prueba 
(Anastasi y Urbina, 1998). Si los ítems del instrumento correlacionan 
positivamente entre sí, éste será homogéneo.  
Por el contrario, la prueba será heterogénea si los reactivos no tienen una 
correlación positiva entre sí, aun cuando aparentemente estén midiendo el 
mismo rasgo. 
Podemos concluir que los coeficientes de homogeneidad (Brown, 1980) 
verifican la consistencia interna, comprobando la congruencia que cada ítem 
del test tiene con los restantes ítems. 
B. Consistencia externa: 
Evalúa la estabilidad del test dentro de las administraciones. Estos coeficientes 
de fiabilidad, se obtienen mediante un simple coeficiente de correlación, las 
cuales son el método test re-test, formas paralelas e inter evaluador. 
El método test re-test, es método que consiste en administrar un test en dos 
oportunidades a la misma muestra de sujetos, con un intervalo de tiempo entre 
las dos administraciones, y se calcula la correlación entre los puntajes 
obtenidos en la primera y segunda administración para comprobar el grado de 
 
 
48 
 
consistencia entre dos conjuntos de puntuaciones obtenidas 
independientemente.  
Son expresados en función de un coeficiente de correlación que expresa el 
grado de correspondencia o relación entre los dos conjuntos de puntuaciones 
(Anastasi y Urbina, 1998; citado por Tornimbeni, et. al, 2008). 
El método formas paralelas o también denominado formas equivalentes. 
Evaluar la consistencia interna al comprobar la estabilidad temporal de un 
conjunto de puntuaciones.  
El procedimiento básico consiste en administrar dos formas equivalentes de un 
test a un mismo grupo de individuos. En el caso de que este método se utilice 
para verificar la estabilidad, la administración de la segunda forma se realiza 
transcurrido un tiempo a partir de la administración de la primera forma, y 
posteriormente se correlacionan los resultados obtenidos. 
Según el APA, (1999, citado por Tornimbeni, et. al, 2008), para ser 
consideradas equivalentes, dos pruebas deben reunir ciertos requisitos, tales 
como tener las mismas características formales (cantidad de ítems, escala de 
respuesta, etc.) y estadísticas (tener medias y desviaciones estándar semejantes, 
coeficientes de correlación elevados entre ambas formas, etc.). 
El método Inter evaluador o llamado también estudios de concordancia, busca 
si un instrumento de medida es fiable (Argimon y Jiménez, 2004; citado por 
Livia y Ortiz, 2014).  
 
 
 
 
49 
 
Este tipo de confiabilidad consiste en la correlación de las puntuaciones de dos 
o más evaluadores que califican el mismo test o escala. También podemos decir 
que es el grado de concordancia entre los resultados de dos o más observadores 
independientes utilizando el mismo instrumento de medida en unos sujetos.  
 
 
50 
 
CAPÍTULO III 
MÉTODO 
3.1. Tipo de investigación 
El tipo de estudio corresponde al no experimental, porque se realizó sin manipular 
deliberadamente la variable inteligencia general. Se observó el fenómenos tal como 
se dio en su contexto natural, para analizarlo (The SAGE Glossary of the Social and 
Behavioral Sciences, 2009, citado por Hernández, Fernández, y Baptista, 2014). 
Asimismo, Kerlinger y Lee (2002, Hernández, Fernández, y Baptista, 2006) señalan 
que una investigación no experimental no se tiene control directo sobre las 
variables, ni se puede influir sobre ellas, porque ya sucedieron, al igual que sus 
efectos.  
3.2. Diseño de investigación 
El diseño es psicométrico según Montero y León (2007) por que estudia la validez 
y confiabilidad de la prueba de inteligencia G-36. 
3.3. Población 
La población estuvo conformada por 600 alumnos de ambos sexos que asistían a la 
academia pre universitario en el cercado de Lima 
3.4. Muestra 
La muestra fue no probabilística, seleccionándose con un tipo de muestreo por 
contingencia (Elorza, 2000). 
 
 
51 
 
La muestra estuvo conformada por 324 alumnos cuyas edades fluctúan entre 16 a 
31 años, siendo el promedio de edad del grupo de 18,84 y la moda de 17 años de 
los cuales el 63% fueron mujeres y el 37 % varones (Figura 1)   
 
Figura 1. Porcentaje de alumnos según género  
 
La edad de la muestra está conformada por 2 etapas de vida, adolescentes de 15 19 
años y adultos de 20 a 25 años (Ministerio de Salud del Perú, 2012). El mayor 
porcentaje de la muestra corresponde a los adolescentes (72%) y menor a los adultos 
(28%) (Tabla 3). 
Tabla 3 
Porcentaje y edad de la muestra. 
Edad N % 
15 - 19 años 234 72 
20 - 25 años 90 28 
Total 324 100 
 
 
203
63%
121
37%
Femenino
Masculino
 
 
52 
 
3.5. Técnica e instrumento de recolección de datos 
El instrumento de medición fue el G-36 que mide la inteligencia general.  El autor 
del instrumento es Boccalandro (2003), empleándose su quinta edición. El test se 
compone de 36 elementos con 6 alternativas de respuesta, teniendo una puntuación 
máxima de 36 puntos. La  prueba comprende las etapas de vida adolescentes o 
adultos, la forma de administración es grupal o individual, pudiendo ser el tiempo 
de administración hasta 45 minutos. 
La prueba presenta elementos en orden creciente de dificultad, que incluye el 
raciocinio por analogía y comprensión de la relación de identidad, analogía de tipo 
numérico con suma, resta y cambio de posición, y la analogía espacial con cambio 
de posición.  
En el año 2003, Boccalandro estudio la fiabilidad del test de inteligencia G36, en 
una muestra de 100 sujetos, compuesta por 75 del sexo masculino (75%) y 25 del 
sexo femenino (25%). Las edades de los sujetos fluctúan entre 16 y 66 años, con un 
edad promedio de 28,53 años. Además su grado de escolaridad, del 51% fue 
secundaria y el 49% fue superior.  
La fiabilidad fue obtenida por el método de consistencia interna, tipo mitades y 
homogeneidad. Por mitades, usaron la fórmula de Kuder-Richardon obteniendo un 
coeficiente de 0,823  y por homogeneidad emplearon la fórmula de Sperman-Brown 
obteniendo un coeficiente 0,825. Ambos resultados indican que la prueba posee un 
alto coeficiente de confiabilidad.  
 
 
 
 
53 
 
Boccalandro (2003), estudió la validez del test de inteligencia G36 en una muestra 
de 70 estudiantes, siendo 26 alumnos del sexo masculino (37,1%) y 44 alumnos del 
sexo femenino (62,9%). Las edades de los sujetos varían entre 17 y 48 años, con un 
edad promedio de 22,64 años.  
La validez de criterio tipo concurrente, fue obtenida al correlacionar con el test de 
Matrices Progresivas de Raven - Escala general. Donde la mitad de los sujetos 
realizó primero el test de inteligencia general G-36 y la otra mitad el Raven. 
El coeficiente de correlación de Pearson fue de 0,76 que indica que la correlación 
entre los resultados de los test es alta y estadísticamente significativa, por lo que 
podemos afirmar, que los dos test evalúan la misma variable. 
En el año 1966, el análisis de ítems se estudió en 500 candidatos, de los cuales 459 
fueron del sexo masculino (91%) y 41 fueron del sexo femenino (8,2%). Las edades 
de los sujetos varias  entre 14 a 45 años, siendo la edad el 70% de los candidatos 
entre 18 y 29 años. Para medir el grado de discriminación de cada ítem fue obtenido 
por el coeficiente de correlación punto-biserial que variaron de 0,17 hasta 0,67. 
Además,  16 ítems de los 36 ítems alcanzaron valores superiores al 0,51.  
La forma de plantear las preguntas se agrupan en 6 grupos, donde cada grupo tiene 
una dificultad mayor que el anterior, pero las dificultades fueron graduadas de tal 
forma que el problema inicial en cada grupo fuese de menor dificultad que el ítem 
precedente. Con eso se pretendía motivar a las personas que encuentran dificultades 
crecientes en el test a continuar respondiendo (Tabla 4). 
 
 
 
 
54 
 
Tabla 4 
Clasificación de los ítems de la prueba de inteligencia general G36. 
Categoría Inferencia Ítems 
A Comprensión de relación de identidad simple 1 y 2 
B 
Compresión de relación de identidad junto a un 
raciocinio por analogía 
3,4,6,8,12 
C 
Raciocinio por analogía envolviendo cambio 
de posición 
10,11,20,2,22,30,31 y 
32 
D 
Raciocinio por analogía de tipo numérico, 
suma y/o sustracción 
5,7,9,13,14,15,16,17,1
8,19,24,26,28,33,35 
E 
Raciocinio por analogía de tipo numérico 
envolviendo cambio de posición, suma y 
saturación 
23,25,27 y 36 
F 
Raciocinio por analogía de tipo espacial 
(descomponer un todo en sus partes, 
envolviendo cambio de posición) 
29 y 34 
 
3.6. Procedimiento 
Se coordinó con los encargados del centro pre universitario, acordando que la 
administración de los instrumentos seria en 2 sesiones  y en forma colectiva. Se 
evaluó la calidad de los instrumentos aplicados, procediéndose al análisis 
estadístico de los datos con el paquete estadístico SPSS versión 22.  
 
 
55 
 
CAPÍTULO IV 
RESULTADOS 
4.1. Análisis de ítem 
4.1.1. Índice de discriminación 
El test consta de 36 ítems, cuyos índice de discriminación (ID) fluctúan entre 
0,201 y 0,435. De los cuales, 2 ítems (ítem 22 y 30) están para eliminar debido a 
que su índice de discriminación está por debajo de 0,10. Asimismo, se encontró 
que 5 ítems (ítem 12, 13, 29, 35 y 36) debe ser modificado o eliminados del test, 
debido a que su índice de discriminación se encuentra entre 0,10 y 0,20 (tabla 5) 
Tabla 5 
Índice de discriminación de la prueba de inteligencia general G36. 
Ítems Media Varianza I.D. Categoría Ítems Media Varianza I.D. Categoría 
01 ,93 ,07 ,222 Baja 19 ,67 ,22 ,302 Aceptable 
02 ,94 ,05 ,219 Baja 20 ,56 ,25 ,411 Alta 
03 ,84 ,13 ,310 Aceptable 21 ,58 ,24 ,288 Baja 
04 ,92 ,07 ,201 Baja 22 ,07 ,07 -,113 Inaceptable 
05 ,86 ,12 ,222 Baja 23 ,31 ,21 ,216 Baja 
06 ,98 ,03 ,338 Aceptable 24 ,44 ,25 ,287 Baja 
07 ,88 ,11 ,370 Aceptable 25 ,48 ,25 ,224 Baja 
08 ,88 ,10 ,350 Aceptable 26 ,34 ,22 ,330 Aceptable 
09 ,85 ,13 ,341 Aceptable 27 ,28 ,20 ,220 Baja 
10 ,83 ,14 ,299 Baja 28 ,67 ,22 ,358 Aceptable 
11 ,70 ,21 ,382 Aceptable 29 ,09 ,08 ,169 Mala 
12 ,64 ,23 ,128 Mala 30 ,14 ,12 ,054 Inaceptable 
13 ,76 ,18 ,157 Mala 31 ,54 ,25 ,286 Baja 
14 ,85 ,12 ,289 Baja 32 ,44 ,25 ,319 Aceptable 
15 ,51 ,25 ,277 Baja 33 ,45 ,25 ,310 Aceptable 
16 ,45 ,25 ,263 Baja 34 ,29 ,21 ,279 Baja 
17 ,61 ,24 ,347 Aceptable 35 ,23 ,18 ,186 Mala 
18 ,67 ,22 ,435 Alta 36 ,13 ,11 ,157 Mala 
 
 
 
56 
 
 
En la figura 2 se observa los índices de dificultad de los ítems, donde se aprecia 
que el ítem 18 es el ítem que mejor discrimina y los ítem 22 y 30 deben ser 
eliminados. 
 
Figura 2. Índice de discriminación de la prueba de inteligencia general G36  
 
4.1.2. Índice de dificultad 
Se encontró que el índice de dificultad de los ítems presenta valores entre 0,94 y 
0,07. De los 36 ítems, el 19 % tienen categoría de muy fáciles, 25% medianamente 
fáciles, el 25% en regular, 20% en medianamente difíciles y 19% en muy difíciles 
(tabla 6) 
 
 
 
-0.20
-0.10
0.00
0.10
0.20
0.30
0.40
0.50
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35
Ín
d
ic
e
d
e 
d
is
cr
im
in
a
ci
ó
n
Ítems
 
 
57 
 
 
Tabla 6 
Índice de dificultad de la prueba de inteligencia general G36. 
Ítems Índice de dificultad Categoría 
01 ,93 Muy fácil 
02 ,94 Muy fácil 
03 ,84 Medianamente fácil 
04 ,92 Muy fácil 
05 ,86 Medianamente fácil 
06 ,98 Muy fácil 
07 ,88 Medianamente fácil 
08 ,88 Medianamente fácil 
09 ,85 Medianamente fácil 
10 ,83 Medianamente fácil 
11 ,70 Medianamente fácil 
12 ,64 Media 
13 ,76 Medianamente fácil 
14 ,85 Medianamente fácil 
15 ,51 Media 
16 ,45 Medianamente difícil 
17 ,61 Media 
18 ,67 Media 
19 ,67 Media 
20 ,56 Media 
21 ,58 Media 
22 ,07 Muy difícil 
23 ,31 Medianamente difícil 
24 ,44 Medianamente difícil 
25 ,48 Medianamente difícil 
26 ,34 Medianamente difícil 
27 ,28 Muy difícil 
28 ,67 Media 
29 ,09 Muy difícil 
30 ,14 Muy difícil 
31 ,54 Media 
32 ,44 Medianamente difícil 
33 ,45 Medianamente difícil 
34 ,29 Muy difícil 
35 ,23 Muy difícil 
36 ,13 Muy difícil 
 
 
 
58 
 
En la figura 3 se observa como se distribuyen los porcentajes entre las diversas 
categorías. 
 
Figura 3. Porcentaje del índice de dificultad según categorías de la prueba de 
inteligencia general G-36 
4.2. Validez psicométrica 
Se estudió la validez de criterio tipo concurrente. Se relacionó el test de inteligencia 
general G-36 con el test de inteligencia Beta III. Se encontró que su correlación es 
positiva y altamente significativa  (r = 0,367; p = 0,000), lo que evidencia  que 
ambos instrumentos miden el mismo constructo (tabla 7). 
Tabla 7 
Validez concurrente del Test de inteligencia general G36.  
 Test de inteligencia Beta 
 r Sig. 
Test de inteligencia G36 ,367 ,000 
 
 
19%
25% 25%
20%
19%
0
5
10
15
20
25
30
Muy fácil Medianamente
fácil
Media Medianamente
difícil
Muy difícil
P
o
rc
e
n
ta
je
Muy fácil Medianamente fácil Media Medianamente difícil Muy difícil
 
 
59 
 
4.3. Confiabilidad  
El test de inteligencia general G-36, fue analizado con el tipo de confiabilidad de 
consistencia interna por el método de homogeneidad, encontrándose que el 
coeficiente de confiabilidad alfa de Crombach obtuvo un valor mayor a 0,70 lo cual 
señala que el test presenta confiabilidad (tabla 8). 
Tabla 8 
Confiabilidad de consistencia interna de la prueba de inteligencia general G36. 
 
 
 
4.1. Baremos 
Se elaboró los baremos por percentiles, para toda la muestra en general debido a 
que no existen diferencias por grupo de estudio de acuerdo a edad o sexo (tabla 9) 
Tabla 9 
Diferenciación de grupo de acuerdo a sexo y edad 
Característica Categoría Media DE t p 
Sexo 
Femenino 20,68 5,107 
-,742 ,459 
Masculino 21,12 4,979 
Edad 
15 - 19 años 20,50 5,012 
-1,969 ,05 
20 - 25 años 21,73 5,090 
 
 
 
Coeficiente Valor 
Alfa de Crombach ,778 
 
 
60 
 
Los percentiles se clasificación en 3 categorías (tabla 10). 
Tabla 10 
Baremos en percentiles del Test de inteligencia general G36. 
Categorías  Percentiles Puntuación  
Bajo 25 0 - 18 
Promedio 50 19 – 23 
Alto 75 24 – a más  
 
Los percentiles por puntajes se encuentran en el anexo 1. 
  
 
 
61 
 
CAPÍTULO V 
DISCUSIÓN 
La inteligencia para Sternberg y Berg (1992), es la capacidad de adaptación que 
explica las diferencias que observamos entre las personas cuando éstas resuelven 
problemas, razonan y/o toman decisiones. 
Spearman (Morris y Maisto, 2005) advirtió que las personas que son brillantes en 
un área, a menudo destacan también en otras áreas. La persona inteligente entiende 
las cosas con rapidez, toma decisiones adecuadas, se enfrasca en conversaciones 
interesantes y tienden a comportarse de manera inteligente en diversas situaciones.  
En el presente estudio, se logró evidenciar que el test de inteligencia G-36 presenta 
las características psicométricas de validez y confiablidad.  
En relación a la validez, el ter de inteligencia G-36, obtuvo validez tipo concurrente 
al correlacionar con el test de inteligencia Beta III. Este resultado se confirma con 
otras investigaciones donde el test de inteligencia ha relacionado positivamente con 
el test R1-B (Dos Santos, Noronha y Fernandes, 2005). Asimismo, Livia (2014)  lo 
relaciona con el test Beta III obteniendo una correlación significativa. Así como, 
Canijas (2013) que relaciona el test Beta III con la batería de pruebas de raciocinio 
BPR – 5. 
Con relación a la confiabilidad  del test G-36 se encontró que presenta confiabilidad 
por consistencia interna, observándose resultados similares al estudio de Livia 
(2014) y Boccalandro (2003) donde muestran la confiabilidad del test.  
 
 
 
62 
 
Con respecto al análisis de ítems, el índice de discriminación, en nuestro estudio se 
encontró que los índices de discriminación de la prueba de inteligencia G-36 
fluctúan entre 0,201 a 0,435. 
Con respecto al análisis de ítems por el índice de dificultas. Se encontraron 5 
categorías, que varían de muy fáciles a muy difíciles, a diferencia del estudio de 
Livia (2014) que señala 3 categorías que son fáciles, media y difíciles. 
Asimismo, Backhof, et. al. (2000) señalan un determinado porcentaje de índice de 
dificultada para cada uno de las 5 categorías. El cual no se ha logrado demostrar en 
el presente estudio. 
Los baremos son expresados en percentiles, la categoría bajo los puntajes se 
encuentren entre 0 a 18, para la categoría promedio entre 19 y 23, finalmente para 
la categoría alto de 24 a más. 
5.1. Conclusiones 
● Los ítems del test presentan aceptables de discriminación y dificultad. 
● El test de inteligencia G-36 presenta confiabilidad por consistencia interna. 
● El test de inteligencia G-36 presenta validez de criterio tipo concurrente. 
● Se elaboraron los baremos por percentiles obteniendo 3 categorías. 
5.2. Recomendaciones 
● Aplicar la prueba en otras etapas de vida.  
● El estudio se realice con una muestra probabilística.  
● Complementar el estudio psicométrico con otros tipos de validez y 
confiabilidad. 
  
 
 
63 
 
Referencias 
Abab, F., Garrido, J., Olea, J. y Ponsoda, V. (2006) Introducción a la psicometría: Teoría 
clásica de los test y teoría de la respuesta al ítem. Universidad  Autónoma de 
Madrid 
Aiken, L. (2003) Test psicológicos y evaluación (Undécima edición). México: Person 
Education. 
Almeida, L., Guisande, M., Primi, R. y Lemos, G. (2008) Contribuciones del factor 
general y de los factores específicos en la relación entre inteligencia y rendimiento 
escolar. European Journal of Education and Psychology, 1 (3), pp 5-16 Recuperado 
de en http://www.redalyc.org/pdf/1293/129318720001.pdf 
Alvarado, J. y Santiesteban, C. (2006) Validez en la medición psicológica. España: 
UNED 
Anastasi, A. y Urbina, S. (1998) Test psicológicos. México: Prentice hall. 
Ardila, R (2010) Inteligencia. ¿Qué sabemos y qué nos falta por investigar?. Revista de 
la Academia Colombiana de Ciencias Exactas, Físicas y Naturales, 35 (134), pp 
87-103. Recuperado de 
http://www.scielo.org.co/pdf/racefn/v35n134/v35n134a09.pdf 
Backhof, E., Larrazolo, N. y Rosas, M. (2000) Nivel de dificultad y poder de 
discriminación del Examen de Habilidades y Conocimientos Básicos 
(EXHCOBA). Revista Electrónica de Investigación Educativa, 2 (1). Recuperado 
de http://redie.uabc.mx/redie/article/view/15/1145 
 
 
 
64 
 
Benatuil, D (2007) La inteligencia práctica como predictor del rendimiento exitoso de 
cadetes militares (Tesis doctoral, Universidad de Palermo). Recuperado de 
http://dspace.palermo.edu/dspace/bitstream/handle/10226/1287/Benatuil%20Deni
se%20Tesis.pdf;jsessionid=27D22B3C4BE3088CDFBBBCC99F138F62?sequenc
e=1 
Bueno, A. (2004) El programa de mejora de la inteligencia p.a.t. (pensamiento, 
aprendizaje y transferencia) y las transferencias al currículo. (Tesis doctoral). 
Universidad complutense de Madrid. Obtenido de 
http://biblioteca.ucm.es/tesis/edu/ucm-t28430.pdf  
Brown, F. (1980) Principios de la medición en psicología y educación. México: Manual 
Moderno.  
Boccalandro, E. (2003) G36: teste não-verbal de inteligência (5ta edición). São Paulo: 
Vetor. 
Cajigas, H. (2013) Propiedades psicométricas de la batería de pruebas de raciocinio bpr-
5 en estudiantes pre-universitarios de una entidad estatal de lima (Tesis de 
licenciatura), Universidad Nacional Federico Villarreal, Lima. 
Cohen, R. y Swerdlink, M. (2006), Pruebas y Evaluación Psicológicas (Sexta Edición). 
España: Editorial McGraw-Hill Interamericana. 
Craig, G. y Baucum. D. (2009) Desarrollo psicológico (9na Edición). México: Pearson 
educación. 
 
 
 
 
65 
 
Delgado, A., Escurra, L., Bulnes, M. y Quesada, R. (2001) Estudio psicométrico del test 
de Matrices Progresivas de Raven forma avanzada en estudiantes universitarios. 
Revista de Investigación en Psicología, 4, (2). Recuperado de 
http://www.researchgate.net/publication/266445599_ESTUDIO_PSICOMETRIC
O_DEL_TEST_DE_MATRICES_PROGRESIVAS_DE_RAVEN_FORMA_AV
ANZADA_EN_ESTUDIANTES_UNIVERSITARIOS 
Dos Santos, A., Boulhoca, A. y  Vendemiatto, B. (2009) Inteligência e compreensão em 
leitura de adolescentes em situação de risco social. Paradígma, 30, (2), pp. 113-
124. Recuperado de 
http://www.scielo.org.ve/scielo.php?script=sci_arttext&pid=S1011-
22512009000200008&lng=es&nrm=iso  
Dos Santos, A.; Noronha, A. y  Fernandes, F. (2005) Test de inteligencia Test Forma R1-
B y G36: evidencias de validez convergente Estudios de Psicología (Natal), 10(2), 
191-197. Recuperado de  
http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1413-
294X2005000200005&lng=en&tlng=en. 10.1590/S1413-294X2005000200005    
Elorza, H. (2000). Estadística para las Ciencias Sociales,  del comportamiento y de la 
salud (3ra edición). México: Cengage Learning. 
Escobar, J. y Cuervo, A. (2008) Validez de contenido y juicio de expertos: una 
aproximación a su utilización. Avances de medición, 6, 27-36 
Elosua, P (2003) Sobre la validez de los tests. Psicothema, 20 (2), 315-321. Recuperado 
http://www.psicothema.com/pdf/1063.pdf 
 
 
 
66 
 
Espinoza, M. (1999) Revisión del libro: Ciencia y política de la inteligencia en la sociedad 
moderna. Psicotema, 449 – 451 Recuperado 
http://www.psicothema.com/pdf/222.pdf  
Fernández, R. (1996) Introducción a la evaluación Psicológica. Madrid: Pirámide. 
Grant, J. y Davis, L. (1997). Selecion and use of content experts for instrument 
development. Forus on Quatitative Methods, 20 (3), 269-274 
Gonzáles, C. (2003) Factores determinantes del bajo rendimiento académico en 
educación secundaria. (Tesis doctoral). Universidad Computense de Madrid. 
Recuperado de http://biblioteca.ucm.es/tesis/edu/ucm-t27044.pdf  
Gonzáles, F. (2007) Instrumentos de evaluación psicológica. La Habana: Editorial 
Ciencias Médicas 
González,  Mª del Rosario, Aragón, L., y Silva, A. (2000) Baremación del test de 
inteligencia factor «G» de Cattell en la zona metropolitana de la ciudad de México. 
Psicothema, 12 (2), 275-278. Recuperado de 
http://www.psicothema.com/pdf/564.pdf  
Hernández, R., Fernández, C. y Baptista, M. (2006). Metodología de la investigación (4ta 
edición). México D. F.: Mc Graw Hill. 
Hernández, R., Fernández, C. y  Baptista, M. (2014) Metodología de la investigación (6ta 
edición). México D. F.: Mc Graw Hill. 
Hyrkas, K., Appelquist-Schmidlechner, K. y Oksa, L. (2003) Validating an instrument 
for clinical supervisión using an expert panel. International Joursal of Nursing 
Studies, 40, 619-625 
 
 
67 
 
Instituto Nacional de Salud Mental Honorio Delgado Hideyo Noguchi (2008). Base de 
Datos de Instrumentos de evaluación de Salud Mental y Psiquiatría. Anales de Salud 
Mental, 19(1), 17-21. 
Jay, R. y Swerdlik, M. (2006) Pruebas y evaluación psicológica. Introducción a las 
pruebas y a la medición. (Sexta edición) México: McGraw-Hill 
Livia, J. (2014). Validez de constructo y confiabilidad de una batería de pruebas de 
inteligencia en estudiantes de una universidad pública de Lima: una comparación 
entre la teoría clásica de los test y la teoría de respuesta al ítem. (Tesis inédita de 
doctorado en psicología), Universidad Nacional Federico Villarreal, Lima. 
Livia, J. y Ortiz, M. (1996). Los test psicológicos en el Perú: investigación, uso y abuso. 
Revista Psicología Actual, 8, 23–32. 
Livia, J. y Ortiz, M. (2014) Construcción de Pruebas psicométricas: Aplicaciones a las 
ciencias sociales y de la salud. Perú: Editorial universitaria 
López, (2009) Construcción y validación de una prueba para medir conocimientos 
matemáticos. Horizonte Pedagógico, 11 (1), 29-37. Recuperado de 
https://www.google.com.pe/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad
=rja&uact=8&ved=0ahUKEwjkz-
jG2pjWAhXHOCYKHRNtBAcQFgglMAA&url=https%3A%2F%2Fdialnet.uniri
oja.es%2Fdescarga%2Farticulo%2F4892966.pdf&usg=AFQjCNEA3i5QFkHz5v1
vPTabQJFdMS4uqw 
 
 
 
 
68 
 
Sánchez, M. (2006) Inteligencia emocional, inteligencia cognitiva y rendimiento 
académico en alumnos de la facultad de psicología. (Tesis de maestría). 
Universidad autónoma de Nuevo León. Recuperado de 
http://eprints.uanl.mx/1964/1/1020154717.PDF 
Sánchez, M. y Pirela, L. (2010) Propiedades psicométricas de la prueba de inteligencia 
Otis en estudiantes de Educación mención Orientación. Omnia, 16(1), 100-120. 
Obtenido de http://www.redalyc.org/articulo.oa?id=73715016006  
Rigo, D. y Donolo, D. (2013) Tres enfoques sobre inteligencia: un estudio con 
trabajadores manuales. Estudos de Psicologia (Campinas), 30(1), 39-48. Obtenido 
de http://www.scielo.br/pdf/estpsi/v30n1/05.pdf 
Papalia, D. y Olds, S. (2004). Psicología. México: McGraw-Hill Interamericana.  
Papalia, D., Wendkos, S. y Duckin, R. (2009). Psicología del desarrollo: De la infancia 
a la adolescencia (11 Edición). México: McGraw-Hill 
Prieto, D.; Inciarte, J.; Rincón, C. y Bonilla, E. (2008) Estudio del coeficiente emocional 
en estudiantes de medicina. Revista chilena de neuro-psiquiatría, 46 (1), 10-15. 
Recuperado de http://www.scielo.cl/pdf/rchnp/v46n1/art02.pdf 
Martínez, M. R., Hernández, M. J y Hernández, M. V (2014) Psicometría. Madrid: 
Alianza  
Meneses, J., Barrios, M., Bonillo, A., Cosculluela, A., Lozano, L.,  Turbany, J. y Valero, 
S. (2013) Psicometría. Barcelona: Editorial UOC 
Ministerio de Salud del Perú (2012) Modelo de Atención Integral de Salud. Recuperado 
de http://www.minsa.gob.pe/portal/servicios/susaludesprimero/mais/mais.asp 
 
 
69 
 
Morris, C. y Maisto, A. (2005). Introducción a la psicología. (Duodécima Edición) 
México: Pearson 
Montero, I., & León, O. (2007). A guide for naming research studies in Psychology. 
International Journal of Clinical and Health Psychology, 7, 847-862. 
Muñiz, J. (2003). Teoría Clásica de los Tests. Madrid: Pirámide. 
Muñiz, J. (2005)  La validez desde una óptica psicométrica. Jornadas en Internet sobre 
Teorías conductuales y Test psicológicos. España: Universidad de Sevilla 
Noronha, A. y Vendramini, C. (2003) Parâmetros Psicométricos: Estudo Comparativo 
entre Testes de Inteligência e de Personalidade. Psicologia: Reflexão e Crítica, 
16(1), 177-182. Recuperado de http://www.scielo.br/pdf/prc/v16n1/16809.pdf 
Nunnally, J (1991) Psychometrictheory. New York: McGraw-Hill 
Sternberg, R. y Berg, C (1992) Integracion cuantitativa. Definciones de intelgiencia: una 
comparación de los simposioas de 1921 y de 1986. En Sternberg, A. y Detterman, 
(Eds.) ¿Qué es la inteligencia? Enfoque actual su naturaleza y definición (185-
194). Madrid: Ediciones Pirámide 
Tornimbeni, S.; Pérez, E. y Olaz, F. (2008) Introducción a la psicometría. México: Paidos 
Ursini, S., Sánchez, G., y Orendain, M. (2004). Validación y confiabilidad de una escala 
de Actitudes hacia las Matemáticas y hacia las Matemáticas Enseñadas con 
Computadora. Educación Matemática, 16 (3), 59-78. Recuperado de 
http://www.redalyc.org/html/405/40516304/ 
Vargas, F. (2016) Reseña de libro: Construcción de pruebas psicométricas: aplicaciones 
a las ciencias sociales y de la salud. Revista Digital de Investigación en Docencia 
 
 
70 
 
Universitaria, 10, (2). Recuperado de 
http://www.scielo.org.pe/scielo.php?pid=S2223-
25162016000200009&script=sci_arttext 
Woolfolk, A (1999) Psicología educativa (Séptima edición). Barcelona: Pearson  
Woolfolk, A. (2006) Psicología educativa (Novena edición). México: Pearson educación 
  
 
 
71 
 
ANEXOS 
 
Baremos  del test de inteligencia G-36 
PD Percentil 
6 1 
8 1 
9 1 
10 1 
11 6 
12 6 
13 8 
14 11 
15 14 
16 17 
17 23 
18 30 
19 38 
20 43 
21 51 
22 58 
23 68 
24 76 
25 81 
26 88 
27 93 
28 97 
29 98 
30 99 
31 100 
 
 
 
 
 
 
 
 
72 
 
 
 
 
Test de inteligencia G-36 
 
  
Nombres ………………………………………………….. 
Apellidos …………………………………………………… 
Edad …………………………………………………… 
Sexo M F  
Fecha ……./ ……./ ……  
Centro de 
estudios 
…………………………………………………….. 
 
 
73 
 
 
 
 
74 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
  
 
 
75 
 
 
 
 
76 
 
 
 
 
77 
 
 
 
 
78 
 
 
 
 
79 
 
 
 
 
80 
 
 
 
 
81 
 
  
 
 
82 
 
 
 
 
83 
 
 
 
 
84 
 
 
 
 
85 
 
  
 
 
86 
 
 
 
 
87 
 
 
 
 
88 
 
 
 
 
89 
 
  
 
 
90 
 
  
 
 
91 
 
 
 
 
  
 
 
92 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
  
 
 
93 
 
 
 
 
94 
 
  
 
 
95 
 
 
 
 
96 
 
 
 
 
97 
 
 
 
 
98 
 
 
 
 
99 
 
  
 
 
100 
 
 
 
  
 
 
101 
 
  
 
 
102 
 
 
 
 
103 
 
 
 
  
 
 
104 
 
 
 
 
 
  
 
 
105 
 
 
 
 
106 
 
 
 
 
107 
 
  
 
 
108