+
Introducción a SPSS: Estadística descriptiva.
+ CONTENIDO DEL CURSO
GENERAL:
Potenciar la capacidad investigadora mediante el conocimiento y práctica de la estadística aplicada.
ESPECÍFICOS:
1. Inicializarse en el manejo de programas estadísticos.
2. Aprender a realizar análisis descriptivos univariados.
3. Crear tablas personalizadas.
4. Aprender a elaborar gráficos y personalizarlos.
2
+
3
1. Introducción al software estadístico: SPSS
+ Codificación de datos Celda sobre la que introducimos el dato
Vista de datos
4
Podemos ver el valor introducido
Vista de variables
Los datos se observan en la pantalla Vista de Datos de SPSS en una presentación muy similar a una hoja de cálculo clásica: -casos ocupan filas -variables ocupan columnas
+ Codificación de datos
1.Asignar un nombre y una etiqueta a la variable. 2.Identificar el tipo de variable. 3.Definir sus posibles valores y las etiquetas de los mismos. 4.Definir el o los valores perdidos. 5.Definir la medida de la variable.
Para crear y dar nombre a una nueva variable debemos completar los datos en Vista de Variables en SPSS.
Para introducir directamente los datos en SPSS deberán completarse, para cada variable los siguientes pasos:
5
+ Codificación de datos 1. Asignar 1.
un nombre y una etiqueta a la variable.
El nombre ha de ser breve como un código y la etiqueta es la descripción de esa variable. (NOTA: como definamos la variable por su etiqueta, así saldrá en los resultados)
2. Identificar 1.
el tipo de variable.
Los más usados son numérico y cadena.
3. Definir
sus posibles valores y las etiquetas de los mismos.
4. Definir 1.
Generalmente se usa el valor 99 o 999
5. Definir 1.
el o los valores perdidos. la medida de la variable.
Escala/Ordinal/Nominal.
6
+ Codificación de datos Asignar tipo de variable.
7
+ Codificación de datos Asignar valores a las variables cualitativas
8
+ Codificación de datos Valores perdidos
Introducimos el valor y le damos a aceptar
9
+ Codificación de datos Definir la medida de la variable
10
+ Elementos básicos de la barra de menú
ARCHIVO: Abrir, guardar e imprimir datos.
EDICIÓN: Modificar, cortar, pegar y buscar cadenas de caracteres en el editor de datos.
DATOS: Operaciones relativas a la administración de variables y ficheros de datos, definir variables, seleccionar un conjunto de observaciones, unir ficheros de datos, segmentar archivos de datos, etc.
TRANSFORMAR: Creación y transformación de variables.
ANALIZAR: Acceso a los procedimientos estadísticos.
GRÁFICOS: Acceso a los procedimientos gráficos.
11
+ Elementos básicos de la barra de menú
ARCHIVO: podemos abrir DATOS (.sav) o RESULTADOS (.spv)
12
+ Elementos básicos de la barra de menú
ARCHIVO: guardar como…
13
+ Práctica 1
PASOS:
Definir todas nuestras variables en “vista de variables”.
Crear una variable que se llame código o identificador.
Introducir para cada fila (que identifica a cada participante) todos los valores que ha obtenido en la prueba (a través de las columnas).
14
+ Práctica 1
Utiliza el cuestionario entregado.
Crea las variables correspondientes y codifica a los 10 sujetos que han respondido.
15
+ Elementos básicos de la barra de menú: Fundir archivos
16
DATOS: fundir archivos (añadir casos/variables)
- Añadir casos: es necesario que contemos con el mismo número de variables, y que éstas estén codificadas igual.
+ Práctica 2. fundir las bases de datos – añadir casos
Funde las matrices:
De tus compañeros en un único fichero.
17
+ Elementos básicos de la barra de menú: Seleccionar casos
DATOS: seleccionar casos
18
+ Elementos básicos de la barra de menú: Seleccionar casos
19
DATOS: seleccionar casos
Podemos descartar los casos no seleccionados/copiar en otro fichero No aconsejable eliminar!
+ Elementos básicos de la barra de menú: Dividir archivo
20
DATOS: segmentar archivos…
Podemos usar dos opciones: Comparar los grupos u organizar los resultados. La 1ª opción presenta los resultados en una misma tabla, la 2ª en diferentes tablas.
+Elementos básicos de la barra de
21
menú: calcular/recodificar variable
TRANSFORMAR: calcular variable, recodificación de las variables…
Con la opción “calcular variable” creamos nuevas variables a partir de la suma, resta, media, etc. De las variables ya existentes. Con la opción “recodificar en las mismas variables” reordenamos la información en las variables ya creadas; si queremos conservar la variable original, emplearemos “recodificar en distintas variables”.
+Elementos básicos de la barra de menú: calcular variable
Introducimos en “variable de destino” el nombre de la nueva variable. En “expresión numérica” empleamos la función que necesitemos.
22
+ Elementos básicos de la barra de menú: calcular variable
Algunas funciones útiles:
$Casenum: te crea una variable con tantos números como filas tenga tu fichero.
Ln: devuelve el logaritmo natural de la variable introducida.
MEAN: devuelve la media de un conjunto de ítem (es necesario un número mayor o igual a 2 ítems).
Ej. MEAN (item1,item2,item3)
SUM: devuelve la suma de las puntuaciones en los ítems seleccionados.
Ej. SUM (item1,item2,item3)
23
+Elementos básicos de la barra de menú: Recodificar variable
Seleccionamos la variable que vamos a recodificar. Posteriormente, recodificamos indicando el “valor antiguo” y el “valor nuevo”.
24
+Elementos básicos de la barra de menú: Recodificar variable
Elegimos la variable que vamos a recodificar y asignamos un nuevo nombre. Pinchamos sobre “valores antiguos y nuevos” e introducimos los cambios
25
+ Elementos básicos de la barra de menú: Recodificar variable
1.Introducimos la/s variable/s en el cuadrado “Variable->Nuevo nombre”. 2. En “Nuevo nombre” indicamos como llamaremos a la vv recodificada. 3. Damos a “aceptar”.
26
+ HERRAMIENTAS HABITUALES QUE SE EMPLEAN EN SPSS (resumen) TRANSFORMAR VARIABLES
CALCULAR NUEVAS VARIABLES
FILTRAR CASOS
FUNDIR ARCHIVOS
Todos estos recursos los hemos visto detenidamente en los pasos previos.
27
+ OTRAS HERRAMIENTAS QUE PODRÍAMOS USAR
ELIMINAR E INSERTAR CASOS Y VARIABLES
ORDENAR Y TRASPONER DATOS
IMPORTAR DATOS DESDE EXCEL (lo veremos cuando tratemos el apartado sobre excel. Pero es una utilidad más!!)
28
+Eliminar e insertar casos y variables Insertar casos Insertar variable Para eliminar variables basta con pulsar sobre el nombre de la variable y presionar “delete”.
29
+Ordenar datos
30
+Trasponer datos Seleccionamos las variables que vamos a trasponer y las introducimos
El resultado es una BBDD invertida
31
+Práctica 3: herramientas básicas de SPSS
Abrir archivo de SPSS Generado en el curso.
Guardar con el nombre que elijáis. Tened en cuenta que podéis anotar la fecha de creación al final por si trabajáis con versiones distintas en un futuro.
Funde las matrices generadas por tus compañeros en un archivo único.
Calcula: Sumatorio de todos los ítems (desde autoestima 1autoestima 10.) Media de todos los ítems (desde autoestima 1autoestima 10.)
Recodifica la variable edad - creando 3 grupos de edades. Decidir los grupos.
Realiza una recodificación automática de la ciudad, para convertirla de cadena a numérica.
32
+
33
2. Análisis descriptivos univariados y sus gráficos. Y cómo exportarlos a otro formato…
+ Obtener tablas de frecuencias
34
+
35
Dejamos marcada la opción por defecto: Mostrar tablas de frecuencias. Estas tablas nos permitirán hacer un primer Análisis Exploratorio de los datos para detectar si existen posibles datos erróneos o atípicos.
+ Aprende a Exportar tus resultados
1.Selecciona las tablas que quieres exportar y con el botón derecho del ratón clickea sobre las tablas. 2. Elige Exportar…
36
+ Aprende a Exportar tus resultados Selecciona el Tipo de archivo al que quieres exportar el resultado. Indica en “nombre del archivo” el nombre y ubicación donde deseas guardar el resultado. Pulsa “aceptar”
37
+ Práctica 4: Tablas de frecuencias y exportación de resultados.
Pide tablas de frecuencias de todas las variables.
Obtén tablas de frecuencias, empleando la herramienta división – segmentar el archivo: Autoestima media en función del: sexo, los grupos de edad, y el nivel educativo.
Exporta tus resultados a un fichero PDF.
38
+
Fases del análisis estadístico
39
+Análisis estadístico unidimensional o descriptivo
OBJETIVO: Una vez organizados los datos, se debe realizar una análisis estadístico gráfico y numérico de las variables del problema con el fin de tener una idea inicial de la información contenida en el conjunto de datos así como detectar la existencia de posibles errores en la codificación de los mismos.
El tipo de análisis a realizar depende de la escala de medida de la variable analizada.
40
+ANÁLISIS ESTADÍSTICO UNIDIMENSIONAL
41
Medidas Descriptivas Numéricas y Representaciones Graficas Escala de medida
Representaci Medida de ón gráfica tendencia central
Medida de dispersión
Nominal
Diagrama de barras Diagrama de líneas Diagrama de sectores
Moda
Ordinal
Boxplot
Mediana
Rango intercuartílico
Intervalo o Razón
Histogramas Polígono de frecuencias
Media
Desviación típica
Procedimien to de SPSS Frecuencias. Tablas
Descriptivos. Explorar. Tablas
+ Estadísticos descriptivos
Medidas de tendencia central:
Media aritmética
Media ponderada
Mediana
Moda
- Se deja influir mucho por los valores extremos de la distribución. - Se suman todos los valores y se divide por el número total de individuos.
Medidas de dispersión:
Varianza
Desviación estándar
Coeficiente de variación
Medidas de posición:
Cuantiles
Percentiles
-No se deja influir mucho por los valores extremos de la distribución. - Coincide con el valor central del conjunto ordenado de observaciones que deja por debajo y por encima a la mitad de las observaciones realizadas. - Se debe utilizar siempre en dos casos: - Bajo tamaño muestral y/o - Cuando existen observaciones extremas (periféricos)
Medidas de forma:
Asimetría
Curtosis o apuntamiento
- Se debe representar como media (desviación estándar), y NO como media ± desviación estándar. - Su magnitud SI depende de las unidades de medida de la variable. NO permite la comparación directa de la dispersión de varias variables.
42
+ANÁLISIS ESTADÍSTICO UNIDIMENSIONAL.
Variable cualitativa
43
+
Ejemplo
44
+ANÁLISIS ESTADÍSTICO UNIDIMENSIONAL.
Variable cuantitativa
45
+ Ejemplo
46
Si la variable es continua o discreta con un elevado número de valores distintos se representa mediante histogramas, diagramas de tallos y hojas y boxplots para estudiar la forma de la distribución.
+ Práctica 5: Análisis Descriptivos
Realiza todos los descriptivos y gráficos apropiados para las variables del estudio.
47
+ Personaliza tus gráficos
Haciendo doble click sobre el gráfico podemos personalizar sus funciones.
Algunas cuestiones interesantes:
Insertar el valor de la frecuencia o recuento en el gráfico.
Añadir un título.
Cambiar la escala del gráfico.
Insertar una anotación.
48
+
49
+
50
Seleccionamos el símbolo “diana” y clickamos con él sobre las columnas del gráfico.
+
51
+
52
+
53
+ ¿Qué otras cosas podemos hacer con nuestros gráficos?
Podrás cambiar la letra o el color de tu gráfico para que se aplique a todos
54
+ Práctica 6. Gráficos
Elabora/recupera los gráficos apropiados para las variables de estudio.
Por cada gráfico: 1) Añádele un titulo apropiado; 2) Insértale los valores al interior del gráfico.
55
+
56
Normalidad de una variable
+ *Patrones más frecuentes de histogramas*
(a) y (b) son simétricas alrededor de un valor central. (a) presenta un único máximo – unimodal – que coincide las medidas de tendencia central.
(b) tiene dos máximos o modas – uno a cada lado del centro de simetría – . Este patrón aparece cuando los datos responden a una mezcla de dos grupos heterogéneos y, siempre que sea posible, conviene estudiar ambos grupos por separado.
(c) y (d) se denominan asimétrica a la derecha y a la izquierda, e indican la presencia de un número significativo de valores muy altos (c) y bajos (d) susceptibles de distorsionar los resultados de análisis estadísticos posteriores.
57
Puede tener valores anormalmente altos y bajos en ambas colas de la distribución que puedan distorsionar los resultados de un análisis estadístico. Para detectarlo: coeficiente de curtosis; si es muy elevada indica que sus colas son "muy pesadas" y hay riesgo.
+ *Estudio de la normalidad de las variables*
Muchos métodos estadísticos se basan en la hipótesis de normalidad de la variable objeto de estudio.
Incluso aunque las muestras grandes tiendan a disminuir los efectos perniciosos de la no normalidad, se debe evaluar la normalidad de todas las variables incluidas en el análisis.
MÉTODOS:
Métodos gráficos:
Contrastes de hipótesis.
58
+ *Normalidad. Métodos gráficos*
Histograma. Muy simple, pero es problemático en muestras pequeñas (puede distorsionarse la representación visual).
Diagramas de cuantiles (Q-Q plots). Los cuantiles muestrales (eje X) se comparan con los cuantiles esperados bajo la hipótesis normalidad. Si la distribución es normal dichos diagramas tenderán a ser rectas que pasan por el origen. Cuanto más se desvíen de la recta menos normales serán los datos.
59
+ *Normalidad. Métodos gráficos*
60
+
61
*Normalidad. Contraste de hipótesis*
NORMALIDAD Sig. (p) ≥ .05. N > 30
N < 30
+ *Normalidad de una variable*
62
- El 100% de los valores deben estar por encima y por debajo de 3 veces la desviación estándar (s) (valores entre X ± 3 s). Cuando existe una asimetría y una curtosis perfectas, sus valores serán 0. -La distribución debe ser SIMÉTRICA. La asimetría en valor absoluto debe ser menor que 2 veces su error estándar. - La distribución debe ser MESOCÚRTICA. La curtois en valor absoluto debe ser menor que 2 veces su error estándar .
+ *Normalidad de una variable*
63
+
64
*Transformaciones para lograr la normalidad*
En ocasiones, la falta de normalidad de una variable puede solucionarse mediante una transformación de la misma; aunque no siempre. En ocasiones, la falta de normalidad va ligada a un problema de heterocedasticidad. En estos casos una transformación útil es la transformación de BoxCox.
( X máx 1) X i Xi
log10 X i
1 Xi
log10 X máx 1 X i
1
X máx 1 X i
Forma de la distribución
Transformación aconsejada
Platicurtosis
X2
+ Práctica 7. Análisis de la Normalidad
Analiza los estadísticos descriptivos unidimensionales y la normalidad de las variables que has codificado a partir del cuestionario.
65
+
66
3. Tablas personalizadas
+ ¿Cuándo usarlas?
Esta herramienta de SPSS te permite crear tablas simples o combinadas en las que podrás elegir qué información quieres mostrar o resaltar.
Principalmente, nos facilita el resumen de variables objeto de nuestro interés.
67
+ ¿Cómo hacerlas?
68
+
69
Desplazamos las variables de interés a filas y/o columnas en función de nuestro objetivo. Seleccionamos: Estadísticos de resumen para elegir la información que queremos mostrar en la tabla
+
70
Este sería un ejemplo cuantitativo; podría ser interesante añadir cualquier información extra a partir de la columna de la izquierda, Estadísticos.
+
Un segundo ejemplo posible, con cruces cualitativos
71
+
Este sería un ejemplo cualitativo. Podemos cambiar el formato de presentación de los datos, para que cumpla con algún formato previo, tipo APA.
72
+ ¿Y personalizar mis tablas para que me las dé en formato APA?
Elige el formato “academic”
73
+ Práctica 8. Crea una tabla personalizada
Indica para todos los ítems del cuestionario de “Autoestima de Rosenberg” su valor medio, y desviación típica, en función del sexo.
74
+
75
4. Trabajar con Excel
+ TRABAJAR CON EXCEL
RECOMENDACIONES:
Limita al máximo el uso de letras, y trabaja todo lo que puedas con números.
Crea un fichero en word en el que definas tus variables y los números que has usado para tus categorías (por ejemplo, 0 hombre, 1 mujer).
Comprueba que usas las COLUMNAS para las variables, y las FILAS para los sujetos.
76
+ Ejemplo de hoja de Excel
77
+ Utilidades de Excel
Uno de los motivos por los que arrasa EXCEL es por su facilidad de uso.
En un mismo documento de excel podemos tener varias hojas, y relacionar los datos de todas ellas.
Podemos crear fórmulas o emplear las funciones que el programa trae.
Excel funciona con celdas, definidas por una letra y un número. Por ejemplo A1, indica la primera fila de la columna A.
78
+ Funciones básicas de excel
Para insertar una fórmula, nos ponemos sobre una celda (ejemplo, D2).
Cualquier fórmula/función debe estar precedida del símbolo “=“.
Ej. “= A1+A2” celdas.
Símbolos básicos:
Esta fórmula nos permite sumar dos
Para sumar (+)
Para restar (–)
Para multiplicar (*)
Para dividir (/)
Para elevar al cuadrado (^)
79
+ Ejemplo
80
Al igual que la suma, podemos emplear el resto de símbolos vistos anteriormente. Nos ponemos sobre la celda D2, insertamos =, y nos ponemos sobre las celdas que vamos a sumar, A2+B2.
+ Copiar y pegar en Excel
La opción copiar y pegar nos permite arrastrar esa fórmula de modo constante.
Para copiar, pulsamos el botón derecho del ratón, elegimos copiar y pegamos sobre la celda que deseemos arrastras la fórmula.
Por ejemplo:
Si tenemos A3 = A1+A2
COPIAMOS
PEGAMOS EN B3
Tendremos que B3 = B1+B2
¿CÓMO FIJAR CELDAS? Con el símbolo $
Por ejemplo: $A$1
81
+ Uso de fórmulas de Excel --> Formulas/insertar
82
+ Tipos de fórmulas en Excel
Las que más usaremos serán las de:
Bases de datos.
Estadísticas
Matemáticas y trigonométricas
83
+ Funciones de bases de datos
84
+Algunas funciones estadísticas
85
+ Algunas funciones matemáticas
POTENCIA = Devuelve el resultado de elevar un número a una potencia. RAIZ = Devuelve la raíz cuadrada positiva de un número. SUMA = Suma sus argumentos.
86
+ Gráficos con Excel
Excel te permite hacer gráficos de barras, de sectores, de dispersión, etc.
87
+ Crear gráficos con Excel
Los gráficos en excel se crean a partir de una estructura de datos ordenadas a interés del investigador/a.
Posteriormente, se seleccionará la opción “gráfico” y elegiremos el gráfico desea.
Cuando ya lo obtengamos, podremos visualizar diferentes opciones del mismo gráfico para el mismo conjunto de datos, en diseño rápido de gráficos.
Veamos algunos ejemplos…
88
+ Gráfico de sectores
89
1. Organizamos los datos y los seleccionamos
2. Marcamos gráficos y elegimos el gráfico “circular” 3. Una vez obtenido el gráfico, lo personalizamos con “diseño rápido de gráfico”
+ Gráfico de columnas
En excel, el gráfico que habitualmente llamamos de barras se llama “gráfico de columnas”. El gráfico de barras es el gráfico invertido del “gráfico de columnas”.
1. Seleccionamos la información a representar.
2. En gráficos elegimos “gráfico de columnas”.
90
+ Gráficos de columnas para dos grupos
El procedimiento es exactamente igual que para los grupos anteriores.
Debemos prestar atención a la forma de organizar los datos cuando trabajamos con información para dos o más grupos:
91
+ Gráficos de líneas para dos grupos
Este gráfico es muy interesante para mostrar medias en variables medidas en varios momentos temporales.
Debemos prestar atención a la forma de organizar los datos cuando trabajamos con información para dos o más grupos:
92
+ Práctica 9: Crear gráficos en excel
Selecciona a partir de las tablas de frecuencias de SPSS la información que desees representar usando Excel (ejemplo, sexo, nivel educativo, medias en autoestima en función del sexo, etc.).
Elabora:
Gráfico de sectores.
Gráfico de columnas.
93
+ Importar datos desde Excel Si el nombre de las variables están incluidas, indicarlo
Al pulsar ACEPTAR, automáticamente cargara dicha matriz de datos en el editor de datos de SPSS.
94
+ Importar datos desde Excel
Recuerda que la hoja de Excel debe:
Cada fila debe de representar un caso y cada columna una variable.
No debe haber espacios en blanco, ni deberán aparecer más tablas de datos en la hoja que vamos a leer.
En la primera fila aparecerá el nombre de cada variable (una por columna).
La hoja de cálculo deberá de estar cerrada para exportarla.
95
+ Práctica 10: Importa un Excel
Importar el archivo de excel “Ejemplo matriz excel” a SPSS
Define las variables en SPSS, si fuera necesario.
96
+
97
Gracias por vuestra asistencia Datos de contacto: Email:
[email protected] Teléfono: 664319707 Web: www.metodik.es