41
ESTADÍSTICA ESCUELA: NOMBRES: Informática Ing. Gabriela Correa Mena BIMESTRE: Segundo Abril Agosto 2011

ESTADISTICA (II Bimestre Abril agosto 2011)

Embed Size (px)

DESCRIPTION

Universidad Técnica Particular de Loja Ciclo Académico Abril Agosto 2011 Carrera: Ciencias de la Computación Docente: Ing. Ana Gabriela Correa Ciclo: Tercero Bimestre: Segundo

Citation preview

Page 1: ESTADISTICA  (II Bimestre Abril agosto 2011)

ESTADÍSTICA

ESCUELA:

NOMBRES:

Informática

Ing. Gabriela Correa Mena

BIMESTRE: Segundo

Abril Agosto 2011

Page 2: ESTADISTICA  (II Bimestre Abril agosto 2011)

CONTENIDO

• UNIDAD 5: Muestreo

• UNIDAD 6: Prueba de hipótesis para dos muestras

• UNIDAD 7: Análisis de varianza

• UNIDAD 8: Métodos no paramétricos ji cuadrada

• UNIDAD 9: Correlación y regresión lineal

Page 3: ESTADISTICA  (II Bimestre Abril agosto 2011)

UNIDAD 5

MUESTREO

Page 4: ESTADISTICA  (II Bimestre Abril agosto 2011)

Herramienta para inferir algo sobre una población

Muestreo

- Entrar en contacto con todos los miembros de la población consumedemasiado tiempo

- El costo de estudiar a todos los elementos de la población es muy alto

- Resulta imposible verificar y localizar a todos los miembros de la población

- Algunas pruebas resultan negativas

Razones para muestrear:

Page 5: ESTADISTICA  (II Bimestre Abril agosto 2011)

• Media poblacional• Valores de la población (X)• Número de elementos de la población (N)

• Total de muestras• Fórmula de Combinación (C)

Aspectos a considerar

Distribución muestral de la Media

Organiza las medias de todas las muestras en una distribución de probabilidad

Media de la población = Media de la distribución muestral de la media

Page 6: ESTADISTICA  (II Bimestre Abril agosto 2011)

Ejemplo: Cierta empresa cuenta con 4 empleados deproducción (a quienes se les considera la población). En latabla siguiente se incluyen los ingresos por hora de cadaempleado.

Empleado Ingreso por hora

José 3

Arturo 1

María 4

Rosa 8

a. Media de la población

Page 7: ESTADISTICA  (II Bimestre Abril agosto 2011)

b. Distribución muestral de la media paramuestras de tamaño 2

Total de muestras:

N= 4n = 2

Page 8: ESTADISTICA  (II Bimestre Abril agosto 2011)

Empleado Ingreso por hora

José 3

Arturo 1

María 4

Rosa 8

Page 9: ESTADISTICA  (II Bimestre Abril agosto 2011)

Media muestral – Distribución de probabilidad

Page 10: ESTADISTICA  (II Bimestre Abril agosto 2011)

c. Media de la distribución muestral de la media

Page 11: ESTADISTICA  (II Bimestre Abril agosto 2011)

Comparar

La dispersión de la distribución muestral de las medias esmenor que la dispersión de los valores de la población

Page 12: ESTADISTICA  (II Bimestre Abril agosto 2011)

Comparar

La dispersión de la distribución muestral de las medias esmenor que la dispersión de los valores de la población

Page 13: ESTADISTICA  (II Bimestre Abril agosto 2011)

Preguntas Objetivas

( ) La media de las medias de lasmuestras es exactamente igual a lamedia de la población

( ) La dispersión de la distribuciónmuestral de la media es más estrechaque la distribución poblacional

Page 14: ESTADISTICA  (II Bimestre Abril agosto 2011)

UNIDAD 6

PRUEBA DE HIPOTESIS PARA DOS MUESTRAS

Page 15: ESTADISTICA  (II Bimestre Abril agosto 2011)

Afirmación relativa a un parámetro de lapoblación sujeta a verificación

Hipótesis

Se establecen las hipótesis nula (H0) y alternativa (H1)

Se selecciona un nivel de

significancia (α)

Se identifica el estadístico de

prueba

Se formula una

regla para tomar

decisiones

Se toma una muestra, se llega

a una decisión

No se rechaza H0Se rechaza H0

Se acepta H1

Procedimiento para probar una hipótesis

Page 16: ESTADISTICA  (II Bimestre Abril agosto 2011)

Formule hipótesis nula (H0) y alternativa (H1)

Ejemplo (pag 371): Los clientes de un supermercado tienen laopción de pagar en una caja registradora normal operada por uncajero o emplear un nuevo procedimiento llamado U-Scan. Lagerente necesita saber si el tiempo medio de pago con el método

tradicional es mayor que con U-scan.

Tipo Cliente Media Muestral

Desviación estándar de la

población

Tamaño de la muestra

Tradicional 5.50 min 0.40 min 50

U-Scan 5.30 min 0.30 min 100

Page 17: ESTADISTICA  (II Bimestre Abril agosto 2011)

Determine el estadístico de prueba

Seleccione el nivel de significancia (α)

Debido a que se conoce las desviaciones estándar se emplea el estadístico Z

Formule una regla de decisión

Page 18: ESTADISTICA  (II Bimestre Abril agosto 2011)

Tome la decisión respecto de H0 e interprete el resultado

13.3064.0

2.0

100

30.0

50

40.0

3.55.5

22

22

u

u

s

s

us

nn

XXz

Se rechaza H0, el método U-scan es mas rápido

Page 19: ESTADISTICA  (II Bimestre Abril agosto 2011)

UNIDAD 7

ANÁLISIS DE VARIANZA

Page 20: ESTADISTICA  (II Bimestre Abril agosto 2011)

Distribución F

Continua

No puede ser

negativos

Tiene sesgo

positivo

Esasintótica

Comparar si dos muestras que provienen de diferentes poblaciones tienen varianzas iguales

Comparar varias medias poblaciones en forma simultanea (ANOVA)

Page 21: ESTADISTICA  (II Bimestre Abril agosto 2011)

Tabla ANOVAFuente devariación

Suma de cuadrados

Grados de libertad

Media cuadrática F

Tratamiento

Aleatorio -Error

Total

Análisis de la varianza (ANOVA)

Poblaciones

Independientes

Igual desviación estándar σ

Page 22: ESTADISTICA  (II Bimestre Abril agosto 2011)

Ejemplo: Citrus Clean es un nuevo limpiador multiusos a

prueba en el mercado, y se han colocado exhibidores en treslugares distintos dentro de varios supermercados. A continuaciónse reporta la cantidad de botellas de 12onzas vendidas en cadalugar del supermercado

Cerca del pan 18 14 19 17

Cerca de las cervezas 12 18 10 16

Cerca de otros limpiadores 26 28 30 32

Con un nivel de significancia de 0.05. ¿Hay alguna diferencia en elnúmero medio de botellas vendidas en los tres lugares?

Page 23: ESTADISTICA  (II Bimestre Abril agosto 2011)

a. Formule la hipótesis nula y alternativaEl número medio de botellas vendido en los tres lugares es el

mismoH0 : µ1 = µ2 = µ3H1 : Número medio de botellas vendido no es el mismo

b. Regla de decisión

Grados de libertad en el numerador : k - 1 = 3 - 1 = 2

Grados de libertad en el denominador: n - k = 12 - 3 = 9Apéndice B.4 pag. 7884.26Rechaza H0 si F > 4.26

Page 24: ESTADISTICA  (II Bimestre Abril agosto 2011)

c. Calcule los valores de SS total

• X cada observación de la muestra

• media global total

d. Calcule los valores de SSE

• X cada observación de la muestra

• media muestral para el tratamiento c

Page 25: ESTADISTICA  (II Bimestre Abril agosto 2011)

d. Calcule los valores de SSECerca del pan Cerca de las cervezas Cerca de otros limpiadores

18 12 26

14 18 28

19 10 30

17 16 32

17 14 29

Page 26: ESTADISTICA  (II Bimestre Abril agosto 2011)

d. Calcule los valores de SST

e. Elabore una tabla ANOVA

Fuente devariación

Suma de cuadrados

Grados de libertad

Media cuadrática F

Tratamiento SST= 504 k – 1 = 2 SST/( k - 1)= 25230.65Aleatorio -Error SSE=74 n – k = 9 SSE/(n - k) = 8.22

Total SST=578 11

Conclusión:H0 se rechazo debido a que F > 4.26Hay una diferencia en el número medio de botellas vendidas en lasdistintas ubicaciones

Page 27: ESTADISTICA  (II Bimestre Abril agosto 2011)

UNIDAD VIII

MÉTODOS NO PARAMÉTRICOSJI CUADRADO

Page 28: ESTADISTICA  (II Bimestre Abril agosto 2011)

Nunca negativo

Tiene sesgo positivo

Existe una familia de

distribuciones de ji cuadradas

(k – 1 )

La distribución se aproxima a distribución

normal

Características distribución ji cuadrada

Page 29: ESTADISTICA  (II Bimestre Abril agosto 2011)

Estadístico de prueba ji cuadrado

• fo frecuencia observada en una categoría en particular

• fe frecuencia esperada en una categoría en particular

Prueba de bondad de ajuste

Comparar una distribución observada con una distribuciónesperada

Page 30: ESTADISTICA  (II Bimestre Abril agosto 2011)

Prueba de bondad de ajuste: fe iguales

Ejemplo: La directora de recursos humanos de una empresa,

está preocupada por el ausentismo entre los trabajadores por hora,por lo que decide tomar una muestra de los registros de lacompañía y determinar si el ausentismo está distribuido de manerauniforme en toda la semana de seis días. Las hipótesis son:

H0: El ausentismo está distribuido de manera uniforme en todala semana de trabajo

H1: Es ausentismo no está distribuido de manera uniforme entoda la semana de trabajo

Page 31: ESTADISTICA  (II Bimestre Abril agosto 2011)

Los resultados de la muestra son

Día Número de ausencias

Lunes 12

Martes 9

Miércoles 11

Jueves 10

Viernes 9

Sábado 9

a. ¿Cómo se denominan los números 12,9,11,10,9,9 ycuántas celdas o categorías hay?

Frecuencias observadas y hay seis celdas (días de la semana)

Page 32: ESTADISTICA  (II Bimestre Abril agosto 2011)

Día Número de ausencias

Lunes 12

Martes 9

Miércoles 11

Jueves 10

Viernes 9

Sábado 9

fe 60/6=10

b. ¿Cuál es la frecuencia esperada para cada día?

c. ¿Cuántos grados de libertad hay?gl = k -1 = 6 – 1 = 5

Page 33: ESTADISTICA  (II Bimestre Abril agosto 2011)

d. ¿Cuál es el valor crítico de ji cuadrado con un nivelde significancia de 1%?Apéndice B.3 pag. 787

Grados de libertad Área de Cola Derecha

Page 34: ESTADISTICA  (II Bimestre Abril agosto 2011)

e. Calcule el estadístico de prueba

Día Número de ausencias

Lunes 12

Martes 9

Miércoles 11

Jueves 10

Viernes 9

Sábado 9

fe 60/6=10

Conclusión:No se rechaza H0El ausentismo se distribuye de manera uniforme durante la semana

Page 35: ESTADISTICA  (II Bimestre Abril agosto 2011)

UNIDAD IX

CORRELACIÓN Y REGRESIÓN LINEAL

Page 36: ESTADISTICA  (II Bimestre Abril agosto 2011)

Análisis de Correlación

Grupo de técnicas para medir la asociación entre dos variables

Variable Independiente: Se representa en el eje X y es la variableempleada como estimador

Variable Dependiente: Se representa en el eje Y y es la variable porestimar o predecir

Page 37: ESTADISTICA  (II Bimestre Abril agosto 2011)

Análisis de Correlación

Grupo de técnicas para medir la asociación entre dos variables

Variable Independiente: Se representa en el eje X y es la variableempleada como estimador

Variable Dependiente: Se representa en el eje Y y es la variable porestimar o predecir

Page 38: ESTADISTICA  (II Bimestre Abril agosto 2011)

Coeficiente de Correlación

Medida de la fuerza de la

relación lineal entre dos variables

r = 0, no hay

asociación entre ellas

r = 1 indica una asociación directa entre las variables

R = -1 indica una

asociación inversa

entre las variables

Varia de -1 a +1

Page 39: ESTADISTICA  (II Bimestre Abril agosto 2011)

Ejemplo: Una empresa americana vende copiadoras de todo tamaño. La nuevagerente nacional de ventas desea saber la relación entre el número de llamadas deventas y el número de copiadoras vendidas. Selecciona una muestra aleatoria de 10representantes, como se se observa en la tabla. ¿Qué observaciones cabe hacerrespecto de la relación entre el número de llamadas de venta y el número decopiadoras vendidas?

Page 40: ESTADISTICA  (II Bimestre Abril agosto 2011)

G R A C I A S

Page 41: ESTADISTICA  (II Bimestre Abril agosto 2011)