Modelos y Simulacion - u3

Embed Size (px)

Citation preview

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 1

    UNIDAD 3: UN MODELO ANALTICO PROGRAMACIN LINEAL

    3.1 Simulacin. Definiciones Simulacin es la imitacin de un proceso real o sistema de tiempo. La simulacin

    involucra la generacin de una historia artificial del sistema y la observacin de esa

    historia artificial para imaginar inferencias concernientes a las operaciones

    caractersticas del sistema real que est representado.

    La simulacin es utilizada para describir y analizar el comportamiento de un

    sistema, realizar preguntas Qu pasara si? (What if analysis) sobre el sistema real y

    ayudar en el diseo del sistema.

    Si las relaciones y los componentes que constituyen el modelo son lo

    suficientemente simples, podemos utilizar mtodos matemticos para obtener respuestas

    exactas sobre ciertos interrogantes, en lo que se denomina una solucin analtica

    (investigacin operativa y teora de colas). Sin embargo la complejidad de muchos

    sistemas del mundo real hace difcil el uso de estas tcnicas, por lo que se recurre a la

    simulacin.

    Las reas de aplicacin de la simulacin son muchas y diversas

    Diseo y anlisis de sistemas de manufacturas.

    Evaluacin de requerimientos de hardware y de software.

    Evaluacin de nuevas tcticas o armas militares.

    Determinacin de polticas de reordenamiento para un sistema de inventario.

    Diseo de sistemas de comunicacin y sus protocolos

    Diseo y operacin de instalaciones de transporte, tales como autopistas, puertos, aeropuertos, etc.

    Evaluacin y diseo de organizaciones de servicio como hospitales, oficinas, restaurantes

    3.2 Propsitos de la Simulacin

    La simulacin ayuda a identificar problemas permitiendo:

    Experimentar nuevas situaciones y generar polticas de decisin

    Experimentar en un tiempo reducido

    Analizar, en algunos segundos, procesos que llevara meses o aos en tiempo real.

    Reducir procesos analticos de investigacin y desarrollo convencional

    Estudiar situaciones complejas.

    Educar y entrenar

    Tener una visin global de un sistema.

    Dividir el sistema en subsistemas.

    3.3 Fundamentos Consideremos la operacin de un cajero automtico de un banco (Teller Bank),

    donde los clientes arriban entre 1 y 10 minutos (solo valores enteros e igualmente

    probables). El objetivo es simular la operacin del cajero a mano hasta que 20 clientes sean atendidos y calcular medidas de performance como el tiempo de espera, etc.

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 2

    SIMULACION AD-HOC (Manual)

    Tabla de Simulacin

    Cliente Tiempo entre cada arribo

    t arribo t servicio Servicio Inicio

    Servicio Termina

    Tiempo en Sistema

    Tiempo Ocioso

    Tiempo en Espera

    1 - 0 2 0 2 2 0 0

    2 5 5 2 5 7 2 3 0

    3 1 6 6 7 13 7 0 1

    79 30 10

    Medidas de Performance

    Tiempo Promedio en el Sistema min95,320

    min79

    clientes

    Tiempo en Espera Promedio x Cliente min25

    min10

    clientes

    Porcentaje de Tiempo Ocioso del Cajero o sin Operar %30100*)301079(

    30

    Tiempo entre Arribo + Tiempo de Arribo = boottrapping

    3.4 Clasificacin de las simulaciones

    Existen 4 estructuras de simulacin.

    1 Mtodo de interaccin de procesos (Process Interaction) 2 Mtodo de secuenciacin de sucesos (Event Scheduling)

    Cajero

    Automtico

    Cliente t arribo = 1 - 10

    Generador Random t

    Servicio Cliente t servicio = 1 6 min

    Generador Random t

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 3

    3 Mtodo de monitores de actividad (Activity Scanning) 4 Mtodo de Tres Fases 3.4.1 Mtodo de Interaccin de Procesos

    En esta estructura de simulacin el programa debera emular el flujo de un

    objeto a travs del sistema. La entidad se mueve lo ms lejos posible en el sistema hasta

    que: es retrasado, entra a una actividad o sale del sistema.

    Tambin se la conoce como simulacin orientada a sucesos (asincrnica).

    Ej: en un modelo de lavandera automtica un cliente puede entrar al sistema,

    esperar por la mquina lavadora, lavar su ropa, esperar una canasta vaca, transportar su

    ropa al secador, cargar el secador, secar la ropa, abandonar la lavandera.

    3.4.2 Mtodo de Secuenciacin de Sucesos

    El concepto bsico de la secuenciacin es avanzar el tiempo hasta que algo a

    continuacin ocurra. Este suceso libera algn recurso. El suceso relocaliza objetos o

    entidades por secuenciacin donde ellos puedan participar.

    Ej: si la ropa lavada de un cliente est lista y hay una canasta disponible esta es

    reasignada inmediatamente al cliente y la descarga de ropa se inicia.

    El tiempo es avanzado hasta el suceso siguiente y las actividades son

    examinadas para ver si alguna puede iniciarse como consecuencia.

    Simulacin asncrona u orientada a sucesos.

    3.4.3 Mtodo de Monitoreo de Actividad

    Este mtodo es conocido tambin como mtodo de 2 fases. El monitoreo de

    actividad est compuesto por una simulacin de mdulos independientes esperando ser

    ejecutados. El monitoreo se maneja por incrementos fijos de tiempo en las cuales se

    toma una decisin si un evento ocurri o no ocurri.

    Si el suceso o evento ocurri el sistema es actualizado.

    Simulacin sincrnica u orientada a intervalos.

    3.4.4 Mtodo de Tres Fases

    En este mtodo el tiempo es avanzado hasta que hay un cambio de estado en el

    sistema o hasta que algo ocurriese. Solo cuando todos los recursos en este intervalo han

    sido liberados se inicia la reasignacin para nuevas actividades en la tercera etapa de la

    simulacin.

    Resumimos: la primera fase es el avance del tiempo, la segunda fase es la

    liberacin de recursos que finalizan su actividad y la tercera es el inicio de actividades

    con los recursos reasignados.

    Simulacin sincrnica u orientada a intervalos.

    3.5 Ventajas de utilizar Simulacin por computadora

    Cada nuevo desarrollo en la industria de la computacin tiene un efecto de empuje

    hacia las industrias relacionadas, este es en caso del software de simulacin.

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 4

    Ventajas

    a) Elegir correctamente. Se pueden testear los diseos sin realizar adquisiciones

    materiales.

    b) Comprimir y expandir el tiempo. Se puede examinar un cambio real de horas

    en pocos minutos y viceversa.

    c) Entender el porqu. Se pueden explicar los porqu de ciertos fenmenos

    reconstruyendo los escenarios.

    d) Explorar posibilidades. Se pueden explicar nuevos mtodos, nuevas tcnicas

    sin afectar el sistema real utilizando el modelo.

    e) Diagnosticar problemas. Se refiere a los sistemas complejos. La simulacin

    incluye las interacciones de sistemas complejos.

    f) Identificar limitaciones. Se pueden identificar los cuellos de botella.

    g) Desarrollar entendimiento. Los estudios de simulacin proveen

    entendimiento sobre como un sistema opera (en vez de seguir las

    predicciones de otro).

    h) Visualizar el plan. Traducir los diseos de CAD a paquetes de simulacin.

    Ayudan a ver defectos de diseo.

    i) Construir consenso. Es ms sencillo aceptar una simulacin que la opinin

    personal sobre los resultados de cambio en un diseo.

    j) Preparar para el cambio. Se refiere a la construccin de escenarios para el

    anlisis (que pasar si).

    k) Invertir con inteligencia. El costo de una simulacin es mucho mas bajo que

    el rediseo de una instalacin.

    l) Entrenar el equipo de personal. Los modelos son excelentes para entrenar

    equipo de personal.

    m) Especificar requerimientos. Se puede especificar requerimientos de una

    mquina o dispositivo por simulacin.

    3.6 Desventajas de usar la simulacin por computadora

    a) Aunque muchos paquetes de software permiten obtener un mejor escenario a partir de una combinacin de variaciones posibles, la simulacin no es una

    herramienta de optimizacin.

    b) La simulacin puede ser costosa cuando se quiere emplearla en problemas relativamente sencillos de resolver, en lugar de utilizar soluciones analticas

    que se han desarrollado de manera especfica para este tipo de casos.

    c) Se requiere bastante tiempo (generalmente meses) para realizar un buen estudio de simulacin; por desgracia, no todos los analistas tienen la

    disposicin (o la oportunidad) de esperar ese tiempo para obtener una

    respuesta.

    d) Es preciso que el analista domine el uso del paquete de simulacin y que tenga slidos conocimientos de estadstica para interpretar los resultados.

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 5

    3.7 Elementos claves para garantizar el xito de un modelo de simulacin

    Tamao suficiente de la corrida: Como se mencion en la unidad anterior, para poder llegar a conclusiones estadsticas vlidas a partir de los

    modelos de simulacin es necesario que las variables aleatorias de respuesta

    estn en un estado estable. El problema estriba en que, generalmente, cuando

    el modelo consta de ms de una variable de decisin, es difcil que estas

    alcancen el estado estable al mismo tiempo.

    Variable(s) de respuesta mal definidas(s): aun cuando el modelo de simulacin sea muy eficiente y representante de la realidad en gran medida,

    si la variable de respuesta no es la apropiada ser imposible tomar decisiones

    que tengan impacto sobre las operaciones del sistema bajo estudio.

    Por ejemplo: si la variable de respuesta es el nivel de inventarios de ciertos

    productos. Al mismo tiempo, la poltica de la empresa establece que no se

    debe parar ninguno de los procesos de fabricacin. En consecuencia, el

    problema no ser el inventario final, sino el ritmo de produccin necesario.

    Errores al establecer las relaciones entre variables aleatorias: Un error comn de programacin es olvidar las relaciones lgicas que existen

    entre las variables aleatorias del modelo, o minimizar su impacto. Si una de

    estas variables no est definida de manera correcta an es posible tener un

    modelo que se apegue a la realidad actual. Sin embargo, si el sistema no se

    lleva hasta su mxima capacidad para observar su comportamiento, podra

    resultar imposible visualizar el verdadero impacto de las deficiencias.

    Errores al determinar el tipo de distribucin asociados a las variables aleatorias del modelo: Este tipo de problema es muy similar al

    anterior, solo que en este caso se utilizan distribuciones que no son las ms

    adecuadas o que responden nicamente a un intento de simplificar los

    estudios estadsticos.

    Falta de anlisis estadstico de los resultados: Un problema comn por el que la simulacin suele ser objeto de crtica, radica en asumir que se trata

    de una herramienta de optimizacin. Esta apreciacin es incorrecta, ya que

    involucra variables aleatorias y caractersticas propias de un modelo que

    incluye probabilidades. Por ello es necesario realizar varias corridas a fin de

    producir diferentes resultados para las variables de respuesta y, a partir de

    estos valores, encontrar un intervalo de confianza que puedan dar un rango

    en donde encontrar valores definitivos

    Uso incorrecto de la informacin obtenida: Un problema que se presenta en ocasiones es el uso incorrecto de la informacin recabada para la

    realizacin del estudio, ya sea a travs de un cliente o de cualesquiera otras

    fuentes. Muchas veces esta informacin se recolecta, analiza y administra d

    acuerdo a las necesidades propias de la empresa, lo que implica que no

    siempre est en el formato y la presentacin que se requiere para la

    simulacin. Si la informacin se utiliza para determinar los parmetros del

    modelo sin ser depurada y reorganizada, es muy probable que la precisin de

    los resultados del estudio se vea afectada

    Falta o exceso de detalle en el modelo: Otro punto importante a considerar es el nivel de detalle del modelo. En muchas ocasiones algn

    proceso se simplifica tanto que tiende a verse como una caja negra que nos

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 6

    impide ver que ocurre en el interior, aunque si haya entrada y salida de datos

    que interactan con el modelo. Cuando esto sucede, el impacto que podran

    tener los subprocesos que se llevan a cabo en la caja negra (es decir el proceso sobre simplificado) no se incluyen en la simulacin.

    Por ejemplo: si se analiza un sistema de distribucin y se da por sentado que

    el almacn siempre surte sus pedidos, no incluiremos el impacto de los

    tiempos necesarios parta surtir las rdenes, ni la posibilidad de que haya

    faltantes del producto.

    Por otra parte si el modelo se hace demasiado detallado, tanto el tiempo

    dedicado al estudio como el costo de llevarlo a cabo podran incrementarse

    sustancialmente. La labor del encargado de simulacin es sugerir y clasificar

    los niveles de detalle que se requieren en el modelo, resaltando los alcances

    y limitaciones de cada uno.

    3.8 Etapas en el desarrollo de experimentos de Simulacin.

    Formulacin

    Problema

    Definicin de Objetos

    Plan de Proyecto Completo

    Conceptualizacin

    del Modelo

    Recoleccin de

    Datos

    Traduccin del

    Modelo

    Diseo Experimental

    Verificado?

    Validado?

    NO

    NO NO

    Mas Ensayos?

    SI SI

    NO

    Documentacin. Generacin de

    Reporte

    Implementacin

    Ensayos de Produccin y

    Anlisis

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 7

    Etapa 1: Formulacin del problema

    Se sugiere que un set de suposiciones se prepare entre el analista simulador y el

    cliente. Es posible que se necesite reformular el problema. Esta etapa tambin se conoce

    como Anlisis de Requerimientos.

    Etapa 2: Definicin de Objetos. Plan de Proyecto Completo

    Los objetivos indican las preguntas a ser respondidas por el estudio de

    Simulacin. El plan de proyecto debera incluir diferentes escenarios a investigar.

    Etapa 3: Conceptualizacin o Formulacin del Modelo

    Los sistemas reales bajo investigacin son abstrados por un modelo conceptual.

    Se recomienda que el modelo se inicie en forma simple y luego se desarrolle hasta un

    modelo de complejidad avanzada o apropiada.

    Etapa 4: Recoleccin de Datos

    Se requiere un cronograma de requerimientos de datos al cliente. Se precisan

    datos individuales y no valores promedios acumulados.

    Etapa 5: Traduccin del Modelo

    Codificacin del Modelo conceptualizado.

    Etapa 6: Verificacin

    Concierne al modelo operativo. Esta trabajando correctamente? Se recomienda

    que la verificacin sea un proceso continuo. (Depuracin de cdigo, y dems estrategias

    como TOP-DOWN, Programacin estructurada, etc.).

    Etapa 7: Validacin

    La validacin es la determinacin de que el modelo conceptual es una

    representacin precisa de sistema real. Una forma ideal de validar el modelo es

    comparar las salidas con las del sistema base (el sistema real).

    Etapa 8: Diseo Experimental

    Estos diseos conciernen a la extensin de la simulacin, el nmero de

    replicaciones y la forma de inicializacin.

    Etapa 9: Replicaciones o Ensayos de Produccin

    Estas replicaciones o ensayos se utilizan para estimar medidas de performance

    en diferentes escenarios.

    Etapa 10: Determinacin de Continuar los Ensayos

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 8

    El analista de simulacin y el cliente determinan si se necesitan escenarios

    adicionales.

    Etapa 11: Generacin de Reportes

    Si el modelo de Simulacin se utilizar de nuevo por analistas diferentes ser

    necesario entender como el modelo trabaja. Por ello existe la necesidad de una buena

    documentacin.

    Etapa 12: Implementacin

    Consiste en la implantacin final del modelo.

    Pasos de un estudio segn Law

    3.8.1 Recoleccin de Datos

    Debemos decidir cmo representar las variables aleatorias. Las tcnicas a utilizar

    pueden variar de acuerdo:

    A la cantidad de datos disponibles

    Si los datos son crudos o son la sugerencia de alguien

    Si cada variable es independiente de otras variables aleatorias de entrada o relacionadas de alguna forma

    Si las variables son independientes de otras variables, las posibilidades son:

    a) Asumir que la variable es determinstica Podemos estar tentados a asumir que la variable es determinstica o constante.

    Ej: una mquina fabrica componentes den 1,5 min. La mquina requiere el

    cambio de herramental de acuerdo a una distribucin exponencial, de un valor

    esperado de 12 min. El tiempo de cambio de la herramienta es otra distribucin

    exponencial con valor esperado de 3 min. Es posible simplificar este proceso

    diciendo que la mquina opera en 1,875 min/min?

    b) Ajustar una funcin de distribucin a los datos histricos Si poseemos al menos 50 puntos, podemos intentar ajustar una funcin de

    distribucin. Si se va a realizar un test de bondad de ajuste, se recomienda seguir

    los siguientes 3 pasos:

    Sistema Real Modelo de

    sistema

    Modelo

    Computacional Programa

    Simulacin

    Objetivos Representacin

    Validacin

    Codificacin

    Validacin

    Verificacin

    Ajuste Datos Reales

    Datos Simulados

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 9

    I) Realizar una hiptesis sobre la funcin candidata. Esta funcin puede ser continua o discreta. Entre las discretas sealamos: Poisson, Binomial,

    Geomtrica. Entre las distribuciones continuas tenemos: Normal,

    Student, Uniforme, Triangular, LogNormal, Gamma, Weibull.

    II) Estimar los parmetros de la distribucin candidata o elegida. Por Ejemplo, si la distribucin es normal, los parmetros a estimar son la

    varianza, el Valor Esperado o esperanza.

    III) Realizar un test de bondad de ajuste como chi cuadrado (x2). Si el test rechaza la hiptesis es porque hay una fuerte indicacin de que no es

    verdad. En ese caso se vuelve al paso 1 o se elige la distribucin

    emprica.

    c) Utilizar la distribucin emprica de los datos Cuando todas las posibilidades se han agotado, utilizamos la distribucin

    emprica. Ejemplo: Un sistema de cinta transportadora tiene los siguientes datos:

    El tiempo para reparar la cinta despus de una falla (x).

    Para las 100 veces anteriores u ocurrencias:

    Intervalo (h) Frecuencia de Ocurrencia

    0 x 1 27 1 < x 2 13 2 < x 3 31 3 < x 4 18 4 < x 8 11

    A veces no hay datos disponibles porque el sistema no est constituido. Una

    posibilidad es estimar subjetivamente un valor. Ej: el tiempo de reparacin es de 3 a 8

    minutos y asumir que los datos siguen una distribucin uniforme.

    30

    20

    10

    0 1 2 3 4 5 6 7 8 x

    27

    13

    31

    18

    11

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 10

    Por ello esta distribucin es referida como la distribucin de mxima ignorancia

    (asume todos los valores por igual).

    3.8.2 Verificacin y validacin del modelo

    La verificacin es la determinacin de que el modelo conceptual en la

    computadora es correcto para ello se sugiere tener en cuenta:

    o Seguir principios de programacin (estructurada, etc). o Hacer que el modelo operativo est bien documentado. o Verificar el cdigo por ms de una persona. o Verificar que los datos de entrada son utilizados correctamente. o Verificar para un conjunto de datos de entrada que las salidas sean

    razonables.

    o Utilizar el depurador. o Utilizar la animacin como verificacin.

    La validacin es la determinacin de que el modelo conceptual pueda sustituir al

    sistema real para la experimentacin.

    Nombraremos las siguientes tcnicas subjetivas:

    La validacin a simple vista (Face Validation): debe ser razonable a los expertos en el rea.

    Anlisis de sensibilidad: se modifican las entradas. Test de condiciones extremas.

    En cuanto a tcnicas objetivas sealaremos:

    Validacin de transformacin de E/S: se compara las salidas del modelo con datos reales. Ej: test t.

    Validacin utilizando datos histricos de entrada: en vez de utilizar datos artificiales utilizaremos datos histricos. Luego se compara la salida con

    el sistema real. Ej: paired test t.

    3.8.3 Anlisis de los Datos Simulados

    El anlisis de simulacin se inicia con las medidas de performance (los tiempos,

    el montaje de ocurrencias, tabulacin de varianzas y promedios, etc.). Ej: una estadstica

    f

    3 8

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 11

    basada en el conteo de ocurrencias es el nmero de unidades aceptadas en 24hs de

    simulacin.

    Una herramienta para analizar o trabajar los datos de salida es el intervalo de

    Confianza. Los 3 factores que influencian la amplitud del Intervalo de Confianza son: El

    nmero de replicaciones (n), el nivel de confianza (1-) y la variacin de la medida de performance (s).

    Resumimos: si el nmero de replicaciones se incrementa, la amplitud del

    intervalo de confianza disminuye.

    Si el nivel de confianza aumenta, la amplitud del intervalo de confianza

    aumenta.

    Si la variacin se incrementa, la amplitud del intervalo se incrementa.

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 12

    3.9 Seleccin de una distribucin de entrada 3.10 Estadstica Descriptiva

    Siendo x una variable aleatoria mnima, mxima, media o valor esperado o

    esperanza matemtica o mediana X0.5.

    Estimaciones de Muestra

    )()1( , nXX (C, D)

    )(nX o x o )(xE (C, D)

    )(5,0 nX )2)1(( nx , si n es par

    21)2/(2/ nxnx , si n es impar

    Varianza 2

    Coeficiente de Variacin

    2cv

    Lexis Ratio

    2r

    n

    i

    i xpxnS1

    22

    nX

    nSnvc

    2

    (C, D)

    nXnS

    nr2

    Sesgo (Skewness)

    2

    32

    3

    xEv

    23

    2

    1

    3

    nS

    nnXX

    y

    n

    i

    i

    Criterios a Utilizar

    Para una distribucin simtrica o Continua (normal), la media es igual a la

    mediana 5,0X , no as para una distribucin discreta.

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 13

    Si las estimaciones nX y la mediana 5,0X son casi iguales, la distribucin puede ser simtrica.

    El coeficiente de variacin cv es igual a 1 para la distribucin exponencial, por

    ello el vc (estimacin) cercano a 1, sugiere dicha distribucin. Para las distribuciones de Gamma y Weibull:

    1

    1

    1

    cv

    cv

    cv

    1

    1

    1

    Siendo un parmetro de forma:

    Parmetro de localizacin: es una abscisa )( ix . Ej: la media para la

    distribucin normal.

    Parmetro de escala: Comprime o expande la distribucin sin cambiar su forma.

    Parmetro de forma: Un cambio altera la forma (el sesgo o skewness).

    La distribucin LogNormal, tiene un cv que puede ser cualquier nmero positivo

    real, por eso si la forma concuerda, y el 1 nvc , esta distribucin puede ser mejor que la Gamma o Weibull.

    Para las distribuciones discretas, el lexis ratio r , es fundamental:

    1r Poisson 1r Binomial 1r Binomial Negativa o Geomtrica (Caso especial)

    El sesgo de la distribucin es una medida de simetra.

    Normal 0

    Sesgada a la derecha o Positivy Skewed 0

    Sesgada a la izquierda o Negativy Skewed 0

    Mediana

    Media

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 14

    Summary Stadistics

    3.10.1 Histogramas y Grficos de Lnea

    Podemos afirmar que las funciones de densidad tienden a poseer formas

    reconocibles, por ello una estimacin grfica nos puede ser muy til para reconocer una

    distribucin. Para el siguiente ejemplo construiremos un histograma basados en la regla

    de Sturgis:

    nk 10log322,31 Siendo k el nmero de intervalos Ejemplo de Aplicacin

    Un modelo de simulacin fue desarrollado para una facilidad en un banco. Los

    datos fueron recolectados en base al patrn de arribo de los autos, sobre un intervalo fijo

    de 90 minutos, 220 autos, llegados a la facilidad y se anot el tiempo de interarribo x

    (en minutos) entre los autos i e i+1 para i=1, 2, 3,, 219.

    n=219 Tiempo de interarribo (minutos) ordenados en orden creciente

    0.01 0.05 0.08 0.14 0.22 0.35 0.46 0.55 0.79 1.28

    0.01 0.05 0.09 0.14 0.23 0.35 0.47 0.55 0.84 1.33

    0.01 0.05 0.09 0.14 0.23 0.36 0.47 0.57 0.86 1.38

    0.01 0.05 0.10 0.14 0.23 0.36 0.47 0.57 0.87 1.44

    0.01 0.05 0.10 0.15 0.23 0.36 0.48 0.60 0.88 1.51

    0.01 0.05 0.10 0.15 0.23 0.37 0.49 0.61 0.88 1.72

    0.01 0.06 0.10 0.15 0.24 0.37 0.49 0.61 0.90 1.83

    0.01 0.06 0.10 0.15 0.25 0.38 0.49 0.63 0.93 1.96

    0.02 0.06 0.10 0.15 0.25 0.38 0.49 0.63 0.93

    0.02 0.06 0.10 0.15 0.25 0.38 0.50 0.64 0.95

    0.03 0.07 0.10 0.17 0.25 0.38 0.50 0.65 0.97

    0.03 0.07 0.10 0.18 0.25 0.38 0.50 0.65 1.03

    0.03 0.07 0.11 0.19 0.26 0.39 0.51 0.65 1.05

    0.04 0.07 0.11 0.19 0.27 0.40 0.51 0.69 1.05

    0.04 0.07 0.11 0.19 0.28 0.40 0.51 0.69 1.06

    0.04 0.07 0.11 0.20 0.28 0.41 0.52 0.70 1.09

    Mediana

    Media

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 15

    621,09

    95,1

    977,8219log322,31

    95,1

    01,096,1

    10

    1219

    k

    Rb

    k

    R

    XXR

    Histograma

    Los valores estn demasiado acumulados, por lo que se recomienda duplicar k, o

    sea 2k = 18.

    100,0

    18

    b

    Rb

    Estadstica Descriptiva

    Mnimo 0,01 1X

    Mximo 1,96 219X

    Media 0,399

    Mediana 0,270

    0.04 0.07 0.11 0.21 0.29 0.41 0.52 0.72 1.10

    0.04 0.07 0.12 0.21 0.29 0.43 0.53 0.72 1.11

    0.04 0.07 0.12 0.21 0.30 0.43 0.53 0.72 1.12

    0.05 0.07 0.12 0.21 0.31 0.43 0.53 0.74 1.17

    0.05 0.08 0.12 0.21 0.31 0.44 0.54 0.75 1.13

    0.05 0.08 0.13 0.22 0.32 0.45 0.54 0.76 1.24

    0.05 0.08 0.13 0.22 0.35 0.45 0.55 0.77 1.24

    h(x)

    100

    75

    50

    25

    0,01 0,266 0,443 0,659 0,876 1,093

    93

    46

    35

    17

    9 4 2

    1

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 16

    Varianza 0,144

    c.v. 0,953

    Sesgo 1,458

    BoxPlot

    Necesitamos conocer el mnimo, el mximo, la mediana y los cuartiles.

    Mnimo = 0,01

    Mximo = 1,96

    Mediana = 0,27

    Cuartiles = 0,100 y 0,545

    La naturaleza elongada hacia la derecha seala que es una distribucin

    exponencial (adems de otros criterios).

    3.11 Estimacin de Parmetros

    Ahora que poseemos una hiptesis sobre que distribucin puede ser utilizada,

    necesitamos estimar los parmetros. Un estimador es una funcin numrica de los datos.

    Aqu vamos a considerar los denominados MLE o Estimadores de Mxima Probabilidad

    (Maximum Likelyhood Estimators).

    3.11.1 Conceptos Tericos de MLE

    Si utilizamos una distribucin discreta para nuestros datos y desconocemos el

    valor del parmetro (theta), la funcin de probabilidad o de masa )(xp . Definimos

    la funcin de probabilidad (likelyhood function) de la siguiente forma

    nxpxpxpL ...21 , siendo L la funcin de masa conjunta o de probabilidad

    h(x)

    100

    75

    50

    25

    0,01 0,266 0,443 0,659 0,876 1,093 1,96

    93

    46

    35

    17

    9 4 2

    1

    0,100 0,27 0,545

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 17

    conjunta que nos da la probabilidad de obtener nuestros datos, si es el valor del parmetro desconocido.

    El MLE del parmetro desconocido es , y es definido como el valor de

    que maximiza la funcin L . LL

    para todo valor posible de .

    Para funciones continuas la funcin de densidad xf , define la funcin de

    probabilidad siguiente: nxfxfxfL ...21

    donde el MLE , es definido a ser

    el valor de que maximiza la funcin )(L sobre todos los valores posibles.

    Ejemplo A: funcin exponencial y su estimador MLE

    (parmetro de escala)

    x

    exf

    1

    )(

    nX = media (Cmo se llega a esta conclusin?)

    nxxx

    eeeL

    1

    ...11

    21

    n

    i

    i

    n

    xn

    xxxn

    eL

    eL

    1

    21

    1

    ...1

    Aplicando ln a ambos miembros:

    n

    i

    i

    n

    i

    i

    n

    xnl

    xl

    Ll

    1

    1

    1ln

    1ln

    ln

    0 x

    f(x)

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 18

    Como el logaritmo es estrictamente creciente, maximizamos la funcin l (

    Ll ) ello implica que maximiza a la funcin L.

    nXn

    x

    xn

    xn

    d

    dl

    n

    i

    i

    i

    n

    i

    i

    1

    12

    1

    1

    Por lo tanto el MLE = = 0,399, con lo cual la funcin de distribucin

    ajustada a los datos del problema es: 399,0399,0

    1x

    exf

    El clculo diferencial y la bsqueda de mximos, a veces no funciona para todas

    las distribuciones. Se puede utilizar, mtodos numricos para encontrar los estimadores

    MLE.

    Tabla de algunos MLEs para distribuciones sencillas (Law & Kelton)

    Distribucin MLE

    Exponencial nX media

    Uniforme ixa min ixb max

    Normal nX 2

    1

    21

    nS

    n

    n

    3.12 Evaluacin del Modelo 3.12.1 Distribucin Ji-Cuadrado

    Definicin: Sea un entero positivo, entonces se dice que la variable aleatoria X posee una distribucin ji-cuadrado, con parmetro , si la funcin de densidad de

    probabilidad de x es la funcin de densidad Gamma con 2

    y 2 . La funcin de

    densidad ji-cuadrado es:

    xkfo

    xf

    ,1

    ,

    0,0

    0,

    22

    1 21

    2

    2

    x

    xex

    x

    El parmetro es llamado nmero de grados de libertad de x. El smbolo 2X es usado para representar el ji-cuadrado (chi-squared).

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 19

    k = nro de intervalos.

    k-1 = nro de grados de libertad.

    3.12.2 Test de Bondad de Ajuste

    Supongamos que en un experimento cada observacin iX en una muestra es

    clasificada como perteneciente a un nmero finito de categoras, con ip definimos la

    probabilidad que cualquier observacin particular pertenezca a una categora i.

    Deseamos verificar 0H , que especifica completamente los valores de todas las

    probabilidades. Ej:

    05,0

    15,0

    35,0

    45,0

    4

    3

    2

    1

    p

    p

    p

    p

    El test estadstico ser una medida de la discrepancia entre los nmeros

    observados en las categoras y los nmeros esperados cuando 0H es verdadero.

    Como la decisin sera alcanzada al comparar un clculo del test con un valor

    crtico de la distribucin ji-cuadrado, este test de bondad de ajuste se denomina ji-

    cuadrado.

    Notacin:

    jN : nmero de observaciones ix en la categora j ( aleatoria)

    jn : nmero de observaciones esperado

    n : numero total de observaciones

    n

    j

    j nN1

    j : categora o clasificacin

    jp : probabilidad de la categora j. La proporcin esperada de los valores iX

    f(x)

    0 1 x

    No Rechaza Rechaza

    Densidad ji-cuadrado

    grados de libertad

    Ji-crtico:

    Regin Sombreada

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 20

    Teorema

    Siendo 5jnp para cada j (j=1,2,,k).

    La variable aleatoria es:

    esperados

    esperadosobservados

    np

    npNX

    n

    j j

    jj2

    1

    2

    2

    Y tiene aproximadamente una distribucin ji-cuadrado con (k-1) grados de

    libertad.

    Test ji-cuadrado

    Hiptesis Nula

    02021010 ,,,: kk ppppppH con kp : observado

    con 0kp : distribucin

    Hiptesis Alternativa

    aH al menos un valor de probabilidad ip no es igual a 0ip

    Frmula del Test

    esperado

    esperadoobservado

    np

    npnX

    k

    i i

    ii

    2

    1 0

    2

    02

    Regin de rechazo (rechazo de la hiptesis nula)

    )1,1(22

    kXX

    Si se supera el valor crtico, la distribucin no sirve, se rechaza la bondad de

    ajuste.

    Observaciones

    Esperamos que el ji-cuadrado 2X sea pequeo para un buen ajuste. El punto crtico del test es elegir el nmero y tamao de los intervalos. Algo de la ambigedad de

    la seleccin del intervalo es eliminado si ellos son elegidos de tal forma que:

    kpppp 321

    Esto se denomina mtodo equiprobable o de probabilidades idnticas.

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 21

    Law & Kelton sugieren para elegir los intervalos el mtodo equiprobable y

    5jnp para todas las categoras j en el caso continuo. En el caso discreto, sugieren los

    jnp aproximadamente iguales y todos como mnimo de valor 5.

    Ejemplo A: funcin exponencial y su MLE

    399,0399,0

    1x

    exf

    n = 219

    Mtodo equiprobable

    kppp 21 k = 20 intervalos

    05,020

    121 kppp

    20

    0

    399,0

    0

    1

    595,1005,0219

    219

    5

    a

    a

    exF

    np

    n

    np

    x

    j

    j

    para j = 1 19

    201

    201

    20

    399,0

    399,0

    je

    je

    jaF

    j

    j

    a

    a

    j

    Aplicando ln a ambos miembros

    201ln399,0

    201ln

    399,0

    ja

    ja

    j

    j

    j para 1 a 19

    j Intervalos jj aa ,1 jN jnp j

    jj

    np

    npN

    1 (0, 0.0204) 8 10,950 0,7947

    2 (0.0204, 0.042) 11 10,950 0,0002

    19

    188,222 X

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 22

    Valor crtico

    10,0

    203,2710,01,1202

    X (por tabla de puntos crticos de ji-cuadrado)

    Se acepta la Hiptesis nula. No se rechaza la bondad de ajuste.

    Ejemplo B: Los valores y totales para n = 256 observaciones sobre el nmero de tems

    demandados en una semana de un inventario de 3 aos, son los siguientes.

    ITEM QTY ESCALADO

    0 59 0,37

    1 26 0,16

    2 24 0,153

    3 18 0,11

    4 12 0,07

    5 5 0,03

    6 4 0,02

    7 3 0,019

    9 3 0,019

    11 2 0,012

    1. Estadstica descriptiva

    Mnimo 0

    Mximo 11

    Media 8,91

    Mediana 1

    Varianza 5,285

    Lexis ratio 2,795

    Sesgo 1,655

    2. Grfico de Lnea

    Escala 59/156 = 0,37

    No es simtrica, por lo tanto no es discreta uniforme. En consecuencia puede ser

    Binomial, Binomial negativa, geomtrica o Poisson.

    El Lexis Ratio es 2,795 > 1 es Binomial negativa o geomtrica.

    0,4

    0,3

    0,2

    0,1

    0 1 2 3 4 5 6 7 8 9 10 11

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 23

    El Sesgo es 1,655 > 1 es sesgada a la derecha

    Elegimos un distribucin Geomtrica

    3. Estimacin del parmetro MLE

    xp ppxP 1 x = 0,1,,n 10 pp

    Funcin de Probabilidad Conjunta 21 11 xx pppppL Aplicando ln a ambos miembros pxpnplL i 1lnlnln Derivamos e igualamos a 0

    11

    X

    pMLE

    xp ppxP 1

    1891,1

    1

    p

    345,0 p

    xp xP 345,01345,0

    xp xP 655,0345,0 x = 0,1,,11

    Test de Bondad

    La moda en este caso vale 0, sugeriremos 3 intervalos. Uno que contenga a la

    moda, otro de 1 a 2 y de all a la 11, el 3er intervalo.

    1ra condicin 321 ppp

    260,0310,0370,0

    321

    IpIpIp

    0,4

    0,3

    0,2

    0,1

    0 1 2 3 4 5 6 7 8 9 10 11

    I1 I2 I3

  • UCSE - DASS

    rea Matemtica Aplicada

    CARRERA: Ingeniera en Informtica

    CTEDRA: Modelos y Simulacin

    Ao:2014

    Pgina 24

    2da condicin 5inp

    345,0655,0345,00 0 pP

    582,53345,01560 np OK

    3739,0655,0345,0655,0345,021 21 pp PP

    534,583739,015612 np OK

    ...113 pp PP

    511,...,3,2,1 np OK

    j intervalo jN jnp

    j

    jj

    np

    npN2

    1 0 59 53,82 0,471

    2 1-2 50 58,34 1,203

    3 3-11 47 43,658 0,256

    930,12 X

    90.0,22

    1,1 XX k

    605,42 criticoX 22 XcriticoX por lo tanto est bien ajustado. La hiptesis nula no es rechazada.