Upload
david-llusco
View
25
Download
0
Embed Size (px)
Citation preview
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 1
UNIDAD 3: UN MODELO ANALTICO PROGRAMACIN LINEAL
3.1 Simulacin. Definiciones Simulacin es la imitacin de un proceso real o sistema de tiempo. La simulacin
involucra la generacin de una historia artificial del sistema y la observacin de esa
historia artificial para imaginar inferencias concernientes a las operaciones
caractersticas del sistema real que est representado.
La simulacin es utilizada para describir y analizar el comportamiento de un
sistema, realizar preguntas Qu pasara si? (What if analysis) sobre el sistema real y
ayudar en el diseo del sistema.
Si las relaciones y los componentes que constituyen el modelo son lo
suficientemente simples, podemos utilizar mtodos matemticos para obtener respuestas
exactas sobre ciertos interrogantes, en lo que se denomina una solucin analtica
(investigacin operativa y teora de colas). Sin embargo la complejidad de muchos
sistemas del mundo real hace difcil el uso de estas tcnicas, por lo que se recurre a la
simulacin.
Las reas de aplicacin de la simulacin son muchas y diversas
Diseo y anlisis de sistemas de manufacturas.
Evaluacin de requerimientos de hardware y de software.
Evaluacin de nuevas tcticas o armas militares.
Determinacin de polticas de reordenamiento para un sistema de inventario.
Diseo de sistemas de comunicacin y sus protocolos
Diseo y operacin de instalaciones de transporte, tales como autopistas, puertos, aeropuertos, etc.
Evaluacin y diseo de organizaciones de servicio como hospitales, oficinas, restaurantes
3.2 Propsitos de la Simulacin
La simulacin ayuda a identificar problemas permitiendo:
Experimentar nuevas situaciones y generar polticas de decisin
Experimentar en un tiempo reducido
Analizar, en algunos segundos, procesos que llevara meses o aos en tiempo real.
Reducir procesos analticos de investigacin y desarrollo convencional
Estudiar situaciones complejas.
Educar y entrenar
Tener una visin global de un sistema.
Dividir el sistema en subsistemas.
3.3 Fundamentos Consideremos la operacin de un cajero automtico de un banco (Teller Bank),
donde los clientes arriban entre 1 y 10 minutos (solo valores enteros e igualmente
probables). El objetivo es simular la operacin del cajero a mano hasta que 20 clientes sean atendidos y calcular medidas de performance como el tiempo de espera, etc.
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 2
SIMULACION AD-HOC (Manual)
Tabla de Simulacin
Cliente Tiempo entre cada arribo
t arribo t servicio Servicio Inicio
Servicio Termina
Tiempo en Sistema
Tiempo Ocioso
Tiempo en Espera
1 - 0 2 0 2 2 0 0
2 5 5 2 5 7 2 3 0
3 1 6 6 7 13 7 0 1
79 30 10
Medidas de Performance
Tiempo Promedio en el Sistema min95,320
min79
clientes
Tiempo en Espera Promedio x Cliente min25
min10
clientes
Porcentaje de Tiempo Ocioso del Cajero o sin Operar %30100*)301079(
30
Tiempo entre Arribo + Tiempo de Arribo = boottrapping
3.4 Clasificacin de las simulaciones
Existen 4 estructuras de simulacin.
1 Mtodo de interaccin de procesos (Process Interaction) 2 Mtodo de secuenciacin de sucesos (Event Scheduling)
Cajero
Automtico
Cliente t arribo = 1 - 10
Generador Random t
Servicio Cliente t servicio = 1 6 min
Generador Random t
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 3
3 Mtodo de monitores de actividad (Activity Scanning) 4 Mtodo de Tres Fases 3.4.1 Mtodo de Interaccin de Procesos
En esta estructura de simulacin el programa debera emular el flujo de un
objeto a travs del sistema. La entidad se mueve lo ms lejos posible en el sistema hasta
que: es retrasado, entra a una actividad o sale del sistema.
Tambin se la conoce como simulacin orientada a sucesos (asincrnica).
Ej: en un modelo de lavandera automtica un cliente puede entrar al sistema,
esperar por la mquina lavadora, lavar su ropa, esperar una canasta vaca, transportar su
ropa al secador, cargar el secador, secar la ropa, abandonar la lavandera.
3.4.2 Mtodo de Secuenciacin de Sucesos
El concepto bsico de la secuenciacin es avanzar el tiempo hasta que algo a
continuacin ocurra. Este suceso libera algn recurso. El suceso relocaliza objetos o
entidades por secuenciacin donde ellos puedan participar.
Ej: si la ropa lavada de un cliente est lista y hay una canasta disponible esta es
reasignada inmediatamente al cliente y la descarga de ropa se inicia.
El tiempo es avanzado hasta el suceso siguiente y las actividades son
examinadas para ver si alguna puede iniciarse como consecuencia.
Simulacin asncrona u orientada a sucesos.
3.4.3 Mtodo de Monitoreo de Actividad
Este mtodo es conocido tambin como mtodo de 2 fases. El monitoreo de
actividad est compuesto por una simulacin de mdulos independientes esperando ser
ejecutados. El monitoreo se maneja por incrementos fijos de tiempo en las cuales se
toma una decisin si un evento ocurri o no ocurri.
Si el suceso o evento ocurri el sistema es actualizado.
Simulacin sincrnica u orientada a intervalos.
3.4.4 Mtodo de Tres Fases
En este mtodo el tiempo es avanzado hasta que hay un cambio de estado en el
sistema o hasta que algo ocurriese. Solo cuando todos los recursos en este intervalo han
sido liberados se inicia la reasignacin para nuevas actividades en la tercera etapa de la
simulacin.
Resumimos: la primera fase es el avance del tiempo, la segunda fase es la
liberacin de recursos que finalizan su actividad y la tercera es el inicio de actividades
con los recursos reasignados.
Simulacin sincrnica u orientada a intervalos.
3.5 Ventajas de utilizar Simulacin por computadora
Cada nuevo desarrollo en la industria de la computacin tiene un efecto de empuje
hacia las industrias relacionadas, este es en caso del software de simulacin.
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 4
Ventajas
a) Elegir correctamente. Se pueden testear los diseos sin realizar adquisiciones
materiales.
b) Comprimir y expandir el tiempo. Se puede examinar un cambio real de horas
en pocos minutos y viceversa.
c) Entender el porqu. Se pueden explicar los porqu de ciertos fenmenos
reconstruyendo los escenarios.
d) Explorar posibilidades. Se pueden explicar nuevos mtodos, nuevas tcnicas
sin afectar el sistema real utilizando el modelo.
e) Diagnosticar problemas. Se refiere a los sistemas complejos. La simulacin
incluye las interacciones de sistemas complejos.
f) Identificar limitaciones. Se pueden identificar los cuellos de botella.
g) Desarrollar entendimiento. Los estudios de simulacin proveen
entendimiento sobre como un sistema opera (en vez de seguir las
predicciones de otro).
h) Visualizar el plan. Traducir los diseos de CAD a paquetes de simulacin.
Ayudan a ver defectos de diseo.
i) Construir consenso. Es ms sencillo aceptar una simulacin que la opinin
personal sobre los resultados de cambio en un diseo.
j) Preparar para el cambio. Se refiere a la construccin de escenarios para el
anlisis (que pasar si).
k) Invertir con inteligencia. El costo de una simulacin es mucho mas bajo que
el rediseo de una instalacin.
l) Entrenar el equipo de personal. Los modelos son excelentes para entrenar
equipo de personal.
m) Especificar requerimientos. Se puede especificar requerimientos de una
mquina o dispositivo por simulacin.
3.6 Desventajas de usar la simulacin por computadora
a) Aunque muchos paquetes de software permiten obtener un mejor escenario a partir de una combinacin de variaciones posibles, la simulacin no es una
herramienta de optimizacin.
b) La simulacin puede ser costosa cuando se quiere emplearla en problemas relativamente sencillos de resolver, en lugar de utilizar soluciones analticas
que se han desarrollado de manera especfica para este tipo de casos.
c) Se requiere bastante tiempo (generalmente meses) para realizar un buen estudio de simulacin; por desgracia, no todos los analistas tienen la
disposicin (o la oportunidad) de esperar ese tiempo para obtener una
respuesta.
d) Es preciso que el analista domine el uso del paquete de simulacin y que tenga slidos conocimientos de estadstica para interpretar los resultados.
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 5
3.7 Elementos claves para garantizar el xito de un modelo de simulacin
Tamao suficiente de la corrida: Como se mencion en la unidad anterior, para poder llegar a conclusiones estadsticas vlidas a partir de los
modelos de simulacin es necesario que las variables aleatorias de respuesta
estn en un estado estable. El problema estriba en que, generalmente, cuando
el modelo consta de ms de una variable de decisin, es difcil que estas
alcancen el estado estable al mismo tiempo.
Variable(s) de respuesta mal definidas(s): aun cuando el modelo de simulacin sea muy eficiente y representante de la realidad en gran medida,
si la variable de respuesta no es la apropiada ser imposible tomar decisiones
que tengan impacto sobre las operaciones del sistema bajo estudio.
Por ejemplo: si la variable de respuesta es el nivel de inventarios de ciertos
productos. Al mismo tiempo, la poltica de la empresa establece que no se
debe parar ninguno de los procesos de fabricacin. En consecuencia, el
problema no ser el inventario final, sino el ritmo de produccin necesario.
Errores al establecer las relaciones entre variables aleatorias: Un error comn de programacin es olvidar las relaciones lgicas que existen
entre las variables aleatorias del modelo, o minimizar su impacto. Si una de
estas variables no est definida de manera correcta an es posible tener un
modelo que se apegue a la realidad actual. Sin embargo, si el sistema no se
lleva hasta su mxima capacidad para observar su comportamiento, podra
resultar imposible visualizar el verdadero impacto de las deficiencias.
Errores al determinar el tipo de distribucin asociados a las variables aleatorias del modelo: Este tipo de problema es muy similar al
anterior, solo que en este caso se utilizan distribuciones que no son las ms
adecuadas o que responden nicamente a un intento de simplificar los
estudios estadsticos.
Falta de anlisis estadstico de los resultados: Un problema comn por el que la simulacin suele ser objeto de crtica, radica en asumir que se trata
de una herramienta de optimizacin. Esta apreciacin es incorrecta, ya que
involucra variables aleatorias y caractersticas propias de un modelo que
incluye probabilidades. Por ello es necesario realizar varias corridas a fin de
producir diferentes resultados para las variables de respuesta y, a partir de
estos valores, encontrar un intervalo de confianza que puedan dar un rango
en donde encontrar valores definitivos
Uso incorrecto de la informacin obtenida: Un problema que se presenta en ocasiones es el uso incorrecto de la informacin recabada para la
realizacin del estudio, ya sea a travs de un cliente o de cualesquiera otras
fuentes. Muchas veces esta informacin se recolecta, analiza y administra d
acuerdo a las necesidades propias de la empresa, lo que implica que no
siempre est en el formato y la presentacin que se requiere para la
simulacin. Si la informacin se utiliza para determinar los parmetros del
modelo sin ser depurada y reorganizada, es muy probable que la precisin de
los resultados del estudio se vea afectada
Falta o exceso de detalle en el modelo: Otro punto importante a considerar es el nivel de detalle del modelo. En muchas ocasiones algn
proceso se simplifica tanto que tiende a verse como una caja negra que nos
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 6
impide ver que ocurre en el interior, aunque si haya entrada y salida de datos
que interactan con el modelo. Cuando esto sucede, el impacto que podran
tener los subprocesos que se llevan a cabo en la caja negra (es decir el proceso sobre simplificado) no se incluyen en la simulacin.
Por ejemplo: si se analiza un sistema de distribucin y se da por sentado que
el almacn siempre surte sus pedidos, no incluiremos el impacto de los
tiempos necesarios parta surtir las rdenes, ni la posibilidad de que haya
faltantes del producto.
Por otra parte si el modelo se hace demasiado detallado, tanto el tiempo
dedicado al estudio como el costo de llevarlo a cabo podran incrementarse
sustancialmente. La labor del encargado de simulacin es sugerir y clasificar
los niveles de detalle que se requieren en el modelo, resaltando los alcances
y limitaciones de cada uno.
3.8 Etapas en el desarrollo de experimentos de Simulacin.
Formulacin
Problema
Definicin de Objetos
Plan de Proyecto Completo
Conceptualizacin
del Modelo
Recoleccin de
Datos
Traduccin del
Modelo
Diseo Experimental
Verificado?
Validado?
NO
NO NO
Mas Ensayos?
SI SI
NO
Documentacin. Generacin de
Reporte
Implementacin
Ensayos de Produccin y
Anlisis
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 7
Etapa 1: Formulacin del problema
Se sugiere que un set de suposiciones se prepare entre el analista simulador y el
cliente. Es posible que se necesite reformular el problema. Esta etapa tambin se conoce
como Anlisis de Requerimientos.
Etapa 2: Definicin de Objetos. Plan de Proyecto Completo
Los objetivos indican las preguntas a ser respondidas por el estudio de
Simulacin. El plan de proyecto debera incluir diferentes escenarios a investigar.
Etapa 3: Conceptualizacin o Formulacin del Modelo
Los sistemas reales bajo investigacin son abstrados por un modelo conceptual.
Se recomienda que el modelo se inicie en forma simple y luego se desarrolle hasta un
modelo de complejidad avanzada o apropiada.
Etapa 4: Recoleccin de Datos
Se requiere un cronograma de requerimientos de datos al cliente. Se precisan
datos individuales y no valores promedios acumulados.
Etapa 5: Traduccin del Modelo
Codificacin del Modelo conceptualizado.
Etapa 6: Verificacin
Concierne al modelo operativo. Esta trabajando correctamente? Se recomienda
que la verificacin sea un proceso continuo. (Depuracin de cdigo, y dems estrategias
como TOP-DOWN, Programacin estructurada, etc.).
Etapa 7: Validacin
La validacin es la determinacin de que el modelo conceptual es una
representacin precisa de sistema real. Una forma ideal de validar el modelo es
comparar las salidas con las del sistema base (el sistema real).
Etapa 8: Diseo Experimental
Estos diseos conciernen a la extensin de la simulacin, el nmero de
replicaciones y la forma de inicializacin.
Etapa 9: Replicaciones o Ensayos de Produccin
Estas replicaciones o ensayos se utilizan para estimar medidas de performance
en diferentes escenarios.
Etapa 10: Determinacin de Continuar los Ensayos
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 8
El analista de simulacin y el cliente determinan si se necesitan escenarios
adicionales.
Etapa 11: Generacin de Reportes
Si el modelo de Simulacin se utilizar de nuevo por analistas diferentes ser
necesario entender como el modelo trabaja. Por ello existe la necesidad de una buena
documentacin.
Etapa 12: Implementacin
Consiste en la implantacin final del modelo.
Pasos de un estudio segn Law
3.8.1 Recoleccin de Datos
Debemos decidir cmo representar las variables aleatorias. Las tcnicas a utilizar
pueden variar de acuerdo:
A la cantidad de datos disponibles
Si los datos son crudos o son la sugerencia de alguien
Si cada variable es independiente de otras variables aleatorias de entrada o relacionadas de alguna forma
Si las variables son independientes de otras variables, las posibilidades son:
a) Asumir que la variable es determinstica Podemos estar tentados a asumir que la variable es determinstica o constante.
Ej: una mquina fabrica componentes den 1,5 min. La mquina requiere el
cambio de herramental de acuerdo a una distribucin exponencial, de un valor
esperado de 12 min. El tiempo de cambio de la herramienta es otra distribucin
exponencial con valor esperado de 3 min. Es posible simplificar este proceso
diciendo que la mquina opera en 1,875 min/min?
b) Ajustar una funcin de distribucin a los datos histricos Si poseemos al menos 50 puntos, podemos intentar ajustar una funcin de
distribucin. Si se va a realizar un test de bondad de ajuste, se recomienda seguir
los siguientes 3 pasos:
Sistema Real Modelo de
sistema
Modelo
Computacional Programa
Simulacin
Objetivos Representacin
Validacin
Codificacin
Validacin
Verificacin
Ajuste Datos Reales
Datos Simulados
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 9
I) Realizar una hiptesis sobre la funcin candidata. Esta funcin puede ser continua o discreta. Entre las discretas sealamos: Poisson, Binomial,
Geomtrica. Entre las distribuciones continuas tenemos: Normal,
Student, Uniforme, Triangular, LogNormal, Gamma, Weibull.
II) Estimar los parmetros de la distribucin candidata o elegida. Por Ejemplo, si la distribucin es normal, los parmetros a estimar son la
varianza, el Valor Esperado o esperanza.
III) Realizar un test de bondad de ajuste como chi cuadrado (x2). Si el test rechaza la hiptesis es porque hay una fuerte indicacin de que no es
verdad. En ese caso se vuelve al paso 1 o se elige la distribucin
emprica.
c) Utilizar la distribucin emprica de los datos Cuando todas las posibilidades se han agotado, utilizamos la distribucin
emprica. Ejemplo: Un sistema de cinta transportadora tiene los siguientes datos:
El tiempo para reparar la cinta despus de una falla (x).
Para las 100 veces anteriores u ocurrencias:
Intervalo (h) Frecuencia de Ocurrencia
0 x 1 27 1 < x 2 13 2 < x 3 31 3 < x 4 18 4 < x 8 11
A veces no hay datos disponibles porque el sistema no est constituido. Una
posibilidad es estimar subjetivamente un valor. Ej: el tiempo de reparacin es de 3 a 8
minutos y asumir que los datos siguen una distribucin uniforme.
30
20
10
0 1 2 3 4 5 6 7 8 x
27
13
31
18
11
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 10
Por ello esta distribucin es referida como la distribucin de mxima ignorancia
(asume todos los valores por igual).
3.8.2 Verificacin y validacin del modelo
La verificacin es la determinacin de que el modelo conceptual en la
computadora es correcto para ello se sugiere tener en cuenta:
o Seguir principios de programacin (estructurada, etc). o Hacer que el modelo operativo est bien documentado. o Verificar el cdigo por ms de una persona. o Verificar que los datos de entrada son utilizados correctamente. o Verificar para un conjunto de datos de entrada que las salidas sean
razonables.
o Utilizar el depurador. o Utilizar la animacin como verificacin.
La validacin es la determinacin de que el modelo conceptual pueda sustituir al
sistema real para la experimentacin.
Nombraremos las siguientes tcnicas subjetivas:
La validacin a simple vista (Face Validation): debe ser razonable a los expertos en el rea.
Anlisis de sensibilidad: se modifican las entradas. Test de condiciones extremas.
En cuanto a tcnicas objetivas sealaremos:
Validacin de transformacin de E/S: se compara las salidas del modelo con datos reales. Ej: test t.
Validacin utilizando datos histricos de entrada: en vez de utilizar datos artificiales utilizaremos datos histricos. Luego se compara la salida con
el sistema real. Ej: paired test t.
3.8.3 Anlisis de los Datos Simulados
El anlisis de simulacin se inicia con las medidas de performance (los tiempos,
el montaje de ocurrencias, tabulacin de varianzas y promedios, etc.). Ej: una estadstica
f
3 8
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 11
basada en el conteo de ocurrencias es el nmero de unidades aceptadas en 24hs de
simulacin.
Una herramienta para analizar o trabajar los datos de salida es el intervalo de
Confianza. Los 3 factores que influencian la amplitud del Intervalo de Confianza son: El
nmero de replicaciones (n), el nivel de confianza (1-) y la variacin de la medida de performance (s).
Resumimos: si el nmero de replicaciones se incrementa, la amplitud del
intervalo de confianza disminuye.
Si el nivel de confianza aumenta, la amplitud del intervalo de confianza
aumenta.
Si la variacin se incrementa, la amplitud del intervalo se incrementa.
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 12
3.9 Seleccin de una distribucin de entrada 3.10 Estadstica Descriptiva
Siendo x una variable aleatoria mnima, mxima, media o valor esperado o
esperanza matemtica o mediana X0.5.
Estimaciones de Muestra
)()1( , nXX (C, D)
)(nX o x o )(xE (C, D)
)(5,0 nX )2)1(( nx , si n es par
21)2/(2/ nxnx , si n es impar
Varianza 2
Coeficiente de Variacin
2cv
Lexis Ratio
2r
n
i
i xpxnS1
22
nX
nSnvc
2
(C, D)
nXnS
nr2
Sesgo (Skewness)
2
32
3
xEv
23
2
1
3
nS
nnXX
y
n
i
i
Criterios a Utilizar
Para una distribucin simtrica o Continua (normal), la media es igual a la
mediana 5,0X , no as para una distribucin discreta.
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 13
Si las estimaciones nX y la mediana 5,0X son casi iguales, la distribucin puede ser simtrica.
El coeficiente de variacin cv es igual a 1 para la distribucin exponencial, por
ello el vc (estimacin) cercano a 1, sugiere dicha distribucin. Para las distribuciones de Gamma y Weibull:
1
1
1
cv
cv
cv
1
1
1
Siendo un parmetro de forma:
Parmetro de localizacin: es una abscisa )( ix . Ej: la media para la
distribucin normal.
Parmetro de escala: Comprime o expande la distribucin sin cambiar su forma.
Parmetro de forma: Un cambio altera la forma (el sesgo o skewness).
La distribucin LogNormal, tiene un cv que puede ser cualquier nmero positivo
real, por eso si la forma concuerda, y el 1 nvc , esta distribucin puede ser mejor que la Gamma o Weibull.
Para las distribuciones discretas, el lexis ratio r , es fundamental:
1r Poisson 1r Binomial 1r Binomial Negativa o Geomtrica (Caso especial)
El sesgo de la distribucin es una medida de simetra.
Normal 0
Sesgada a la derecha o Positivy Skewed 0
Sesgada a la izquierda o Negativy Skewed 0
Mediana
Media
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 14
Summary Stadistics
3.10.1 Histogramas y Grficos de Lnea
Podemos afirmar que las funciones de densidad tienden a poseer formas
reconocibles, por ello una estimacin grfica nos puede ser muy til para reconocer una
distribucin. Para el siguiente ejemplo construiremos un histograma basados en la regla
de Sturgis:
nk 10log322,31 Siendo k el nmero de intervalos Ejemplo de Aplicacin
Un modelo de simulacin fue desarrollado para una facilidad en un banco. Los
datos fueron recolectados en base al patrn de arribo de los autos, sobre un intervalo fijo
de 90 minutos, 220 autos, llegados a la facilidad y se anot el tiempo de interarribo x
(en minutos) entre los autos i e i+1 para i=1, 2, 3,, 219.
n=219 Tiempo de interarribo (minutos) ordenados en orden creciente
0.01 0.05 0.08 0.14 0.22 0.35 0.46 0.55 0.79 1.28
0.01 0.05 0.09 0.14 0.23 0.35 0.47 0.55 0.84 1.33
0.01 0.05 0.09 0.14 0.23 0.36 0.47 0.57 0.86 1.38
0.01 0.05 0.10 0.14 0.23 0.36 0.47 0.57 0.87 1.44
0.01 0.05 0.10 0.15 0.23 0.36 0.48 0.60 0.88 1.51
0.01 0.05 0.10 0.15 0.23 0.37 0.49 0.61 0.88 1.72
0.01 0.06 0.10 0.15 0.24 0.37 0.49 0.61 0.90 1.83
0.01 0.06 0.10 0.15 0.25 0.38 0.49 0.63 0.93 1.96
0.02 0.06 0.10 0.15 0.25 0.38 0.49 0.63 0.93
0.02 0.06 0.10 0.15 0.25 0.38 0.50 0.64 0.95
0.03 0.07 0.10 0.17 0.25 0.38 0.50 0.65 0.97
0.03 0.07 0.10 0.18 0.25 0.38 0.50 0.65 1.03
0.03 0.07 0.11 0.19 0.26 0.39 0.51 0.65 1.05
0.04 0.07 0.11 0.19 0.27 0.40 0.51 0.69 1.05
0.04 0.07 0.11 0.19 0.28 0.40 0.51 0.69 1.06
0.04 0.07 0.11 0.20 0.28 0.41 0.52 0.70 1.09
Mediana
Media
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 15
621,09
95,1
977,8219log322,31
95,1
01,096,1
10
1219
k
Rb
k
R
XXR
Histograma
Los valores estn demasiado acumulados, por lo que se recomienda duplicar k, o
sea 2k = 18.
100,0
18
b
Rb
Estadstica Descriptiva
Mnimo 0,01 1X
Mximo 1,96 219X
Media 0,399
Mediana 0,270
0.04 0.07 0.11 0.21 0.29 0.41 0.52 0.72 1.10
0.04 0.07 0.12 0.21 0.29 0.43 0.53 0.72 1.11
0.04 0.07 0.12 0.21 0.30 0.43 0.53 0.72 1.12
0.05 0.07 0.12 0.21 0.31 0.43 0.53 0.74 1.17
0.05 0.08 0.12 0.21 0.31 0.44 0.54 0.75 1.13
0.05 0.08 0.13 0.22 0.32 0.45 0.54 0.76 1.24
0.05 0.08 0.13 0.22 0.35 0.45 0.55 0.77 1.24
h(x)
100
75
50
25
0,01 0,266 0,443 0,659 0,876 1,093
93
46
35
17
9 4 2
1
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 16
Varianza 0,144
c.v. 0,953
Sesgo 1,458
BoxPlot
Necesitamos conocer el mnimo, el mximo, la mediana y los cuartiles.
Mnimo = 0,01
Mximo = 1,96
Mediana = 0,27
Cuartiles = 0,100 y 0,545
La naturaleza elongada hacia la derecha seala que es una distribucin
exponencial (adems de otros criterios).
3.11 Estimacin de Parmetros
Ahora que poseemos una hiptesis sobre que distribucin puede ser utilizada,
necesitamos estimar los parmetros. Un estimador es una funcin numrica de los datos.
Aqu vamos a considerar los denominados MLE o Estimadores de Mxima Probabilidad
(Maximum Likelyhood Estimators).
3.11.1 Conceptos Tericos de MLE
Si utilizamos una distribucin discreta para nuestros datos y desconocemos el
valor del parmetro (theta), la funcin de probabilidad o de masa )(xp . Definimos
la funcin de probabilidad (likelyhood function) de la siguiente forma
nxpxpxpL ...21 , siendo L la funcin de masa conjunta o de probabilidad
h(x)
100
75
50
25
0,01 0,266 0,443 0,659 0,876 1,093 1,96
93
46
35
17
9 4 2
1
0,100 0,27 0,545
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 17
conjunta que nos da la probabilidad de obtener nuestros datos, si es el valor del parmetro desconocido.
El MLE del parmetro desconocido es , y es definido como el valor de
que maximiza la funcin L . LL
para todo valor posible de .
Para funciones continuas la funcin de densidad xf , define la funcin de
probabilidad siguiente: nxfxfxfL ...21
donde el MLE , es definido a ser
el valor de que maximiza la funcin )(L sobre todos los valores posibles.
Ejemplo A: funcin exponencial y su estimador MLE
(parmetro de escala)
x
exf
1
)(
nX = media (Cmo se llega a esta conclusin?)
nxxx
eeeL
1
...11
21
n
i
i
n
xn
xxxn
eL
eL
1
21
1
...1
Aplicando ln a ambos miembros:
n
i
i
n
i
i
n
xnl
xl
Ll
1
1
1ln
1ln
ln
0 x
f(x)
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 18
Como el logaritmo es estrictamente creciente, maximizamos la funcin l (
Ll ) ello implica que maximiza a la funcin L.
nXn
x
xn
xn
d
dl
n
i
i
i
n
i
i
1
12
1
1
Por lo tanto el MLE = = 0,399, con lo cual la funcin de distribucin
ajustada a los datos del problema es: 399,0399,0
1x
exf
El clculo diferencial y la bsqueda de mximos, a veces no funciona para todas
las distribuciones. Se puede utilizar, mtodos numricos para encontrar los estimadores
MLE.
Tabla de algunos MLEs para distribuciones sencillas (Law & Kelton)
Distribucin MLE
Exponencial nX media
Uniforme ixa min ixb max
Normal nX 2
1
21
nS
n
n
3.12 Evaluacin del Modelo 3.12.1 Distribucin Ji-Cuadrado
Definicin: Sea un entero positivo, entonces se dice que la variable aleatoria X posee una distribucin ji-cuadrado, con parmetro , si la funcin de densidad de
probabilidad de x es la funcin de densidad Gamma con 2
y 2 . La funcin de
densidad ji-cuadrado es:
xkfo
xf
,1
,
0,0
0,
22
1 21
2
2
x
xex
x
El parmetro es llamado nmero de grados de libertad de x. El smbolo 2X es usado para representar el ji-cuadrado (chi-squared).
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 19
k = nro de intervalos.
k-1 = nro de grados de libertad.
3.12.2 Test de Bondad de Ajuste
Supongamos que en un experimento cada observacin iX en una muestra es
clasificada como perteneciente a un nmero finito de categoras, con ip definimos la
probabilidad que cualquier observacin particular pertenezca a una categora i.
Deseamos verificar 0H , que especifica completamente los valores de todas las
probabilidades. Ej:
05,0
15,0
35,0
45,0
4
3
2
1
p
p
p
p
El test estadstico ser una medida de la discrepancia entre los nmeros
observados en las categoras y los nmeros esperados cuando 0H es verdadero.
Como la decisin sera alcanzada al comparar un clculo del test con un valor
crtico de la distribucin ji-cuadrado, este test de bondad de ajuste se denomina ji-
cuadrado.
Notacin:
jN : nmero de observaciones ix en la categora j ( aleatoria)
jn : nmero de observaciones esperado
n : numero total de observaciones
n
j
j nN1
j : categora o clasificacin
jp : probabilidad de la categora j. La proporcin esperada de los valores iX
f(x)
0 1 x
No Rechaza Rechaza
Densidad ji-cuadrado
grados de libertad
Ji-crtico:
Regin Sombreada
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 20
Teorema
Siendo 5jnp para cada j (j=1,2,,k).
La variable aleatoria es:
esperados
esperadosobservados
np
npNX
n
j j
jj2
1
2
2
Y tiene aproximadamente una distribucin ji-cuadrado con (k-1) grados de
libertad.
Test ji-cuadrado
Hiptesis Nula
02021010 ,,,: kk ppppppH con kp : observado
con 0kp : distribucin
Hiptesis Alternativa
aH al menos un valor de probabilidad ip no es igual a 0ip
Frmula del Test
esperado
esperadoobservado
np
npnX
k
i i
ii
2
1 0
2
02
Regin de rechazo (rechazo de la hiptesis nula)
)1,1(22
kXX
Si se supera el valor crtico, la distribucin no sirve, se rechaza la bondad de
ajuste.
Observaciones
Esperamos que el ji-cuadrado 2X sea pequeo para un buen ajuste. El punto crtico del test es elegir el nmero y tamao de los intervalos. Algo de la ambigedad de
la seleccin del intervalo es eliminado si ellos son elegidos de tal forma que:
kpppp 321
Esto se denomina mtodo equiprobable o de probabilidades idnticas.
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 21
Law & Kelton sugieren para elegir los intervalos el mtodo equiprobable y
5jnp para todas las categoras j en el caso continuo. En el caso discreto, sugieren los
jnp aproximadamente iguales y todos como mnimo de valor 5.
Ejemplo A: funcin exponencial y su MLE
399,0399,0
1x
exf
n = 219
Mtodo equiprobable
kppp 21 k = 20 intervalos
05,020
121 kppp
20
0
399,0
0
1
595,1005,0219
219
5
a
a
exF
np
n
np
x
j
j
para j = 1 19
201
201
20
399,0
399,0
je
je
jaF
j
j
a
a
j
Aplicando ln a ambos miembros
201ln399,0
201ln
399,0
ja
ja
j
j
j para 1 a 19
j Intervalos jj aa ,1 jN jnp j
jj
np
npN
1 (0, 0.0204) 8 10,950 0,7947
2 (0.0204, 0.042) 11 10,950 0,0002
19
188,222 X
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 22
Valor crtico
10,0
203,2710,01,1202
X (por tabla de puntos crticos de ji-cuadrado)
Se acepta la Hiptesis nula. No se rechaza la bondad de ajuste.
Ejemplo B: Los valores y totales para n = 256 observaciones sobre el nmero de tems
demandados en una semana de un inventario de 3 aos, son los siguientes.
ITEM QTY ESCALADO
0 59 0,37
1 26 0,16
2 24 0,153
3 18 0,11
4 12 0,07
5 5 0,03
6 4 0,02
7 3 0,019
9 3 0,019
11 2 0,012
1. Estadstica descriptiva
Mnimo 0
Mximo 11
Media 8,91
Mediana 1
Varianza 5,285
Lexis ratio 2,795
Sesgo 1,655
2. Grfico de Lnea
Escala 59/156 = 0,37
No es simtrica, por lo tanto no es discreta uniforme. En consecuencia puede ser
Binomial, Binomial negativa, geomtrica o Poisson.
El Lexis Ratio es 2,795 > 1 es Binomial negativa o geomtrica.
0,4
0,3
0,2
0,1
0 1 2 3 4 5 6 7 8 9 10 11
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 23
El Sesgo es 1,655 > 1 es sesgada a la derecha
Elegimos un distribucin Geomtrica
3. Estimacin del parmetro MLE
xp ppxP 1 x = 0,1,,n 10 pp
Funcin de Probabilidad Conjunta 21 11 xx pppppL Aplicando ln a ambos miembros pxpnplL i 1lnlnln Derivamos e igualamos a 0
11
X
pMLE
xp ppxP 1
1891,1
1
p
345,0 p
xp xP 345,01345,0
xp xP 655,0345,0 x = 0,1,,11
Test de Bondad
La moda en este caso vale 0, sugeriremos 3 intervalos. Uno que contenga a la
moda, otro de 1 a 2 y de all a la 11, el 3er intervalo.
1ra condicin 321 ppp
260,0310,0370,0
321
IpIpIp
0,4
0,3
0,2
0,1
0 1 2 3 4 5 6 7 8 9 10 11
I1 I2 I3
UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014
Pgina 24
2da condicin 5inp
345,0655,0345,00 0 pP
582,53345,01560 np OK
3739,0655,0345,0655,0345,021 21 pp PP
534,583739,015612 np OK
...113 pp PP
511,...,3,2,1 np OK
j intervalo jN jnp
j
jj
np
npN2
1 0 59 53,82 0,471
2 1-2 50 58,34 1,203
3 3-11 47 43,658 0,256
930,12 X
90.0,22
1,1 XX k
605,42 criticoX 22 XcriticoX por lo tanto est bien ajustado. La hiptesis nula no es rechazada.