Laboratorio de Probabilidad
(simulación)


Probabilidad I, curso 2003/2004
(Segundo de Matemáticas, Universidad Autónoma de Madrid)

 

1. Sesiones de prácticas

Los siguientes archivos, simul_geometrica.zip y simul_geometrica_con_tabla.zip son hojas de Excel para realizar simulaciones de una variable aleatoria geométrica. Incluye tablas, macros y botones, y puede servir de referencia para vuestras simulaciones.

 

2. Trabajos de fin de curso

El objetivo de estos trabajos es abordar una cuestión probabilística (que se elegirá de entre las de la lista que aparece más abajo) mediante simulación.

La estructura general de uno de estos trabajos incluiría:

En muchas de las cuestiones planteadas será necesaria una búsqueda previa de información (en Internet, bibliografía). En algún caso, los profesores de la asignatura suministrarán alguna referencia especial.

Los trabajos serán realizados individualmente o en grupos. Pero cada alumno deberá entregar su propio material: memoria y archivos de la simulación (aunque esa documentación sea la misma para los miembros de un grupo). Los profesores de la asignatura convocarán a cada alumno, en fecha que se determinará más adelante, y tras la entrega de los trabajos, para que explique el desarrollo del mismo.

Cada alumno o grupo de alumnos deberá elegir y comunicarnos (en persona, en la Secretaría del Departamento de Matemáticas, o por correo electrónico; por ejemplo, rellenando y enviando el formulario adjunto) el tema de trabajo antes del lunes 15 de diciembre. Se hará constar el título del trabajo elegido, y el nombre, correo electrónico y teléfono de contacto de cada uno de los miembros del grupo.

Estos trabajos supondrán el 25% de la calificación de la asignatura. El plazo límite para la entrega de los trabajos será el lunes 26 de enero de 2004 (el examen de la asignatura es el jueves 29 de enero).

Para cualquier duda o aclaración, consultad con los profesores de la asignatura: Pablo Fernández Gallardo (pablo.fernandez@uam.es) y José Luis Fernández Pérez (joseluis.fernandez@uam.es)

 

Lista de posibles temas de trabajo

En lo que sigue exponemos una serie de temas que pueden ser elegidos (cabe también la posibilidad, previa consulta con los profesores, de desarrollar alguna cuestión que no aparezca en esta lista). En cada uno de ellos se da una breve descripción que incluye: el objetivo, el modelo y un esquema de trabajo que recoge, como orientación, algunas posibles preguntas al respecto del problema planteado. Por supuesto, cualquier variación interesante será bienvenida.

1. Simulación del juego del tenis

Objetivo: Simulación del juego del tenis para analizar la relación entre la probabilidad de ganar puntos sueltos y la probabilidad de ganar partidos, y para analizar el efecto de un cambio de reglas (más sets de menos juegos, por ejemplo).

Modelo. Dados dos jugadores A y B, A gana cada punto con probabilidad p y B gana con probabilidad (1-p). Los puntos se ganan o pierden independientemente unos de otros.

Esquema de trabajo. Determinar empíricamente la relación entre p y la probabilidad de ganar el partido y el número medio de puntos.Repetir el análisis con reglas distintas: de cuatro sets de cuatro juegos, por ejemplo. O quizás como en el juego del ping-pong: partidos a un cierto número de puntos (sin sets). Repetir el análisis con una variación (para hacerlo más realista): ahora A gana los puntos "normales" con probabilidad p y los puntos comprometidos con otra probabilidad p*, para reflejar el efecto de la presión del juego.

2. Casino

Objetivo Simulación de ruleta americana y europea, para analizar las consecuencias de distintas estrategias de apuestas a Rojo y Negro

Modelo. Las distintas casillas de la ruleta son igualmente probables. En la ruleta europea están los números del 1 al 36 (la mitad rojos, la mitad negros), además del 0. En la americana, además, hay un 00.

Esquema de trabajo. Se parte de una cierta fortuna inicial. Se trata de estudiar distintas estrategias de apuestas, como las siguientes:

Las cuestiones que nos pueden interesar son variadas. Por ejemplo, simular la "ruina del jugador" (probabilidad de arruinarse y duración media de las partidas). O comprobar que el bold play es la mejor estrategia para maximizar la probabilidad de "supervivencia". O maximizar el rendimiento obtenido. O...

Convendría hacer simulaciones "realistas", en las que el número de apuestas y el montante de éstas tengan restricciones.

3. Modelo de Galton-Watson

Objetivo Simulación de la evolución de una población.

Modelo Galton-Watson de ramificación.

Esquema de trabajo Partimos de una distribución de la variable Z, el número de descendientes, con valores 0, 1, 2, 3, y probabilidades p0, p1, p2, p3. Comprobar el teorema que relaciona el número medio de descendientes con la probabilidad de extinción. Calcular el tiempo medio de extinción. Realizar el mismo análisis cuando Z sigue la distribución de parámetro p, dada por

Prob(Z=k)=(1-p)^k p, para k=0, 1, 2 ...

Obtener una relación empírica entre el parámetro p y la probabilidad de extinción. Analizar qué ocurre si la distribución de Z cambia de la siguiente manera: cuando el tamaño de la población está por encima de un umbral, la media de Z es baja; y por debajo de ese umbral, la media de Z es alta.

4. Tiempo de espera de autobuses

Objetivo. Analizar la influencia de la dispersión de los intervalos entre llegadas sobre el tiempo medio de espera.

Modelo. La unidad de tiempo es el minuto. El intervalo de tiempo A entre un autobús y el siguiente es una variable aleatoria finita positiva con media m minutos (que toma valores enteros), mientras que la llegada V del viajero a la parada se modeliza con una variable aleatoria uniforme entre los minutos de un amplio intervalo de tiempo.

Esquema de trabajo. Estimar el tiempo medio de espera del viajero, y obtener empíricamente una relación entre la media y la varianza de A y la media de V. Obtener empíricamente la distribución de probabilidad del número de autobuses que se observan en un intervalo arbitrario de tiempo de amplitud 3m.

5. Patrones en lanzamientos de cara y cruz

Objetivo. Entender cómo la estructura de los distintos patrones influye a la hora de determinar los tiempos de aparición o a la hora de competir.

Modelo Lanzamientos independientes de moneda (quizás cargada).

Esquema de trabajo Simulamos del lanzamiento de una moneda hasta que sale un patrón (una cierta lista) de caras y cruces predeterminado. Calcular tiempos medios de aparición. Ahora ponemos a competir patrones (por ejemplo, de longitud 3 ó 4) con distintos tiempos medios de aparición.

6. Ley del arco seno de las rachas en el camino aleatorio

Objetivo Entender las sutilezas de un objeto tan aparentemente sencillo como el camino aleatorio.

Modelo Lanzamientos independientes de una moneda (equilibrada).

Esquema de trabajo Lanzamos una moneda un número N determinado de veces; en cada lanzamiento, si sale cara, ganamos 1, y si sale cruz perdemos 1. Una racha es una serie consecutiva de lanzamientos para los que nuestra fortuna está por encima (o por debajo) de la inicial. ¿Cómo de probable es tener rachas largas? ¿Dónde es más probable que se produzcan, al principio, al final, o por la mitad de la partida? (en otras palabras, ¿cuándo "conviene" retirarse de una partida?). Podemos, por ejemplo, fijar la longitud de las partidas, digamos N=2n, y estudiar cuándo se produce la última "visita al cero" (volver a tener la fortuna inicial).

7. La urna de Pólya

Objetivo. Comprender el resultado y las implicaciones del modelo.

Modelo. Urna de Pólya.

Esquema de trabajo Partimos de una urna con una cierta composición inicial de bolas blancas y negras (1 y 1, por ejemplo). Se extrae una bola al azar de la urna y se añade una bola del mismo color que la extraída. Estudiar la proporción de bolas blancas y negras para la que se alcanza el equilibrio (si es que se alcanza).

Variaciones: tres colores, distintas proporciones iniciales, distintas reglas (por ejemplo, se añade del color contrario a la extraída, se añaden n del mismo color, etc.).

8. Sobreventa

Objetivo Entender la razón por la que las compañías aéreas suelen vender más billetes que plazas hay en el avión.

Modelo Hay una cierta probabilidad de cancelación p. Suponemos que es la misma para todos los pasajeros, y que cada pasajero decidir aparecer independientemente de lo que hagan los demás. Se venden un cierto número de billetes N y hay P plazas en el avión. Habrá que pagar una cierta indemnización por cada pasajero que no encuentre plaza en el avión.

Esquema de trabajo. Fijados los parámetros del modelo (no estaría de más buscar algunos datos reales sobre costes de flete, coste de billetes, indemnizaciones, etc.), simulamos escenarios en los que los pasajeros con reserva aparecen o no a la hora del vuelo. Se trata de decidir cuál es la elección óptima de N, la cantidad de asientos sobrevendidos, para los parámetros elegidos. O el problema inverso: sabemos que la compañía sobrevende un cierto número de plazas. Deducir qué probabilidad de incomparecencia p está manejando la compañía.

9. Dados mágicos

Objetivo Simular la competición entre varios dados.

Modelo Lanzamiento de dados "especiales".

Esquema de trabajo Simulamos el lanzamiento de tres dados: A tiene los números 2, 4, 9; B tiene 3, 5,7 y C tiene 1, 6, 8. Compiten dos dados: ¿quién gana? ¿Se cumple que si un dado gana a otro, y éste al tecero, entonces el primero gana al tecero? Ahora ponemos a competir los tres dados. Podemos también cambiar los pagos del juego: por ejemplo, (a) el premio es 1 para el que gana; (b) el premio es la diferencia de puntos. ¿Y con cuatro dados? ¿Y con n dados?

10. Resolución de la ecuación del calor con lanzamientos de moneda

Objetivo Resolver (la versión discreta de) una ecuación en derivadas parciales utilizando lanzamiento de monedas.

Modelo Damos datos de temperatura en cada uno de los valores enteros entre –5 y +5; fuera de este rango la temperatura es cero. Hay dos variables, n, la variable espacial (un entero) y k, el tiempo (un entero mayor que cero). Para cada par (n,k) realizamos el siguiente juego: se lanza una moneda k veces, se parte del valor n y se le suma 1 cada vez que salga cara y se le resta 1 cada vez que salga cruz. Tras los k lanzamientos, se obtiene un valor aleatorio v; a ese valor le corresponde un cierto pago (la temperatura inicial en ese valor). Repetimos el proceso muchas veces y calculamos el pago medio que recibimos: ésa es la temperatura en el punto n en tiempo k.

Esquema de trabajo Calcular la temperatura media para cada tiempo k. Comprobar que los valores obtenidos satisfacen la ecuación del calor discreta. Analizar el comportamiento de la temperatura cuando k tiende a infinito.

Reto. ¿Qué ocurre si adoptamos una estrategia de apuesta más general? ¿Qué ocurre si, en lugar de una moneda, lanzamos un dado y si sale 1 ó 2 sumamos 1, si sale 3 ó 4 no sumamos nada y si sale 5 ó 6 sumamos –1? Generalizar.

11. Modelo de difusión para el crecimiento de un área urbana

Objetivo Simular el crecimiento de un área urbana.

Modelo. Partimos de una densidad de población en cada punto de un retículo (en una dimensión, o quizás en dos). En cada instante de tiempo, esa densidad evoluciona con la siguiente regla: con probabilidad p la densidad se hace cero y con probabilidad 1-p, se calcula la densidad media de los puntos vecinos (en el retículo) y se multiplica por un factor fijo superior a uno.

Esquema de trabajo Comprobar cómo evoluciona la densidad de población en función de los datos iniciales, p, y el factor de multiplicación.

12. Corrección de errores en listas de ceros y unos

Objetivo Entender, probabilísticamente, la eficacia de los sistemas de detección y corrección de errores.

Modelo Una fuente produce ceros y unos (aleatoriamente). Hay una cierta probabilidad p de confusión (cambiar un 0 por un 1 o viceversa). El mensaje es de longitud n.

Esquema de trabajo ¿Cuál es la probabilidad de que el mensaje se transmita correctamente? Ahora empleamos un sistema de corrección de errores: enviamos cada símbolo un número impar de veces (3, por ejemplo). Se utliza un criterio de corrección de mayoría. ¿Probabilidad de transmisión correcta? ¿Y si se utilizan otros sistemas de corrección, como un código de Hamming o un control de paridad?

13. Colas en cajeros

Objetivo Entender cómo se forman colas en las cajas de un supermercado y tomar decisiones para evitarlo.

Modelo Simulación aleatoria de las llegadas de los clientes a las cajas y de la atención por parte de los empleados de las cajas.

Esquema de trabajo Hay tres cajas en un supermercado. Los clientes llegan (en cada unidad de tiempo, un minuto, por ejemplo) a las cajas con una cierta distribución (digamos, una Poisson) y se colocan en ellas aleatoriamente. Los encargados de las cajas atienden m personas (en media) por minuto. ¿Cuál es la longitud de la cola que se forma? ¿Cómo influye si cambiamos la velocidad de atención en una caja? Variación: los clientes, al llegar, se sitúan en la caja cuya cola sea más corta.

14. El viaje ¿sin retorno? del borracho en una, dos y tres dimensiones

Objetivo Estudiar la probabilidad de que las trayectorias del camino aleatorio en una, dos y tres dimensiones vuelvan al origen.

Modelo Camino aleatorio en el retículo de 1, 2 y 3 dimensiones.

Esquema de trabajo Un tipo sale de su casa y se mueve aleatoriamente, a derecha e izquierda. ¿Volverá alguna vez a su casa, al punto de partida? ¿Y si se mueve en el plano? ¿Y en el espacio? ¿Cómo se podría hacer si no nos restringimos al retículo?

15. Diseño de ascensores

Objetivo Tomar una decisión sobre el diseño del funcionamiento de un ascensor en un edificio.

Modelo y esquema de trabajo. Se trata de simular los movimientos de un ascensor, en función de las llamadas que recibe.

Queremos comparar dos posibles diseños: en uno, el ascensor se queda en el último piso en el que haya dejado pasajeros. En otro, si durante un cierto tiempo no ha sido llamado, baja automáticamente a la planta baja.

En un modelo sencillo, el edificio tiene 10 pisos, además de la planta baja, y en el ascensor sólo cabe una persona. En un cierto paso, el ascensor está en un determinado piso. Sorteamos primero desde qué piso se le llama (quizás desde ninguno). Y contamos el "tiempo" que tarda en llegar (medido en número de pisos recorridos). Luego sorteamos en qué piso se queda. Y volvemos a empezar.

El objetivo es minimizar el tiempo medio de espera hasta que llega el ascensor, comparando las posibles estrategias: el ascensor se queda en el último piso visitado, va automáticamente a la planta baja, o quizás hace esto sólo en el caso de no haber sido pedido en el paso anterior.

16. Paradoja de Braess

Objetivo Comprobar que no siempre, al mejorar una red de comunicaciones, se mejora el funcionamiento de la misma.

Modelo Simulación de una red de transporte.

Esquema de trabajo Diseñamos dos redes de transporte (ver, por ejemplo, el artículo de Manuel Conthe sobre la paradoja de Braess) y comparamos el tiempo que se tarda en hacer los recorridos en cada una de ellas.

17. El coleccionista de cromos

Objetivo Medir el tiempo que se tarda en completar una colección de cromos.

Modelo Los cromos aparecen con distribución uniforme. Variantes: algunos cromos son especialmente "difíciles".

Esquema de trabajo La colección consta de n cromos. Cada mañana se visita el kiosko y se compra un sobre que contiene un cromo. Visitamos el kiosko hasta completar la colección. Y medimos el tiempo medio (en número de días) que tardamos en conseguirlo.

18. La ruina de una compañía

Objetivo Analizar la estrategia que debe seguir una compañía (reservas que debe mantener) para evitar situaciones de quiebra..

Modelo Los pagos anuales siguen una cierta distribución, por ejemplo, una Poisson (o quizás una lognormal).

Esquema de trabajo Una compañía (de seguros) tiene unos ingresos fijos anuales C (por ejemplo, las primas que cobra a sus clientes). Los pagos que realiza cada año (por ejemplo, por los sinistros sufridos por sus clientes) son, sin embargo, aleatorios. Tiene, además, una reserva de fondos R. El primer año, el balance es X1 - C, donde X1 son los pagos efectuados ese primer año. Si esa diferencia es mayor que R, entonces la compañía quiebra. Lo mismo ocurre el segundo año, sólo que ahora hay que comparar X1+X2 con 2C. Y así, sucesivamente.

Marcamos un horizonte temporal, digamos 10 años, y queremos calcular la probabilidad de que la compañía no quiebre en ese periodo, dado un cierto valor de R. O, mejor, determinar el valor de R que hace que la probabilidad de quiebra sea menor de, por ejemplo, un 5%.

19. Sufriendo en el Cercanías

Objetivo Analizar cómo pequeños retrasos en un tren en un determinado nodo del trayecto pueden dar lugar a grandes retrasos globales (¡y no llegar a la clase de Probabilidad de las 9:30!).

Modelo Para llegar a la Autónoma, un alumno del curso de Probabilidad tiene que hacer dos trasbordos en el Cercanías. Los tiempos de llegada de los trenes son variables aleatorias.

Esquema de trabajo En las tres líneas, los trenes circulan cada 15 minutos. De la casa (A) al nodo B se toma la línea 1, del nodo a B al nodo C la línea 2, y del nodo C a la Autónoma, la línea 3. El tren parte de A a las 8:30, y tarda en llegar a B, en media, 15 minutos (digamos que con variabilidad de un minuto arriba o abajo). A las 8:45 tiene prevista la llegada a B el tren de la línea 2 (pero, de nuevo, hay aleatoriedad en ese momento de llegada). El trayecto hasta C dura, en media, otros 25 minutos. Y a las 9:10 es cuando se prevé que llegue el tren de la línea 3, que tarda, en media, 10 minutos en llegar a la Autónoma. ¿Con qué probabilidad llegamos a clase de primera hora? ¿Con qué probabilidad tendremos grandes retrasos?

20. Recuentos electorales

Objetivo Analizar la significación que pueden tener las encuestas parciales (por ejemplo, recuento de las cien primeras papeletas) en el resultado final de unas elecciones.

Modelo Ballot problem, camino aleatorio.

Esquema de trabajo En una votación, el candidato A obtiene a votos, mientras que el candidato B obtiene b votos, con a>b. Queremos medir la probabilidad de que el candidato finalmente ganador, A, vaya siempre en cabeza a lo largo de todo el recuento (éste es el clásico ballot problem).

Una variación: Sabemos que el candidato A ha conseguido, al final del recuento (hay 1000 votos), un 52% de los votos, mientras que B ha conseguido un 48%. ¿Cuál es la probabilidad de que, en el recuento de los primeros 100 votos, el resultado sea "el contrario" (esto es, que el candidato finalmente ganador tenga menos del 48% de los votos)? Recuérdese cierto episodio electoral reciente y sáquense conclusiones.

Última actualización: 2 de enero de 2003.