Combinatoria

Algunos problemas de combinatoria requieren gran cantidad de cálculos y se impone una solución con el ordenador. Muchos otros problemas se pueden resolver con papel y lápiz, pero requieren tiempo e ingenio. Sin embargo, escribir programas de ordenador que resuelven los problemas por fuerza bruta suele ser bastante fácil. El problema estriba en que la cantidad de casos a examinar a menudo se dispara, y un programa poco fino sólo podrá resolver los casos más sencillos. A veces, éso es suficiente para darnos una idea, pero en general es más recomendable aprender a hacer programas más eficientes.

En este bloque escribiremos programas que exploran conjuntos de posibilidades muy amplios. Es muy importante comenzar siempre por aplicar nuestros programas con valores muy pequeños, medir bien los tiempos, y sólo lanzar los programas con los valores que nos interesan cuando pensemos que el programa podrá manejarlo.

Cómo iterar sobre todos los posibles valores de muchas variables

Comenzamos un truco muy práctico que puede servir como alternativa a anidar muchos bucles for. Supón que tenemos K variables que pueden tomar el valor 0 ó 1, y queremos recorrer todas las posibles combinaciones de valores para cada variable.

Si por ejemplo, K=10, la cantidad total de posibilidades es 2^{10}=1024, algo perfectamente asumible. Anidar 10 bucles es muy poco práctico, y obliga a hacer cambios sustanciales si aumentamos el número de variables:

for k1 in [0,1]:
    for k2 in [0,1]:
        for k3 in [0,1]:
            for k4 in [0,1]:
                for k5 in [0,1]:
...

En su lugar, podemos usar el siguiente truco: cuando un número k recorre los números desde 0 hasta 2^k -1, sus bits recorren todas las posibles combinaciones de 0 y 1 para K variables. Podemos usar, por ejemplo, el método digits() pasando los argumento base=2 y padto=K , para que extraiga los dígitos binarios (bits) y devuelva siempre listas de longitud K.

Este método lo tienen todos los enteros de SAGE (cuidado: esto nos obliga a usar srange en vez de range , para tener enteros de SAGE en vez de enteros de la máquina).

Con este truco, no necesitamos saber el número de variables al escribir el código.

sage: #Truco para iterar K variables que pueden tomar el valor 0 o 1
sage: #K no es conocido a priori
sage: K=4
sage: for k in srange(2^K):
...       vars = k.digits(base=2,padto=K)
...       print vars
[0, 0, 0, 0]
[1, 0, 0, 0]
[0, 1, 0, 0]
[1, 1, 0, 0]
[0, 0, 1, 0]
[1, 0, 1, 0]
[0, 1, 1, 0]
[1, 1, 1, 0]
[0, 0, 0, 1]
[1, 0, 0, 1]
[0, 1, 0, 1]
[1, 1, 0, 1]
[0, 0, 1, 1]
[1, 0, 1, 1]
[0, 1, 1, 1]
[1, 1, 1, 1]

Subconjuntos (y sublistas)

La técnica anterior permite iterar sobre todas las sublistas de una lista dada. Dada una lista con k elementos, usamos k variables que pueden tomar los valores 0 y 1. Si la variable xj vale 1, incluimos el elemento j-ésimo en la sublista y, si vale 0, no lo incluimos.

Ejercicio: usa la técnica anterior para mostrar todas las sublistas de una lista dada.

sage: lista = ['a','b','c','d']

También podemos usar la función powerset , definida en SAGE que hace la misma tarea.

sage: for sublista in powerset(lista):
...       print sublista
[]
['a']
['b']
['a', 'b']
['c']
['a', 'c']
['b', 'c']
['a', 'b', 'c']
['d']
['a', 'd']
['b', 'd']
['a', 'b', 'd']
['c', 'd']
['a', 'c', 'd']
['b', 'c', 'd']
['a', 'b', 'c', 'd']

Ejemplo: gcd de un subconjunto de números

¿Cuántos conjuntos de números enteros entre 2 y K tienen máximo común divisor igual a 1?

sage: K = 7
sage: numeros = range(2,K+1)
sage: mcd_es_1 = 0
sage: for subconjunto in powerset(numeros):
...       if gcd(subconjunto)==1:
...           mcd_es_1 += 1
sage: print mcd_es_1
52

Consideramos el ratio entre el número de conjuntos de números enteros entre 2 y K cuyo máximo común divisor es igual a 1 frente al total de subconjuntos de enteros entre 2 y K: ¿existe el límite de esta sucesión?

sage: probs = []
sage: for K in range(3,15):
...       numeros = range(2,K+1)
...       mcd_es_1 = 0
...       for subconjunto in Subsets(numeros):
...           if gcd(subconjunto)==1:
...               mcd_es_1 += 1
...       total = 2^(K-1)
...       probs.append((K,mcd_es_1/total))
sage: point(probs).show(ymin=0,ymax=1)
_images/cell_21_sage0.png

Observación : la función powerset devuelve un objeto similar a un generador. Recordamos que al construir un generador el código no se ejecuta, y no se almacenan en memoria los resultados, sino que sólo se van construyendo según son necesarios, por ejemplo al iterar powerset en un bucle for. Sin embargo, difiere de un generador en que no se agota al iterarlo. Cada vez que recorremos el objeto, se crea un generador nuevo.

sage: ps = powerset([1, 2, 3])
sage: all(1 in s for s in ps)
sage: for k in ps:
...       print k
[1]
[2]
[1, 2]
[3]
[1, 3]
[2, 3]
[1, 2, 3]

Recorrer otras listas de objetos combinatorios

Los objetos combinatorios suelen admitir una definición recursiva que permite construir unos a partir de otros. Si representamos los objetos primordiales (una lista vacía, un árbol con un sólo nodo ...) como las raíces de un árbol, y utilizamos la definición recursiva para construir las sucesivas generaciones de nodos, podemos generar los objetos de forma bastante limpia, recorriendo el árbol que comienza en cada nodo base (sea en recorrido o en profundidad).

Lo importante de este enfoque es concretar la definición recursiva en una función que acepta un nodo como argumento y devuelve la lista con sus hijos, y separar esta parte de la definición del recorrido del grafo. Para esta segunda parte podemos usar por ejemplo la función SearchForest definida en Sage, que hace un recorrido en profundidad de un bosque, que no es otra cosa que una unión disjunta de árboles. También podemos escribir nuestro propio código genérico para esta tarea.

Como ejemplo, usamos esta idea para construir las particiones de un número k: todas las formas de sumar k con enteros positivos menores que k. Escribimos cada partición de k como una lista de enteros que suma k, y para evitar repeticiones las listamos sólo una vez en orden decreciente. Podemos construir todas las particiones parciales de k, que son listas decrecientes cuya suma es a lo sumo k. Los hijos de una partición parcial L son las particiones parciales que comienzan por L y tienen un elemento más que L. Lo dibujamos como un grafo:

_images/particiones5.png
sage: total = 5
sage: def hijos(ls):
...       '''Los hijos de una lista ls son las listas que comienzan por ls
...       y tienen un elemento más que ls
...       '''
...       suma  = sum(ls)
...       minimo = min(ls) if ls else total
...       return [ls + [j] for j in range(1, min(total - suma, minimo) + 1)]
sage: hijos([2])
[[2, 1], [2, 2]]
sage: #SearchForest necesita una lista de nodos raices y la funcion que
sage: #genera los hijos
sage: S = SearchForest([[]], hijos)
sage: #Si pasamos el resultado a lista recorremos todas las particiones parciales
sage: [ls for ls in S]
sage: #Si queremos sólo las particiones completas, basta con filtrarlas
sage: [ls for ls in S if sum(ls)==total]
[[1, 1, 1, 1, 1], [2, 1, 1, 1], [2, 2, 1], [3, 1, 1], [3, 2], [4, 1], [5]]

Antes de poder reusar este código, observamos que la función hijos usa la variable total definida en el ámbito principal. Para pasar este código a función, podemos simplemente anidar la función hijos dentro de la nueva función para que pueda acceder al argumento de la función principal:

sage: def particiones(total):
...       def hijos(ls):
...           suma  = sum(ls)
...           minimo = min(ls) if ls else total
...           return [ls + [j] for j in range(1, min(total - suma, minimo) + 1)]
...
...       return [ls for ls in SearchForest([[]], hijos) if sum(ls)==total]
sage: list(particiones(5))
[[1, 1, 1, 1, 1], [2, 1, 1, 1], [2, 2, 1], [3, 1, 1], [3, 2], [4, 1], [5]]

Ya hemos encontrado otros ejemplos de este patrón, como por ejemplo generar todos los polinomios de cierto grado con coeficientes en un cierto rango. Repetimos el ejercicio con esta visión, declarando que los hijos del polinomio p son los polinomios px+j, para j en el rango de coeficientes en el que trabajamos.

sage: m = 3
sage: R.<x> = PolynomialRing(Integers(m))
sage: pols1 = [R(j) for j in srange(m)]
sage: grado_max = 3
sage: def children(p):
...       if p.degree()>=grado_max or p == 0:
...           return []
...       else:
...           return [p*x+j for j in srange(m)]
sage: S = SearchForest(pols1, children)
sage: [ls for ls in S]
[0, 1, x, x^2, x^3, x^3 + 1, x^3 + 2, x^2 + 1, x^3 + x, x^3 + x + 1, x^3 + x + 2, x^2 + 2, x^3 + 2*x, x^3 + 2*x + 1, x^3 + 2*x + 2, x + 1, x^2 + x, x^3 + x^2, x^3 + x^2 + 1, x^3 + x^2 + 2, x^2 + x + 1, x^3 + x^2 + x, x^3 + x^2 + x + 1, x^3 + x^2 + x + 2, x^2 + x + 2, x^3 + x^2 + 2*x, x^3 + x^2 + 2*x + 1, x^3 + x^2 + 2*x + 2, x + 2, x^2 + 2*x, x^3 + 2*x^2, x^3 + 2*x^2 + 1, x^3 + 2*x^2 + 2, x^2 + 2*x + 1, x^3 + 2*x^2 + x, x^3 + 2*x^2 + x + 1, x^3 + 2*x^2 + x + 2, x^2 + 2*x + 2, x^3 + 2*x^2 + 2*x, x^3 + 2*x^2 + 2*x + 1, x^3 + 2*x^2 + 2*x + 2, 2, 2*x, 2*x^2, 2*x^3, 2*x^3 + 1, 2*x^3 + 2, 2*x^2 + 1, 2*x^3 + x, 2*x^3 + x + 1, 2*x^3 + x + 2, 2*x^2 + 2, 2*x^3 + 2*x, 2*x^3 + 2*x + 1, 2*x^3 + 2*x + 2, 2*x + 1, 2*x^2 + x, 2*x^3 + x^2, 2*x^3 + x^2 + 1, 2*x^3 + x^2 + 2, 2*x^2 + x + 1, 2*x^3 + x^2 + x, 2*x^3 + x^2 + x + 1, 2*x^3 + x^2 + x + 2, 2*x^2 + x + 2, 2*x^3 + x^2 + 2*x, 2*x^3 + x^2 + 2*x + 1, 2*x^3 + x^2 + 2*x + 2, 2*x + 2, 2*x^2 + 2*x, 2*x^3 + 2*x^2, 2*x^3 + 2*x^2 + 1, 2*x^3 + 2*x^2 + 2, 2*x^2 + 2*x + 1, 2*x^3 + 2*x^2 + x, 2*x^3 + 2*x^2 + x + 1, 2*x^3 + 2*x^2 + x + 2, 2*x^2 + 2*x + 2, 2*x^3 + 2*x^2 + 2*x, 2*x^3 + 2*x^2 + 2*x + 1, 2*x^3 + 2*x^2 + 2*x + 2]

Objetos combinatorios útiles definidos en Sage

En Sage están definidos muchos objetos combinatorios útiles, que podemos usar y combinar de varias formas. Todos tienen una estructura uniforme que permite usarlos de varias formas. Todas estos objetos combinatorios son perezosos, e incluso podemos definir objetos infinitos. En general usan un método para enumerar todos los objetos y otro distinto para contarlos , que es importante porque en muchos casos se puede contar el número de objetos en muy poco tiempo aplicando fórmulas, mientras que enumerarlos todos podría llevar mucho tiempo. En general, usaremos los siguientes métodos:

  • cardinality() para obtener el número de elementos
  • list() para obtener la lista de todos los elementos
  • random_element() para obtener un elemento aleatorio
  • Iteraciones del tipo for objeto in Clase para recorrer los objetos sin necesidad de cargarlos todos en memoria.

Conjuntos y subconjuntos

Probemos todo ésto con los conjuntos ( Set ) y subconjuntos ( Subsets ) :

sage: S = Set([1,2,3,4])
sage: S1 = Subsets(S)
sage: S1.list()
[{}, {1}, {2}, {3}, {4}, {1, 2}, {1, 3}, {1, 4}, {2, 3}, {2, 4}, {3, 4}, {1, 2, 3}, {1, 2, 4}, {1, 3, 4}, {2, 3, 4}, {1, 2, 3, 4}]
sage: S2 = Subsets(Subsets(S))
sage: S2.random_element()
{{3}, {4}, {1, 2, 3}, {1, 4}, {}, {2, 3, 4}, {1, 2, 4}, {3, 4}, {1, 3, 4}, {2, 3}, {1, 3}, {2}}
sage: #Por si acaso no te creias que para calcular el cardinal no hace falta
sage: #calcular todos los elementos
sage: S3 = Subsets(Subsets(Subsets(S)))
sage: S3.cardinality()


Combinaciones

Dada una lista de tamaño k, las combinaciones de j elementos de la lista son todas las posibles sublistas con j elementos extraídos de la lista. En SAGE, podemos recorrer las combinaciones con un generador, de forma similar a la que usamos para powerset:

for c in Combinations(lista,j):
    ...haz algo con c...
sage: K=5
sage: for c in Combinations(range(2,K+1),2):
...       print c
[2, 3]
[2, 4]
[2, 5]
[3, 4]
[3, 5]
[4, 5]

Ejemplo: ¿Cuál es la probabilidad de que dos números elegidos al azar entre 2 y K sean primos entre sí?

Usando la fórmula:

\text{probabilidad}=\frac{\text{casos favorables}}{\text{casos posibles}}

sólo tenemos que extraer todos los posibles pares de números entre 2 y K, y contar cuántas parejas están formadas por dos números primos entre sí.

sage: K=5
sage: primos_relativos = 0
sage: for c in Combinations(range(2,K+1),2):
...       if gcd(c)==1:
...           primos_relativos += 1
sage: print primos_relativos
5
sage: binomial(10,2)
45

¿Existe el límite cuando K\rightarrow \infty?

sage: probs = []
sage: for K in range(3,40):
...       primos_relativos = 0
...       for c in Combinations(range(2,K+1),2):
...           if gcd(c)==1:
...               primos_relativos += 1
...       total = binomial(K-1,2)
...       probs.append((K,primos_relativos/total))
sage: print probs
[(3, 1), (4, 2/3), (5, 5/6), (6, 3/5), (7, 11/15), (8, 2/3), (9, 19/28), (10, 11/18), (11, 31/45), (12, 34/55), (13, 15/22), (14, 25/39), (15, 57/91), (16, 64/105), (17, 79/120), (18, 21/34), (19, 101/153), (20, 12/19), (21, 119/190), (22, 64/105), (23, 149/231), (24, 156/253), (25, 175/276), (26, 31/50), (27, 203/325), (28, 214/351), (29, 241/378), (30, 124/203), (31, 277/435), (32, 292/465), (33, 311/496), (34, 163/264), (35, 349/561), (36, 72/119), (37, 79/126), (38, 206/333), (39, 435/703)]
sage: point(probs).show(ymin=0,ymax=1)
_images/cell_27_sage0.png

Más

  • Permutaciones: Permutations(lista) recorre todas las ordenaciones de lista .
  • Particiones: Partitions (k) recorre las formas de sumar k con enteros positivos. Además admite argumentos extra para limitar más las particiones (aunque atención: lee bien la documentación porque en algunos casos el resultado no es claro).
  • Vectores de enteros: IntegerVectors recorre las formas de sumar un entero con enteros no negativos. También admite argumentos extra.
  • WeightedIntegerVectors recorre las formas de sumar un entero usando los enteros de una lista dada (¿de cuántas formas puedo pagar 33 euros usando billetes de 5 y monedas de 2?)
  • CartesianProduct calcula el producto cartesiano de dos conjuntos.
sage: Permutations(srange(4)).list()
[[0, 1, 2, 3], [0, 1, 3, 2], [0, 2, 1, 3], [0, 2, 3, 1], [0, 3, 1, 2], [0, 3, 2, 1], [1, 0, 2, 3], [1, 0, 3, 2], [1, 2, 0, 3], [1, 2, 3, 0], [1, 3, 0, 2], [1, 3, 2, 0], [2, 0, 1, 3], [2, 0, 3, 1], [2, 1, 0, 3], [2, 1, 3, 0], [2, 3, 0, 1], [2, 3, 1, 0], [3, 0, 1, 2], [3, 0, 2, 1], [3, 1, 0, 2], [3, 1, 2, 0], [3, 2, 0, 1], [3, 2, 1, 0]]
sage: Partitions(5).list()
[[5], [4, 1], [3, 2], [3, 1, 1], [2, 2, 1], [2, 1, 1, 1], [1, 1, 1, 1, 1]]
sage: IntegerVectors(4, max_length=3).list()
[[4], [3, 1], [3, 0, 1], [2, 2], [2, 1, 1], [2, 0, 2], [1, 3], [1, 2, 1], [1, 1, 2], [1, 0, 3], [0, 4], [0, 3, 1], [0, 2, 2], [0, 1, 3], [0, 0, 4]]
sage: #Todas las formas de sumar 8 usando monedas de 1, 2 y 5
sage: WeightedIntegerVectors(8, [1,2,5]).list()
[[1, 1, 1], [3, 0, 1], [0, 4, 0], [2, 3, 0], [4, 2, 0], [6, 1, 0], [8, 0, 0]]
sage: WeightedIntegerVectors(33,[2,5]).list()
[[4, 5], [9, 3], [14, 1]]