Sea \(X\) una v.a. con distribución de Cauchy(\(\theta\),\(a=1\)), cuya función de densidad \[ f(x;\theta) = \frac{1}{\pi}\frac{1}{1+(x-\theta)^2}, \qquad x\in{\mathbb R}, \] depende del parámetro desconocido \(\theta\in{\mathbb R}\). Comprobar que \(\theta\) coincide con la mediana y la moda de \(X\) pero que la media \({\mathbb E}(X)\) no está definida.

Diseñar un experimento de simulación en R, tomando algún valor concreto de \(\theta\), orientado a comprobar cómo se comportan la mediana muestral y la media muestral como estimadores de \(\theta\): mientras la mediana muestral se acerca al verdadero valor de \(\theta\) al aumentar \(n\), la media muestral oscila fuertemente y no se acerca a \(\theta\) aunque se aumente el tamaño muestral \(n\).


Solución:

La mediana poblacional es un valor \(M\) tal que \(\mathbb P\{X\leq\theta\}=\mathbb P\{X\geq\theta\}=0.5\). Por simetría de la densidad \(f\) respecto al punto \(x=\theta\), está claro que la mediana poblacional en este caso es \(M=\theta\).

Además, claramente la densidad \(f\) es estrictamente creciente de \(-\infty\) a \(\theta\) y estrictamente decreciente de \(\theta\) a \(\infty\). Además la densidad \(f\) es continua en todo \(\mathbb R\). Por tanto, la (única) moda de la densidad es \(x=\theta\), el punto de máximo global de \(f\).

\[ {\mathbb E}|X| = \int_{\mathbb R} |x| f(x;\theta) dx = \frac{1}{\pi} \left( \int_0^{\infty} \frac{x}{1+(x-\theta)^2} dx - \int_{-\infty}^0 \frac{x}{1+(x-\theta)^2} dx \right) = \infty. \]

Respecto al experimento computacional, fijamos un tamaño muestral n y, sin pérdida de generalidad, un valor de \(\theta=0\).

n = 1000
theta = 0

Aunque no se pide en el enunciado se puede dibujar la densidad de la Cauchy(\(\theta\),\(a=1\)) y compararla con una N(0,1) para comprobar que las colas de la Cauchy son más pesadas que las de la normal:

par(mar=c(2,2,0.1,0.1)) # Ajusta el margen exterior de la figura
t = seq(-4,4,0.1)
plot(t,dcauchy(t),col='red',ylim=c(0,0.4),type='l')
lines(t,dnorm(t),col='black')

Hacemos un bucle for con n iteraciones. En la iteración i del bucle extraemos una muestra de tamaño i de la Cauchy(\(\theta\),\(a=1\)). Calculamos las correspondientes media y la mediana muestrales que guardamos en la componente i de los vectores m y med respectivamente:

m = rep(0,n)
med = rep(0,n)

for (i in 1:n){
    X = rcauchy(i, location = theta, scale = 1)
    m[i] = mean(X)
    med[i] = median(X)
}

Dibujamos las medias muestrales en función del tamaño muestral n:

par(mar=c(2,2,0.2,0.2)) # Ajusta el margen exterior de la figura
plot(1:n,m[1:n],type="l",lwd=1,xlab="n",ylab="Medias muestrales",font.main=1,cex.main=1)
points(1:n,m[1:n],pch=".",cex=2,col="red")

En este caso no se cumple la Ley de los Grandes Números porque no existe \(\mathbb E(X)\). Por eso la media muestral no converge a ningún valor y ocasionalmente tiene grandes oscilaciones.

Análogamente dibujamos las medianas muestrales en función del tamaño muestral n:

par(mar=c(2,2,0.1,0.2)) # Ajusta el margen exterior de la figura
plot(1:n,med[1:n],type="l",lwd=1,xlab="n",ylab="Medianas muestrales",cex.main=1,font.main=1)
points(1:n,med[1:n],pch=".",cex=2,col="red")

Las medianas muestrales sí convergen a la mediana poblacional (\(\theta=0\)) cuando \(n\) crece.