<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" 
      xmlns:media="http://search.yahoo.com/mrss/" 
      xmlns:content="http://purl.org/rss/1.0/modules/content/" 
      xmlns:dc="http://purl.org/dc/elements/1.1/" 
      version="2.0">
<channel>
<title>Caminos aleatorios</title>
<link>/~joser.berrendero/caminos_aleatorios/</link>
<atom:link href="/~joser.berrendero/caminos_aleatorios/index.xml" rel="self" type="application/rss+xml"/>
<description>Docencia e investigación en estadística</description>
<generator>quarto-1.8.24</generator>
<lastBuildDate>Sun, 12 Apr 2026 22:00:00 GMT</lastBuildDate>
<item>
  <title>Gráficos cuantil-cuantil (QQ-Plots)</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/037-qqplots/</link>
  <description><![CDATA[ 





<p>La técnica que vamos a describir en esta entrada se utiliza para determinar si una muestra de observaciones independientes e idénticamente distribuidas <img src="https://latex.codecogs.com/png.latex?X_1,%5Cldots,X_n"> sigue una distribución determinada <img src="https://latex.codecogs.com/png.latex?F">. Es decir, el problema es el mismo que el de los contrastes de bondad de ajuste pero se trata de una técnica exploratoria en lugar de ser un contraste planteado formalmente. Esencialmente consiste en comparar los valores de la muestra ordenados (los estadísticos de orden) con sus valores esperados para una distribución dada. Si se observa una diferencia grande se concluye que esa distribución no es la que siguen los datos.</p>
<section id="distribución-uniforme" class="level2">
<h2 class="anchored" data-anchor-id="distribución-uniforme">Distribución uniforme</h2>
<p>Comenzamos por observaciones i.i.d. <img src="https://latex.codecogs.com/png.latex?U_1,%5Cldots,U_n"> procedentes de una distribución uniforme en el intervalo <img src="https://latex.codecogs.com/png.latex?(0,1)">. Denotamos por <img src="https://latex.codecogs.com/png.latex?U_%7B(i)%7D"> al estadístico de orden <img src="https://latex.codecogs.com/png.latex?i">, es decir, el dato que ocupa el lugar <img src="https://latex.codecogs.com/png.latex?i">-ésimo cuando los ordenamos de menor a mayor. Como la probabilidad se reparte por igual por todas las zonas del intervalo, parece razonable esperar que <strong>por término medio</strong> las observaciones dividan al intervalo en <img src="https://latex.codecogs.com/png.latex?n+1"> partes iguales, lo que implica que <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D(U_%7B(i)%7D)%20=%20%5Cfrac%7Bi%7D%7Bn+1%7D."> Este resultado se puede probar rigurosamente. Ahora, si representamos los valores <img src="https://latex.codecogs.com/png.latex?U_%7B(i)%7D"> frente a los <img src="https://latex.codecogs.com/png.latex?i/(n+1)"> para <img src="https://latex.codecogs.com/png.latex?i=1,%5Cldots,n"> es de esperar que los puntos se sitúen aproximadamente alineados sobre la bisectriz. Con el siguiente código generamos una muestra de datos uniformes y hacemos el gráfico para comprobar que los puntos resultantes están aproximadamente alineados:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb1" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb1-1"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">set.seed</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span>)</span>
<span id="cb1-2">n <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">100</span></span>
<span id="cb1-3">x <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">seq</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span>,n)<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span> (n<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span>)</span>
<span id="cb1-4">y <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">sort</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">runif</span>(n))</span>
<span id="cb1-5"></span>
<span id="cb1-6"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">ggplot</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">data.frame</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> x, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> y), <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">aes</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> x, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> y)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb1-7">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_point</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb1-8">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_abline</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">intercept =</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">0</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">slope =</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">linetype =</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>)</span></code></pre></div></div>
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/037-qqplots/index_files/figure-html/unnamed-chunk-2-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:80.0%"></p>
</figure>
</div>
</div>
</div>
</section>
<section id="distribución-continua-conocida" class="level2">
<h2 class="anchored" data-anchor-id="distribución-continua-conocida">Distribución continua conocida</h2>
<p>Sea ahora <img src="https://latex.codecogs.com/png.latex?F"> una función de distribución continua y <img src="https://latex.codecogs.com/png.latex?X_1,...,X_n%20%5Coverset%7Biid%7D%7B%5Csim%7D%20F">. Es un hecho bastante conocido que <img src="https://latex.codecogs.com/png.latex?F(X_1),%5Cldots,F(X_n)"> son i.i.d. con distribución uniforme en el intervalo <img src="https://latex.codecogs.com/png.latex?(0,1)">. Por lo tanto, si representamos <img src="https://latex.codecogs.com/png.latex?F(X_%7B(i)%7D)%20%5C%20%5C%20%20%5Cmbox%7Bfrente%20a%7D%5C%20%5C%20%20i/(n+1),%5C%20%5C%20i=1,%5Cldots,n,"> debemos esperar que los puntos estén más o menos alineados. Si esto no ocurre, es probable que <img src="https://latex.codecogs.com/png.latex?F"> no sea la distribución de la que proceden los datos. Equivalentemente, el gráfico que se utiliza a veces es el de <img src="https://latex.codecogs.com/png.latex?X_%7B(i)%7D%5C%20%20%5C%20%5Cmbox%7Bfrente%20a%7D%5C%20%5C%20F%5E%7B-1%7D%5Cleft(%5Cfrac%7Bi%7D%7Bn+1%7D%5Cright),"> y la interpretación es la misma. Veamos el gráfico para una muestra de variables normales estándar:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb2" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb2-1">x <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">qnorm</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">seq</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span>,n)<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span> (n<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span>))</span>
<span id="cb2-2">y <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">sort</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">rnorm</span>(n))</span>
<span id="cb2-3"></span>
<span id="cb2-4"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">ggplot</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">data.frame</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> x, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> y), <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">aes</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> x, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> y)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb2-5">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_point</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb2-6">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_abline</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">intercept =</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">0</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">slope =</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">linetype =</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>)</span></code></pre></div></div>
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/037-qqplots/index_files/figure-html/unnamed-chunk-3-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:80.0%"></p>
</figure>
</div>
</div>
</div>
</section>
<section id="familia-de-posición-dispersión.-distribución-normal" class="level2">
<h2 class="anchored" data-anchor-id="familia-de-posición-dispersión.-distribución-normal">Familia de posición-dispersión. Distribución normal</h2>
<p>Finalmente, supongamos que <img src="https://latex.codecogs.com/png.latex?F"> no está especificada totalmente pero sabemos que pertenece a una familia paramétrica de posición-dispersión, es decir, para todo <img src="https://latex.codecogs.com/png.latex?x">, <img src="https://latex.codecogs.com/png.latex?F(x)%20=%20F_0%5Cleft(%5Cfrac%7Bx-%5Cmu%7D%7B%5Csigma%7D%5Cright),"> donde <img src="https://latex.codecogs.com/png.latex?%5Cmu%5Cin%5Cmathbb%7BR%7D">, <img src="https://latex.codecogs.com/png.latex?%5Csigma%3E0"> son arbitrarios y <strong>desconocidos</strong> pero <img src="https://latex.codecogs.com/png.latex?F_0"> es totalmente conocida. Esta situación es equivalente a decir que, si <img src="https://latex.codecogs.com/png.latex?X"> tiene distribución <img src="https://latex.codecogs.com/png.latex?F">, existen valores <img src="https://latex.codecogs.com/png.latex?%5Cmu%5Cin%5Cmathbb%7BR%7D"> y <img src="https://latex.codecogs.com/png.latex?%5Csigma%3E0"> tales que <img src="https://latex.codecogs.com/png.latex?(X-%5Cmu)/%5Csigma"> tiene distribución <img src="https://latex.codecogs.com/png.latex?F_0">. El ejemplo más importante es el caso en que <img src="https://latex.codecogs.com/png.latex?F"> es la distribución <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BN%7D(%5Cmu,%5Csigma%5E2)"> y <img src="https://latex.codecogs.com/png.latex?F_0"> es la distribución normal estándar. En este caso, por el razonamiento que hemos hecho anteriormente, <img src="https://latex.codecogs.com/png.latex?%5Cfrac%7BX_%7B(i)%7D-%5Cmu%7D%7B%5Csigma%7D%20%5Capprox%0AF_0%5E%7B-1%7D%5Cleft(%5Cfrac%7Bi%7D%7Bn+1%7D%5Cright),%5C%20%5C%20i=1,%5Cldots,n,"> o, equivalentemente, <img src="https://latex.codecogs.com/png.latex?X_%7B(i)%7D%20%5Capprox%20%5Csigma%20F_0%5E%7B-1%7D%5Cleft(%5Cfrac%7Bi%7D%7Bn+1%7D%5Cright)%20+%20%5Cmu,%5C%0A%5C%20i=1,%5Cldots,n,"> lo que implica que si representamos <img src="https://latex.codecogs.com/png.latex?X_%7B(i)%7D%20%20%5C%20%5C%20%20%5Cmbox%7Bfrente%20a%7D%5C%20%5C%20%20F_0%5E%7B-1%7D%5Cleft(%5Cfrac%7Bi%7D%7Bn+1%7D%5Cright),"> también debemos observar puntos aproximadamente alineados (ya no necesariamente sobre la bisectriz) bajo la hipótesis de que la muestra procede de <img src="https://latex.codecogs.com/png.latex?F">. Veamos de nuevo un ejemplo con datos normales, es importante observar que el gráfico no requiere conocer los valores de la media y la varianza de la distribución:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb3" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb3-1">x <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">qnorm</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">seq</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">:</span>n)<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span> (n<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span>))</span>
<span id="cb3-2">y <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">sort</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">rnorm</span>(n, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">mean=</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">sd=</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">3</span>))</span>
<span id="cb3-3"></span>
<span id="cb3-4"></span>
<span id="cb3-5"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">ggplot</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">data.frame</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> x, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> y), <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">aes</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> x, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> y)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb3-6">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_point</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb3-7">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_smooth</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">method =</span> lm, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">se =</span> <span class="cn" style="color: #8f5902;
background-color: null;
font-style: inherit;">FALSE</span>,</span>
<span id="cb3-8">              <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">linetype =</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">linewidth =</span> <span class="fl" style="color: #AD0000;
background-color: null;
font-style: inherit;">0.7</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">col =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"black"</span>)</span></code></pre></div></div>
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/037-qqplots/index_files/figure-html/unnamed-chunk-4-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:80.0%"></p>
</figure>
</div>
</div>
</div>
<p>A veces se utilizan ligeras modificaciones o correcciones de este procedimiento. Por ejemplo, para la distribución normal y <img src="https://latex.codecogs.com/png.latex?n"> suficientemente grande, <code>R</code> representa <img src="https://latex.codecogs.com/png.latex?X_%7B(i)%7D%20%20%5C%20%5C%20%20%5Cmbox%7Bfrente%20a%7D%5C%20%5C%20%20F_0%5E%7B-1%7D%5Cleft(%5Cfrac%7Bi-0.5%7D%7Bn%7D%5Cright)."> La interpretación y motivación del gráfico es en cualquier caso la misma que hemos comentado.</p>
<p>Para representar los gráficos de probabilidad <strong>correspondientes a la familia de distribuciones normales</strong> con <code>R</code> se pueden usar los comandos <code>qqnorm</code> y <code>qqline</code>. El primero representa las coordenadas de los puntos y el segundo añade una recta que pasa por el primer y el tercer cuartil, para facilitar la interpretación del gráfico. Para calcular los valores esperados de los estadísticos de orden, <code>qqnorm</code> llama a la función <code>ppoints</code>.</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb4" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb4-1">datos <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> y</span>
<span id="cb4-2"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">qqnorm</span>(datos,</span>
<span id="cb4-3">       <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">xlab=</span><span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">'Cuantiles teóricos'</span>,</span>
<span id="cb4-4">       <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">ylab=</span><span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">'Cuantiles muestrales'</span>,</span>
<span id="cb4-5">       <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">main=</span><span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">'Gráfico cuantil-cuantil normal'</span>,</span>
<span id="cb4-6">       <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">pch =</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">16</span>)</span>
<span id="cb4-7"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">qqline</span>(datos) </span></code></pre></div></div>
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/037-qqplots/index_files/figure-html/unnamed-chunk-5-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:80.0%"></p>
</figure>
</div>
</div>
</div>
<p>Con <code>ggplot2</code>, el código para generar el mismo gráfico es:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb5" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb5-1"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">ggplot</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">data.frame</span>(datos), <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">aes</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">sample =</span> datos)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb5-2">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_qq</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb5-3">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_qq_line</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb5-4">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">labs</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Cuantiles teóricos"</span>,</span>
<span id="cb5-5">       <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Cuantiles muestrales"</span>,</span>
<span id="cb5-6">       <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">title =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Gráfico cuantil-cuantil normal"</span>)</span></code></pre></div></div>
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/037-qqplots/index_files/figure-html/unnamed-chunk-6-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:75.0%"></p>
</figure>
</div>
</div>
</div>
<p>¿Puedes determinar cuáles de los gráficos de la figura 1 corresponden a muestras con distribución normal y cuáles no? (Contesta antes de mirar la respuesta que aparece bajo la figura).</p>
<div class="cell" data-layout-align="center">
<div class="cell-output-display">
<div id="fig-qqplot" class="quarto-float quarto-figure quarto-figure-center anchored" data-fig-align="center">
<figure class="quarto-float quarto-float-fig figure">
<div aria-describedby="fig-qqplot-caption-0ceaefa1-69ba-4598-a22c-09a6ac19f8ca">
<img src="/~joser.berrendero/caminos_aleatorios/posts/037-qqplots/index_files/figure-html/fig-qqplot-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:100.0%">
</div>
<figcaption class="quarto-float-caption-bottom quarto-float-caption quarto-float-fig" id="fig-qqplot-caption-0ceaefa1-69ba-4598-a22c-09a6ac19f8ca">
Figura&nbsp;1: Gráficos de probabilidad para muestras de tamaño 50 procedentes de varias distribuciones.
</figcaption>
</figure>
</div>
</div>
</div>
<p><strong>Respuesta:</strong> En la fila de de arriba, solo es normal el gráfico de la derecha. En la de abajo son normales el de la izquierda y el de la derecha, pero no el del centro.</p>


</section>

 ]]></description>
  <category>Materiales docentes</category>
  <category>Bondad de ajuste</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/037-qqplots/</guid>
  <pubDate>Sun, 12 Apr 2026 22:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/037-qqplots/qqplots.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>Estadística Aplicada con R</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/036-curso_estadistica_26/</link>
  <description><![CDATA[ 





<div class="cell" data-layout-align="center">
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/036-curso_estadistica_26/curso_R.jpg" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:50.0%"></p>
</figure>
</div>
</div>
</div>
<p>El Departamento de Matemáticas de la Facultad de Ciencias de la Universidad Autónoma de Madrid organiza, conjuntamente con el Departamento de Bioestadística de GEICAM e investigadores de FUNDAE, la séptima edición del curso <strong>Estadística Aplicada con R</strong>, dirigido a profesionales, investigadores, profesorado y estudiantes interesados en el uso práctico de R para el análisis de datos.</p>
<p>El programa tiene una <strong>estructura modular</strong>, de modo que puede cursarse completo o mediante la inscripción en módulos independientes, según los intereses y conocimientos previos de cada participante.</p>
<ul>
<li><strong>Fechas:</strong> Abril y mayo de 2026</li>
<li><strong>Modalidad:</strong> Presencial, en la Facultad de Ciencias de la UAM.</li>
</ul>
<p>El equipo docente está compuesto por expertos de la UAM y otras instituciones de investigación. El curso combina contenidos teóricos y prácticos y permite construir itinerarios formativos adaptados a distintos perfiles.</p>
<section id="lista-de-módulos-ofertados" class="level3">
<h3 class="anchored" data-anchor-id="lista-de-módulos-ofertados">Lista de módulos ofertados</h3>
<ul>
<li>Introducción a R</li>
<li>Visualización interactiva de datos con el paquete Shiny</li>
<li>Agentes de IA para docencia e investigación</li>
<li>Métodos de regresión y análisis multivariante</li>
<li>Estadística aplicada a la investigación biomédica</li>
<li>Introducción práctica a la estadística bayesiana</li>
<li>Machine learning con R y tidymodels</li>
<li>Análisis de datos funcionales con R</li>
</ul>
<div class="my-box">
<p>Para más información e inscripciones <a href="https://fuam.es/curso-corto/estadistica-aplicada-con-r-ed-7/">visita este enlace</a></p>
</div>


</section>

 ]]></description>
  <category>Cursos</category>
  <category>Noticias</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/036-curso_estadistica_26/</guid>
  <pubDate>Wed, 11 Mar 2026 23:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/036-curso_estadistica_26/curso_R.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>Poniendo orden en las distribuciones de probabilidad</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/035-orden-estocastico/</link>
  <description><![CDATA[ 





<p>Presento un ejemplo sencillo con datos de rentas que permite ilustrar la ordenación estocástica entre variables aleatorias. Después comento algunas implicaciones de las ordenaciones en el análisis de la desigualdad o el bienestar.</p>
<section id="el-ejemplo" class="level2">
<h2 class="anchored" data-anchor-id="el-ejemplo">El ejemplo</h2>
<p>En la <a href="https://x.com/Jongonzlz?s=20">cuenta de X de Jon González (<span class="citation" data-cites="Jongonzlz">@Jongonzlz</span>)</a> y concretamente en <a href="https://x.com/Jongonzlz/status/2008494023930003745?s=20">este tuit</a> me encontré con un buen ejemplo para ilustrar la ordenación estocástica de dos distribuciones. En el siguiente gráfico se comparan los ingresos de las personas menores de 35 años con estudios superiores con los de las personas entre 65 y 79 años sin estudios superiores:</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/035-orden-estocastico/comparacion_distribuciones.png" class="quarto-figure quarto-figure-center figure-img" style="height:12cm"></p>
</figure>
</div>
<p>Cada curva representa el porcentaje de personas cuya renta individual neta es superior a cada valor dado en el eje <img src="https://latex.codecogs.com/png.latex?x">. La curva roja corresponde a las personas entre 65 y 79 años sin estudios superiores mientras que la verde (siempre por debajo de la roja) a las personas con menos de 35 años. Estas curvas se llaman curvas de supervivencia. Si <img src="https://latex.codecogs.com/png.latex?X"> es la variable aleatoria que corresponde a seleccionar una persona de una población y mirar la renta que tiene, las curvas nos dirían cuál es el valor de <img src="https://latex.codecogs.com/png.latex?%5Ctext%7BP%7D(X%3Et)">, la probabilidad de que la renta esté por encima de cada valor <img src="https://latex.codecogs.com/png.latex?t"> del eje de las <img src="https://latex.codecogs.com/png.latex?x">. Si <img src="https://latex.codecogs.com/png.latex?X"> corresponde a la población de menores de 35 años con estudios superiores e <img src="https://latex.codecogs.com/png.latex?Y"> a la población de personas entre 65 y 79 sin estudios superiores, lo que vemos es que para cualquier nivel de renta <img src="https://latex.codecogs.com/png.latex?t"> (salvo tal vez un empate alrededor de <img src="https://latex.codecogs.com/png.latex?t%20=%2015000"> euros), <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BP%7D(X%20%3E%20t)%20%5Cleq%20%5Cmbox%7BP%7D(Y%3Et)."> De acuerdo con la definición que vamos a introducir enseguida la distribución de la renta de menores de 35 años con estudios superiores es estocásticamente menor (en el orden usual) que la de personas entre 65 y 79 años sin estudios superiores.</p>
</section>
<section id="el-orden-estocástico-usual" class="level2">
<h2 class="anchored" data-anchor-id="el-orden-estocástico-usual">El orden estocástico usual</h2>
<div class="my-box">
<p>Se dice que una variable aleatoria <img src="https://latex.codecogs.com/png.latex?X"> es estocásticamente menor que otra <img src="https://latex.codecogs.com/png.latex?Y"> en el orden usual si para todo <img src="https://latex.codecogs.com/png.latex?t%5Cin%5Cmathbb%7BR%7D"> se verifica <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BP%7D(X%20%3E%20t)%20%5Cleq%20%5Cmbox%7BP%7D(Y%3Et)">. Cuando esto ocurre escribiremos <img src="https://latex.codecogs.com/png.latex?X%5Cleq_%7B%5Ctext%7Bst%7D%7DY">.</p>
</div>
<p><br>
</p>
<p>Si <img src="https://latex.codecogs.com/png.latex?X"> tiene función de distribución <img src="https://latex.codecogs.com/png.latex?F"> e <img src="https://latex.codecogs.com/png.latex?Y"> tiene función de distribución <img src="https://latex.codecogs.com/png.latex?G">, la definición equivale a pedir que la función de supervivencia de <img src="https://latex.codecogs.com/png.latex?X"> está uniformemente por debajo de la de <img src="https://latex.codecogs.com/png.latex?Y">, es decir, <img src="https://latex.codecogs.com/png.latex?1-F(t)%5Cleq%201-G(t)">, para todo <img src="https://latex.codecogs.com/png.latex?t%5Cin%5Cmathbb%7BR%7D">. Esto es justo lo que ocurre en los datos anteriores.</p>
<p>La siguiente propiedad nos permite profundizar en las consecuencias de este hecho. Su demostración es especialmente elegante y se basa en una técnica de acoplamiento (coupling). Se trata de uno de los primeros resultados que aparecen en los libros dedicados a las ordenaciones estocásticas:</p>
<div class="my-box">
<div id="thm-caracterizacion-orden" class="theorem">
<p><span class="theorem-title"><strong>Teorema 1</strong></span> Sean <img src="https://latex.codecogs.com/png.latex?X"> e <img src="https://latex.codecogs.com/png.latex?Y"> dos variables aleatorias. Se verifica <img src="https://latex.codecogs.com/png.latex?X%5Cleq_%7B%5Ctext%7Bst%7D%7DY%20%5CLeftrightarrow%20%5Ctext%7BE%7D%5Bf(X)%5D%5Cleq%20%5Ctext%7BE%7D%5Bf(Y)%5D,%5C%20%5C%20%5Ctext%7Bpara%20toda%20funci%C3%B3n%7D%5C%20%20f:%5Cmathbb%7BR%7D%5Cto%5Cmathbb%7BR%7D%5C%20%5Ctext%7Bno%20decreciente%7D,"> siempre que las esperanzas existan.</p>
</div>
</div>
<p><br>
</p>
<p>Podemos interpretar <img src="https://latex.codecogs.com/png.latex?f"> como una función de utilidad que crece si la renta crece. El valor esperado de <img src="https://latex.codecogs.com/png.latex?f(X)"> podría entonces interpretarse como un índice de bienestar de la población dada por la variable <img src="https://latex.codecogs.com/png.latex?X">. La conclusión del resultado es que si <img src="https://latex.codecogs.com/png.latex?X%5Cleq_%7B%5Ctext%7Bst%7D%7DY"> el índice de bienestar para la distribución de <img src="https://latex.codecogs.com/png.latex?Y"> es mayor que para la distribución de <img src="https://latex.codecogs.com/png.latex?X"> <strong>sea cual sea el criterio de utilidad que usemos para definir el índice</strong>, con la única condición de que la utilidad aumente al aumentar la renta, lo que no es mucho pedir.</p>
<p>Doy la demostración del teorema al final de la entrada.</p>
</section>
<section id="el-orden-creciente-cóncavo" class="level2">
<h2 class="anchored" data-anchor-id="el-orden-creciente-cóncavo">El orden creciente cóncavo</h2>
<p>La ordenación estocástica de variables aleatorias desempeña un papel muy relevante en los estudios económicos sobre desigualdad de rentas. En este campo es significativo el llamado <em>orden creciente cóncavo</em> (que en economía es más habitual llamar <em>dominación estocástica de segundo orden</em>):</p>
<div class="my-box">
<p>Una variable aleatoria <img src="https://latex.codecogs.com/png.latex?X"> es estocásticamente menor que otra <img src="https://latex.codecogs.com/png.latex?Y"> en el orden creciente cóncavo si para todo <img src="https://latex.codecogs.com/png.latex?t%5Cin%5Cmathbb%7BR%7D"> se verifica <img src="https://latex.codecogs.com/png.latex?%5Cint_%7B-%5Cinfty%7D%5Et%20%5Cmbox%7BP%7D(X%20%5Cleq%20u)%5C,%20%5Cmathrm%7Bd%7Du%20%5Cleq%20%5Cint_%7B-%5Cinfty%7D%5Et%5Cmbox%7BP%7D(Y%5Cleq%20u)%5C,%20%5Cmathrm%7Bd%7Du">. Cuando esto ocurre escribiremos <img src="https://latex.codecogs.com/png.latex?X%5Cleq_%7B%5Ctext%7Bicv%7D%7DY">.</p>
</div>
<p><br>
</p>
<p>Si usamos este orden para comparar dos distribuciones de rentas nos estamos fijando en la renta de los individuos más pobres de la población (las colas inferiores de las distribuciones). Si <img src="https://latex.codecogs.com/png.latex?X%5Cleq_%7B%5Ctext%7Bicv%7D%7DY">, los pobres en la distribución de <img src="https://latex.codecogs.com/png.latex?X"> tienen a acumular menos renta que los de la distribución de <img src="https://latex.codecogs.com/png.latex?Y">. En este sentido podemos decir que la distribución de la variable <img src="https://latex.codecogs.com/png.latex?Y"> es más igualitaria. Puede demostrarse una equivalencia similar a la del Teorema&nbsp;1:</p>
<div class="my-box">
<div id="thm-caracterizacion-icv" class="theorem">
<p><span class="theorem-title"><strong>Teorema 2</strong></span> Sean <img src="https://latex.codecogs.com/png.latex?X"> e <img src="https://latex.codecogs.com/png.latex?Y"> dos variables aleatorias. Se verifica <img src="https://latex.codecogs.com/png.latex?X%5Cleq_%7B%5Ctext%7Bicv%7D%7DY%20%5CLeftrightarrow%20%5Ctext%7BE%7D%5Bf(X)%5D%5Cleq%20%5Ctext%7BE%7D%5Bf(Y)%5D,%5C%20%5C%20%5Ctext%7Bpara%20toda%20funci%C3%B3n%7D%5C%20%20f:%5Cmathbb%7BR%7D%5Cto%5Cmathbb%7BR%7D%5C%20%5Ctext%7Bno%20decreciente%20y%20c%C3%B3ncava%7D,"> siempre que las esperanzas existan.</p>
</div>
</div>
<p><br>
</p>
<p>Por una parte vemos que <img src="https://latex.codecogs.com/png.latex?X%5Cleq_%7B%5Ctext%7Bst%7D%7DY%20%5CRightarrow%20X%5Cleq_%7B%5Ctext%7Bicv%7D%7DY">, el orden estocástico usual es más fuerte que el orden creciente cóncavo. Por otra parte, la interpretación en términos de índice de bienestar se mantiene, pero en este caso las funciones de utilidad además de ser crecientes deben ser cóncavas. En un índice de bienestar social la concavidad de la función de utilidad es bastante razonable. Parece lógico suponer que el aumento de utilidad cuando uno pasa de tener 100 euros a tener 200 es mayor que el aumento al pasar de 100000 a 100100.</p>
<p>Una buena referencia acerca de diferentes órdenes estocásticos y sus propiedades es Müller y Stoyan (2002).</p>
</section>
<section id="una-contribución-personal-a-este-tema" class="level2">
<h2 class="anchored" data-anchor-id="una-contribución-personal-a-este-tema">Una contribución personal a este tema</h2>
<p>En Berrendero y Cárcamo (2011) estudiamos un problema de contraste de hipótesis relacionado con el orden creciente cóncavo. A partir de muestras de las poblaciones <img src="https://latex.codecogs.com/png.latex?X"> e <img src="https://latex.codecogs.com/png.latex?Y"> proporcionábamos un test para contrastar si las dos distribuciones son iguales frente a la alternativa de que están estrictamente ordenadas, es decir, proporcionábamos un test para la hipótesis nula</p>
<p><img src="https://latex.codecogs.com/png.latex?H_0%20:%20X%20=_%7B%5Cmathrm%7Bst%7D%7D%20Y"> frente a la alternativa</p>
<p><img src="https://latex.codecogs.com/png.latex?H_1%20:%20X%20%5Cle_%7B%5Cmathrm%7Bicv%7D%7D%20Y%20%5Cquad%20%5Ctext%7By%7D%20%5Cquad%20X%20%5Cneq_%7B%5Cmathrm%7Bst%7D%7D%20Y."></p>
<p>Este tipo de contrastes tienen interés en economía, donde cambios en el escenario -una modificación en la política fiscal o un shock tecnológico, como por ejemplo la irrupción de la IA- pueden producir cambios en la distribución de rentas y buscamos evidencia empírica de si la nueva distribución es dominada o domina a la anterior.</p>
<p>El estadístico de contraste que propusimos estaba basado en la comparación de combinaciones lineales de los estadísticos de orden de las muestras (<a href="https://en.wikipedia.org/wiki/L-estimator">L-estadísticos</a>) con los pesos adecuados. Este era un enfoque alternativo al propuesto en el artículo clásico de Barrett y Donald (2003), basado en el supremo de funcionales aplicados a las funciones de supervivencia empíricas.</p>
</section>
<section id="la-demostración" class="level2">
<h2 class="anchored" data-anchor-id="la-demostración">La demostración</h2>
<p>Para terminar en este apartado doy una demostración del Teorema&nbsp;1:</p>
<p>La implicación <img src="https://latex.codecogs.com/png.latex?(%5CLeftarrow)"> es muy sencilla. Consideramos la función <img src="https://latex.codecogs.com/png.latex?f_t"> tal que <img src="https://latex.codecogs.com/png.latex?f_t(x)"> vale 1 si <img src="https://latex.codecogs.com/png.latex?x%3Et"> y 0 en caso contrario. Observamos que <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D%5Bf_t(X)%5D%20=%20%5Cmbox%7BP%7D(X%3Et)"> y <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D%5Bf_t(Y)%5D%20=%20%5Cmbox%7BP%7D(Y%3Et)">. Además, <img src="https://latex.codecogs.com/png.latex?f_t"> es no decreciente por lo que <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BP%7D(X%20%3E%20t)%20%5Cleq%20%5Cmbox%7BP%7D(Y%3Et)">, es decir, <img src="https://latex.codecogs.com/png.latex?X%5Cleq_%7B%5Ctext%7Bst%7D%7DY">.</p>
<p>Usando la técnica conocida como acoplamiento (<em>coupling</em>) la implicación <img src="https://latex.codecogs.com/png.latex?(%5CRightarrow)"> es también bastante fácil. Cuando queremos establecer una propiedad para las distribuciones de dos variables aleatorias, el acoplamiento consiste en construir variables específicas en el mismo espacio con las distribuciones indicadas pero que tienen una relación entre ellas que nos resulta conveniente para establecer la propiedad que queremos.</p>
<p>En nuestro caso, supongamos que <img src="https://latex.codecogs.com/png.latex?X"> tiene distribución <img src="https://latex.codecogs.com/png.latex?F"> e <img src="https://latex.codecogs.com/png.latex?Y"> tiene distribución <img src="https://latex.codecogs.com/png.latex?G">. Una propiedad bastante conocida es que si <img src="https://latex.codecogs.com/png.latex?U"> es una variable aleatoria con distribución uniforme en <img src="https://latex.codecogs.com/png.latex?(0,1)">, entonces <img src="https://latex.codecogs.com/png.latex?%5Ctilde%7BX%7D:=%20F%5E%7B-1%7D(U)"> e <img src="https://latex.codecogs.com/png.latex?%5Ctilde%7BY%7D:=%20G%5E%7B-1%7D(U)"> tienen también distribuciones <img src="https://latex.codecogs.com/png.latex?F"> y <img src="https://latex.codecogs.com/png.latex?G">, respectivamente. Ahora, como <img src="https://latex.codecogs.com/png.latex?F(t)%20%5Cgeq%20G(t)">, para todo <img src="https://latex.codecogs.com/png.latex?t%5Cin%5Cmathbb%7BR%7D">, tenemos que para cualquier <img src="https://latex.codecogs.com/png.latex?f"> no decreciente, <img src="https://latex.codecogs.com/png.latex?1%20=%20%5Ctext%7BP%7D(%5Ctilde%7BX%7D%5Cleq%5Ctilde%7BY%7D)%20=%20%5Ctext%7BP%7D(f(%5Ctilde%7BX%7D)%5Cleq%20f(%5Ctilde%7BY%7D))."> Por lo tanto, para cualquier <img src="https://latex.codecogs.com/png.latex?f"> no decreciente, <img src="https://latex.codecogs.com/png.latex?%5Ctext%7BE%7D%5Bf(X)%5D%20=%20%20%5Ctext%7BE%7D%5Bf(%5Ctilde%7BX%7D)%5D%20%5Cleq%20%5Ctext%7BE%7D%5Bf(%5Ctilde%7BY%7D)%5D%20=%20%5Ctext%7BE%7D%5Bf(Y)%5D."></p>
</section>
<section id="referencias" class="level2">
<h2 class="anchored" data-anchor-id="referencias">Referencias</h2>
<ul>
<li>Barrett, G.F., y Donald, S.G. (2003). Consistent tests for stochastic dominance. Econometrica, <strong>71</strong>, 71-104.</li>
<li>Berrendero, J.R. y Cárcamo, J. (2011). Tests for the second order stochastic dominance based on L-statistics. <em>Journal of Business and Economic Statistics</em>, <strong>29</strong>, 260-270. <a href="http://verso.mat.uam.es/~joser.berrendero/papers/2011-JBES-pre.pdf">Preprint</a></li>
<li>Müller. A. y Stoyan, D. (2002). <em>Comparison Methods for Stochastic Models and Risks.</em> New York: Wiley.</li>
</ul>


</section>

 ]]></description>
  <category>Probabilidad</category>
  <category>Investigación</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/035-orden-estocastico/</guid>
  <pubDate>Mon, 16 Feb 2026 23:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/035-orden-estocastico/orden-renta.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>Paseos aleatorios por arXiv</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/034-arxiv_25/</link>
  <description><![CDATA[ 





<p>Repaso en esta entrada algunos de los documentos que me he encontrado por arXiv en 2025. No los he leído en profundidad pero me han llamado la atención. Los menciono aquí como futura referencia para mí mismo y por si le resultan útiles a alguien más. Comienzo con algunos artículos que me han parecido curiosos:</p>
<ul>
<li><p>Los lanzamientos de tandas de penaltis en competiciones futbolísticas son más frecuentes desde que el mayor número de goles fuera de casa ya no deshace los empates de las eliminatorias. En <a href="https://arxiv.org/abs/2510.17641">Are penalty shootouts better than a coin toss? Evidence from international club football in Europe</a> se analizan todas las tandas disputadas entre 2000 y 2025 para ver si el orden de lanzamiento, el campo de juego o la fortaleza de los equipos influyen en el resultado final.</p></li>
<li><p>Se dice que un mono que escribiera al azar en un teclado durante mucho tiempo acabaría produciendo la obra completa de Shakespeare (el lema de Borel-Cantelli se invoca para justificarlo). No obstante, el tiempo que tardaría el mono en hacerlo sería inconcebiblemente largo. En <a href="https://arxiv.org/abs/2512.11880">Shakespeare, Entropy and Educated Monkeys</a> se observa que un mono ilustrado que siguiera escribiendo al azar, pero que estuviera limitado a escribir solo textos “estadísticamente típicos”, produciría cualquier texto dado en mucho menos tiempo.</p></li>
<li><p>Gini observó que no hace falta usar el concepto de media para definir la varianza ya que esta se puede expresar como función de las diferencias entre pares de observaciones. En <a href="https://arxiv.org/abs/2510.22714">Pairwise Difference Representations of Moments: Gini and Generalized Lagrange identities</a> se muestra cómo hacer lo mismo para los <a href="https://es.wikipedia.org/wiki/Momento_central">momentos centrados</a> de cualquier orden.</p></li>
<li><p>Varias propiedades de la distribución de la variable <img src="https://latex.codecogs.com/png.latex?X/%5C%7CX%5C%7C">, donde <img src="https://latex.codecogs.com/png.latex?X"> es un vector normal, se investigan en <a href="https://arxiv.org/abs/2506.17461">projected Normal Distribution: Moment Approximations and Generalizations</a>.</p></li>
<li><p>Siguen apareciendo en el mercado estadístico medidas de dependencia que mejoran las propiedades del coeficiente de correlación. Este año ha aparecido una nueva en <a href="https://arxiv.org/abs/2505.18146">A new measure of dependence: Integrated R2</a>. La definición guarda semejanzas con la del ya bastante conocido <a href="https://medium.com/@iamban/beyond-pearson-and-spearman-or-kendal-understanding-chatterjees-correlation-coefficient-281b31e2bf7c">coeficiente de Chatterjee</a> pero, según los autores, funciona mucho mejor.</p></li>
<li><p>En relación con el punto anterior, en <a href="https://arxiv.org/abs/2503.21715">A Powerful Bootstrap Test of Independence in High Dimensions</a> se considera el máximo de los coeficientes de Chatterjee para contrastar la independencia entre una variable aleatoria <img src="https://latex.codecogs.com/png.latex?Y"> y un conjunto grande de variables <img src="https://latex.codecogs.com/png.latex?X_1,%5Cldots,X_p">.</p></li>
</ul>
<p>A continuación aparece una relación de libros, apuntes o revisiones de distintos temas:</p>
<ul>
<li><p><a href="https://arxiv.org/abs/2501.14787">Matrix Calculus (for Machine Learning and Beyond)</a> son unas notas que surgen a partir de un <a href="https://github.com/mitmath/matrixcalc">curso impartido en el MIT</a>. Muchas técnicas de análisis multivariante pueden requerir el uso de las fórmulas que aparecen aquí. Véase por ejemplo <a href="https://doi.org/10.1016/j.sctalk.2023.100274">Liu et al (2022)</a> para una revisión reciente de las aplicaciones del cálculo diferencial con matrices en estadística.</p></li>
<li><p>En <a href="https://arxiv.org/abs/2502.03090">Gaussian Processes Regression for Uncertainty Quantification: An Introductory Tutorial</a> se incluye una introducción a la regresión con procesos gaussianos (una técnica de regresión no paramétrica bayesiana) y sus aplicaciones a problemas de cuantificación de la incertidumbre. Por otra parte, una técnica general para cuantificar la incertidumbre en modelos predictivos es la predicción conformal (<em>conformal prediction</em>). En <a href="https://arxiv.org/abs/2411.11824">estas extensas notas</a> se presentan los fundamentos teóricos de esta técnica. Son la versión preliminar de un libro sobre el tema.</p></li>
<li><p>En <a href="https://arxiv.org/abs/2506.17366">Gaussian Processes and Reproducing Kernels: Connections and Equivalences</a> se desarrollan con bastante claridad las relaciones entre la teoría de espacios de Hilbert con núcleo reproductor (RKHS) y las técnicas de regresión con procesos gaussianos que he mencionado más arriba. Las relaciones entre la regresión con procesos gaussianos y el <a href="https://en.wikipedia.org/wiki/Kriging">kriging</a> se explican en <a href="https://arxiv.org/abs/2408.02331">Explaining and Connecting Kriging with Gaussian Process Regression</a>.</p></li>
<li><p><a href="https://arxiv.org/abs/2505.23592">Estos apuntes</a> contienen una elaborada teoría sobre técnicas de validación cruzada y proceden de un curso impartido en 2024 en la Universidad de Seúl.</p></li>
<li><p><a href="https://arxiv.org/abs/2412.15633">Lecture Notes on High Dimensional Linear Regression</a> incluye resultados sobre regresión de mínimos cuadrados con penalización (lasso, ridge) a un nivel relativamente asequible pero no introductorio. Son notas de un curso sobre aprendizaje automático avanzado en la Universidad Erasmo de Rotterdam.</p></li>
</ul>
<p>Sé poco de los temas que tratan los documentos que siguen, pero me gustaría leer un poco sobre ellos así que para terminar la entrada aquí los dejo:</p>
<ul>
<li><p>En <a href="https://arxiv.org/abs/2506.16486">An introduction to Causal Modelling</a> se presentan las ideas principales en inferencia causal.</p></li>
<li><p>La aplicación de ideas topológicas al análisis de datos ha ganado relevancia en los últimos años. Una revisión se puede encontrar en <a href="https://arxiv.org/abs/2507.19504">Topological Data Analysis and Topological Deep Learning Beyond Persistent Homology - A Review</a>.</p></li>
<li><p>Algunos datos de alta dimensión tienen una estructura tal que en realidad se encuentran cerca de una variedad de dimensión mucho más baja (véase la figura). En <a href="https://arxiv.org/abs/2507.13887">A Survey of Dimension Estimation Methods</a> se revisan métodos para estimar la dimensión de esta variedad. Recientemente, uno de los miembros de nuestro proyecto de investigación ha publicado en JMVA una contribución a este problema que a su vez contiene una breve revisión del tema: <a href="https://arxiv.org/abs/2412.13898">On consistent estimation of dimension values</a>.</p></li>
</ul>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/034-arxiv_25/swiss_roll.jpg" class="img-fluid figure-img" style="width:5cm"></p>
<figcaption>Datos tridimensionales que viven en una variedad de dimensión dos (<em>Swiss roll</em>)</figcaption>
</figure>
</div>



 ]]></description>
  <category>arXiv</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/034-arxiv_25/</guid>
  <pubDate>Sun, 11 Jan 2026 23:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/034-arxiv_25/arxiv-25.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>Algunos libros que he leído en 2025</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/033-libros_25/</link>
  <description><![CDATA[ 





<p>Esta entrada sobre libros de no ficción se añade a las de <a href="https://caminosaleatorios.wordpress.com/2019/12/20/algunos-libros-sobre-ciencia-que-he-leido-en-2019/">2019</a>, <a href="https://caminosaleatorios.wordpress.com/2021/01/02/algunos-libros-que-he-leido-en-2020/">2020</a>, <a href="https://caminosaleatorios.wordpress.com/2021/12/29/algunos-libros-que-he-leido-en-2021/">2021</a>, <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/005-libros_22/">2022</a>, <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/014-libros_23/">2023</a> y <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/025-libros_24/">2024</a></p>
<section id="franz-kafka-edición-de-reiner-stach-tú-eres-la-tarea" class="level2">
<h2 class="anchored" data-anchor-id="franz-kafka-edición-de-reiner-stach-tú-eres-la-tarea">Franz Kafka (edición de Reiner Stach): <em>“Tú eres la tarea”</em></h2>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/033-libros_25/tarea.jpg" class="quarto-figure quarto-figure-center figure-img" style="height:5cm"></p>
</figure>
</div>
<p>El 12 de septiembre de 1917 un Kafka ligero de equipaje se instaló en la casa de su hermana Ottla en Zürau, a dos horas en tren de Praga. Tenía 34 años y unas semanas antes había experimentado los primeros síntomas de tuberculosis por lo que se encontraba de baja. Como su hermana regentaba una granja, Kafka ayudaba a recolectar patatas o asistía al apareamiento de las cabras, además de describir en sus cartas los ejércitos de ratones que poblaban su habitación. Pero, sobre todo, allí Kafka completó dos cuadernos en octavo (16.5 <img src="https://latex.codecogs.com/png.latex?%5Ctimes"> 10 cm) con anotaciones a lápiz plagadas de tachones. Posteriormente transcribió algunas de las frases de los cuadernos en una serie de papelitos, a modo de fichas, que han dado lugar a la colección de <em>aforismos de Zürau</em>. Este libro es una edición de estos aforismos a cargo de Reiner Stach, autor además de una extensa biografía de Kafka, publicada por Acantilado en dos volúmenes. En el libro cada aforismo va acompañado de un breve comentario así como de versiones preliminares que Kafka modificó al copiar los textos en las fichas.</p>
<p>Stach señala en la introducción dos influencias en estos aforismos: la teoría de las ideas de Platón, que Kafka había estudiado desde joven, y el Antiguo Testamento, especialmente el Génesis, en el que según los diarios llevaba un año interesado. Leyendo todos los aforismos seguidos se aprecia mejor el efecto de ambas fuentes.</p>
<p>Pero mi verdadera intención al traer aquí este libro es que en el blog aparezcan algunas de las frases de Kafka. Aquí están, traducidas por Luis Fernando Moreno Claros:</p>
<ul>
<li>El camino hacia el prójimo es demasiado largo para mí.</li>
<li>A partir de un cierto punto ya no hay vuelta atrás. Ese es el punto que hay que alcanzar.</li>
<li>Sancho Panza, quien por cierto nunca se jactó de ello, logró con el paso de los años, aprovechando las tardes y las noches, apartar de sí a su demonio -al que más tarde dio el nombre de Don Quijote- por el método de proporcionarle una gran cantidad de libros de caballerías y novelas de bandoleros.</li>
<li>Una jaula fue en busca de un pájaro.</li>
<li>Si hubiera sido posible construir la torre de Babel sin escalarla, habría estado permitido.</li>
<li>No dejes que el mal te haga creer que puedes ocultarle secretos.</li>
<li>Tú eres la tarea. Ningún alumno a lo largo y ancho.</li>
<li>Del verdadero enemigo te llega un valor ilimitado.</li>
<li>Solo nuestro concepto del tiempo hace que llamemos al Juicio Final así, en realidad se trata de un juicio sumario.</li>
<li>El silencio es un atributo de la perfección.</li>
<li>Fuimos expulsados del Paraíso, pero no fue destruido.</li>
</ul>
<p>Termino con la frase del último de los papelitos. Según Stach, Kafka quiso que la colección de aforismos acabara así en el caso de que se publicara:</p>
<blockquote class="blockquote">
<p>No es necesario que salgas de casa. Quédate junto a tu mesa y escucha. Ni siquiera escuches, solo espera. Ni siquiera esperes, quédate absolutamente tranquilo y solo. El mundo se te brindará para que lo desenmascares, no puede hacer otra cosa, embelesado se plegará ante ti.</p>
</blockquote>
</section>
<section id="atossia-araxia-abrahamian-dónde-se-esconde-el-dinero" class="level2">
<h2 class="anchored" data-anchor-id="atossia-araxia-abrahamian-dónde-se-esconde-el-dinero">Atossia Araxia Abrahamian: <em>Dónde se esconde el dinero</em></h2>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/033-libros_25/atossia.jpg" class="quarto-figure quarto-figure-center figure-img" style="height:5cm"></p>
</figure>
</div>
<p>El poeta Paul Èluard dijo que <em>hay otros mundos pero están en este</em>. La periodista <a href="https://www.atossaaraxia.com/">Atossia Araxia</a> nos habla en este libro de mundos excepcionales que están en este pero escapan del ordenamiento legal que afecta al común de los mortales (mundos a los que la autora llama <em>agujeros</em>). Un viaje que comienza en Ginebra, se desplaza a Luxemburgo y a Dubái, navega en barcos con bandera de conveniencia, y recala en los limbos legales a los que son conducidos los solicitantes de asilo interceptados en alta mar.</p>
<p>Ginebra “tiene más agujeros que un queso suizo”. La autora escribe sobre los puertos francos ginebrinos en los que se eluden las regulaciones de transparencia que afectan a los bancos y se producen transacciones de obras de arte que no pagan impuestos. Por su parte y desde los años 30 del siglo XX, Luxemburgo era reconocido por fondos de inversión y por pequeños clientes reacios a pagar impuestos (conocidos informalmente como <em>los dentistas belgas</em>).</p>
<p>Más agujeros: las banderas de conveniencia sirven a grandes líneas de cruceros para eludir múltiples regulaciones arrendando las legislaciones de Liberia, Panamá o Bahamas. La flota de Liberia asciende al 15 % de todos los buques del mundo. <a href="https://es.wikipedia.org/wiki/Palaos">Palaos</a> tiene el 0,001 % de la flota mundial pero el 59,40 % de las banderas de última travesía, al convertirse en el instrumento usado por las navieras para eludir las responsabilidades medioambientales que conllevan los desguaces de los grandes buques.</p>
<p>El libro no destaca por la claridad del estilo (he leído la versión traducida, no sé si tendrá algo que ver) y los diferentes capítulos pueden dar la sensación de ser reportajes escritos de forma independiente, pero seguro que proporciona a sus lectores la oportunidad de indignarse varias veces, y es que “cuando las leyes favorecen a los ricos, los ricos no necesitan transgredir las leyes”.</p>
</section>
<section id="philippe-sands-calle-londres-38" class="level2">
<h2 class="anchored" data-anchor-id="philippe-sands-calle-londres-38">Philippe Sands: <em>Calle Londres 38</em></h2>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/033-libros_25/Londres_38.jpg" class="quarto-figure quarto-figure-center figure-img" style="height:5cm"></p>
</figure>
</div>
<p>En la literatura latinoamericana existe una amplia tradición de obras que reflexionan sobre la violencia ejercida desde el poder. Pienso, por ejemplo, en esas dos grandes novelas que son <em>Conversación en La Catedral</em> y <em>La fiesta del Chivo</em>, de Mario Vargas Llosa. Este mismo año he leído otras dos novelas también muy recomendables y originales, estrechamente vinculadas con el tema del libro que voy a comentar: se trata de <em>Vivir abajo</em> y <em>Minimosca</em>, de <a href="http://www.faveronpatriau.com/">Gustavo Faverón</a>, escritor peruano afincado en Estados Unidos.</p>
<p>En <em>Calle Londres 38</em> se entrecruzan dos historias reales: por un lado, la detención del general Pinochet en 1998 durante su estancia en Londres, tras la solicitud de extradición emitida por el juez Baltasar Garzón; por otro, las relaciones del nazi Walter Rauff con el régimen pinochetista. Rauff, responsable de la creación de cámaras de gas móviles en las que murieron más de 90 000 personas, también fue objeto de una solicitud de extradición en los años sesenta, cuando residía en Punta Arenas.</p>
<p>En relación con la primera de estas historias, resultan esclarecedoras las reflexiones sobre el derecho de inmunidad de los gobernantes y jefes de Estado, así como sobre el difuso límite que separa este derecho de la impunidad ante crímenes contra la humanidad. Todas las circunstancias del proceso a Pinochet están expuestas de forma clara, detallada y amena. Sands es abogado y participó en el proceso como representante de <em>Human Rights Watch</em>.</p>
<p>Si la primera historia es muy interesante desde el punto de vista legal, la segunda se lee como una novela negra (en varios sentidos). El autor sigue la pista de Rauff en Chile tras la denegación de su extradición: el intento de asesinarlo del Mossad en Santigo de Chile; su posible implicación en interrogatorios de la <a href="https://es.wikipedia.org/wiki/Direcci%C3%B3n_de_Inteligencia_Nacional">DINA</a>, algunos de los cuales tuvieron lugar en un edificio de la calle Londres 38 de Santiago (sede del Partido Socialista de Chile hasta el golpe de Pinochet en 1973); y su relación con la siniestra <a href="https://es.wikipedia.org/wiki/Colonia_Dignidad"><em>Colonia Dignidad</em></a>.</p>
<p>Este libro puede contemplarse como la contrapartida real, trágica y con frecuencia aterradora, de las novelas de Vargas Llosa, Faverón o Bolaño. Una de mis mejores lecturas de 2025.</p>
</section>
<section id="richard-flanagan-la-pregunta-7" class="level2">
<h2 class="anchored" data-anchor-id="richard-flanagan-la-pregunta-7">Richard Flanagan: <em>La pregunta 7</em></h2>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/033-libros_25/pregunta_7.jpg" class="quarto-figure quarto-figure-center figure-img" style="height:5cm"></p>
</figure>
</div>
<p>En <a href="https://culturacientifica.com/2020/08/19/tareas-de-un-matematico-loco/"><em>Tareas de un matemático loco</em></a>, publicado en 1882, Chejov parodia los libros de ejercicios de matemáticas a través de una lista de preguntas absurdas. La pregunta 7 es la que da título al libro de Richard Flanagan:</p>
<blockquote class="blockquote">
<p>El miércoles, 17 de junio de 1881, un tren debía salir de la estación A a las 3:00 horas para llegar a la estación B a las 23:00 horas; sin embargo, justo cuando el tren estaba a punto de arrancar, se recibió la orden de que el tren tenía que llegar a la estación В a las 19:00 horas. ¿Quién ama más tiempo, un hombre o una mujer?</p>
</blockquote>
<p>Durante la segunda guerra mundial, el padre del autor era prisionero en un campo de trabajo japonés. Estados Unidos lanzó la bomba atómica sobre Hiroshima y precipitó la rendición japonesa, por lo que muy probablemente, reflexiona el autor, las decenas de miles de japoneses muertos salvaron la vida de su padre, que pudo regresar a Tasmania. Este punto de partida sirve a Flanagan para recordar su infancia en Tasmania y trazar una semblanza muy conmovedora de sus padres. Se entrecruzan estos recuerdos con reflexiones sobre la creación literaria: “de las muchas ilusiones que permiten escribir a un escritor, dos son primordiales: una es la vanidad de creerse capaz de escribir un buen libro, y la otra, la presunción de que un buen libro caerá en manos de buenos lectores”.</p>
<p>El mismo punto de partida también da pie para escribir sobre la concepción de la bomba atómica. No su diseño y fabricación (el proyecto Manhattan, Oppenheimer y todo eso) sino su concepción, esto es, quiénes pensaron por primera vez que sería posible usar la energía nuclear para producir una bomba. Así, el libro se remonta a H. G. Wells que, antes que cualquier científico, ya hablaba de armamento atómico en su novela <em>El mundo liberado (The world set free, 1914)</em>. Otro estrafalario protagonista es el científico húngaro <a href="https://es.wikipedia.org/wiki/Le%C3%B3_Szil%C3%A1rd">Leo Szilard</a> que concibió la posibilidad de una reacción en cadena exactamente en un semáforo junto a <em>Russell Square</em>, cerca del Museo Británico, en septiembre de 1933.</p>
<p>La colonización de Tasmania y el genocidio de su población aborigen también son objeto de varias reflexiones. Este es un tema que el autor conecta con la historia de sus antepasados.</p>
<p>En los últimos capítulos Flanagan describe un accidente en canoa en el que estuvo a punto de morir ahogado cuando era muy joven, pero al que por fortuna sobrevivió, de tal manera que no siempre es posible encontrar la lógica en la sucesión de acontecimientos que componen una vida, igual que no es posible encontrar la lógica de la pregunta 7 de Chejov. Con sus pequeñas dosis de épica y de lírica, me ha parecido un libro de memorias bastante disfrutable.</p>
</section>
<section id="carmen-estrada-la-herencia-de-eva" class="level2">
<h2 class="anchored" data-anchor-id="carmen-estrada-la-herencia-de-eva">Carmen Estrada: <em>La herencia de Eva</em></h2>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/033-libros_25/eva.jpg" class="quarto-figure quarto-figure-center figure-img" style="height:5cm"></p>
</figure>
</div>
<p>Abre este libro una hermosa cita de Epicuro (fragmento A27):</p>
<blockquote class="blockquote">
<p>En las demás tareas de la vida solo después de terminadas les llega el fruto, pero en la búsqueda de la verdad corren a la par el deleite y la comprensión, pues no viene el gozo después del aprendizaje, sino que se da el aprendizaje a la vez que el gozo.</p>
</blockquote>
<p>La autora describe sus intenciones al comienzo del libro: no es historia ni filosofía de la ciencia, tampoco divulgación, sociología científica ni libro de memorias, “es la idea de la ciencia como actividad humana natural e instintiva la que he pretendido rescatar”. El resultado es un libro misceláneo que tiene un poco de todo eso que según la autora no es: notas históricas, reflexiones filosóficas, mucha sociología para explicar por qué la ciencia ha evolucionado como lo ha hecho y alguna anécdota personal. <a href="https://www.rtve.es/play/videos/pagina-dos/carmen-estrada-ciencia-cultura/16144455/">Carmen Estrada</a> es doctora en Medicina por la UAM y ejerció su labor docente e investigadora en la UAM, la Universidad de Cádiz y la Universidad de California en Los Ángeles, entre otras instituciones. Tras su jubilación se ha dedicado al estudio del griego clásico. Este gusto por la cultura clásica se pone de manifiesto en el libro a través de multitud de referencias a los antiguos griegos.</p>
<p>El libro se estructura en seis partes, amenas pero un tanto inconexas. En la primera parte se comentan algunos aspectos de los inicios de la actividad científica: los primeros registros de datos, las primeras bibliotecas, los primeros mapas. El mapa más antiguo conocido es una <a href="https://www.britishmuseum.org/collection/image/32436001">tablilla babilónica que se puede encontrar en el Museo Británico</a>:</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/033-libros_25/mapa_mas_antiguo.jpg" style="height:7cm" class="figure-img"></p>
<figcaption>© The Trustees of the British Museum. Shared under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) licence.</figcaption>
</figure>
</div>
<p>La segunda parte trata de algunos de los motores que han impulsado la ciencia: el asombro (“la filosofía comienza con el asombro”, afirma Aristóteles al principio de su <em>Metafísica</em>), los mitos, el capitalismo, la técnica. En general, en el libro se filtra una opinión muy crítica sobre las trabas de la religión a la búsqueda del conocimiento.</p>
<p>La tercera, cuarta y quinta partes se dedican a algunos aspectos de sociología de la ciencia: la humildad (no ciertamente de los científicos, entre los que abundan los vanidosos, sino referida a las limitaciones del conocimiento científico), la influencia de las ideologías, o el papel desempeñado por la Revolución Científica. Especialmente en la quinta parte se ponen de manifiesto algunos aspectos negativos en relación con la financiación de la investigación, el registro de patentes, la instrumentalización de la ciencia como medio de persuasión o la revisión por pares (“que no significa que los trabajos tengan que ser revisados por un número par de personas, como dijo una vez en mi presencia un supuesto experto en política científica”).</p>
<p>Finalmente, la sexta parte (<em>Con nombre propio</em>) compila historias de diversos científicos de todas las épocas en capítulos de lectura casi independiente. Aparecen, entre otros, el gran Arquímedes, Jeova Sanctus Unus (o sea, Newton, quien firmaba con ese nombre sus escritos sobre alquimia), Marie Curie, Michel Faraday o Jane Marcet, precursora de los libros de divulgación científica.</p>
<p>Una lectura fácil, agradable y variada para quien quiera acercarse al mundo de la ciencia. Toca muchos temas, aunque inevitablemente no pueda profundizar demasiado en ellos.</p>


</section>

 ]]></description>
  <category>Libros</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/033-libros_25/</guid>
  <pubDate>Thu, 18 Dec 2025 23:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/033-libros_25/libros-25.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>Una observación sobre intervalos de confianza bootstrap</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/032-ic-exp/</link>
  <description><![CDATA[ 





<p>Para calcular un intervalo de confianza usando <a href="">bootstrap</a> hay que decidir qué estadístico se remuestrea. Las distintas posibilidades han dado lugar a una amplia bibliografía sobre qué es lo más conveniente. Aquí voy a usar el ejemplo del intervalo de confianza de la media de una distribución exponencial para ilustrar por qué algunas posibilidades son claramente mejores que otras.</p>
<p>Comienzo describiendo de forma general los dos métodos bootstrap para calcular intervalos de confianza que voy a discutir, para luego compararlos en el caso de la media de una distribución exponencial. Usaré asteriscos para denotar, como es habitual, las cantidades obtenidas bajo la distribución empírica.</p>
<section id="método-bootstrap-básico" class="level2">
<h2 class="anchored" data-anchor-id="método-bootstrap-básico">Método bootstrap básico</h2>
<p>Consiste en remuestrar el estadístico <img src="https://latex.codecogs.com/png.latex?%5Chat%5Ctheta%20-%5Ctheta">. Supongamos que la distribución bootstrap de <img src="https://latex.codecogs.com/png.latex?%5Chat%5Ctheta%5E*%20-%5Chat%5Ctheta"> es similar a la distribución de <img src="https://latex.codecogs.com/png.latex?%5Chat%5Ctheta%20-%5Ctheta">. Entonces, si <img src="https://latex.codecogs.com/png.latex?q%5E*_%5Calpha"> es el cuantil <img src="https://latex.codecogs.com/png.latex?%5Calpha"> de la distribución de <img src="https://latex.codecogs.com/png.latex?%5Chat%5Ctheta%5E*%20-%5Chat%5Ctheta"> (que siempre se puede aproximar por Monte Carlo) tenemos: <img src="https://latex.codecogs.com/png.latex?1-%5Calpha%20=%20%5Ctext%7BP%7D_*(q%5E*_%7B%5Calpha/2%7D%20%3C%20%5Chat%5Ctheta%5E*%20-%5Chat%5Ctheta%20%3C%20q%5E*_%7B1-%5Calpha/2%7D)%5Capprox%20%5Ctext%7BP%7D(q%5E*_%7B%5Calpha/2%7D%20%3C%20%5Chat%5Ctheta%20-%5Ctheta%20%3C%20q%5E*_%7B1-%5Calpha/2%7D),"> lo que da lugar al intervalo <img src="https://latex.codecogs.com/png.latex?%5Ctext%7BIC%7D_%7B%5Ctext%7Bb%C3%A1sico%7D%7D(%5Ctheta)%20=%20%5B%5Chat%7B%5Ctheta%7D-q%5E*_%7B1-%5Calpha/2%7D,%5C%20%5Chat%7B%5Ctheta%7D-q%5E*_%7B%5Calpha/2%7D%5D."></p>
<p>Este método es muy fácil de usar: basta calcular muchas copias bootstrap de <img src="https://latex.codecogs.com/png.latex?%5Chat%7B%5Ctheta%7D"> y obtener los cuantiles de las copias. En el siguiente ejemplo, voy a generar una muestra de tamaño <img src="https://latex.codecogs.com/png.latex?n=50"> de una distribución exponencial de media <img src="https://latex.codecogs.com/png.latex?%5Cmu%20=%201/%5Clambda"> y voy a calcular el intervalo:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb1" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb1-1"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Parámetros</span></span>
<span id="cb1-2"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">set.seed</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">100</span>)</span>
<span id="cb1-3">lambda <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span></span>
<span id="cb1-4">alpha <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fl" style="color: #AD0000;
background-color: null;
font-style: inherit;">0.05</span></span>
<span id="cb1-5">n <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">50</span></span>
<span id="cb1-6">R <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1000</span> <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># número de remuestras</span></span>
<span id="cb1-7"></span>
<span id="cb1-8"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Datos</span></span>
<span id="cb1-9">x <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">rexp</span>(n, lambda)</span>
<span id="cb1-10"></span>
<span id="cb1-11"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Intervalo</span></span>
<span id="cb1-12">xbar <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">mean</span>(x)</span>
<span id="cb1-13"></span>
<span id="cb1-14"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Remuestras</span></span>
<span id="cb1-15">muestras_bootstrap <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">matrix</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">sample</span>(x, n<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span>R, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">rep =</span> <span class="cn" style="color: #8f5902;
background-color: null;
font-style: inherit;">TRUE</span>), <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">nrow =</span> n) <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># cada columna una remuestra</span></span>
<span id="cb1-16"></span>
<span id="cb1-17"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># IC bootstrap Básico</span></span>
<span id="cb1-18">medias_bootstrap <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">apply</span>(muestras_bootstrap, <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>, mean)</span>
<span id="cb1-19">T_bootstrap <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> medias_bootstrap <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">-</span> xbar</span>
<span id="cb1-20">lower_basico <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> xbar <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">-</span>  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">quantile</span>(T_bootstrap, <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">-</span>alpha<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>)</span>
<span id="cb1-21">upper_basico <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> xbar <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">-</span>  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">quantile</span>(T_bootstrap, alpha<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>)</span>
<span id="cb1-22"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">c</span>(lower_basico, upper_basico)</span>
<span id="cb1-23"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt;     97.5%      2.5% </span></span>
<span id="cb1-24"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; 0.6608514 1.0253285</span></span></code></pre></div></div>
</div>
</section>
<section id="método-bootstrap-t" class="level2">
<h2 class="anchored" data-anchor-id="método-bootstrap-t">Método bootstrap <img src="https://latex.codecogs.com/png.latex?t"></h2>
<p>En este caso se aproxima la distribución del estadístico estandarizado <img src="https://latex.codecogs.com/png.latex?(%5Chat%7B%5Ctheta%7D%20-%5Ctheta)/%5Ctext%7Bet%7D(%5Chat%7B%5Ctheta%7D)">, donde <img src="https://latex.codecogs.com/png.latex?%5Ctext%7Bet%7D(%5Chat%7B%5Ctheta%7D)"> es el error típico de <img src="https://latex.codecogs.com/png.latex?%5Chat%5Ctheta">. Si denotamos por <img src="https://latex.codecogs.com/png.latex?t_%5Calpha"> los cuantiles de esta distribución tenemos el intervalo clásico habitual <img src="https://latex.codecogs.com/png.latex?%5B%5Chat%7B%5Ctheta%7D-t_%7B1-%5Calpha/2%7D%5C,%20%5Ctext%7Bet%7D(%5Chat%7B%5Ctheta%7D),%5C%20%5Chat%7B%5Ctheta%7D-t_%7B%5Calpha/2%7D%5C,%20%5Ctext%7Bet%7D(%5Chat%7B%5Ctheta%7D)%5D">.</p>
<p>En la práctica, los cuantiles <img src="https://latex.codecogs.com/png.latex?t_%5Calpha"> no son conocidos pero de nuevo, si la distribución bootstrap de <img src="https://latex.codecogs.com/png.latex?(%5Chat%7B%5Ctheta%7D%5E*%20-%5Chat%5Ctheta)/%5Ctext%7Bet%7D(%5Chat%7B%5Ctheta%7D%5E*)"> es similar a la distribución de <img src="https://latex.codecogs.com/png.latex?(%5Chat%7B%5Ctheta%7D%20-%5Ctheta)/%5Ctext%7Bet%7D(%5Chat%7B%5Ctheta%7D)"> y llamamos <img src="https://latex.codecogs.com/png.latex?t%5E*_%5Calpha"> a sus cuantiles, se cumplirá <img src="https://latex.codecogs.com/png.latex?t%5E*_%5Calpha%5Capprox%20t_%5Calpha"> y sustituyendo los cuantiles que habría que usar por su versión bootstrap obtenemos el intervalo<br>
<img src="https://latex.codecogs.com/png.latex?%5Ctext%7BIC%7D_%7B%5Ctext%7Bt%7D%7D(%5Ctheta)%20=%5B%5Chat%7B%5Ctheta%7D-t%5E*_%7B1-%5Calpha/2%7D%5Ctext%7Bet%7D(%5Chat%7B%5Ctheta%7D),%5C%20%5Chat%7B%5Ctheta%7D-t%5E*_%7B%5Calpha/2%7D%5Ctext%7Bet%7D(%5Chat%7B%5Ctheta%7D)%5D."> La notación para los cuantiles se ha elegido para recordar que para la media de una población normal corresponderían a los cuantiles de una distribución t de Student. Parafraseando a Efron y Tibshirani (1994), el bootstrap sirve en este caso para fabricarnos unas tablas de la <img src="https://latex.codecogs.com/png.latex?t"> a la medida de los datos disponibles.</p>
<p>El cálculo de este intervalo es más complicado que el básico. Para empezar, es necesario calcular el error típico de <img src="https://latex.codecogs.com/png.latex?%5Chat%5Ctheta">. Esto no supone un problema si se dispone de una expresión analítica. Por ejemplo, si <img src="https://latex.codecogs.com/png.latex?%5Chat%5Ctheta%20=%20%5Cbar%20x">, entonces <img src="https://latex.codecogs.com/png.latex?%5Ctext%7Bet%7D(%5Chat%5Ctheta)=%20s/%5Csqrt%7Bn%7D"> y <img src="https://latex.codecogs.com/png.latex?%5Ctext%7Bet%7D(%5Chat%5Ctheta%5E*)=%20s%5E*/%5Csqrt%7Bn%7D">. Sin embargo, en casos más complejos puede ser necesario usar bootstrap para calcular <img src="https://latex.codecogs.com/png.latex?%5Ctext%7Bet%7D(%5Chat%5Ctheta)">. En particular, el cálculo de <img src="https://latex.codecogs.com/png.latex?%5Ctext%7Bet%7D(%5Chat%5Ctheta%5E*)"> requeriría obtener remuestras de las remuestras (re-remuestras) lo que incrementa mucho el coste computacional.</p>
<p>A continuación calculo el intervalo para la misma muestra anterior (como hemos dicho, no es necesario re-remuestrear porque <img src="https://latex.codecogs.com/png.latex?%5Chat%5Ctheta%20=%20%5Cbar%20x">):</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb2" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb2-1"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Desviaciones típicas de la muestra original y de las remuestras</span></span>
<span id="cb2-2">sdev <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">sd</span>(x)</span>
<span id="cb2-3">sd_bootstrap <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">apply</span>(muestras_bootstrap, <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>, sd)</span>
<span id="cb2-4"></span>
<span id="cb2-5"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># IC bootstrap t</span></span>
<span id="cb2-6">T_bootstrap <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">sqrt</span>(n) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span> (medias_bootstrap <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">-</span> xbar) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span> sd_bootstrap</span>
<span id="cb2-7">lower_t <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> xbar <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">-</span>  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">quantile</span>(T_bootstrap, <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">-</span>alpha<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span> sdev <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">sqrt</span>(n)</span>
<span id="cb2-8">upper_t <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> xbar <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">-</span>  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">quantile</span>(T_bootstrap, alpha<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span> sdev <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">sqrt</span>(n)</span>
<span id="cb2-9"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">c</span>(lower_t, upper_t)</span>
<span id="cb2-10"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt;     97.5%      2.5% </span></span>
<span id="cb2-11"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; 0.6857357 1.0662902</span></span></code></pre></div></div>
</div>
</section>
<section id="la-diferencia-entre-la-distribución-bootstrap-de-la-media-y-la-de-la-media-estandarizada" class="level2">
<h2 class="anchored" data-anchor-id="la-diferencia-entre-la-distribución-bootstrap-de-la-media-y-la-de-la-media-estandarizada">La diferencia entre la distribución bootstrap de la media y la de la media estandarizada</h2>
<p>La cuestión es cuál de los dos intervalos que hemos calculado es mejor. La figura&nbsp;1, tomada de Hesterberg (2015), me parece que es bastante ilustrativa al respecto.</p>
<p>La primera columna representa la población exponencial así como cinco posibles muestras de esta población en distintos colores. Si obtenemos muchas remuestras de cada muestra, calculamos sus medias <img src="https://latex.codecogs.com/png.latex?%5Cbar%7Bx%7D%5E*"> y representamos los correspondientes histogramas, tendríamos las distribuciones bootstrap de la segunda columna. Si comparamos con la distribución verdadera de la primera fila vemos que mientras que esta está centrada en <img src="https://latex.codecogs.com/png.latex?%5Cmu">, el centro de las distribuciones bootstrap son las medias muestrales respectivas. Si las centramos tendríamos las distribuciones bootstrap <img src="https://latex.codecogs.com/png.latex?%5Cbar%7Bx%7D%5E*-%5Cbar%20x"> que se usan en el intervalo básico. Pero, y esto es lo esencial, <strong>la dispersión en una distribución exponencial está estrechamente ligada a la media</strong> ya que <img src="https://latex.codecogs.com/png.latex?%5Csigma%5E2%20=%201/%5Clambda%5E2%20=%20%5Cmu%5E2">. Esto se refleja en que, según el valor de <img src="https://latex.codecogs.com/png.latex?%5Cbar%7Bx%7D"> en cada caso, las dispersiones de las distribuciones bootstrap son muy diferentes (muy baja la azul, por ejemplo, porque resultó <img src="https://latex.codecogs.com/png.latex?%5Cbar%7Bx%7D%3C%5Cmu">; pero muy alta la morada porque <img src="https://latex.codecogs.com/png.latex?%5Cbar%7Bx%7D%3E%5Cmu"> en este caso). Esta observación apunta a que es bastante posible tener mala suerte y que realmente <img src="https://latex.codecogs.com/png.latex?q%5E*_%5Calpha"> no se parezca a <img src="https://latex.codecogs.com/png.latex?q_%5Calpha">.</p>
<p>La forma obvia de corregir este inconveniente es estandarizar. En la tercera columna vemos cómo las distribuciones bootstrap de <img src="https://latex.codecogs.com/png.latex?%5Csqrt%7Bn%7D(%5Cbar%7Bx%7D%5E*-%5Cbar%7Bx%7D)/s%5E*"> son mucho más estables y los cuantiles <img src="https://latex.codecogs.com/png.latex?t%5E*_%5Calpha"> se parecen a los cuantiles <img src="https://latex.codecogs.com/png.latex?t_%5Calpha"> para las cinco muestras. Parece que el método bootstrap t va a ser mucho más fiable.</p>
<div class="cell" data-layout-align="center">
<div class="cell-output-display">
<div id="fig-hesterberg" class="quarto-float quarto-figure quarto-figure-center anchored" data-fig-align="center">
<figure class="quarto-float quarto-float-fig figure">
<div aria-describedby="fig-hesterberg-caption-0ceaefa1-69ba-4598-a22c-09a6ac19f8ca">
<img src="/~joser.berrendero/caminos_aleatorios/posts/032-ic-exp/bootstrap-dist-exponencial.jpg" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:75.0%">
</div>
<figcaption class="quarto-float-caption-bottom quarto-float-caption quarto-float-fig" id="fig-hesterberg-caption-0ceaefa1-69ba-4598-a22c-09a6ac19f8ca">
Figura&nbsp;1: Distribución bootstrap de la media (segunda columna) y de la media estandarizada (tercera columna) para diferentes muestras (primera columna) de una distribución exponencial. Fuente: Hesterberg (2015).
</figcaption>
</figure>
</div>
</div>
</div>
<p>Cuanto más asimétrica es una distribución mayor es la correlación entre <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2"> (para una demostración y fórmulas precisas del coeficiente de correlación entre ambas puede verse <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/023-correlacion-media-var/">esta entrada del blog</a>). La conclusión es que el método básico no debe usarse, especialmente si la distribución de los datos es asimétrica.</p>
</section>
<section id="el-intervalo-exacto-para-la-media-de-una-exponencial" class="level2">
<h2 class="anchored" data-anchor-id="el-intervalo-exacto-para-la-media-de-una-exponencial">El intervalo exacto para la media de una exponencial</h2>
<p>Para la media de la distribución exponencial es posible calcular un intervalo exacto que es útil para comparar. Es bien conocido que <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> tiene distribución gamma en este caso, y de aquí se puede deducir el siguiente intervalo exacto para <img src="https://latex.codecogs.com/png.latex?%5Cmu">: <img src="https://latex.codecogs.com/png.latex?%5Ctext%7BIC%7D_%7B%5Ctext%7Bexacto%7D%7D(%5Cmu)%0A=%0A%5Cleft%5B%0A%5Cfrac%7B2n%5Cbar%20X%7D%7B%5Cchi%5E2_%7B2n,%5C,1-%5Calpha/2%7D%7D%0A%5C;,%5C;%0A%5Cfrac%7B2n%5Cbar%20X%7D%7B%5Cchi%5E2_%7B2n,%5C,%5Calpha/2%7D%7D%0A%5Cright%5D."></p>
<p>Por ejemplo, para los datos de los ejemplos anteriores:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb3" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb3-1">lower_exact <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span>n<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span>xbar <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">qchisq</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">-</span>alpha<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>, <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span>n)</span>
<span id="cb3-2">upper_exact <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span>n<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span>xbar <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">qchisq</span>(alpha<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>, <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span>n)</span>
<span id="cb3-3"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">c</span>(lower_exact, upper_exact)</span>
<span id="cb3-4"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; [1] 0.6591107 1.1505384</span></span></code></pre></div></div>
</div>
<p>He calculado los tres intervalos a nivel 0.95 para 1000 muestras de tamaño 50. La siguiente tabla registra la proporción de veces que la media se va por encima del extremo superior de cada intervalo (fila 1) o por debajo del inferior (fila 2). Los valores nominales son 0.025 en cada caso.</p>
<table class="caption-top table">
<thead>
<tr class="header">
<th></th>
<th>Exacto</th>
<th>Básico</th>
<th>t</th>
</tr>
</thead>
<tbody>
<tr class="odd">
<td>inferior</td>
<td>0.025</td>
<td>0.008</td>
<td>0.018</td>
</tr>
<tr class="even">
<td>superior</td>
<td>0.021</td>
<td>0.077</td>
<td>0.027</td>
</tr>
</tbody>
</table>
<p>Como es lógico los valores empíricos para los intervalos exactos son los más parecidos al valor nominal. El intervalo básico está bastante lejos, por defecto en el extremo inferior y por exceso en el superior. Sin embargo, los resultados con el método bootstrap t no están lejos de los del intervalo exacto con la gran ventaja a favor del bootstrap de que <strong>no usa que los datos tienen distribución exponencial, ni requiere derivar la distribución exacta de la media muestral</strong>.</p>
</section>
<section id="coda-el-método-del-percentil-bootstrap" class="level2">
<h2 class="anchored" data-anchor-id="coda-el-método-del-percentil-bootstrap">Coda: el método del percentil bootstrap</h2>
<p>Otro intervalo bootstrap que también aparece en los libros se basa en remuestrear directamente el estimador <img src="https://latex.codecogs.com/png.latex?%5Chat%7B%5Ctheta%7D">, lo que en los libros se conoce como el método del percentil bootstrap. Es más difícil motivar por qué este método lleva a un intervalo de confianza razonable por lo que lo dejo para una futura entrada. Solo observo aquí que este método está estrechamente relacionado con el método básico. Si <img src="https://latex.codecogs.com/png.latex?p%5E*_%5Calpha"> son los cuantiles de la distribución bootstrap de <img src="https://latex.codecogs.com/png.latex?%5Chat%5Ctheta%5E*">, tenemos <img src="https://latex.codecogs.com/png.latex?%20%5Calpha%20=%20%5Ctext%7BP%7D_*(%5Chat%5Ctheta%5E*%5Cleq%20p%5E*_%5Calpha)=%5Ctext%7BP%7D_*(%5Chat%5Ctheta%5E*-%5Chat%5Ctheta%5Cleq%20p%5E*_%5Calpha-%5Chat%5Ctheta),"> y entonces <img src="https://latex.codecogs.com/png.latex?p%5E*_%5Calpha%20=%20q%5E*_%5Calpha%20+%20%5Chat%5Ctheta">. Por lo tanto: <img src="https://latex.codecogs.com/png.latex?%5Ctext%7BIC%7D_%7B%5Ctext%7Bpercentil%7D%7D(%5Ctheta)%20:=%20%5Bp%5E*_%7B%5Calpha/2%7D,%5C,%20p%5E*_%7B1-%5Calpha/2%7D%5D=%5B2%5Chat%5Ctheta%20-%20(%5Chat%5Ctheta%20-%20q%5E*_%7B%5Calpha/2%7D),%5C,%202%5Chat%5Ctheta%20-%20(%5Chat%5Ctheta%20-%20q%5E*_%7B1-%5Calpha/2%7D)%5D."> Esto significa que el intervalo del método percentil es una versión reflejada del que resultaría si aplicáramos el método básico.</p>
</section>
<section id="referencias" class="level2">
<h2 class="anchored" data-anchor-id="referencias">Referencias</h2>
<ul>
<li>Efron, B., y Tibshirani, R.J. (1994). <em>An introduction to the bootstrap</em>. Chapman and Hall/CRC.</li>
<li>Hesterberg, T. C. (2015). What teachers should know about the bootstrap: resampling in the undergraduate statistics curriculum. <em>The American Statistician</em>, <strong>69</strong>, 371–386. <a href="https://doi.org/10.1080/00031305.2015.1089789">doi (open access)</a></li>
</ul>


</section>

 ]]></description>
  <category>Intervalos de confianza</category>
  <category>Bootstrap</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/032-ic-exp/</guid>
  <pubDate>Thu, 27 Nov 2025 23:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/032-ic-exp/hester.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>El principio de minoración-maximización</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/031-mm/</link>
  <description><![CDATA[ 





<section id="el-principio-de-minoración-maximización" class="level2">
<h2 class="anchored" data-anchor-id="el-principio-de-minoración-maximización">El principio de minoración-maximización</h2>
<p>La situación de partida es que queremos maximizar una función <img src="https://latex.codecogs.com/png.latex?%5Cell(%5Ctheta)"> en <img src="https://latex.codecogs.com/png.latex?%5Ctheta%5Cin%5CTheta"> y para ello usamos un algoritmo en cuya etapa <img src="https://latex.codecogs.com/png.latex?k"> el valor actual de la variable resulta ser <img src="https://latex.codecogs.com/png.latex?%5Ctheta_k">. El principio de minoración-maximización consiste en sustituir la función original por otra más conveniente <img src="https://latex.codecogs.com/png.latex?H(%5Ctheta;%5Ctheta_k)"> que verifique las dos propiedades siguientes:</p>
<ol type="1">
<li><img src="https://latex.codecogs.com/png.latex?H"> minora a <img src="https://latex.codecogs.com/png.latex?%5Cell">, es decir, <img src="https://latex.codecogs.com/png.latex?%5Cell(%5Ctheta)%5Cgeq%20H(%5Ctheta;%5Ctheta_k)">, para todo <img src="https://latex.codecogs.com/png.latex?%5Ctheta%5Cin%5CTheta">.</li>
<li><img src="https://latex.codecogs.com/png.latex?H"> coincide con <img src="https://latex.codecogs.com/png.latex?%5Cell"> en el valor actual de la variable: <img src="https://latex.codecogs.com/png.latex?%5Cell(%5Ctheta_k)=%20H(%5Ctheta_k;%5Ctheta_k)">.</li>
</ol>
<p>El valor de la variable en el paso <img src="https://latex.codecogs.com/png.latex?k+1"> del algoritmo se obtiene entonces maximizando la función conveniente <img src="https://latex.codecogs.com/png.latex?H"> en lugar de la original <img src="https://latex.codecogs.com/png.latex?%5Cell">:</p>
<ol start="3" type="1">
<li><img src="https://latex.codecogs.com/png.latex?H(%5Ctheta_%7Bk+1%7D;%5Ctheta_k)%5Cgeq%20H(%5Ctheta;%20%5Ctheta_k)">, para todo <img src="https://latex.codecogs.com/png.latex?%5Ctheta%5Cin%5CTheta">.</li>
</ol>
<p>La propiedad importante de este método es la siguiente:</p>
<div class="my-box">
<p>El principio de minoración-maximización (principio MM) nunca empeora nuestro objetivo, es decir, <img src="https://latex.codecogs.com/png.latex?%5Cell(%5Ctheta_%7Bk+1%7D)%5Cgeq%5Cell(%5Ctheta_k)">.</p>
</div>
<p><br>
</p>
<p>La afirmación anterior es muy fácil de probar:</p>
<p><img src="https://latex.codecogs.com/png.latex?%5Cell(%5Ctheta_%7Bk+1%7D)%20%5Cgeq%20H(%5Ctheta_%7Bk+1%7D;%5Ctheta_k)%20%5Cgeq%20H(%5Ctheta_k;%5Ctheta_k)%20=%20%5Cell(%5Ctheta_k)."> La primera desigualdad se debe a la propiedad 1, la segunda desigualdad a la propiedad 3 y la última igualdad a la propiedad 2.</p>
<p>Si lo que queremos es minimizar <img src="https://latex.codecogs.com/png.latex?%5Cell(%5Ctheta)"> en lugar de maximizar basta minimizar una función mayorante pero las ideas son exactamente las mismas (basta cambiar de signo todas las funciones en el razonamiento anterior). En este caso podríamos llamar a la idea el principio de mayoración-minimización.</p>
<p>De hecho el principio MM que acabo de describir se encuentra detrás de muchos algoritmos diferentes con importantes aplicaciones en estadística. En lo que queda de entrada vamos a ver dos ejemplos. El primero es más bien anecdótico y más que nada sirve para ilustrar la idea, aunque al mismo tiempo muestra una forma de calcular la mediana que no requiere tener que ordenar los datos. El segundo ejemplo es más relevante ya que permite entender el famoso algoritmo EM para calcular estimadores de máxima verosimilitud como una implementación del principio MM.</p>
</section>
<section id="cálculo-de-la-mediana" class="level2">
<h2 class="anchored" data-anchor-id="cálculo-de-la-mediana">Cálculo de la mediana</h2>
<p>Es bien conocido (véase <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/009-mediana-mad/">esta entrada del blog</a> para una demostración fácil) que la mediana de un conjunto de datos <img src="https://latex.codecogs.com/png.latex?x_1,%5Cldots,x_n"> minimiza la función</p>
<p><img src="https://latex.codecogs.com/png.latex?%5Cell(%5Ctheta)%20=%20%5Cell(%5Ctheta;x_1,%5Cdots,x_n)%20=%20%5Csum_%7Bi=1%7D%5En%20%7Cx_i-%5Ctheta%7C."> Dado que esta función no es derivable, la idea sería sustituirla por otra que sí lo sea y que la mayore. Así en cada paso sí podremos derivar para acercarnos a la mediana.</p>
<p>Una función con las propiedades requeridas<sup>1</sup> es <img src="https://latex.codecogs.com/png.latex?H(%5Ctheta,%5Ctheta_k)%20=%20%5Csum_%7Bi=1%7D%5En%20%5Cfrac%7B(x_i-%5Ctheta)%5E2%20+%20(x_i-%5Ctheta_k)%5E2%7D%7B2%7Cx_i-%5Ctheta_k%7C%7D."></p>
<p>Obviamente <img src="https://latex.codecogs.com/png.latex?H(%5Ctheta_k,%5Ctheta_k)=%5Cell(%5Ctheta_k)"> (propiedad 2). Por otra parte, para todo <img src="https://latex.codecogs.com/png.latex?i=1,%5Cldots,n">, <img src="https://latex.codecogs.com/png.latex?%5Cfrac%7B(x_i-%5Ctheta)%5E2%20+%20(x_i-%5Ctheta_k)%5E2%7D%7B2%7Cx_i-%5Ctheta_k%7C%7D%20=%20%5Cfrac%7B(%7Cx_i-%5Ctheta%7C-%7Cx_i-%5Ctheta_k%7C)%5E2%20+%202%7Cx_i-%5Ctheta%7C%5C%20%7Cx_i-%5Ctheta_k%7C%7D%7B2%7Cx_i-%5Ctheta_k%7C%7D%5Cgeq%20%7Cx_i-%5Ctheta%7C,"> lo que demuestra que <img src="https://latex.codecogs.com/png.latex?H(%5Ctheta,%5Ctheta_k)"> mayora a la función <img src="https://latex.codecogs.com/png.latex?%5Cell(%5Ctheta)"> (propiedad 1). La desigualdad se obtiene al eliminar el término al cuadrado y simplificar.</p>
<p>En el gráfico siguiente se muestra la función que hay que minimizar para calcular la mediana de una muestra de cinco puntos (en negro) y la función <img src="https://latex.codecogs.com/png.latex?H"> (en azul) en un paso del algoritmo para el que <img src="https://latex.codecogs.com/png.latex?%5Ctheta_k=1"> (línea vertical discontinua). El mínimo de la función azul sería el siguiente valor del algoritmo.</p>
<div class="cell" data-layout-align="center">
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/031-mm/index_files/figure-html/unnamed-chunk-1-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:75.0%"></p>
</figure>
</div>
</div>
</div>
<p>En general, para calcular el valor <img src="https://latex.codecogs.com/png.latex?%5Ctheta_%7Bk+1%7D"> derivamos <img src="https://latex.codecogs.com/png.latex?H"> e igualamos a cero. Dado que <img src="https://latex.codecogs.com/png.latex?%5Cfrac%7Bd%7D%7Bd%5Ctheta%7DH(%5Ctheta,%5Ctheta_k)%20=%20-%5Csum_%7Bi=1%7D%5En%20%5Cfrac%7Bx_i-%5Ctheta%7D%7B%7Cx_i-%5Ctheta_k%7C%7D,"> el valor <img src="https://latex.codecogs.com/png.latex?%5Ctheta_%7Bk+1%7D"> verifica <img src="https://latex.codecogs.com/png.latex?%5Csum_%7Bi=1%7D%5En%20w_i%5E%7B(k)%7Dx_i%20=%20%5Ctheta_%7Bk+1%7D%5Csum_%7Bi=1%7D%5En%20w_i%5E%7B(k)%7D,%5C%20%5C%20%5C%20%5C%20%5C%20%5C%20w_i%5E%7B(k)%7D%20:=%20%5Cfrac%7B1%7D%7B%7Cx_i-%5Ctheta_k%7C%7D.%20"></p>
<div class="my-box">
<p>Tenemos entonces el algoritmo siguiente para calcular la mediana:</p>
<ul>
<li>Fijamos un valor inicial <img src="https://latex.codecogs.com/png.latex?%5Ctheta_0"> (por ejemplo, la media)</li>
<li>Repetimos hasta la convergencia: <img src="https://latex.codecogs.com/png.latex?%5Ctheta_%7Bk+1%7D%20=%20%5Cfrac%7B%5Csum_%7Bi=1%7D%5En%20w_i%5E%7B(k)%7Dx_i%7D%7B%5Csum_%7Bi=1%7D%5En%20w_i%5E%7B(k)%7D%7D,%5C%20%5C%20%5C%20%5C%20%5C%20%5C%20w_i%5E%7B(k)%7D%20=%20%5Cfrac%7B1%7D%7B%7Cx_i-%5Ctheta_k%7C%7D."></li>
</ul>
</div>
<p><br></p>
<p>El algoritmo permite interpretar la mediana como una media ponderada de los datos, de forma que la ponderación que recibe cada observación es inversamente proporcional a su distancia al centro de la muestra.</p>
</section>
<section id="el-algoritmo-em" class="level2">
<h2 class="anchored" data-anchor-id="el-algoritmo-em">El algoritmo EM</h2>
<p>En este apartado sigo la notación de <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/018-em/">la entrada del blog en la que se explicaba el algoritmo EM</a>, uno de los más importantes y citados para calcular estimadores de máxima verosimilitud.</p>
<p>Resulta que también se puede entender este método en términos del principio de minoración-maximización, lo que automáticamente da una demostración de que la verosimilitud no disminuye en cada paso del algoritmo EM. La función <img src="https://latex.codecogs.com/png.latex?H"> apropiada resulta ser <img src="https://latex.codecogs.com/png.latex?H(%5Ctheta;%5Ctheta_k)%20=%20Q(%5Ctheta;%5Ctheta_k)%20+%20%5Cell(%5Ctheta_k)%20-%20Q(%5Ctheta_k;%5Ctheta_k),"> donde, recordando la notación de la entrada mencionada, se define <img src="https://latex.codecogs.com/png.latex?Q(%5Ctheta;%5Ctheta_k):=%20%5Cmbox%7BE%7D_%7BY%7Cx;%5Ctheta_k%7D%5B%5Cell_c(%5Ctheta;x,Y)%5D."></p>
<p>Obviamente la función <img src="https://latex.codecogs.com/png.latex?H"> cumple la propiedad 2. Veamos cómo se justifica que <img src="https://latex.codecogs.com/png.latex?H"> minora a <img src="https://latex.codecogs.com/png.latex?%5Cell">. Notamos primero que, reordenando términos, <img src="https://latex.codecogs.com/png.latex?%5Cell(%5Ctheta)%5Cgeq%20H(%5Ctheta;%5Ctheta_k)%20%5CLeftrightarrow%20Q(%5Ctheta;%5Ctheta_k)%20-%5Cell(%5Ctheta)%20%5Cleq%20%20Q(%5Ctheta_k;%5Ctheta_k)%20-%5Cell(%5Ctheta_k)."></p>
<p>Vamos a comprobar la desigualdad de la derecha. A las funciones de densidad o de probabilidad involucradas las llamo siempre <img src="https://latex.codecogs.com/png.latex?f"> para simplificar la notación, creo que el abuso no causa ambigüedad. Primero, observamos que <img src="https://latex.codecogs.com/png.latex?Q(%5Ctheta;%5Ctheta_k)-%5Cell(%5Ctheta)=%5Cmbox%7BE%7D_%7BY%7Cx;%5Ctheta_k%7D%5B%5Clog%20f(x,Y%7C%5Ctheta)%5D-%5Clog%20f(x%7C%5Ctheta)%20=%20%5Cmbox%7BE%7D_%7BY%7Cx;%5Ctheta_k%7D%5Cleft%5B%5Clog%5Cfrac%7Bf(x,Y%7C%5Ctheta)%7D%7Bf(x%7C%5Ctheta)%7D%5Cright%5D=%5Cmbox%7BE%7D_%7BY%7Cx;%5Ctheta_k%7D%5Cleft%5B%5Clog%20f(Y%7Cx,%5Ctheta)%5Cright%5D."> Por otra parte, se verifica <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D_%7BY%7Cx;%5Ctheta_k%7D%5Cleft%5B%5Clog%20f(Y%7Cx,%5Ctheta)%5Cright%5D%20%5Cleq%20%5Cmbox%7BE%7D_%7BY%7Cx;%5Ctheta_k%7D%5Cleft%5B%5Clog%20f(Y%7Cx,%5Ctheta_k)%5Cright%5D=%5Cmbox%7BE%7D_%7BY%7Cx;%5Ctheta_k%7D%5Cleft%5B%5Clog%5Cfrac%7Bf(x,Y%7C%5Ctheta_k)%7D%7Bf(x%7C%5Ctheta_k)%7D%5Cright%5D=Q(%5Ctheta_k;%5Ctheta_k)-%5Cell(%5Ctheta_k),"> que es lo que queríamos demostrar.</p>
<p>La desigualdad de la ecuación anterior se debe al hecho de que la <a href="https://es.wikipedia.org/wiki/Divergencia_de_Kullback-Leibler">divergencia de Kullback-Leibler</a> es no negativa (lo que a su vez es una consecuencia inmediata de la desigualdad de Jensen): para dos funciones de densidad o de probabilidad <img src="https://latex.codecogs.com/png.latex?f"> y <img src="https://latex.codecogs.com/png.latex?g"> cualesquiera <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D_f%5Cleft%5B%5Clog%5Cfrac%7Bf(X)%7D%7Bg(X)%7D%20%5Cright%5D%20%5Cgeq%200%20%5CLeftrightarrow%20%5Cmbox%7BE%7D_f%5B%5Clog%20g(X)%5D%5Cleq%20%5Cmbox%7BE%7D_f%5B%5Clog%0Af(X)%5D,"> donde <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D_f(%5Ccdot)"> significa que al tomar la esperanza la variable aleatoria <img src="https://latex.codecogs.com/png.latex?X"> tiene distribución dada por <img src="https://latex.codecogs.com/png.latex?f">.</p>
</section>
<section id="referencias" class="level2">
<h2 class="anchored" data-anchor-id="referencias">Referencias</h2>
<p>Las ideas y ejemplos de esta entrada se deben a <a href="https://doi.org/10.1198/0003130042836">Hunter y Lange (2012)</a>. En el artículo se desarrollan otros ejemplos más sofisticados y se enumeran algunas técnicas útiles para determinar la función auxiliar <img src="https://latex.codecogs.com/png.latex?H"> a partir de la función <img src="https://latex.codecogs.com/png.latex?%5Cell"> que queremos optimizar. El algoritmo que hemos presentado para calcular la mediana fue introducido por <a href="https://doi.org/10.1080/01621459.1973.10481436">Schlossmacher (1973)</a> en el contexto de regresión.</p>


</section>


<div id="quarto-appendix" class="default"><section id="footnotes" class="footnotes footnotes-end-of-document"><h2 class="anchored quarto-appendix-heading">Notas</h2>

<ol>
<li id="fn1"><p>Suponemos que siempre se va a cumplir <img src="https://latex.codecogs.com/png.latex?x_i%5Cneq%20%5Ctheta_k"> para todo <img src="https://latex.codecogs.com/png.latex?i=1,%5Cldots,n"> y para cualquier paso <img src="https://latex.codecogs.com/png.latex?k">. Esta es una limitación del algoritmo tal y como lo describimos aquí.↩︎</p></li>
</ol>
</section></div> ]]></description>
  <category>Estimación</category>
  <category>Mediana</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/031-mm/</guid>
  <pubDate>Sun, 28 Sep 2025 22:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/031-mm/max-algorithm.png" medium="image" type="image/png" height="82" width="144"/>
</item>
<item>
  <title>Estadística en un lugar de la Mancha</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/030-zipf/</link>
  <description><![CDATA[ 





<p>He convertido dos obras cumbres de la novela en castellano en sendos <em>data frames</em> de R, y he hecho alguna estadística sencilla con ellas. Los conjuntos de datos resultantes se pueden usar en la docencia como ejemplos de visualización de datos o de ajuste de una recta por mínimos cuadrados.</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/030-zipf/QuijoteSancho.jpg" class="quarto-figure quarto-figure-center figure-img" style="height:5cm"></p>
</figure>
</div>
<p>La primera novela empieza así:</p>
<blockquote class="blockquote">
<p>En un lugar de la Mancha, de cuyo nombre no quiero acordarme, no ha mucho tiempo que vivía un hidalgo de los de lanza en astillero, adarga antigua, rocín flaco y galgo corredor. Una olla de algo más vaca que carnero, salpicón las más noches, duelos y quebrantos los sábados, lantejas los viernes, algún palomino de añadidura los domingos, consumían las tres partes de su hacienda. El resto della concluían sayo de velarte, calzas de velludo para las fiestas, con sus pantuflos de lo mesmo, y los días de entresemana se honraba con su vellorí de lo más fino. Tenía en su casa una ama que pasaba de los cuarenta, y una sobrina que no llegaba a los veinte, y un mozo de campo y plaza, que así ensillaba el rocín como tomaba la podadera.</p>
</blockquote>
<p>El comienzo de la segunda es:</p>
<blockquote class="blockquote">
<p>La heroica ciudad dormía la siesta. El viento Sur, caliente y perezoso, empujaba las nubes blanquecinas que se rasgaban al correr hacia el Norte. En las calles no había más ruido que el rumor estridente de los remolinos de polvo, trapos, pajas y papeles que iban de arroyo en arroyo, de acera en acera, de esquina en esquina revolando y persiguiéndose, como mariposas que se buscan y huyen y que el aire envuelve en sus pliegues invisibles.</p>
</blockquote>
<p>Se trata, claro, del <em>Quijote</em> y <em>La Regenta</em>.</p>
<section id="cómo-convertir-una-novela-en-un-data-frame" class="level2">
<h2 class="anchored" data-anchor-id="cómo-convertir-una-novela-en-un-data-frame">Cómo convertir una novela en un <em>data frame</em></h2>
<p>Antes de empezar hay que cargar todos los paquetes que van a ser necesarios:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb1" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb1-1"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">library</span>(tidyverse)</span>
<span id="cb1-2"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">library</span>(gutenbergr)</span>
<span id="cb1-3"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">library</span>(tidytext)</span>
<span id="cb1-4"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">library</span>(patchwork)</span>
<span id="cb1-5"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">library</span>(wordcloud)</span></code></pre></div></div>
</div>
<p>El siguiente código usa el paquete <code>gutenbergr</code> para descargar el <em>Quijote</em> y la <em>Regenta</em> desde <a href="https://www.gutenberg.org/">la página del Proyecto Gutenberg</a>. Se usa el paquete <code>gutenbergr</code> y el comando <code>gutenberg_download</code> aplicado a la clave del libro, que hay que buscar en la página mencionada. Posteriormente se usa <code>unnest_tokens</code> de <code>tidytext</code> para convertir el libro en un <em>data frame</em> manejable:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb2" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb2-1"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Quijote --------------------------------------</span></span>
<span id="cb2-2"></span>
<span id="cb2-3">quijote <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">gutenberg_download</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2000</span>)</span>
<span id="cb2-4"></span>
<span id="cb2-5">quijote <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> quijote <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span> </span>
<span id="cb2-6">  <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Crea una variable que contiene las palabras sueltas:</span></span>
<span id="cb2-7">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">unnest_tokens</span>(word, text)</span>
<span id="cb2-8"></span>
<span id="cb2-9"></span>
<span id="cb2-10"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Regenta -------------------------------------</span></span>
<span id="cb2-11"></span>
<span id="cb2-12">regenta <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">gutenberg_download</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">17073</span>)</span>
<span id="cb2-13"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Para resolver un problema técnico con la codificación</span></span>
<span id="cb2-14">regenta<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">$</span>text <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">iconv</span>(regenta<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">$</span>text, <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"latin1"</span>, <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"UTF-8"</span>)</span>
<span id="cb2-15"></span>
<span id="cb2-16">regenta <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> regenta <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span> </span>
<span id="cb2-17">  <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Crea una variable que contiene las palabras sueltas:</span></span>
<span id="cb2-18">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">unnest_tokens</span>(word, text)</span></code></pre></div></div>
</div>
<p>El resultado es un fichero con dos variables, la primera contiene el código del libro y la segunda, una por una, todas las palabras.</p>
</section>
<section id="cuáles-son-las-palabras-significativas-más-frecuentes" class="level2">
<h2 class="anchored" data-anchor-id="cuáles-son-las-palabras-significativas-más-frecuentes">¿Cuáles son las palabras significativas más frecuentes?</h2>
<p>Si vamos a mirar cuáles son las palabras más repetidas tenemos que quitar primero las que no son significativas (preposiciones, artículos, etc.). Para ello, he usado un fichero de palabras no significativas del castellano que he encontrado <a href="https://github.com/stopwords-iso/stopwords-es/blob/master/stopwords-es.txt">aquí</a> y luego he retocado ligeramente. Además, es necesario quitar algunas otras palabras por la naturaleza del texto que estamos analizando:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb3" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb3-1"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Convierte fichero de palabras no significativas (stop-words) en data frame </span></span>
<span id="cb3-2">stop_words <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">scan</span>(<span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">'datos/spanish.txt'</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">what =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"character"</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">encoding =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"UTF-8"</span>)</span>
<span id="cb3-3">stop_words_spanish <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">tibble</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">word =</span> stop_words)</span>
<span id="cb3-4"></span>
<span id="cb3-5"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Se eliminan palabras no significativas y otras rarezas</span></span>
<span id="cb3-6">quijote_ordenado <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span>  quijote <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span></span>
<span id="cb3-7">  <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># filter(!word %in% c("don", "Don", "á", "ó", "the")) %&gt;%   # quita rarezas</span></span>
<span id="cb3-8">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">anti_join</span>(stop_words_spanish)     <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># quita lista de palabras no significativas</span></span>
<span id="cb3-9"></span>
<span id="cb3-10">regenta_ordenado <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span>  regenta <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span></span>
<span id="cb3-11">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">anti_join</span>(stop_words_spanish)     <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># quita lista de palabras no significativas</span></span></code></pre></div></div>
</div>
<p>Para visualizar la lista de palabras más frecuentes he usado gráficos de barras estándar generados con el código siguiente:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb4" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb4-1">rmax <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">20</span>  <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Considera las 20 palabras más frecuentes</span></span>
<span id="cb4-2"></span>
<span id="cb4-3">df <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> quijote_ordenado <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span></span>
<span id="cb4-4">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">count</span>(word, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">sort =</span> <span class="cn" style="color: #8f5902;
background-color: null;
font-style: inherit;">TRUE</span>) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span>    <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># cuenta las frecuencias</span></span>
<span id="cb4-5">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">mutate</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">word =</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">reorder</span>(word, n)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span>    <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># para ordenar según frecuencia en lugar de alfabéticamente</span></span>
<span id="cb4-6">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">filter</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">row_number</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">&lt;=</span> rmax) </span>
<span id="cb4-7"></span>
<span id="cb4-8"></span>
<span id="cb4-9">plot1 <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">ggplot</span>(df, <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">aes</span>(word, n)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span>  </span>
<span id="cb4-10">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_col</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">fill=</span><span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">'lightblue'</span>) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb4-11">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">coord_flip</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span> </span>
<span id="cb4-12">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">labs</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">title =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"El Quijote"</span>,</span>
<span id="cb4-13">       <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> <span class="cn" style="color: #8f5902;
background-color: null;
font-style: inherit;">NULL</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> <span class="cn" style="color: #8f5902;
background-color: null;
font-style: inherit;">NULL</span>)</span>
<span id="cb4-14"></span>
<span id="cb4-15">df <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> regenta_ordenado <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span></span>
<span id="cb4-16">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">count</span>(word, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">sort =</span> <span class="cn" style="color: #8f5902;
background-color: null;
font-style: inherit;">TRUE</span>) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span>    <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># cuenta las frecuencias</span></span>
<span id="cb4-17">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">mutate</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">word =</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">reorder</span>(word, n)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span>    <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># para ordenar según frecuencia en lugar de alfabéticamente</span></span>
<span id="cb4-18">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">filter</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">row_number</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">&lt;=</span> rmax) </span>
<span id="cb4-19"></span>
<span id="cb4-20">plot2 <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span>  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">ggplot</span>(df, <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">aes</span>(word, n)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span>  </span>
<span id="cb4-21">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_col</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">fill=</span><span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">'lightblue'</span>) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb4-22">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">coord_flip</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span> </span>
<span id="cb4-23">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">labs</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">title =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"La Regenta"</span>,</span>
<span id="cb4-24">       <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> <span class="cn" style="color: #8f5902;
background-color: null;
font-style: inherit;">NULL</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> <span class="cn" style="color: #8f5902;
background-color: null;
font-style: inherit;">NULL</span>)</span>
<span id="cb4-25"></span>
<span id="cb4-26">plot1 <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span> plot2</span></code></pre></div></div>
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/030-zipf/index_files/figure-html/unnamed-chunk-4-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:75.0%"></p>
</figure>
</div>
</div>
</div>
<p>Tal vez debería haber quitado también los nombres de los personajes, lo que sería fácil modificando el código anterior, pero ya no he tenido ganas. El <em>Quijote</em> se publicó en 1605 (primera parte) y 1615 (segunda parte) mientras que <em>La Regenta</em> se publicó en dos tomos en 1884 y 1885. Me ha llamado la atención que, aunque hay más de 250 años de diferencia entre la publicación de ambas novelas y aunque hablan de personajes y entornos sociales muy distintos, hay algunas palabras comunes entre las más repetidas: <em>señor</em>, <em>Dios</em>, <em>mundo</em>, <em>vida</em>, <em>casa</em>, <em>ojos</em>.</p>
<p>Los mismos datos se pueden visualizar de formas diferentes en función de lo que se pretenda comunicar. Por ejemplo, según el contexto puede ser conveniente representar las palabras más frecuentes en forma de nube:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb5" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb5-1">pal <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">brewer.pal</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">9</span>, <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Set1"</span>)</span>
<span id="cb5-2">quijote_ordenado <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span></span>
<span id="cb5-3">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">count</span>(word) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span></span>
<span id="cb5-4">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">with</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">wordcloud</span>(</span>
<span id="cb5-5">    word, n, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">max.words =</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">50</span>,</span>
<span id="cb5-6">    <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">colors =</span> pal))</span></code></pre></div></div>
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/030-zipf/index_files/figure-html/unnamed-chunk-5-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:75.0%"></p>
</figure>
</div>
</div>
</div>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb6" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb6-1">pal <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">brewer.pal</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">9</span>, <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Set1"</span>)</span>
<span id="cb6-2">regenta_ordenado <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span></span>
<span id="cb6-3">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">count</span>(word) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span></span>
<span id="cb6-4">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">with</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">wordcloud</span>(</span>
<span id="cb6-5">    word, n, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">max.words =</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">50</span>,</span>
<span id="cb6-6">    <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">colors =</span> pal))</span></code></pre></div></div>
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/030-zipf/index_files/figure-html/unnamed-chunk-6-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:75.0%"></p>
</figure>
</div>
</div>
</div>
</section>
<section id="la-ley-de-zipf" class="level2">
<h2 class="anchored" data-anchor-id="la-ley-de-zipf">La ley de Zipf</h2>
<p>El lingüista <a href="https://en.wikipedia.org/wiki/George_Kingsley_Zipf">George Kingsley Zipf</a>, al estudiar el vocabulario en la obra de James Joyce alrededor de 1935, describió una regularidad estadística: cuando hablamos o escribimos hay un conjunto pequeño de palabras que se repiten con una frecuencia muy alta mientras que hay un conjunto numeroso de palabras que usamos muy poco. Supongamos que ordenamos todas las palabras de un texto de más frecuente a menos (como hemos hecho antes pero sin quitar las palabras no significativas), entonces el rango de una palabra es el lugar que ocupa en la lista y lo que dice la <a href="https://en.wikipedia.org/wiki/Zipf%27s_law">ley de Zipf</a> es que la frecuencia es (de forma aproximada) inversamente proporcional al rango:</p>
<p><img src="https://latex.codecogs.com/png.latex?%5Ctext%7Bfrecuencia%7D%20%5Capprox%20%5Cfrac%7Ba%7D%7B(%5Ctext%7Brango%7D)%5Eb%7D,%5C%20%5C%20%5C%20%5Ctext%7Bcon%7D%5C%20%5C%20%5C%20b%5Capprox%201."> Esto significa que si tomamos logaritmos</p>
<p><img src="https://latex.codecogs.com/png.latex?%5Clog(%5Ctext%7Bfrecuencia%7D)%20%5Capprox%20%5Clog(a)%20-%20b%5Clog(%5Ctext%7Brango%7D),"> es decir, si representamos frecuencias y rangos de cada palabra en escala logarítmica deberíamos observar puntos aproximadamente alineados.</p>
<p>Veamos qué ocurre con los dos textos que estamos analizando en esta entrada. Para el <em>Quijote</em> tenemos:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb7" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb7-1">df <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> quijote <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span></span>
<span id="cb7-2">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">count</span>(word, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">sort =</span> <span class="cn" style="color: #8f5902;
background-color: null;
font-style: inherit;">TRUE</span>) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span></span>
<span id="cb7-3">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">mutate</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">rango =</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">row_number</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">desc</span>(n))) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span> </span>
<span id="cb7-4">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">rename</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">frecuencia =</span> n, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">palabra =</span> word)</span>
<span id="cb7-5"></span>
<span id="cb7-6"></span>
<span id="cb7-7"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">ggplot</span>(df, <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">aes</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> rango, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> frecuencia)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb7-8">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_point</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb7-9">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">scale_x_log10</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">scale_y_log10</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb7-10">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">labs</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Rango"</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Frecuencia"</span>,</span>
<span id="cb7-11">       <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">title =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Frecuencia vs rango en El Quijote"</span>)</span></code></pre></div></div>
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/030-zipf/index_files/figure-html/unnamed-chunk-7-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:75.0%"></p>
</figure>
</div>
</div>
</div>
<p>Los valores estimados de las constantes <img src="https://latex.codecogs.com/png.latex?a"> y <img src="https://latex.codecogs.com/png.latex?b"> son:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb8" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb8-1"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">lm</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">log</span>(frecuencia) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">~</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">log</span>(rango), <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">data =</span> df)</span>
<span id="cb8-2"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; </span></span>
<span id="cb8-3"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; Call:</span></span>
<span id="cb8-4"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; lm(formula = log(frecuencia) ~ log(rango), data = df)</span></span>
<span id="cb8-5"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; </span></span>
<span id="cb8-6"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; Coefficients:</span></span>
<span id="cb8-7"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; (Intercept)   log(rango)  </span></span>
<span id="cb8-8"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt;      11.885       -1.215</span></span></code></pre></div></div>
</div>
<p>Para <em>La Regenta</em>:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb9" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb9-1">df <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> regenta <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span></span>
<span id="cb9-2">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">count</span>(word, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">sort =</span> <span class="cn" style="color: #8f5902;
background-color: null;
font-style: inherit;">TRUE</span>) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span></span>
<span id="cb9-3">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">mutate</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">rango =</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">row_number</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">desc</span>(n))) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">%&gt;%</span> </span>
<span id="cb9-4">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">rename</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">frecuencia =</span> n, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">palabra =</span> word)</span>
<span id="cb9-5"></span>
<span id="cb9-6"></span>
<span id="cb9-7"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">ggplot</span>(df, <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">aes</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> rango, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> frecuencia)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb9-8">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_point</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb9-9">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">scale_x_log10</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">scale_y_log10</span>() <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb9-10">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">labs</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Rango"</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Frecuencia"</span>,</span>
<span id="cb9-11">       <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">title =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Frecuencia vs rango en La Regenta"</span>)</span></code></pre></div></div>
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/030-zipf/index_files/figure-html/unnamed-chunk-9-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:75.0%"></p>
</figure>
</div>
</div>
</div>
<p>Y la recta estimada es:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb10" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb10-1"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">lm</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">log</span>(frecuencia) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">~</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">log</span>(rango), <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">data =</span> df)</span>
<span id="cb10-2"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; </span></span>
<span id="cb10-3"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; Call:</span></span>
<span id="cb10-4"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; lm(formula = log(frecuencia) ~ log(rango), data = df)</span></span>
<span id="cb10-5"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; </span></span>
<span id="cb10-6"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; Coefficients:</span></span>
<span id="cb10-7"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; (Intercept)   log(rango)  </span></span>
<span id="cb10-8"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt;      11.290       -1.147</span></span></code></pre></div></div>
</div>
<p>Sí parece que las dos cimas de la literatura en castellano cumplen la ley de Zipf aproximadamente con valores de <img src="https://latex.codecogs.com/png.latex?b"> similares y cercanos a uno.</p>


</section>

 ]]></description>
  <category>Datos</category>
  <category>Libros</category>
  <category>Regresión</category>
  <category>Visualización</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/030-zipf/</guid>
  <pubDate>Mon, 14 Jul 2025 22:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/030-zipf/QuijoteSancho.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>La vida no es markoviana</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/029-aforismos/</link>
  <description><![CDATA[ 





<p>Llevo bastantes años usando X (antiguamente Twitter) para compartir cosas diversas, frecuentemente relacionadas con estadística y matemáticas. Los tuits se pierden en la inmensidad de las redes sociales, así que en esta entrada rescato algunos de ellos que forman una breve colección de reflexiones o aforismos con alusiones a conceptos matemáticos o estadísticos.</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/029-aforismos/aforismos-imagen.jpg" class="img-fluid quarto-figure quarto-figure-center figure-img" width="400"></p>
</figure>
</div>
<ul>
<li><p>La vida no es markoviana: no importa cómo sea el presente, el pasado siempre influye en el futuro</p></li>
<li><p>Si los enunciados de los teoremas son las fachadas del edificio matemático, las definiciones son los andamios</p></li>
<li><p>Me cuesta dejar de leer una nota a pie de página. Esto tiene ventajas e inconvenientes: disminuye el sesgo, pero aumenta la varianza</p></li>
<li><p>Un teorema es tanto más valioso en estadística cuantas más predicciones de resultados de simulaciones se puedan hacer a partir de él</p></li>
<li><p>Todos los modelos lineales se parecen, los no lineales lo son cada uno a su manera</p></li>
<li><p>En estadística hay que mirar los datos a la distancia justa para equilibrar sesgo y varianza. En la vida es parecido.</p></li>
</ul>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/029-aforismos/sesgo-varianza.jpg" class="img-fluid figure-img" width="400"></p>
<figcaption>Fuente: <a href="https://stanford.edu/~shervine/">Shervine Amidi</a></figcaption>
</figure>
</div>
<ul>
<li><p>A mis queridos alumnos: la UAM es vuestro Hogwarts, aprovechadlo</p></li>
<li><p>“No deje el camino por coger la vereda”, como lema de vida. A la manera estadística: no deje que el ruido le oculte la señal</p></li>
<li><p>Dice Nicolás Gómez Dávila que “la redención de la realidad es el oficio de la imaginación”. En estadística la realidad serían los datos y la imaginación los modelos</p></li>
<li><p>Todo profe de estadística conoce estas tres extrañas palabras: versicolor, setosa y virginica</p></li>
<li><p>Se habla de estadística casi siempre en contextos negativos (manipulación, errores de encuestas, etc.) En contextos positivos se habla de algoritmos, matemáticas, machine learning,… Tenemos un problema de imagen</p></li>
<li><p>En estadística hay que tener cuidado para que el rigor matemático no se convierta en <em>rigor mortis</em></p></li>
<li><p>Desde que <a href="https://www.fundeu.es/recomendacion/cluster/">se puede decir clústeres</a>, los conglomerados se sienten ignorados</p></li>
<li><p>Según Samule Butler “la vida es el arte de sacar conclusiones suficientes a partir de datos insuficientes”. Eso es más bien la estadística, en la vida a menudo hay que sacar conclusiones sin dato alguno.</p></li>
<li><p>Hay que leer las demostraciones de los teoremas muchas veces. Su valor no es la garantía de que un resultado es cierto, sino lo que aportan a la comprensión de los conceptos</p></li>
<li><p>Hay dos tipos principales de personas: las que en su vida quieren minimizar el sesgo y las que buscan minimizar la varianza</p></li>
<li><p>Los modelos sin datos están vacíos; los datos sin modelos son ciegos</p></li>
<li><p>Las demostraciones se inventan pero los resultados se descubren</p></li>
<li><p>En un problema de clasificación dos variables inútiles por separado pueden ser muy efectivas si colaboran. Considérese lección para la vida en general</p></li>
<li><p>La literatura y las matemáticas se parecen: ambas ponen en la vida un poco de orden</p></li>
<li><p>Las buenas matemáticas siempre mejoran la comprensión de un problema. Esto las distingue de las malas, que suelen complicarlo innecesariamente</p></li>
<li><p>El futuro depende del presente, y no de cómo hemos llegado a este presente. Pensándolo bien, la propiedad de Markov encierra una lección de vida</p></li>
</ul>



 ]]></description>
  <category>Aforismos</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/029-aforismos/</guid>
  <pubDate>Sun, 15 Jun 2025 22:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/029-aforismos/aforismos-imagen.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>XII Jornada Estadística UAM</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/028-jornada-uam/</link>
  <description><![CDATA[ 





<p>Los días 22 y 23 de mayo de 2025 celebraremos en la sala 520 del Departamento de Matemáticas (módulo 17 de la Facultad de Ciencias) la <strong>XII Jornada Estadística UAM</strong>, con diferentes charlas de miembros de <a href="http://verso.mat.uam.es/~joser.berrendero/WebProyecto.html">nuestro grupo de investigación</a> y de algunos otros profesores invitados.</p>
<p>Esta jornada será especial ya que se celebra en honor al Profesor <a href="https://verso.mat.uam.es/~antonio.cuevas/WebAntonio.html">Antonio Cuevas</a>, el año en el que se jubilará después de una extraordinaria trayectoria investigadora.</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/028-jornada-uam/XII_jornada_UAM.jpg" class="img-fluid quarto-figure quarto-figure-center figure-img" width="500"></p>
</figure>
</div>
<p>En <a href="https://eventos.uam.es/129881/programme/xii-jornada-estadistica-uam.html">este enlace</a> se pueden consultar tanto el programa detallado de la jornada como el horario de cada charla.</p>



 ]]></description>
  <category>Investigación</category>
  <category>Noticias</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/028-jornada-uam/</guid>
  <pubDate>Thu, 15 May 2025 22:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/028-jornada-uam/XIIjornadaUAM.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>La recta de mínimos cuadrados como estimador de momentos</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/027-mc-momentos/</link>
  <description><![CDATA[ 





<p>Como su nombre indica, la recta de mínimos cuadrados se suele introducir en los libros de estadística básica como la recta que mejor se ajusta a los datos en el sentido de minimizar la suma de los errores de predicción al cuadrado. En otros libros más avanzados se demuestra que la recta también se obtiene si se aplica el método de máxima verosimilitud y los errores tienen distribución normal. Aquí voy a motivar la recta como estimador de momentos, que es algo que no suele mencionarse en la mayoría de libros de referencia.</p>
<div class="cell" data-layout-align="center">
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/027-mc-momentos/index_files/figure-html/unnamed-chunk-1-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:75.0%"></p>
</figure>
</div>
</div>
</div>
<section id="el-modelo" class="level2">
<h2 class="anchored" data-anchor-id="el-modelo">El modelo</h2>
<p>Sea <img src="https://latex.codecogs.com/png.latex?X"> una variable regresora e <img src="https://latex.codecogs.com/png.latex?Y"> una variable respuesta, relacionadas a través del siguiente modelo: <span id="eq-modelo"><img src="https://latex.codecogs.com/png.latex?%0AY%20=%20%5Cbeta_0%20+%20%5Cbeta_1%20X%20+%20%5Cepsilon,%5C%20%5C%20%5C%20%5Cmbox%7BE%7D(%5Cepsilon%7CX)%20=%200.%0A%5Ctag%7B1%7D"></span> Tomando esperanzas condicionadas a <img src="https://latex.codecogs.com/png.latex?X">, se comprueba que (1) equivale a suponer que el valor esperado de <img src="https://latex.codecogs.com/png.latex?Y"> dada <img src="https://latex.codecogs.com/png.latex?X"> es <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D(Y%7CX)%20=%20%5Cbeta_0%20+%5Cbeta_1%20X">. No suponemos ni que la variable explicativa <img src="https://latex.codecogs.com/png.latex?X"> ni que el término de error <img src="https://latex.codecogs.com/png.latex?%5Cepsilon"> tengan distribución normal. Solo estamos suponiendo que la relación entre la variable respuesta y la variable regresora es aproximadamente lineal.</p>
<p>Usando la ley de la esperanza iterada, <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D(%5Cepsilon)%20=%20%5Cmbox%7BE%7D%5B%5Cmbox%7BE%7D(%5Cepsilon%7CX)%5D%20=%200">. Además, también se verifica <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D(%5Cepsilon%20X)%20%20=%20%5Cmbox%7BE%7D%5B%5Cmbox%7BE%7D(%5Cepsilon%20X%7CX)%5D%20=%20%5Cmbox%7BE%7D%5BX%5Cmbox%7BE%7D(%5Cepsilon%7CX)%5D%20=%200">.</p>
</section>
<section id="la-recta-en-función-de-los-momentos-de-las-variables" class="level2">
<h2 class="anchored" data-anchor-id="la-recta-en-función-de-los-momentos-de-las-variables">La recta en función de los momentos de las variables</h2>
<p>Sea <img src="https://latex.codecogs.com/png.latex?%5Cmu_y=%5Cmbox%7BE%7D(Y)"> y <img src="https://latex.codecogs.com/png.latex?%5Cmu_x%20=%20%5Cmbox%7BE%7D(X)">. Tomando esperanzas en el modelo, tenemos <img src="https://latex.codecogs.com/png.latex?%5Cmu_y%20=%20%5Cbeta_0%20+%20%5Cbeta_1%5Cmu_x"> y restando esta ecuación de (1) se deduce <img src="https://latex.codecogs.com/png.latex?Y-%5Cmu_y%20=%20%5Cbeta_1(x-%5Cmu_x)%20+%20%5Cepsilon."> Multiplicando ahora esta última ecuación por <img src="https://latex.codecogs.com/png.latex?X-%5Cmu_x"> resulta <img src="https://latex.codecogs.com/png.latex?(Y-%5Cmu_y)(X-%5Cmu_x)%20=%20%5Cbeta_1(X-%5Cmu_x)%5E2%20+%20%5Cepsilon%20(X-%5Cmu_x)."> Finalmente, tomando aquí esperanzas, tenemos <img src="https://latex.codecogs.com/png.latex?%5Csigma_%7Bx,y%7D=%5Cbeta_1%5Csigma_%7Bx%7D%5E2">, donde <img src="https://latex.codecogs.com/png.latex?%5Csigma_%7Bx,y%7D=%5Cmbox%7BCov%7D(X,Y)"> y <img src="https://latex.codecogs.com/png.latex?%5Csigma%5E2_x%20=%20%5Cmbox%7BVar%7D(X)">. Esto significa que en el modelo (1) necesariamente se cumple <span id="eq-poblacional"><img src="https://latex.codecogs.com/png.latex?%0A%5Cbeta_1%20=%5Cfrac%7B%5Csigma_%7Bx,y%7D%7D%7B%5Csigma_x%5E2%7D%5C%20%5C%20%5C%20%5Cmbox%7By%7D%5C%20%5C%20%5C%20%5Cbeta_0%20=%20%5Cmu_y%20-%20%5Cfrac%7B%5Csigma_%7Bx,y%7D%7D%7B%5Csigma_x%5E2%7D%5Cmu_x.%0A%5Ctag%7B2%7D"></span></p>
</section>
<section id="el-estimador-de-momentos" class="level2">
<h2 class="anchored" data-anchor-id="el-estimador-de-momentos">El estimador de momentos</h2>
<p>El método de momentos consiste en estimar cualquier parámetro reemplazando los momentos poblacionales por los correspondientes momentos muestrales. Si tenemos una muestra <img src="https://latex.codecogs.com/png.latex?(X_1,Y_1),%5Cldots,(X_n,Y_n)"> y aplicamos esta idea en (2) los estimadores resultantes son <img src="https://latex.codecogs.com/png.latex?%0A%5Chat%7B%5Cbeta%7D_1%20=%20%5Cfrac%7B%5Csum_%7Bi=1%7D%5En(x_i-%5Cbar%7Bx%7D)(y_i-%5Cbar%7By%7D)%7D%7B%5Csum_%7Bi=1%7D%5En(x_i-%5Cbar%7Bx%7D)%5E2%7D%5C%20%5C%20%5C%20%5Cmbox%7By%7D%5C%20%5C%20%5C%20%5Chat%5Cbeta_0%20=%20%5Cbar%7BY%7D%20-%5Chat%7B%5Cbeta%7D_1%20%5Cbar%7BX%7D,%0A"> que dan lugar a la recta de mínimos cuadrados.</p>
<p>Esto me dejó un poco perplejo en un principio ya que me parecía sorprendente poder introducir la recta de mínimos cuadrados sin usar para nada el criterio de mínimos cuadrados, ni tampoco máxima verosimilitud bajo normalidad. Pero las casualidades no suelen darse en estadística…</p>
</section>
<section id="las-casualidades-no-suelen-existir" class="level2">
<h2 class="anchored" data-anchor-id="las-casualidades-no-suelen-existir">Las casualidades no suelen existir</h2>
<p>La conexión del modelo (1) con el criterio de mínimos cuadrados viene a través de la propiedad de la esperanza condicionada como predictor óptimo en el sentido de ser la función que minimiza el error cuadrático medio de predicción: <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D%5B(Y%20-%20%5Cmbox%7BE%7D(Y%7CX))%5E2%5D%20%5Cleq%20%5Cmbox%7BE%7D%5B(Y%20-%20f(X))%5E2%5D,"> para cualquier <img src="https://latex.codecogs.com/png.latex?f"> (medible y tal que las esperanzas anteriores son finitas).</p>
<p>El modelo (1) es equivalente a <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D(Y%7CX)=%5Cbeta_0%20+%5Cbeta_1%20X">, por lo que <img src="https://latex.codecogs.com/png.latex?%5Cbeta_0"> y <img src="https://latex.codecogs.com/png.latex?%5Cbeta_1"> deben verificar <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D%5B(Y%20-%20%5Cbeta_0%20-%5Cbeta_1X)%5E2%5D%20%5Cleq%20%5Cmbox%7BE%7D%5B(Y%20-%20f(X))%5E2%5D,"></p>
<p>para cualquier función razonable <img src="https://latex.codecogs.com/png.latex?f">. El criterio de mínimos cuadrados se obtiene sustituyendo la esperanza por el promedio en el término de la izquierda de la desigualdad anterior. Así pues, no es sorprendente que se obtenga el mismo estimador:</p>
<ul>
<li>minimizando un estimador de momentos del criterio poblacional (minimizando la suma de errores al cuadrado),</li>
<li>minimizando el criterio poblacional (lo que da (2)) y luego estimando por momentos la solución del problema de minimización.</li>
</ul>
<p>La recta de mínimos cuadrados está relacionada a nivel más básico con la linealidad de la relación entre <img src="https://latex.codecogs.com/png.latex?Y"> y <img src="https://latex.codecogs.com/png.latex?X"> que con cualquier otro aspecto de la distribución del vector <img src="https://latex.codecogs.com/png.latex?(X,Y)">.</p>


</section>

 ]]></description>
  <category>Regresión</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/027-mc-momentos/</guid>
  <pubDate>Tue, 01 Apr 2025 22:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/027-mc-momentos/imagen-reg.png" medium="image" type="image/png" height="82" width="144"/>
</item>
<item>
  <title>Paseos aleatorios por arXiv</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/026-arxiv_24/</link>
  <description><![CDATA[ 





<p>De los artículos, libros y apuntes que me he encontrado por arXiv en 2024, se relacionan en esta entrada los que pienso que quizá puedan interesar a alguien más. Los he clasificado en dos apartados: el primero se refiere a libros, apuntes o revisiones de temas diversos relacionados con la estadística; el segundo incluye artículos sobre temas más particulares, pero no demasiado especializados. El orden de los artículos no sigue ningún criterio particular.</p>
<section id="libros-apuntes-o-revisiones" class="level3">
<h3 class="anchored" data-anchor-id="libros-apuntes-o-revisiones">Libros, apuntes o revisiones</h3>
<ul>
<li><p><a href="https://arxiv.org/abs/2401.07625">Statistics in survey sampling</a>, unos apuntes sobre muestreo en poblaciones finitas para una asignatura de la Iowa State University. Hasta donde he visto cubre los temas básicos de introducción a esta materia.</p></li>
<li><p><a href="https://arxiv.org/abs/2401.00649">Linear Model and Extensions</a> son unos apuntes usados en la Universidad de California en Berkeley. Incluye ridge, lasso, GLM, regresión cuantílica, selección de modelos e incluso regresión con datos de supervivencia.</p></li>
<li><p>El algoritmo EM es un conocido método para calcular estimadores de máxima verosimilitud. <a href="https://arxiv.org/abs/2401.00945">A review of Monte Carlo-based versions of the EM algorithm</a> comienza con una revisión del algoritmo y demuestra sus principales propiedades. Posteriormente, resume algunos de los métodos basados en simulación que se han propuesto para simplificar los cálculos necesarios, que a menudo son intratables.</p></li>
<li><p><a href="https://arxiv.org/abs/2404.16598">Uncovering Data Across Continua: An Introduction to Functional Data Analysis</a> es una introducción accesible al análisis de datos funcionales.</p></li>
<li><p><a href="https://arxiv.org/abs/2405.16359">A First Course in Monte Carlo Methods</a> cubre de forma concisa desde el uso de la simulación como técnica para aproximar integrales hasta las técnicas de Montecarlo basadas en cadenas de Markov.</p></li>
<li><p><a href="https://arxiv.org/abs/2407.18384">Mathematical theory of deep learning</a> trata de forma relativamente accesible resultados de las tres áreas matemáticas más relacionadas con el aprendizaje profundo: teoría de la aproximación, optimización y estadística (<em>statistical learning</em>).</p></li>
<li><p>Los así llamados e-valores son una alternativa a los clásicos p-valores para llevar a cabo un contraste de hipótesis. En <a href="https://arxiv.org/abs/2410.23614">Hypothesis testing with e-values</a> se discuten sus ventajas, se presenta la teoría básica y se incluyen algunos capítulos sobre temas más avanzados.</p></li>
<li><p><a href="https://arxiv.org/abs/2402.17873">Randomized matrix computations: Themes and variations</a> es un curso sobre álgebra lineal aleatorizada.</p></li>
<li><p><a href="https://arxiv.org/abs/2210.07114">A Tutorial on Statistical Models Based on Counting Processes</a> relaciona el análisis de datos de supervivencia con el análisis estadístico de los procesos de conteo.</p></li>
<li><p><a href="https://arxiv.org/abs/2412.06848#">Application of Random Matrix Theory in High-Dimensional Statistics</a> resume los principales resultados de la teoría de matrices aleatorias y sus aplicaciones estadísticas (inferencia sobre matrices de covarianzas, componentes principales, procesamiento de señal)</p></li>
</ul>
</section>
<section id="artículos" class="level3">
<h3 class="anchored" data-anchor-id="artículos">Artículos</h3>
<ul>
<li><p><a href="https://arxiv.org/abs/2112.07737">The Importance of Discussing Assumptions when Teaching Bootstrapping</a> da algunos ejemplos de simulaciones que ayudan a determinar las hipótesis de validez de los intervalos obtenidos con bootstrap. Previamente se resumen los principales métodos para calcular intervalos de confianza bootstrap.</p></li>
<li><p><a href="https://arxiv.org/abs/2406.01819">Bayesian Linear Models: A compact general set of results</a> presenta en datalle los cálculos necesarios para hacer inferencia bayesiana en el modelo de regresión lineal (no es una introducción al enfoque bayesiano en regresión).</p></li>
<li><p>Cuando se da un curso de introducción a la estadística con R surge la duda de si usar o no tidyverse. <a href="https://arxiv.org/abs/2201.12960">Teaching modeling in introductory statistics: A comparison of formula and tidyverse syntaxes</a> es una discusión de las ventajas e inconvenientes de las diferentes posibilidades de usar R.</p></li>
<li><p>En el experimento clásico de de Buffon para aproximar el valor de <img src="https://latex.codecogs.com/png.latex?%5Cpi"> se lanza una aguja sobre un papel pautado con líneas. <a href="https://arxiv.org/abs/2412.20614">Buffon’s Triangle – A Variant of the Buffon Needle Method for a Probabilistic Determination of the Value of Pi</a> analiza una variante en la que se lanza un triángulo equilátero sobre una cuadrícula.</p></li>
<li><p>Si <img src="https://latex.codecogs.com/png.latex?r_n"> es el coeficiente de correlación muestral y <img src="https://latex.codecogs.com/png.latex?%5Crho"> es el poblacional, en <a href="https://arxiv.org/abs/2401.12190">Concentration inequalities for the sample correlation coefficient</a> se demuestran, entre otros resultados, las aproximaciones siguientes de la esperanza y la varianza de <img src="https://latex.codecogs.com/png.latex?r_n"> cuando los datos son normales: <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D(r_n)%20=%20%5Csqrt%7B%5Cfrac%7Bn-1%7D%7Bn%7D%7D%5Crho%20+%20O(n%5E%7B-1%7D)"> y <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BVar%7D(r_n)%20=%20%5Cfrac%7B(1-%5Crho%5E2)%5E2%7D%7Bn-1%7D%20+%20O(n%5E%7B-2%7D)."></p></li>
<li><p><a href="https://arxiv.org/abs/2412.19579">Stamps and Mathematics</a> revisa diversos aspectos de la filatelia relacionados con las matemáticas.</p></li>
</ul>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/026-arxiv_24/gauss_stamp.jpg" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:4cm"></p>
</figure>
</div>


</section>

 ]]></description>
  <category>arXiv</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/026-arxiv_24/</guid>
  <pubDate>Thu, 30 Jan 2025 23:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/026-arxiv_24/arxiv-24.png" medium="image" type="image/png" height="65" width="144"/>
</item>
<item>
  <title>Algunos libros que he leído en 2024</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/025-libros_24/</link>
  <description><![CDATA[ 





<p>Esta entrada sobre libros de no ficción se añade a las de <a href="https://caminosaleatorios.wordpress.com/2019/12/20/algunos-libros-sobre-ciencia-que-he-leido-en-2019/">2019</a>, <a href="https://caminosaleatorios.wordpress.com/2021/01/02/algunos-libros-que-he-leido-en-2020/">2020</a>, <a href="https://caminosaleatorios.wordpress.com/2021/12/29/algunos-libros-que-he-leido-en-2021/">2021</a>, <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/005-libros_22/">2022</a> y <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/014-libros_23/">2023</a></p>
<section id="tim-harford-10-reglas-para-comprender-el-mundo" class="level2">
<h2 class="anchored" data-anchor-id="tim-harford-10-reglas-para-comprender-el-mundo">Tim Harford: <em>10 reglas para comprender el mundo</em></h2>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/025-libros_24/harford.jpg" class="quarto-figure quarto-figure-center figure-img" style="height:5cm"></p>
</figure>
</div>
<p>Tim Harford es un economista que presenta desde 2007 <a href="https://www.bbc.co.uk/programmes/b006qshd">el programa de radio <em>More or less</em> en la BBC</a> sobre los números en las noticias y en la vida. Me gusta su actitud desde el principio. He detectado a veces cierta delectación en poner de manifiesto aspectos negativos de la estadística. Aquí sin embargo se contempla la estadística como merece, es decir, como una herramienta invaluable para facilitar el conocimiento en todos los ámbitos:</p>
<blockquote class="blockquote">
<p>Muchos de nosotros nos negamos a fiarnos de las pruebas estadísticas por miedo a que nos engañen […] Mi intención es otra. Quiero que tengas la confianza suficiente para mirar por el telescopio y escudriñar el mundo. Quiero que comprendas la lógica que sustenta las verdades estadísticas, y que escapes de la influencia de la lógica defectuosa y los sesgos cognitivos y emocionales que configuran las falsedades.</p>
</blockquote>
<p>Como Harford dice en la introducción, “nuestro mundo, enorme y convulso, está lleno de preguntas que solo una atención adecuada a los números puede responder”. Pero a veces el problema es más bien de los usuarios, debido a prejuicios o a falta de comprensión. En este libro, más que aconsejar sobre cómo analizar datos, el autor se centra en la actitud con la que tenemos que enfrentarnos a los datos que nos encontremos. No es una crítica de los posibles malos usos de la herramienta sino una serie de reglas para comprenderla de la mejor forma posible. En este sentido, es un libro que comparte características <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/014-libros_23/#kiko-llaneras-piensa-claro">con el de Kiko Llaneras que reseñé el año pasado</a>.</p>
<p>No mencionaré aquí cuáles son las 10 reglas concretas que sugiere el autor, pero sí la que considera la regla de oro: ser curioso, tener un interés genuino por aprender, no quedarse en la superficie e indagar. Tal vez así valoraremos un dato estadístico independientemente de las emociones que nos provoque, atenderemos a las definiciones de las variables para entender mejor una cifra o trataremos de comprender cómo funcionan los algoritmos para juzgar mejor sus imperfecciones:</p>
<blockquote class="blockquote">
<p>Una afirmación estadística sorprendente es un reto a nuestra visión del mundo. Puede provocar una reacción emocional, incluso miedo. Los estudios neurocientíficos apuntan a que el cerebro reacciona con la misma angustia a hechos que amenazan a nuestras preconcepciones que a animales salvajes que amenazan nuestra vida. Pero para alguien con una mentalidad curiosa, por el contrario, una afirmación sorprendente no tiene por qué provocar angustia. Puede ser un misterio o un rompecabezas que resolver.</p>
</blockquote>
<p>Me parece una actitud esencial en estos tiempos de polarización y redes sociales.</p>
</section>
<section id="margaret-macmillan-la-guerra-cómo-nos-han-marcado-los-conflictos" class="level2">
<h2 class="anchored" data-anchor-id="margaret-macmillan-la-guerra-cómo-nos-han-marcado-los-conflictos">Margaret MacMillan: <em>La guerra: Cómo nos han marcado los conflictos</em></h2>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/025-libros_24/guerra.jpg" class="quarto-figure quarto-figure-center figure-img" style="height:5cm"></p>
</figure>
</div>
<p>Al comienzo de este libro dice <a href="https://es.wikipedia.org/wiki/Margaret_MacMillan">Margaret MacMillan</a>, una historiadora y profesora de la Universidad de Oxford, que “la guerra tal vez sea la más organizada de todas las actividades humanas, y a su vez ha estimulado una mayor organización de la sociedad”. Y el análisis de esta afirmación es uno de sus objetivos: estudiar cómo la guerra ha cambiado las sociedades humanas, pero también cómo los cambios sociales han influido en la manera de hacer la guerra.</p>
<p>La guerra, es cierto, ha producido mucho dolor y destrucción, pero con incomodidad hay que admitir que también estimula avances. La autora menciona que las primeras transfusiones se realizaron en un campo de batalla (<a href="https://es.wikipedia.org/wiki/Norman_Bethune">Norman Bethune</a>, en España en 1936, según algunas fuentes), que los fondos para desarrollar la penicilina solo estuvieron disponibles gracias a la Segunda Guerra Mundial, o que la práctica del triaje, habitual en las emergencias de los hospitales, se comenzó a usar probablemente en las guerras napoleónicas.</p>
<p>El libro contempla la guerra desde muchas perspectivas diferentes. Por ejemplo, sus causas. Estas pueden ser variadas, pero recurrentemente aparecen la codicia, la autodefensa y los sentimientos e ideas. También la evolución de los recursos y armas utilizados. En el capítulo llamado <em>La forja del guerrero</em> se enumeran las razones que llevan a los soldados a luchar y se introduce el debate acerca de por qué la premisa de que son los hombres los que deben combatir y no las mujeres es casi universal en el tiempo y en diferentes culturas. Otros capítulos se dedican a examinar el papel de la sociedad civil o las diferentes ideas para controlar o suprimir la guerra.</p>
<p>En el último capítulo del libro, <em>La guerra en nuestro imaginario y en nuestra memoria</em>, se repasan las obras literarias y artísticas que han reflejado nuestra forma de pensar en la guerra, desde Shakespeare hasta <em>Apocalypse Now</em>, pasando por Homero, Robert Capa, <em>Platoon</em>, Goya, Vassili Grosmann, Tolstoi, Erich Maria Remarque, Tim O’Brien o Picasso.</p>
<p>De fondo siempre queda la reflexión sobre si la sociedad nos hace más belicosos o más pacíficos, si azuza el conflicto o lo atempera. La primera postura representada por Rousseau y la segunda por Hobbes. No sé si es posible llegar a una conclusión clara y me gustaría que Rousseau tuviera razón pero mi impresión tras la lectura del libro es que Hobbes -y su pesimismo sobre la naturaleza humana- se acerca más a la verdad.</p>
</section>
<section id="ignacio-martínez-de-pisón-ropa-de-casa" class="level2">
<h2 class="anchored" data-anchor-id="ignacio-martínez-de-pisón-ropa-de-casa">Ignacio Martínez de Pisón: <em>Ropa de casa</em></h2>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/025-libros_24/ropa_de_casa.jpg" class="quarto-figure quarto-figure-center figure-img" style="height:5cm"></p>
</figure>
</div>
<p>El año pasado leí la extraordinaria novela <em>Castillos de fuego</em> de Ignacio Martínez de Pisón (Zaragoza, 1960) así que tenía curiosidad por <em>Ropa de casa</em>, su libro autobiográfico publicado este año, que abarca su infancia, juventud y primeros años de formación como escritor, hasta llegar a los primeros años 90.</p>
<p>Los primeros capítulos trazan semblanzas de su padre, un militar del régimen franquista que falleció cuando el autor tenía unos diez años, y su madre, que quedó viuda muy joven y al cuidado de cinco hijos pequeños. Aunque el autor es unos años mayor que yo y de clase social bien diferente (algunos de sus abuelos eran marqueses) los años 70 que retrata en la primera parte del libro me han resultado bastante reconocibles. Estos primeros años de su vida transcurrieron primero en Logroño y posteriormente ya en Zaragoza.</p>
<p>Una vez acabados sus estudios universitarios el autor se traslada a Barcelona, donde intenta convertirse en escritor. Esta es la parte más interesante del libro para mí. En los años 80 formó parte de un grupo heterogéneo de escritores a los que se etiquetó como <em>nueva narrativa española</em>, y que se beneficiaron del deseo colectivo de romper con el pasado literario reciente, que se relacionaba con la dictadura. Muy pronto un manuscrito de sus relatos fue aceptado por Anagrama, eran los comienzos de la colección <em>Narrativas hispánicas</em> en esta editorial, y comenzó a publicar.</p>
<p>Destacan los retratos de los escritores y editores con los que el autor se encuentra aquellos años: entre otros, Jorge Herralde, Javier Marías (quien fue una especie de mentor literario durante una década), Álvaro Pombo, Javier Tomeo, Cristina Fernández Cubas, Bernardo Atxaga (“entre las personas que conozco, puede que sea la que tiene el carácter más afable”) o, de forma más emotiva hacia el final del libro, Félix Romeo.</p>
<p>El mismo autor dice que su vida, en comparación con otras, ha sido una vida pequeña. No debe el lector esperar grandes emociones, pero el libro se lee con facilidad y resulta atractivo para aquellos a los que interese conocer algo más del mundo de un escritor.</p>
</section>
<section id="michael-ignatieff-en-busca-de-consuelo" class="level2">
<h2 class="anchored" data-anchor-id="michael-ignatieff-en-busca-de-consuelo">Michael Ignatieff: <em>En busca de consuelo</em></h2>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/025-libros_24/consuelo.jpg" class="quarto-figure quarto-figure-center figure-img" style="height:5cm"></p>
</figure>
</div>
<p>Dice el escritor <a href="https://es.wikipedia.org/wiki/Norman_Lebrecht">Norman Lebrecht</a> sobre la música de Gustav Mahler:</p>
<blockquote class="blockquote">
<p>No toda persona civilizada es sensible a Mahler, pero dentro del monumental edificio de sus obras hay resquicios que permiten al oyente estar en paz consigo mismo. Esos son los lugares en los que la fortaleza Mahler se convierte en un refugio privado.</p>
</blockquote>
<p>Y es que todos necesitamos refugio y consuelo en algún momento de nuestras vidas, y tal vez podamos encontrarlo en la música. <a href="https://es.wikipedia.org/wiki/Michael_Ignatieff">Michael Ignatieff</a>, un historiador y ex-político canadiense, nos habla en este libro de un conjunto de personajes históricos que buscan consuelo al componer, escribir, pintar o filosofar. En 2017 invitaron al autor a pronunciar una conferencia que acompañara un festival en Utrecht en el que se iban a interpretar versiones musicales de los ciento cincuenta salmos. Este encargo llevó al autor a una reflexión sobre el poder consolador de las obras de arte, literarias, filosóficas o religiosas. El libro es el resultado de esta reflexión.</p>
<p>Los capítulos siguen un orden cronológico, desde los desconocidos autores de los Salmos y el Libro de Job, hasta la admirable <a href="https://es.wikipedia.org/wiki/Cicely_Saunders">Cicely Saunders</a>, una de las pioneras de la medicina de los cuidados paliativos, pasando por Mahler, el Greco, Montaigne, Marx, Ajmátova o Camus, entre otros.</p>
<p>El subtítulo del libro es <em>Vivir con esperanza en tiempos oscuros</em>. Para tiempos oscuros es apropiado <a href="https://www.youtube.com/watch?v=M0Px44IuVKM">el final de la Segunda de Mahler</a>, uno de los fragmentos, para mí, más consoladores de la historia de la música. Es algo más de cuarto de hora, denle una oportunidad cuando lo necesiten.</p>


</section>

 ]]></description>
  <category>Libros</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/025-libros_24/</guid>
  <pubDate>Thu, 26 Dec 2024 23:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/025-libros_24/libros-24.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>Condicionando vectores normales</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/024-condicionada/</link>
  <description><![CDATA[ 





<p>Se sugiere una forma de presentar en clase la distribución condicionada de un vector normal por otro, cuando ambos son conjuntamente normales.</p>
<p>Esencialmente, la demostración es la misma que la que aparece en los textos clásicos de Johnson y Wichern (2002) o Mardia et al (1979), nada nuevo realmente, pero creo que presentada de esta forma queda mucho más natural y clara, y además no requiere casi hacer ninguna cuenta (solo una muy fácil para la matriz de covarianzas).</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/024-condicionada/normal_condicionada.jpg" style="height:10cm" class="figure-img"></p>
<figcaption>Imagen generada artificialmente por Copilot</figcaption>
</figure>
</div>
<section id="el-resultado" class="level2">
<h2 class="anchored" data-anchor-id="el-resultado">El resultado</h2>
<p>Sea <img src="https://latex.codecogs.com/png.latex?X"> un vector con distribución normal multivariante <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BN%7D_%7Bp+q%7D(%5Cmu,%5CSigma)">. Dividimos las componentes de <img src="https://latex.codecogs.com/png.latex?X"> en dos grupos, <img src="https://latex.codecogs.com/png.latex?X=(X'_1,%5C,%20%20X'_2)'">, el primer vector <img src="https://latex.codecogs.com/png.latex?X_1"> formado por las <img src="https://latex.codecogs.com/png.latex?q"> primeras y el segundo <img src="https://latex.codecogs.com/png.latex?X_2"> formado por las <img src="https://latex.codecogs.com/png.latex?p"> últimas. Consideramos las correspondientes particiones tanto del vector de medias como de la matriz de covarianzas:</p>
<p><img src="https://latex.codecogs.com/png.latex?%5Cmu%20=%20(%5Cmu'_1,%20%20%5Cmu'_2)',%5C%20%5C%20%5CSigma%20=%20%5Cleft(%5Cbegin%7Barray%7D%7Bc%7Cc%7D%20%5CSigma_%7B11%7D%20&amp;%20%5CSigma_%7B12%7D%20%5C%5C%20%5Chline%20%5CSigma_%7B21%7D%20&amp;%20%5CSigma_%7B22%7D%5Cend%7Barray%7D%20%5Cright)."></p>
<p>Suponemos que existe <img src="https://latex.codecogs.com/png.latex?%5CSigma_%7B11%7D%5E%7B-1%7D">. Queremos probar el siguiente famoso y muy relevante resultado:</p>
<p><img src="https://latex.codecogs.com/png.latex?X_2%20%7C%20(X_1=x_1)%5C,%20%20%5Coverset%7Bd%7D%7B%5Cequiv%7D%5C,%20%5Cmbox%7BN%7D_%7Bp%7D(%5Cmu_%7B2%7C1%7D,%5C,%20%5CSigma_%7B22%7C1%7D),"> donde <img src="https://latex.codecogs.com/png.latex?%5Cbegin%7Balign*%7D%0A%5Cmu_%7B2%7C1%7D%20&amp;:=%20%5Cmu_2%20+%20%5CSigma_%7B21%7D%5CSigma_%7B11%7D%5E%7B-1%7D(x_1-%5Cmu_1),%5C%5C%0A%5CSigma_%7B22%7C1%7D%20&amp;:=%20%5CSigma_%7B22%7D%20-%20%5CSigma_%7B21%7D%5CSigma_%7B11%7D%5E%7B-1%7D%5CSigma_%7B12%7D.%0A%5Cend%7Balign*%7D"></p>
<p>Uso la notación <img src="https://latex.codecogs.com/png.latex?X%5C,%20%5Coverset%7Bd%7D%7B%5Cequiv%7D%20Y%5C,"> o <img src="https://latex.codecogs.com/png.latex?X%5C,%20%5Coverset%7Bd%7D%7B%5Cequiv%7D%20F%5C,"> para indicar que las variables <img src="https://latex.codecogs.com/png.latex?X"> e <img src="https://latex.codecogs.com/png.latex?Y"> se distribuyen igual o que la distribución de <img src="https://latex.codecogs.com/png.latex?X"> es <img src="https://latex.codecogs.com/png.latex?F">, respectivamente.</p>
</section>
<section id="la-demostración" class="level2">
<h2 class="anchored" data-anchor-id="la-demostración">La demostración</h2>
<p>Suponemos que <img src="https://latex.codecogs.com/png.latex?%5Cmu=0"> por simplicidad. Si no fuese así se puede aplicar exactamente el mismo razonamiento a los vectores centrados <img src="https://latex.codecogs.com/png.latex?X_1-%5Cmu_1"> y <img src="https://latex.codecogs.com/png.latex?X_2-%5Cmu_2">.</p>
<p>Supongamos que queremos predecir <img src="https://latex.codecogs.com/png.latex?X_2"> a partir de <img src="https://latex.codecogs.com/png.latex?X_1">. Dado que las únicas relaciones que hay entre vectores conjuntamente normales son lineales (son independientes si y solo si la matriz de covarianzas cruzadas es la matriz de ceros) parece natural considerar una predicción de la forma <img src="https://latex.codecogs.com/png.latex?MX_1"> para una matriz <img src="https://latex.codecogs.com/png.latex?M"> adecuada. Consideramos la siguiente descomposición de <img src="https://latex.codecogs.com/png.latex?X_2"> en parte explicada por <img src="https://latex.codecogs.com/png.latex?X_1"> y parte no explicada: <img src="https://latex.codecogs.com/png.latex?X_2%20=%20MX_1%20+%20(X_2-MX_1):=MX_1%20+%20%5Cvarepsilon."></p>
<p>Para aprovechar toda la información imponemos que la parte residual no contenga ninguna información de <img src="https://latex.codecogs.com/png.latex?X_1">, es decir, que <img src="https://latex.codecogs.com/png.latex?%5Cvarepsilon"> y <img src="https://latex.codecogs.com/png.latex?X_1"> sean independientes. Como todos los vectores involucrados son conjuntamente normales (por ser funciones lineales de vectores normales) la independencia equivale a que las covarianzas cruzadas valgan cero: <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D%5B(X_2-MX_1)X_1'%5D%20=%200%5CLeftrightarrow%20%5CSigma_%7B21%7D%20=%20M%5CSigma_%7B11%7D%5CLeftrightarrow%20M%20=%20%5CSigma_%7B21%7D%5CSigma_%7B11%7D%5E%7B-1%7D."></p>
<p>Para esta elección de <img src="https://latex.codecogs.com/png.latex?M"> tenemos entonces que <img src="https://latex.codecogs.com/png.latex?%5Cvarepsilon"> es un vector normal independiente de <img src="https://latex.codecogs.com/png.latex?X_1"> con <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D(%5Cvarepsilon)=0">, ya que <img src="https://latex.codecogs.com/png.latex?%5Cmu=0">, y <img src="https://latex.codecogs.com/png.latex?%5Cbegin%7Balign*%7D%0A%5Cmbox%7BCov%7D(%5Cvarepsilon%20)%20&amp;=%20%20%5Cmbox%7BE%7D%5B(X_2-MX_1)(X_2-MX_1)'%5D%5C%5C%0A&amp;=%5Cmbox%7BE%7D%5B(X_2-%5CSigma_%7B21%7D%5CSigma_%7B11%7D%5E%7B-1%7DX_1)(X'_2-X_1'%5CSigma_%7B11%7D%5E%7B-1%7D%5CSigma_%7B12%7D)%5D%20=%5C%5C%0A&amp;=%5CSigma_%7B22%7D%20-%20%5CSigma_%7B21%7D%5CSigma_%7B11%7D%5E%7B-1%7D%5CSigma_%7B12%7D-%5CSigma_%7B21%7D%5CSigma_%7B11%7D%5E%7B-1%7D%5CSigma_%7B12%7D%20+%20%5CSigma_%7B21%7D%5CSigma_%7B11%7D%5E%7B-1%7D%5CSigma_%7B11%7D%5CSigma_%7B11%7D%5E%7B-1%7D%5CSigma_%7B12%7D%5C%5C%0A&amp;=%5CSigma_%7B22%7D%20-%20%5CSigma_%7B21%7D%5CSigma_%7B11%7D%5E%7B-1%7D%5CSigma_%7B12%7D=%20%5CSigma_%7B22%7C1%7D.%0A%5Cend%7Balign*%7D"> (Hemos usado que <img src="https://latex.codecogs.com/png.latex?%5CSigma'_%7B12%7D=%5CSigma_%7B21%7D">.)</p>
<p>Finalmente, dado <img src="https://latex.codecogs.com/png.latex?X_1=x_1">, los vectores <img src="https://latex.codecogs.com/png.latex?%5Cvarepsilon"> y <img src="https://latex.codecogs.com/png.latex?X_2"> solo difieren en una constante y por ello <img src="https://latex.codecogs.com/png.latex?%5Cvarepsilon%20%5C,%20%5Coverset%7Bd%7D%7B%5Cequiv%7D%5C,%20%5Cvarepsilon%20%20%7C%20(X_1%20=%20x_1)%5C,%20%20%20%5C,%20%5Coverset%7Bd%7D%7B%5Cequiv%7D%5C,%20(X_2-Mx_1)%20%7C%20(X_1%20=%20x_1)%20%5C,%20%5Coverset%7Bd%7D%7B%5Cequiv%7D%5C,%5Cmbox%7BN%7D_p(0,%5CSigma_%7B22%7C1%7D)"> equivale a <img src="https://latex.codecogs.com/png.latex?X_2%20%7C%20(X_1%20=%20x_1)%20%5C,%20%5Coverset%7Bd%7D%7B%5Cequiv%7D%5C,%5Cmbox%7BN%7D_p(Mx_1,%5CSigma_%7B22%7C1%7D)%5C,%20%5Coverset%7Bd%7D%7B%5Cequiv%7D%5C,%20%5Cmbox%7BN%7D_p(%5Cmu_%7B2%7C1%7D,%5CSigma_%7B22%7C1%7D),"> que es lo que queríamos demostrar.</p>
</section>
<section id="el-caso-pq1" class="level2">
<h2 class="anchored" data-anchor-id="el-caso-pq1">El caso <img src="https://latex.codecogs.com/png.latex?p=q=1"></h2>
<p>La primera vez que uno ve las fórmulas anteriores parecen un poco extrañas. Por eso yo en clase discuto inmediatamente después el caso <img src="https://latex.codecogs.com/png.latex?p=q=1">. En esta situación tenemos de partida un vector normal bidimensional: <img src="https://latex.codecogs.com/png.latex?%5Cbegin%7Bpmatrix%7D%20X%5C%5CY%5Cend%7Bpmatrix%7D%20%5Coverset%7Bd%7D%7B%5Cequiv%7D%5C,%20%5Cmbox%7BN%7D_2%20%5Cleft(%5Cbegin%7Bpmatrix%7D%20%5Cmu_x%5C%5C%5Cmu_y%5Cend%7Bpmatrix%7D,%20%5Cbegin%7Bpmatrix%7D%20%5Csigma%5E2_x%20&amp;%20%5Csigma_%7Bxy%7D%5C%5C%20%5Csigma_%7Byx%7D%20&amp;%20%5Csigma_x%5E2%5Cend%7Bpmatrix%7D%5Cright)."> Sea <img src="https://latex.codecogs.com/png.latex?%5Crho%20=%20%5Csigma_%7Bxy%7D/(%5Csigma_x%5Csigma_y)"> el coeficiente de correlación entre <img src="https://latex.codecogs.com/png.latex?X"> e <img src="https://latex.codecogs.com/png.latex?Y">. Aplicando las fórmulas, la distribución condicionada <img src="https://latex.codecogs.com/png.latex?Y%20%7C%20X%20=%20x"> es normal con parámetros: <img src="https://latex.codecogs.com/png.latex?%5Cbegin%7Balign*%7D%0A%5Cmbox%7BE%7D(Y%7CX=x)%20&amp;=%20%5Cmu_y%20+%5Cfrac%7B%5Csigma_%7Bxy%7D%7D%7B%5Csigma%5E2_x%7D(x-%5Cmu_x),%5C%5C%0A%5Cmbox%7BVar%7D(Y%7CX=x)%20&amp;=%20%5Csigma%5E2_y%20-%20%5Cfrac%7B%5Csigma%5E2_%7Bxy%7D%7D%7B%5Csigma%5E2_x%7D%20=%20%5Csigma%5E2_y(1-%5Crho%5E2).%0A%5Cend%7Balign*%7D"></p>
<p>Si en la ecuación de la esperanza condicionada sustituimos los parámetros poblacionales por sus análogos muestrales resulta la recta de mínimos cuadrados, con la que los estudiantes están familiarizados. Aparece ahora esta recta sin acudir al criterio de mínimos cuadrados (o al de máxima verosimilitud) sino como estimador de momentos de la esperanza condicionada en un vector normal bidimensional.</p>
<p>Por su parte, la fórmula de la varianza condicionada también merece comentario ya que implica <img src="https://latex.codecogs.com/png.latex?%5Crho%5E2%20=%201%20-%20%5Cfrac%7B%5Cmbox%7BVar%7D(Y%7CX=x)%7D%7B%5Cmbox%7BVar%7D(Y)%7D,"> lo que permite interpretar el coeficiente de correlación al cuadrado como la proporción de la variabilidad de <img src="https://latex.codecogs.com/png.latex?Y"> que <img src="https://latex.codecogs.com/png.latex?X"> es capaz de explicar.</p>
</section>
<section id="apéndice" class="level2">
<h2 class="anchored" data-anchor-id="apéndice">Apéndice</h2>
<p>Puede que la equivalencia del final de la demostración no sea del todo satisfactoria para los amantes del rigor, aunque los textos clásicos que he mencionado también la usan sin más explicaciones. En este apéndice incluyo un resultado técnico que la garantiza.</p>
<p>Supongamos que es posible descomponer <img src="https://latex.codecogs.com/png.latex?X_2"> en una parte que es función de <img src="https://latex.codecogs.com/png.latex?X_1"> (la parte de <img src="https://latex.codecogs.com/png.latex?X_2"> que <em>es explicada</em> por <img src="https://latex.codecogs.com/png.latex?X_1">) y otra que es independiente de <img src="https://latex.codecogs.com/png.latex?X_1"> (el residuo). Parece intuitivo que si condicionamos a un valor concreto de <img src="https://latex.codecogs.com/png.latex?X_1">, la primera parte se comporte como una constante mientras que la parte residual sea la que determine la distribución condicionada. Esto es lo que afirma el lema siguiente:</p>
<div class="my-box">
<div id="lem-cond" class="theorem lemma">
<p><span class="theorem-title"><strong>Lema 1</strong></span> Sean <img src="https://latex.codecogs.com/png.latex?X_1">, <img src="https://latex.codecogs.com/png.latex?X_2"> y <img src="https://latex.codecogs.com/png.latex?%5Cvarepsilon"> tres vectores aleatorios tales que <img src="https://latex.codecogs.com/png.latex?X_1"> es independiente de <img src="https://latex.codecogs.com/png.latex?%5Cvarepsilon"> y existe una función medible <img src="https://latex.codecogs.com/png.latex?f"> tal que <img src="https://latex.codecogs.com/png.latex?X_2%20%5Coverset%7Bd%7D%7B%5Cequiv%7D%20f(X_1)%20+%20%5Cvarepsilon."> Entonces, la distribución condicionada <img src="https://latex.codecogs.com/png.latex?X_2%20%7C%20X_1%20=%20x_1"> coincide con la distribución del vector <img src="https://latex.codecogs.com/png.latex?f(x_1)%20+%5Cvarepsilon."> En particular, tomando esperanzas y covarianzas, <img src="https://latex.codecogs.com/png.latex?%5Cbegin%7Balign*%7D%0A%5Cmbox%7BE%7D(X_2%20%7C%20X_1%20=%20x_1)%20&amp;=%20f(x_1)%20+%20%5Cmbox%7BE%7D(%5Cvarepsilon),%5C%5C%0A%5Cmbox%7BCov%7D(X_2%20%7C%20X_1%20=%20x_1)%20&amp;=%20%5Cmbox%7BCov%7D(%5Cvarepsilon).%0A%5Cend%7Balign*%7D"></p>
</div>
</div>
<p><br></p>
<p>Si <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D(%5Cvarepsilon)=0">, entonces <img src="https://latex.codecogs.com/png.latex?f(x_1)"> es la esperanza condicionada de <img src="https://latex.codecogs.com/png.latex?X_2"> dado que <img src="https://latex.codecogs.com/png.latex?X_1=x_1">, es decir, la mejor predicción de <img src="https://latex.codecogs.com/png.latex?X_2"> a partir del conocimiento de <img src="https://latex.codecogs.com/png.latex?X_1">. Esto resulta intuitivamente claro dado que el residuo <img src="https://latex.codecogs.com/png.latex?%5Cvarepsilon"> ya no contiene información de <img src="https://latex.codecogs.com/png.latex?X_1">. Además, <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BCov%7D(%5Cvarepsilon)"> representa la parte de la covarianza de <img src="https://latex.codecogs.com/png.latex?X_2"> que <img src="https://latex.codecogs.com/png.latex?X_1"> no puede explicar.</p>
<p>Una demostración rigurosa del lema -que es delicada, como todas las que involucran a las distribuciones condicionadas- se puede encontrar en <a href="https://www.jmlr.org/papers/volume22/20-1260/20-1260.pdf">Wilson et al (2021)</a>, pag. 5.</p>
</section>
<section id="referencias" class="level2">
<h2 class="anchored" data-anchor-id="referencias">Referencias</h2>
<ul>
<li>Mardia, K. V., Kent, J. T., y Bibby, J.M. (1979). <em>Multivariate analysis.</em> John Wiley &amp; Sons.</li>
<li>Johnson, R. A., y Wichern, D. W. (2002). <em>Applied multivariate statistical analysis.</em> Prentice-Hall.</li>
<li>Wilson, J. T., Borovitskiy, V., Terenin, A., Mostowsky, P. and Deisenroth, M. P. (2021). Pathwise conditioning of Gaussian processes. <em>Journal of Machine Learning Research</em>, <strong>22</strong>, 1-47.</li>
</ul>


</section>

 ]]></description>
  <category>Análisis multivariante</category>
  <category>Regresión</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/024-condicionada/</guid>
  <pubDate>Mon, 28 Oct 2024 23:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/024-condicionada/normal_condicionada.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>¿Cuándo hay relación entre la media muestral y la varianza muestral? (Segunda parte)</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/023-correlacion-media-var/</link>
  <description><![CDATA[ 





<p>En esta segunda parte del análisis de la relación entre la media muestral y la covarianza muestral calculamos la correlación entre ellas y observamos que de la expresión resultante se deduce una antigua desigualdad clásica -atribuida a Pearson- que involucra a los coeficientes de asimetría y de curtosis.</p>
<section id="introducción" class="level2">
<h2 class="anchored" data-anchor-id="introducción">Introducción</h2>
<p>Recordamos la notación y la principal fórmula de la <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/022-covarianza-media-var/">primera parte</a>:</p>
<p>Sea <img src="https://latex.codecogs.com/png.latex?X_1,%20%5Cldots,%20X_n"> una muestra de observaciones independientes de una población <img src="https://latex.codecogs.com/png.latex?F">. Consideramos la media muestral <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D=n%5E%7B-1%7D%5Csum_%7Bi=1%7D%5En%20X_i"> y la varianza muestral <img src="https://latex.codecogs.com/png.latex?S%5E2%20=%20(n-1)%5E%7B-1%7D%5Csum_%7Bi=1%7D%5En%20(X_i-%5Cbar%7BX%7D)%5E2">. En la entrada anterior se demostraba la fórmula de la covarianza entre <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2">:</p>
<p><span id="eq-cov"><img src="https://latex.codecogs.com/png.latex?%5Ctext%7BCov%7D(%5Cbar%7BX%7D,S%5E2)%20=%20%5Cfrac%7B%5Ctext%7BE%7D%5B(X-%5Cmu)%5E3%5D%7D%7Bn%7D=%5Cfrac%7B%5Csigma%5E3%5Cgamma%7D%7Bn%7D,%20%5Ctag%7B1%7D"></span> donde <img src="https://latex.codecogs.com/png.latex?X"> es una variable aleatoria con distribución <img src="https://latex.codecogs.com/png.latex?F">, media <img src="https://latex.codecogs.com/png.latex?%5Cmu"> y varianza <img src="https://latex.codecogs.com/png.latex?%5Csigma%5E2">, y <img src="https://latex.codecogs.com/png.latex?%5Cgamma%20=%20%5Ctext%7BE%7D%5Cleft%5B%5Cleft(%5Cfrac%7BX-%5Cmu%7D%7B%5Csigma%7D%5Cright)%5E3%5Cright%5D"> es el correspondiente coeficiente de asimetría. En particular esta fórmula demuestra que hay relación lineal entre la media y la varianza si y solo si la distribución de la que proceden los datos es simétrica.</p>
</section>
<section id="la-correlación-entre-barx-y-s2" class="level2">
<h2 class="anchored" data-anchor-id="la-correlación-entre-barx-y-s2">La correlación entre <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2"></h2>
<p>Para determinar el grado de relación lineal entre <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2"> es más ilustrativo usar la correlación que la covarianza. Para calcularla basta recordar las fórmulas de las varianzas de <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2">. La varianza de <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> es una magnitud fundamental en estadística y viene en todos los libros de texto: <span id="eq-var-media"><img src="https://latex.codecogs.com/png.latex?%5Ctext%7BVar%7D(%5Cbar%7BX%7D)%20=%20%5Cfrac%7B%5Csigma%5E2%7D%7Bn%7D.%20%5Ctag%7B2%7D"></span> Por su parte, <a href="http://localhost:4518/posts/020-varianza-varianza/">la fórmula de la varianza de <img src="https://latex.codecogs.com/png.latex?S%5E2"></a> es menos conocida y más complicada, pero también es posible encontrarla en algunos libros: <span id="eq-var-var"><img src="https://latex.codecogs.com/png.latex?%5Ctext%7BVar%7D(S%5E2)%20=%20%5Cfrac%7B1%7D%7Bn%7D%5Cleft(%5Ctext%7BE%7D%5B(X-%5Cmu)%5E4%5D%20-%20%5Cfrac%7Bn-3%7D%7Bn-1%7D%5Csigma%5E4%5Cright)=%5Cfrac%7B%5Csigma%5E4%7D%7Bn%7D%5Cleft(%5Ckappa%20-1%20%20+%20%5Cfrac%7B2%7D%7Bn-1%7D%5Cright),%20%5Ctag%7B3%7D"></span> donde <img src="https://latex.codecogs.com/png.latex?%5Ckappa%20=%20%5Ctext%7BE%7D%5Cleft%5B%5Cleft(%5Cfrac%7BX-%5Cmu%7D%7B%5Csigma%7D%5Cright)%5E4%5Cright%5D"> es el coeficiente de curtosis de la distribución de la que proceden los datos.</p>
<div class="my-box">
<p>Teniendo en cuenta (1), (2) y (3), <img src="https://latex.codecogs.com/png.latex?%5Crho(%5Cbar%7BX%7D,S%5E2)">, el coeficiente de correlación entre <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2">, es <span id="eq-cor"><img src="https://latex.codecogs.com/png.latex?%5Crho(%5Cbar%7BX%7D,S%5E2)%20=%20%5Cfrac%7B%5Csigma%5E3%5Cgamma/n%7D%7B%5Csigma%5E3/n%5Cleft(%5Ckappa%20-%201%20+%5Cfrac%7B2%7D%7Bn-1%7D%5Cright)%5E%7B1/2%7D%7D=%5Cfrac%7B%5Cgamma%7D%7B%5Cleft(%5Ckappa%20-%201%20+%5Cfrac%7B2%7D%7Bn-1%7D%5Cright)%5E%7B1/2%7D%7D.%20%5Ctag%7B4%7D"></span></p>
</div>
</section>
<section id="la-desigualdad-de-pearson" class="level2">
<h2 class="anchored" data-anchor-id="la-desigualdad-de-pearson">La desigualdad de Pearson</h2>
<p>Ahora, <img src="https://latex.codecogs.com/png.latex?%7C%5Crho(%5Cbar%7BX%7D,%20S%5E2)%7C%20%5Cleq%201">, por lo que (4) implica <img src="https://latex.codecogs.com/png.latex?%0A%5Cgamma%5E2%20%5Cleq%20%5Ckappa%20-%201%20+%20%5Cfrac%7B2%7D%7Bn-1%7D,%5C%20%5C%20%5C%20%5Ctext%7Bpara%20todo%7D%5C%20%5C%20%5C%20n%20%5Cgeq%202.%0A"> Si ahora tomamos límites cuando <img src="https://latex.codecogs.com/png.latex?n%20%5Cto%20%5Cinfty"> en la última desigualdad, tenemos <span id="eq-pearson"><img src="https://latex.codecogs.com/png.latex?%0A%5Ckappa%20%5Cgeq%20%5Cgamma%5E2%20+%201.%0A%5Ctag%7B5%7D"></span></p>
<p>Los valores de <img src="https://latex.codecogs.com/png.latex?%5Cgamma"> y <img src="https://latex.codecogs.com/png.latex?%5Ckappa"> no pueden ser totalmente arbitrarios sino que están ligados por la desigualdad anterior, que se conoce como la <strong>desigualdad de Pearson</strong>. Apareció por primera vez en Pearson (1916) quien dio una demostración para el caso muestral que él mismo atribuye a Watson, como aparece en la figura siguiente.</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/023-correlacion-media-var/pearson-inequality.jpg" class="quarto-figure quarto-figure-center figure-img" style="height:10cm"></p>
</figure>
</div>
<p>Más tarde, Wilkins (1944) proporcionó una prueba más simple para una versión discreta de (5). Una prueba para el caso general se puede encontrar en Rohatgi y Székely (1989). El razonamiento anterior basado en la correlación entre la media y la varianza es una demostración general alternativa y se puede encontrar, por ejemplo, en Sen (2012).</p>
</section>
<section id="cuándo-es-máxima-la-relación-lineal-entre-la-media-muestral-y-la-varianza-muestral" class="level2">
<h2 class="anchored" data-anchor-id="cuándo-es-máxima-la-relación-lineal-entre-la-media-muestral-y-la-varianza-muestral">¿Cuándo es máxima la relación lineal entre la media muestral y la varianza muestral?</h2>
<p>Para <img src="https://latex.codecogs.com/png.latex?n"> grande, la ecuación (4) implica <img src="https://latex.codecogs.com/png.latex?%0A%5Crho%5E2(%5Cbar%7BX%7D,%20S%5E2)%20%5Capprox%20%5Cfrac%7B%5Cgamma%5E2%7D%7B%5Ckappa%20-%201%7D.%0A"></p>
<p>El grado de relación lineal entre la media y la varianza está esencialmente determinado por la relación entre la curtosis y el cuadrado de la asimetría. La aproximación anterior me parece una relación elegante entre los dos primeros momentos muestrales y los momentos poblacionales tercero y cuarto.</p>
<p>Podemos preguntarnos en qué situaciones se espera que la correlación sea máxima. Dado que la igualdad en la ecuación (5) se alcanza si y solo si la distribución es dicotómica (se demuestra, por ejemplo, en Rohatgi y Székely (1989)) podemos esperar que la correlación sea máxima para distribuciones que solo toman dos valores (con diferentes probabilidades para evitar la simetría). De hecho, cuando <img src="https://latex.codecogs.com/png.latex?F"> es una distribución de Bernoulli con <img src="https://latex.codecogs.com/png.latex?p%20=%20%5Ctext%7BP%7D(X=1)%20%5Cneq%201/2">, entonces es fácil (pero algo tedioso) demostrar usando (4) que <img src="https://latex.codecogs.com/png.latex?%0A%5Crho%5E2(%5Cbar%7BX%7D,%20S%5E2)%20=%20%5Cleft(1+%5Cfrac%7B2p(1-p)%7D%7B(n-1)(2p-1)%5E2%7D%5Cright)%5E%7B-1%7D,%0A"> así que tenemos <img src="https://latex.codecogs.com/png.latex?%5Crho%5E2(%5Cbar%7BX%7D,%20S%5E2)%20%5Cto%201">, a medida que <img src="https://latex.codecogs.com/png.latex?n%20%5Cto%20%5Cinfty">.</p>
</section>
<section id="coda" class="level2">
<h2 class="anchored" data-anchor-id="coda">Coda</h2>
<p>Esta entrada tiene aspecto más de artículo académico que de nota divulgativa. En realidad es el resumen de un artículo que ya tenía escrito con la demostración alternativa de (5). Poco después de terminar el manuscrito descubrí el artículo de Sen (2012) en el que básicamente se hacía lo mismo. La vida del investigador es a veces dura. Al menos he podido escribir esta entrada…</p>
</section>
<section id="referencias" class="level2">
<h2 class="anchored" data-anchor-id="referencias">Referencias</h2>
<ul>
<li><p>Pearson, K. (1916). Mathematical contributions to the theory of evolution.—xix. second supplement to a memoir on skew variation. <em>Philosophical Transactions of the Royal Society of London, Series A,</em> <strong>216</strong>, 429–457.</p></li>
<li><p>Rohatgi, V. K. and Székely, G. J. (1989). Sharp inequalities between skewness and kurtosis. <em>Statistics and probability letters</em>, <strong>8</strong>, 297–299.</p></li>
<li><p>Sen, A. (2012). On the interrelation between the sample mean and the sample variance. <em>The American Statistician</em>, <strong>66</strong>, 112-117.</p></li>
<li><p>Wilkins, J.E. (1944). A note on skewness and kurtosis. <em>The Annals of Mathematical Statistics</em>, <strong>15</strong>, 333–335.</p></li>
</ul>


</section>

 ]]></description>
  <category>Estimación</category>
  <category>Correlación</category>
  <category>Historia</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/023-correlacion-media-var/</guid>
  <pubDate>Sun, 29 Sep 2024 22:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/023-correlacion-media-var/pearson-inequality.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>¿Cuándo hay relación entre la media muestral y la varianza muestral? (Primera parte)</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/022-covarianza-media-var/</link>
  <description><![CDATA[ 





<section id="introducción-y-antecedentes" class="level2">
<h2 class="anchored" data-anchor-id="introducción-y-antecedentes">Introducción y antecedentes</h2>
<p>Saber cuál es la posición de un conjunto de datos, ¿aporta información sobre su dispersión?</p>
<p>Sea <img src="https://latex.codecogs.com/png.latex?X_1,%20%5Cldots,%20X_n"> una muestra de observaciones independientes de una población <img src="https://latex.codecogs.com/png.latex?F">. Consideramos la media muestral <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D=n%5E%7B-1%7D%5Csum_%7Bi=1%7D%5En%20X_i"> y la varianza muestral <img src="https://latex.codecogs.com/png.latex?S%5E2%20=%20(n-1)%5E%7B-1%7D%5Csum_%7Bi=1%7D%5En%20(X_i-%5Cbar%7BX%7D)%5E2">. Si alguien nos dijera el valor de <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D">, ¿nos daría eso alguna información sobre cuánto vale <img src="https://latex.codecogs.com/png.latex?S%5E2">? La respuesta depende de cómo es la distribución de la que proceden los datos.</p>
<p><a href="https://www.jstor.org/stable/2331838">Fisher (1915)</a> observó que en poblaciones normales <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2"> son variables aleatorias independientes. Esta es una propiedad fundamental de la teoría del muestreo en poblaciones normales y en muchos textos se denomina <em>lema de Fisher</em>. Como consecuencia, si la población es normal, conocer la media muestral no aporta ninguna información sobre el valor de la varianza muestral. Sin embargo, esta situación es excepcional, la distribución normal es la única para la que eso pasa. <a href="https://www.jstor.org/stable/2236166">Lukacs (1942)</a> demostró que <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2"> son independientes <strong>si y solo si</strong> la distribución de <img src="https://latex.codecogs.com/png.latex?X_1,%5Cldots,X_n"> es normal. Cuando <img src="https://latex.codecogs.com/png.latex?F"> no es normal, tiene por lo tanto sentido que nos preguntemos sobre el grado de dependencia entre <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2"> y, en particular, si son o no incorreladas.</p>
<p>Resulta que la fórmula para la covarianza entre <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2"> que vamos a demostrar en esta entrada es notablemente simple y elegante, proporcionando una respuesta completa a esta pregunta:</p>
<div class="my-box">
<p><img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2"> son incorreladas <sup>1</sup> si y solo si la distribución de <img src="https://latex.codecogs.com/png.latex?X_1,%5Cldots,X_n"> es simétrica.</p>
</div>
</section>
<section id="la-covarianza-entre-barx-y-s2" class="level2">
<h2 class="anchored" data-anchor-id="la-covarianza-entre-barx-y-s2">La covarianza entre <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2"></h2>
<p>La fórmula depende de manera muy simple del coeficiente de asimetría. Dada una variable aleatoria <img src="https://latex.codecogs.com/png.latex?X"> con distribución <img src="https://latex.codecogs.com/png.latex?F">, media <img src="https://latex.codecogs.com/png.latex?%5Cmu"> y varianza <img src="https://latex.codecogs.com/png.latex?%5Csigma%5E2">, el coeficiente de asimetría de <img src="https://latex.codecogs.com/png.latex?X"> es <img src="https://latex.codecogs.com/png.latex?%5Cgamma%20=%20%5Ctext%7BE%7D%5Cleft%5B%5Cleft(%5Cfrac%7BX-%5Cmu%7D%7B%5Csigma%7D%5Cright)%5E3%5Cright%5D."></p>
<p>Con esta notación, el resultado es el siguiente:</p>
<div class="my-box">
<p>La covarianza entre <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2"> viene dada por</p>
<p><span id="eq-covariance"><img src="https://latex.codecogs.com/png.latex?%5Ctext%7BCov%7D(%5Cbar%7BX%7D,S%5E2)%20=%20%5Cfrac%7B%5Ctext%7BE%7D%5B(X-%5Cmu)%5E3%5D%7D%7Bn%7D=%5Cfrac%7B%5Csigma%5E3%5Cgamma%7D%7Bn%7D.%20%5Ctag%7B1%7D"></span></p>
</div>
<p><br></p>
<p>Estoy de acuerdo con <a href="https://www.tandfonline.com/doi/abs/10.1080/00031305.1999.10474471">Dodge y Rousson (1999)</a>:</p>
<blockquote class="blockquote">
<p>Statistical theory provides beautiful formulas when they involve the first three moments (with a special prize for the insufficiently known formula <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BCov%7D(%5Cbar%7BX%7D,%20S%5E2)%20=%20%5Cmbox%7BE%7D%5B(X-%5Cmu)%5E3%5D/n">).</p>
</blockquote>
<p>Una demostración de (1) se puede encontrar en <a href="https://doi.org/10.1198/000313007X188379">Zhang (2007)</a>. La demostración que aparece al final de esta entrada es una versión de la suya un poco más compacta. Puede ser un buen ejercicio porque requiere un manejo adecuado de los sumatorios que aparecen y un uso hábil de la propiedad según la cual la esperanza de productos de variables aleatorias independientes es el producto de las esperanzas.</p>
<p>Como observa <a href="https://doi.org/10.1198/000313007X188379">Zhang (2007)</a>, la fórmula (1) produce un buen número de ejemplos de variables aleatorias incorreladas pero no independientes que aparecen naturalmente en problemas de estimación: basta con considerar medias y varianzas de muestras extraídas de poblaciones simétricas que no sean normales. Por ejemplo, la media y la varianza muestrales de observaciones con distribución t de Student (más de 4 grados de libertad, para que la curtosis sea finita) son incorreladas pero no independientes. Veamos un ejemplo con muestras de la distribución t de Student con 5 grados de libertad:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb1" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb1-1"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">library</span>(ggplot2)</span>
<span id="cb1-2">R <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1000</span></span>
<span id="cb1-3">n <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">10</span></span>
<span id="cb1-4">gl <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">5</span></span>
<span id="cb1-5"></span>
<span id="cb1-6"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">set.seed</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">123</span>)</span>
<span id="cb1-7">datos <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">matrix</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">rt</span>(n<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span>R, gl), n)   <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># cada columna es una muestra</span></span>
<span id="cb1-8">medias <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">apply</span>(datos, <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>, mean)</span>
<span id="cb1-9">varianzas <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">apply</span>(datos, <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span>, var)</span>
<span id="cb1-10"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">ggplot</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">data.frame</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">medias =</span> medias, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">varianzas =</span> varianzas)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb1-11">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_point</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">aes</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> medias, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> varianzas)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb1-12">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">labs</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Medias"</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">y =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">"Varianzas"</span>)</span></code></pre></div></div>
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/022-covarianza-media-var/index_files/figure-html/unnamed-chunk-1-1.png" class="img-fluid figure-img" style="width:75.0%"></p>
<figcaption>Medias y varianzas de muestras de tamaño 10 de una distribución t de Student con 5 grados de libertad</figcaption>
</figure>
</div>
</div>
</div>
<p>En el gráfico parece que valores extremos de la media incrementan la posibilidad de que los valores de la varianza sean también muy grandes, por lo que no son independientes. La simetría de la nube de puntos es la que hace que la covarianza sea cero.</p>
</section>
<section id="y-qué-pasa-con-la-correlación" class="level2">
<h2 class="anchored" data-anchor-id="y-qué-pasa-con-la-correlación">¿Y qué pasa con la correlación?</h2>
<p>Para determinar el grado de relación lineal entre <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2"> es mejor y más habitual usar la correlación entre ellas que su covarianza, pero como la fórmula de la correlación permite contar otra pequeña historia, lo dejo para una segunda parte.</p>
</section>
<section id="la-demostración" class="level2">
<h2 class="anchored" data-anchor-id="la-demostración">La demostración</h2>
<p>Veamos cómo se demuestra (1). Denotamos por <img src="https://latex.codecogs.com/png.latex?Y_i%20=%20X_i-%5Cmu"> a las variables centradas restándoles la media, con lo que <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BCov%7D(%5Cbar%7BX%7D,S%5E2)=%5Cmbox%7BE%7D(%5Cbar%7BY%7DS%5E2_Y)">. Ahora, <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BE%7D(%5Cbar%7BY%7DS%5E2_Y)%20=%20%5Cfrac%7Bn%7D%7Bn-1%7D%5Cleft%5B%20%5Cmbox%7BE%7D%5Cleft(%5Cbar%7BY%7D%5Cfrac%7B%5Csum_%7Bi=1%7D%5En%20Y%5E2_i%7D%7Bn%7D%5Cright)-%5Cmbox%7BE%7D(%5Cbar%7BY%7D%5E3)%20%5Cright%5D:=%5Cfrac%7Bn%7D%7Bn-1%7D(A-B)."> Tenemos que <img src="https://latex.codecogs.com/png.latex?A=%5Cfrac%7B1%7D%7Bn%5E2%7D%20%5Cmbox%7BE%7D%5Cleft(%5Csum_%7Bi=1%7D%5En%5Csum_%7Bj=1%7D%5EnY_iY_j%5E2%5Cright%20)=%5Cfrac%7B1%7D%7Bn%7D%5Cmbox%7BE%7D(Y_i%5E3)%20=%20%5Cfrac%7B1%7D%7Bn%7D%5Csigma%5E3%5Cgamma,"> donde hemos usado la independencia y el hecho de que la esperanza de <img src="https://latex.codecogs.com/png.latex?Y_i"> es cero, con lo que las únicas esperanzas que no se anulan son las que corresponden a los términos con <img src="https://latex.codecogs.com/png.latex?i=j">. Por las mismas razones, <img src="https://latex.codecogs.com/png.latex?B%20=%20%5Cfrac%7B1%7D%7Bn%5E3%7D%5Cmbox%7BE%7D%5Cleft(%5Csum_%7Bi=1%7D%5En%5Csum_%7Bj=1%7D%5En%5Csum_%7Bk=1%7D%5EnY_iY_jY_k%5Cright)=%5Cfrac%7B1%7D%7Bn%5E2%7D%5Cmbox%7BE%7D(Y_i%5E3)=%5Cfrac%7B1%7D%7Bn%5E2%7D%5Csigma%5E3%5Cgamma."> Finalmente, <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BCov%7D(%5Cbar%7BX%7D,S%5E2)=%5Cfrac%7Bn%7D%7Bn-1%7D(A-B)=%5Cfrac%7B%5Csigma%5E3%5Cgamma%7D%7Bn%7D."></p>


</section>


<div id="quarto-appendix" class="default"><section id="footnotes" class="footnotes footnotes-end-of-document"><h2 class="anchored quarto-appendix-heading">Notas</h2>

<ol>
<li id="fn1"><p>Estrictamente hablando, para que tenga sentido hablar de correlación entre <img src="https://latex.codecogs.com/png.latex?%5Cbar%7BX%7D"> y <img src="https://latex.codecogs.com/png.latex?S%5E2"> hay que suponer que el coeficiente de curtosis es finito, puesto que la varianza de <img src="https://latex.codecogs.com/png.latex?S%5E2"> solo es finita si el coeficiente de curtosis lo es.↩︎</p></li>
</ol>
</section></div> ]]></description>
  <category>Estimación</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/022-covarianza-media-var/</guid>
  <pubDate>Mon, 22 Jul 2024 22:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/022-covarianza-media-var/cov-media-var.png" medium="image" type="image/png" height="103" width="144"/>
</item>
<item>
  <title>Cómo decir la verdad con la estadística</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/021-darrell-huff/</link>
  <description><![CDATA[ 





<p>La palabra <em>estadística</em> siempre suele aparecer en contextos negativos: fallos de predicción de las encuestas electorales, manipulación interesada, clases aburridas, … Todo lo contrario ocurre con la apasionante <em>ciencia de datos</em>: se comentan sus éxitos al diagnosticar enfermedades, sus aplicaciones en genética y proteómica, o sus usos en inteligencia artificial. Y sin embargo será difícil para cualquiera explicar la diferencia entre ambas. Las posibilidades de la estadística como herramienta para manipular una afirmación se han señalado (incluso con cierta delectación) desde hace mucho tiempo. Uno de los grandes clásicos en esta línea es <em>How to Lie with Statistics</em>, el libro de Darrell Huff publicado originalmente en 1954. Comento aquí algunos datos acerca de este libro y de su autor, así como una historia posterior, bastante más oscura, sobre otro libro de Huff que nunca llegó a publicarse.</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/021-darrell-huff/huff.jpg" class="quarto-figure quarto-figure-center figure-img" height="350"></p>
</figure>
</div>
<section id="how-to-lie-with-statistics" class="level2">
<h2 class="anchored" data-anchor-id="how-to-lie-with-statistics">How to Lie with Statistics</h2>
<p>Conocí <em>How to Lie with Statistics</em> gracias al clásico texto de Daniel Peña <em>Fundamentos de Estadística</em>, donde se describía como “un libro excelente sobre cómo prevenir la manipulación con la estadística”. Unos años más tarde compré un ejemplar correspondiente a una edición de 1993 (véase la foto que encabeza la entrada), una de las muchas ediciones que han venido sucediéndose desde que se publicó el libro en 1954. He leído que en 2005 se habían vendido alrededor de un millón y medio de ejemplares, lo que tal vez lo convierte en el libro sobre estadística más popular de la historia.</p>
<p><a href="https://en.wikipedia.org/wiki/Darrell_Huff">Durrell Huff (1913-2001)</a> era un periodista que, antes de convertirse en escritor independiente, había sido editor de las revistas <em>Better Homes and Gardens</em> y <em>Liberty</em>. No tenía ninguna formación específica en estadística. Como periodista independiente escribió varios libros cuyo título empezaba con <em>“How to…”</em>, entre ellos uno sobre las reglas de la probabilidad (<em>How to Take a Chance: The Laws of Probability</em>, 1959) pero también otros sin relación alguna con la estadística (<em>How to Work With Concrete and Masonry</em>, 1968)</p>
<p>J. Michael Steele ha enumerado algunas de las razones por las que el libro de Huff se convirtió en un superventas. En primer lugar, su título. Como dijo el ilustrador Irving Geis: “Huff could have well titled it <em>An Introduction to Statistics</em> and it would have sold a few hundred copies for a year or two. But with that title, it’s been selling steadily since 1954”. En segundo lugar, las ilustraciones del propio Geis, con su aire <em>vintage</em> (y en algún caso, sexista) cuando se miran setenta años después:</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/021-darrell-huff/huff-dibujo.jpg" class="img-fluid quarto-figure quarto-figure-center figure-img" width="400"></p>
</figure>
</div>
<p>Hoy en día no es raro encontrar libros divulgativos en los que aparecen dibujos que aportan un toque de humor, pero en aquella época la fórmula era más novedosa. Steele también menciona unos contenidos bien elegidos: los tres primeros capítulos se refieren a medidas descriptivas numéricas, los capítulos 4 a 7 tratan sobre visualización de datos. Los tres capítulos finales son más heterogéneos y se dedican a discutir lo que llamaríamos pensamiento estadístico crítico. Todo ello en 142 páginas.</p>
</section>
<section id="durrell-huff-y-las-tabacaleras" class="level2">
<h2 class="anchored" data-anchor-id="durrell-huff-y-las-tabacaleras">Durrell Huff y las tabacaleras</h2>
<p>Huff también escribió un libro que nunca se llegó a publicar cuyo título era <em>How to Lie with Smoking Statistics</em>.</p>
<p>A principios de los años 60 se habían encontrado bastantes indicios de los efectos perjudiciales que el consumo de tabaco podía tener en la salud. En 1965 se aprobó una norma para que en las cajetillas de tabaco apareciera el mensaje <em>Caution: Cigarette Smoking May Be Hazardous to Your Health</em>. Se había propuesto un mensaje mucho más contundente pero las compañías tabacaleras lograron suavizarlo.</p>
<p>Las compañías trataban de transmitir la idea de que no había evidencia científica sobre los efectos del consumo de tabaco en la salud. Como parte de esta estrategia contrataron a Huff en 1964 para escribir un libro en el que se criticaran los análisis estadísticos de los estudios publicados sobre el tema. Huff trabajó en colaboración con el abogado Edwin Jacob quien sugería comentarios y temas de acuerdo con la conveniencia de las tabacaleras. El manuscrito solo se conoció en 1998, gracias al <a href="https://en.wikipedia.org/wiki/Tobacco_Master_Settlement_Agreement"><em>Tobacco Settlement Agreement</em></a> que hizo pública mucha documentación de los casos legales contra las tabacaleras, y en particular una parte de la correspondencia de Huff.</p>
<p>Por ejemplo, en la carta que aparece debajo, Huff le envía a Jacob un borrador del capítulo I y espera que esta versión “comes close to doing the job”. También pregunta el momento apropiado para solicitar más dinero:</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/021-darrell-huff/carta-huff-jacob.jpg" class="img-fluid quarto-figure quarto-figure-center figure-img" width="500"></p>
</figure>
</div>
<p>El borrador del libro comienza con este párrafo:</p>
<blockquote class="blockquote">
<p>If we want to know what effect, if any, smoking cigerettes has on human health, there is an obvious and direct way to set about finding out. Essentially, we should set up an experiment in which half the population is directed to smoke and the other half is prevented from doing so. Observation of the two groups should eventually tell us what we want to know.</p>
<p>If it is not feasible to conduct such an experiment, even on a small scale -as indeed appears to be the case- we can only approach the problem indirectly.</p>
</blockquote>
<p>Obviamente, la evidencia de los efectos del tabaco en la salud no se obtuvo a partir de un experimento controlado sino gracias a la combinación de cientos de estudios y experimentos que aportaban evidencias indirectas del efecto. La crítica de Huff se dirigía a puntos débiles de cada uno de estos estudios individuales.</p>
<p>En 1968 Huff llegó a un acuerdo con la editorial MacMillan para publicar una edición del libro en tapa dura a la que seguiría una tirada de bolsillo de 100000 ejemplares. Sin embargo, el proceso de publicación se interrumpió poco después porque se descubrió que las tabacaleras estaban detrás de artículos supuestamente independientes publicados en favor del tabaco en las revistas <em>True</em> (paradójico nombre, en lo que se refiere a este asunto) y <em>National Enquirer</em>. Se consideró incluir un aviso en el libro informando de la financiación que había recibido Huff, pero el hecho es que el libro finalmente no se llegó a publicar sin que se hayan documentado claramente las razones. Andrew Gelman aventura que el propio Huff no quiso que se publicara para que no perjudicara su reputación.</p>
</section>
<section id="cómo-decir-la-verdad-con-la-estadística" class="level2">
<h2 class="anchored" data-anchor-id="cómo-decir-la-verdad-con-la-estadística">Cómo decir la verdad con la estadística</h2>
<p>Aunque no está de más ser consciente de las posibles manipulaciones que podemos sufrir cuando nos presentan cifras relacionadas con un hecho, me interesan mucho más los libros que ponen el énfasis en la forma de usar los datos para presentar la realidad certera y honradamente, es decir, aquellos que enseñan cómo decir la verdad con la estadística. Concluyo mencionando tres ejemplos recientes de este tipo de libros: <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/014-libros_23/#kiko-llaneras-piensa-claro">Piensa claro</a>, de Kiko Llaneras, <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/014-libros_23/#david-spiegelhalter-el-arte-de-la-estad%C3%ADstica">El arte de la estadística</a> de David Spiegelhalter o <a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/005-libros_22/#anabel-forte-deltell-c%C3%B3mo-sobrevivir-a-la-incertidumbre">¿Cómo sobrevivir a la incertidumbre?</a> de Anabell Forte Deltell.</p>
</section>
<section id="referencias" class="level2">
<h2 class="anchored" data-anchor-id="referencias">Referencias</h2>
<p>Toda la documentación de la relación de Huff con las compañías de tabaco, así como el manuscrito inédito se pueden encontrar <a href="http://bit.ly/Y61goV">aquí</a>. La información que aparece en esta entrada la he leído en los tres artículos siguientes:</p>
<ul>
<li><a href="https://doi.org/10.1080/09332480.2012.726563">Gelman, A. (2011). Ethics and Statistics: Statistics for Cigarette Sellers. <em>CHANCE</em>, 25, 43–46</a></li>
<li><a href="https://doi.org/10.1111/j.1740-9713.2014.00765.x">Reinhart, A. (2014) Huff and Puff. <em>Significance</em>, 11, 28-33</a></li>
<li><a href="http://whr.tn/1mgMW0J">Steele, J. M. (2005). Darrell Huff and fifty years of <em>How to lie with statistics</em>. <em>Statistical Science</em>, 20, 205-209</a></li>
</ul>


</section>

 ]]></description>
  <category>Profesión</category>
  <category>Historia</category>
  <category>Libros</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/021-darrell-huff/</guid>
  <pubDate>Mon, 01 Jul 2024 22:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/021-darrell-huff/huff.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>¿Cuál es la varianza de la varianza?</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/020-varianza-varianza/</link>
  <description><![CDATA[ 





<p>Para introducir el bootstrap sugiero aquí el problema de estimar la precisión de la varianza muestral. Este ejemplo tiene alguna ventaja respecto al de estimar la precisión de la media muestral ya que las fórmulas teóricas para la varianza no son tan conocidas para los estudiantes como las de la media, lo que creo que hace que valoren mejor el interés del bootstrap. Concluyo con una breve reflexión sobre la docencia en asignaturas de introducción a la estadística.</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/020-varianza-varianza/scatter.jpg" class="img-fluid quarto-figure quarto-figure-center figure-img" width="400"></p>
</figure>
</div>
<section id="tres-varianzas-distintas" class="level2">
<h2 class="anchored" data-anchor-id="tres-varianzas-distintas">Tres varianzas distintas</h2>
<p>La varianza <img src="https://latex.codecogs.com/png.latex?%5Csigma%5E2"> de una distribución de probabilidad <img src="https://latex.codecogs.com/png.latex?F"> (la primera de las varianzas) mide la dispersión de los valores aleatorios generados a partir de esa distribución (o población). Es un parámetro importante porque da una medida de lo heterogénea que es la población e interviene de manera decisiva en cualquier inferencia que hagamos sobre, por ejemplo, la media poblacional.</p>
<p>Si por ejemplo generamos una muestra de 200 datos normales con media 0 y varianza <img src="https://latex.codecogs.com/png.latex?%5Csigma%5E2%20=%20(1.4)%5E2%20=%201.96">, podemos estimar <img src="https://latex.codecogs.com/png.latex?%5Csigma%5E2"> calculando la varianza muestral (la segunda de las varianzas) <img src="https://latex.codecogs.com/png.latex?S%5E2%20=%20%5Cfrac%7B1%7D%7Bn-1%7D%5Csum_%7Bi=1%7D%5En%20(X_i%20-%20%5Cbar%7BX%7D)%5E2."> En la siguiente simulación vemos que el valor de <img src="https://latex.codecogs.com/png.latex?S%5E2"> obtenido es parecido a <img src="https://latex.codecogs.com/png.latex?%5Csigma%5E2">, pero no igual:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb1" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb1-1"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">set.seed</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">123</span>)  <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># para reproducir los resultados</span></span>
<span id="cb1-2">n <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">200</span></span>
<span id="cb1-3">sigma <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fl" style="color: #AD0000;
background-color: null;
font-style: inherit;">1.4</span></span>
<span id="cb1-4">sigma<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">^</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span></span>
<span id="cb1-5"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; [1] 1.96</span></span>
<span id="cb1-6">datos <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">rnorm</span>(n, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">sd =</span> sigma)  <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># genera la muestra</span></span>
<span id="cb1-7"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">var</span>(datos)</span>
<span id="cb1-8"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; [1] 1.743519</span></span></code></pre></div></div>
</div>
<p>De hecho, si repetimos el experimento anterior muchas veces obtenemos muchos valores distintos de <img src="https://latex.codecogs.com/png.latex?S%5E2"> que tienen su propia dispersión, determinada por el valor de <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BVar%7D(S%5E2)"> (la tercera de las varianzas):</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb2" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb2-1">R <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">10000</span> <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># número de réplicas</span></span>
<span id="cb2-2">varianzas <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">replicate</span>(R, <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">var</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">rnorm</span>(n, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">sd =</span> sigma)))</span>
<span id="cb2-3"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">var</span>(varianzas)</span>
<span id="cb2-4"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; [1] 0.03785888</span></span></code></pre></div></div>
</div>
<p>Esta tercera de las varianzas es importante porque cuantifica hasta qué punto podemos estar seguros de que <img src="https://latex.codecogs.com/png.latex?S%5E2%5Capprox%5Csigma%5E2">. De hecho, la desigualdad de Chebychev (dado que <img src="https://latex.codecogs.com/png.latex?S%5E2"> es insesgado) implica que para cualquier margen de error <img src="https://latex.codecogs.com/png.latex?%5Cepsilon%3E0">, <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BP%7D(%7CS%5E2-%5Csigma%5E2%7C%5Cgeq%20%5Cepsilon)%20%5Cleq%5Cfrac%7B%5Cmbox%7BVar%7D(S%5E2)%7D%7B%5Cepsilon%5E2%7D."></p>
<p>Luego si <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BVar%7D(S%5E2)%5Capprox%200"> la probabilidad de que <img src="https://latex.codecogs.com/png.latex?S%5E2"> difiera mucho de <img src="https://latex.codecogs.com/png.latex?%5Csigma%5E2"> será muy baja. ¿Qué es lo que explica el valor 0.038 que hemos obtenido en la simulación? ¿Cómo podemos aproximarlo a partir de la muestra sin conocer la distribución de la que proceden los datos? En esta entrada se muestra cómo valorar la precisión de <img src="https://latex.codecogs.com/png.latex?S%5E2"> como estimador de <img src="https://latex.codecogs.com/png.latex?%5Csigma%5E2"> sin recurrir a fórmulas matemáticas o teoría estadística.</p>
</section>
<section id="si-asumimos-que-la-distribución-de-los-datos-es-normal" class="level2">
<h2 class="anchored" data-anchor-id="si-asumimos-que-la-distribución-de-los-datos-es-normal">Si asumimos que la distribución de los datos es normal</h2>
<p>Si podemos suponer que los datos vienen de una distribución normal (con la media y la varianza desconocidas), algo muy sencillo que podemos hacer es repetir la simulación anterior pero sustituyendo los valores de <img src="https://latex.codecogs.com/png.latex?%5Cmu"> y <img src="https://latex.codecogs.com/png.latex?%5Csigma"> por los estimadores <img src="https://latex.codecogs.com/png.latex?%5Cbar%7Bx%7D"> y <img src="https://latex.codecogs.com/png.latex?s"> calculados a partir de los datos. Este procedimiento se denomina <strong>bootstrap paramétrico</strong>:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb3" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb3-1">R <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">10000</span> <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># número de réplicas</span></span>
<span id="cb3-2">varianzas <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">replicate</span>(R, <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">var</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">rnorm</span>(n, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">mean =</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">mean</span>(datos), <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">sd =</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">sd</span>(datos))))</span>
<span id="cb3-3"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">var</span>(varianzas)</span>
<span id="cb3-4"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; [1] 0.03011815</span></span></code></pre></div></div>
</div>
<p>Este método evita tener que conocer la teoría clásica estadística, de acuerdo con la cual si los datos son normales la distribución de <img src="https://latex.codecogs.com/png.latex?S%5E2"> es una <img src="https://latex.codecogs.com/png.latex?%5Cchi%5E2_%7Bn-1%7D"> (salvo constantes): <img src="https://latex.codecogs.com/png.latex?%5Cfrac%7B(n-1)S%5E2%7D%7B%5Csigma%5E2%7D%20%5Cequiv%20%5Cchi%5E2_%7Bn-1%7D."> A partir del resultado anterior se deduce la relación teórica entre las tres varianzas del apartado anterior: <span id="eq-relacion"><img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BVar%7D(S%5E2)%20=%20%5Cfrac%7B2%5Csigma%5E4%7D%7Bn-1%7D.%20%5Ctag%7B1%7D"></span> La ecuación (1) explica el valor que obtuvimos en la simulación inicial:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb4" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb4-1"><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span>sigma<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">^</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">4</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span>(n<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">-1</span>)</span>
<span id="cb4-2"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; [1] 0.03860905</span></span></code></pre></div></div>
</div>
<p>De hecho, a partir de (1), el estimador más natural de la varianza de <img src="https://latex.codecogs.com/png.latex?S%5E2"> es <img src="https://latex.codecogs.com/png.latex?2S%5E4/(n-1)"></p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb5" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb5-1"><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">var</span>(datos)<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">^</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">2</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span>(n<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">-1</span>)</span>
<span id="cb5-2"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; [1] 0.03055134</span></span></code></pre></div></div>
</div>
<p>Este valor es prácticamente idéntico al que se obtiene con bootstrap paramétrico. No es extraño ya que, si uno se para a pensarlo, el valor obtenido con lo que he llamado bootstrap paramétrico es en realidad una aproximación de Monte Carlo de <img src="https://latex.codecogs.com/png.latex?2S%5E4/(n-1)">, que en realidad es el estimador bootstrap paramétrico <em>ideal</em>, el que se obtiene al sustituir la verdadera distribución <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BN%7D(%5Cmu,%5Csigma%5E2)"> por la distribución estimada <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BN%7D(%5Cbar%7Bx%7D,s%5E2)">. La ventaja de la aproximación de Monte Carlo es que no requiere saber nada sobre la <img src="https://latex.codecogs.com/png.latex?%5Cchi%5E2"> ni conocer la fórmula (1), y esto hace que la idea del bootstrap combinada con el procedimiento de Monte Carlo sea tan potente.</p>
</section>
<section id="si-no-sabemos-nada-sobre-la-distribución-de-los-datos" class="level2">
<h2 class="anchored" data-anchor-id="si-no-sabemos-nada-sobre-la-distribución-de-los-datos">Si no sabemos nada sobre la distribución de los datos</h2>
<p>Si no tenemos ni idea de la distribución <img src="https://latex.codecogs.com/png.latex?F"> de la que proceden los datos, podemos aplicar una versión más radical del bootstrap llamada <strong>bootstrap no paramétrico</strong>. Se repite la simulación pero ahora los datos se extraen de la distribución empírica <img src="https://latex.codecogs.com/png.latex?F_n"> (la que asigna probabilidad <img src="https://latex.codecogs.com/png.latex?1/n"> a cada uno de los datos originales <img src="https://latex.codecogs.com/png.latex?X_1,%5Cldots,X_n">). Este método es razonable al menos para tamaños muestrales grandes ya que en este caso <a href="https://en.wikipedia.org/wiki/Glivenko%E2%80%93Cantelli_theorem">el teorema de Glivenko-Cantelli</a> garantiza que <img src="https://latex.codecogs.com/png.latex?F_n%5Capprox%20F">.</p>
<p>Veamos qué pasa:</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb6" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb6-1">R <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">10000</span> <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># número de réplicas</span></span>
<span id="cb6-2">varianzas <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">replicate</span>(R, <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">var</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">sample</span>(datos, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">replace =</span> <span class="cn" style="color: #8f5902;
background-color: null;
font-style: inherit;">TRUE</span>)))</span>
<span id="cb6-3"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">var</span>(varianzas)</span>
<span id="cb6-4"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; [1] 0.03349739</span></span></code></pre></div></div>
</div>
<p>Mediante el procedimiento anterior, extremadamente simple y sin suponer nada sobre <img src="https://latex.codecogs.com/png.latex?F"> ni conocer ninguna teoría, hemos podido valorar la precisión de <img src="https://latex.codecogs.com/png.latex?S%5E2">. El valor obtenido no está lejos del correcto, 0.0386.</p>
</section>
<section id="la-relación-general-entre-las-tres-varianzas" class="level2">
<h2 class="anchored" data-anchor-id="la-relación-general-entre-las-tres-varianzas">La relación general entre las tres varianzas</h2>
<p>Para los/as curiosos/as, una bonita fórmula que viene en algunos libros es la equivalente a (1), pero para datos que no son normales. La relación general entre las tres varianzas es: <span id="eq-relacion-general"><img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BVar%7D(S%5E2)%20=%20%5Cfrac%7B%5Csigma%5E4%7D%7Bn%7D%5Cleft(%5Ckappa%20-1%20%20+%20%5Cfrac%7B2%7D%7Bn-1%7D%5Cright).%20%5Ctag%7B2%7D"></span> En (2), <img src="https://latex.codecogs.com/png.latex?%5Ckappa"> representa el <a href="https://es.wikipedia.org/wiki/Curtosis">coeficiente de curtosis</a>. En el caso de la distribución normal <img src="https://latex.codecogs.com/png.latex?%5Ckappa=3">, lo que muestra que (1) es un caso particular de (2). Si prescindimos de términos de orden <img src="https://latex.codecogs.com/png.latex?n%5E%7B-2%7D">, tenemos la aproximación <img src="https://latex.codecogs.com/png.latex?%5Cmbox%7BVar%7D(S%5E2)%20%5Capprox%20%5Cfrac%7B%5Csigma%5E4(%5Ckappa-1)%7D%7Bn%7D"> válida para cualquier distribución tal que <img src="https://latex.codecogs.com/png.latex?%5Ckappa%3C%5Cinfty">. Esta aproximación es la misma que se deduce de la aplicación del teorema central del límite a <img src="https://latex.codecogs.com/png.latex?S%5E2"> para obtener su distribución asintótica.</p>
</section>
<section id="una-breve-reflexión-sobre-la-docencia" class="level2">
<h2 class="anchored" data-anchor-id="una-breve-reflexión-sobre-la-docencia">Una breve reflexión sobre la docencia</h2>
<p>Una comprensión del bootstrap como método para valorar la precisión de un estimador es mucho más formativa conceptualmente y se acerca más a la esencia de la inferencia estadística que conocer las propiedades de la distribución <img src="https://latex.codecogs.com/png.latex?%5Cchi%5E2"> o de la <img src="https://latex.codecogs.com/png.latex?t"> de Student. Además, su rango de aplicaciones es mucho más amplio. Creo que se debería explicar en los cursos introductorios y se le debería dar la importancia que merece de acuerdo con su impacto en la práctica estadística de las últimas décadas. El problema es la inercia. Por una parte en los docentes, ya que suele ser difícil cambiar los contenidos de asignaturas que a veces son impartidas por muchas personas diferentes. Pero también la inercia en los investigadores aplicados a quienes a menudo ahuyenta cualquier desviación de los métodos que usan tradicionalmente.</p>


</section>

 ]]></description>
  <category>Profesión</category>
  <category>Estimación</category>
  <category>Bootstrap</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/020-varianza-varianza/</guid>
  <pubDate>Sun, 19 May 2024 22:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/020-varianza-varianza/scatter.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>Diez ideas estadísticas que cambiaron el mundo</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/019-diez-ideas/</link>
  <description><![CDATA[ 





<p>Destaco aquí el interés de una <a href="https://www.youtube.com/playlist?list=PLt_pNkbycxqahVksaNnjz3M6759xHIZ-r">serie de entrevistas en YouTube</a> realizadas a estadísticos que desarrollaron algunas de las ideas más importantes de la disciplina en las últimas décadas del siglo XX. Los entrevistadores son Trevor Hastie y Robert Tibshirani, ellos mismos investigadores de primera línea, y los vídeos duran entre 20 y 25 minutos cada uno.</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/019-diez-ideas/hastie_tibshirani.jpg" class="img-fluid quarto-figure quarto-figure-center figure-img" width="400"></p>
</figure>
</div>
<p>La confección de la lista surge a partir de un curso en la Universidad de Stanford, impartido por Tibshirani, cuya base era un conjunto de artículos históricos que han influido en la forma de analizar datos en muchas áreas de la ciencia. En la <a href="https://ledaliang.github.io/journalclub/">página del curso</a> se puede encontrar más información, como por ejemplo los resúmenes y las presentaciones realizadas por los estudiantes del curso sobre los artículos originales.</p>
<p>Como dice Tibshirani en el vídeo de presentación, tal vez el título de la serie es un tanto hiperbólico, pero es verdad que algunas de las contribuciones han sido muy importantes. Tibshirani destaca tres: la regresión de Cox cambió la manera de analizar los datos de supervivencia (tiempo hasta que se produce un evento) en miles de ensayos clínicos, el bootstrap (Efron, 1979) fue una técnica pionera en usar cálculos intensivos de ordenador en lugar de fórmulas matemáticas para calcular el error típico de un estimador y, finalmente, el control de la tasa de descubrimientos falsos (Benjamini y Hochberg, 1995) es muy importante en la época de <a href="https://es.wikipedia.org/wiki/%C3%93mica">las ómicas</a> en la que es posible medir miles de biomarcadores en un paciente para tratar de comprender las bases de su enfermedad.</p>
<p><br></p>
<iframe width="560" height="315" src="https://www.youtube.com/embed/EaYrAZkWVbs?si=QMJIp-w83R1aYDs8" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen="">
</iframe>
<p><br></p>
<p>Estas son las diez ideas según el orden en el que aparecen en la lista de vídeos. Para cada una de ellas pongo el enlace al vídeo, otro enlace a una página en la que se puede encontrar más información sobre la idea en cuestión (normalmente en Wikipedia) y la referencia al artículo de investigación original correspondiente.</p>
<section id="bootstrap-1979" class="level4">
<h4 class="anchored" data-anchor-id="bootstrap-1979">1. Bootstrap (1979)</h4>
<ul>
<li><a href="https://youtu.be/0tA3x64nCGY?feature=shared">Entrevista con Bradley Efron</a></li>
<li><a href="https://caminosaleatorios.wordpress.com/2021/04/28/que-es-el-bootstrap/">Una entrada de <em>Caminos Aleatorios</em> en la que se explica la idea</a></li>
<li>Efron, B. (1979). Bootstrap Methods: Another Look at the Jackknife. <em>The Annals of Statistics</em>, 7, 1-26.</li>
</ul>
</section>
<section id="modelo-de-regresión-para-datos-de-supervivencia-1972" class="level4">
<h4 class="anchored" data-anchor-id="modelo-de-regresión-para-datos-de-supervivencia-1972">2. Modelo de regresión para datos de supervivencia (1972)</h4>
<ul>
<li><a href="https://youtu.be/TiHCNRUiLKc?feature=shared">Entrevista con David Cox</a></li>
<li><a href="https://en.wikipedia.org/wiki/Proportional_hazards_model">Modelo de regresión de Cox en Wikipedia</a></li>
<li>Cox, D.R. (1972). Regression models and life-tables. <em>Journal of the Royal Statistical Society: series B</em>, 34, 187-202.</li>
</ul>
</section>
<section id="control-de-la-tasa-de-descubrimientos-falsos-1995" class="level4">
<h4 class="anchored" data-anchor-id="control-de-la-tasa-de-descubrimientos-falsos-1995">3. Control de la tasa de descubrimientos falsos (1995)</h4>
<ul>
<li><a href="https://youtu.be/ZGU4SlE9Pu8?feature=shared">Entrevista con Yoav Benjamini</a></li>
<li><a href="https://es.wikipedia.org/wiki/Tasa_de_descubrimiento_falso">Tasa de falsos descubrimientos en Wikipedia</a></li>
<li>Benjamini, Y. y Hochberg, Y. (1995). Controlling the false discovery rate: a practical and powerful approach to multiple testing. <em>Journal of the Royal Statistical Society: series B</em>, 57, 289-300.</li>
</ul>
</section>
<section id="el-algoritmo-em-1977" class="level4">
<h4 class="anchored" data-anchor-id="el-algoritmo-em-1977">4. El algoritmo EM (1977)</h4>
<ul>
<li><a href="https://youtu.be/tboxy6k_ux4?feature=shared">Entrevista con Nan Laird y Art Dempster</a></li>
<li><a href="https://verso.mat.uam.es/~joser.berrendero/caminos_aleatorios/posts/018-em/">Una entrada reciente en <em>Caminos Aleatorios</em> sobre este tema</a></li>
<li>Dempster, A. P., Laird, N. M., y Rubin, D. B. (1977). Maximum likelihood from incomplete data via the EM algorithm. <em>Journal of the Royal Statistical Society: series B</em>, 39, 1-22.</li>
</ul>
</section>
<section id="modelos-de-efectos-aleatorios-para-datos-longitudinales-1982" class="level4">
<h4 class="anchored" data-anchor-id="modelos-de-efectos-aleatorios-para-datos-longitudinales-1982">5. Modelos de efectos aleatorios para datos longitudinales (1982)</h4>
<ul>
<li><a href="https://youtu.be/ih3jHYgMl2U?feature=shared">Entrevista con Nan Laird</a></li>
<li><a href="https://en.wikipedia.org/wiki/Random_effects_model">Modelo de efectos aleatorios en Wikipedia</a></li>
<li>Laird, N.M., y Ware, J.H. (1982). Random-effects models for longitudinal data. <em>Biometrics</em>, 38, 963-974.</li>
</ul>
</section>
<section id="modelos-lineales-generalizados-1972" class="level4">
<h4 class="anchored" data-anchor-id="modelos-lineales-generalizados-1972">6. Modelos lineales generalizados (1972)</h4>
<ul>
<li><a href="https://youtu.be/sE5e29WAvSc?feature=shared">Entrevista con Peter McCullagh</a></li>
<li><a href="https://es.wikipedia.org/wiki/Modelo_lineal_generalizado">Modelos lineales generalizados en Wikipedia</a></li>
<li>Nelder, J.A. y Wedderburn, R.W. (1972). Generalized linear models. <em>Journal of the Royal Statistical Society: Series A</em>, 135, 370-384.</li>
</ul>
</section>
<section id="puntuación-de-propensión-en-estudios-observacionales-1983" class="level4">
<h4 class="anchored" data-anchor-id="puntuación-de-propensión-en-estudios-observacionales-1983">7. Puntuación de propensión en estudios observacionales (1983)</h4>
<ul>
<li><a href="https://youtu.be/eF12bVsvq2Q?feature=shared">Entrevista con Don Rubin</a></li>
<li><a href="https://es.wikipedia.org/wiki/Pareamiento_por_puntaje_de_propensi%C3%B3n">Puntuación de propensión en Wikipedia</a></li>
<li>Rosenbaum, P. R. y Rubin, D. B. (1983). The central role of the propensity score in observational studies for causal effects. <em>Biometrika</em>, 70, 41-55.</li>
</ul>
</section>
<section id="muestreo-de-gibbs-gibbs-sampling-1990" class="level4">
<h4 class="anchored" data-anchor-id="muestreo-de-gibbs-gibbs-sampling-1990">8. Muestreo de Gibbs (<em>Gibbs sampling</em>, 1990)</h4>
<ul>
<li><a href="https://youtu.be/ZpFqaPHRCps?feature=shared">Entrevista con Adrian Smith</a></li>
<li><a href="http://euler.mat.ufrgs.br/~viali/estatistica/mat2274/material/textos/ExpGibbs.pdf">Un artículo divulgativo sobre <em>Gibbs sampling</em> (pdf)</a></li>
<li>Gelfand, A. E., y Smith, A. F. (1990). Sampling-based approaches to calculating marginal densities. <em>Journal of the American statistical association</em>, 85, 398-409.</li>
</ul>
</section>
<section id="ecuaciones-de-estimación-generalizadas-1986" class="level4">
<h4 class="anchored" data-anchor-id="ecuaciones-de-estimación-generalizadas-1986">9. Ecuaciones de estimación generalizadas (1986)</h4>
<ul>
<li><a href="https://youtu.be/Y5E278Wy6Es?feature=shared">Entrevista con Scott Zeger</a></li>
<li><a href="https://en.wikipedia.org/wiki/Generalized_estimating_equation">Ecuaciones de estimación generalizadas en Wikipedia</a></li>
<li>Liang, K.Y. y Zeger, S.L. (1986). Longitudinal data analysis using generalized linear models. <em>Biometrika</em>, 73, 13-22.</li>
</ul>
</section>
<section id="modelos-aditivos-generalizados-1986" class="level4">
<h4 class="anchored" data-anchor-id="modelos-aditivos-generalizados-1986">10. Modelos aditivos generalizados (1986)</h4>
<ul>
<li><a href="https://youtu.be/1MmBVtp2y5U?feature=shared">Entrevista con Trevor Hastie y Robert Tibshirani</a></li>
<li><a href="https://en.wikipedia.org/wiki/Generalized_estimating_equation">Modelos aditivos generalizados en Wikipedia</a></li>
<li>Hastie, T. y Tibshirani, R. (1986). Generalized Additive Models. <em>Statistical Science</em>, 1, 297-310.</li>
</ul>


</section>

 ]]></description>
  <category>Profesión</category>
  <category>Historia</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/019-diez-ideas/</guid>
  <pubDate>Mon, 22 Apr 2024 22:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/019-diez-ideas/hastie_tibshirani.jpg" medium="image" type="image/jpeg"/>
</item>
<item>
  <title>Estimación de máxima verosimilitud cuando falta información</title>
  <link>/~joser.berrendero/caminos_aleatorios/posts/018-em/</link>
  <description><![CDATA[ 





<p>Los estimadores de máxima verosimilitud tienen excelentes propiedades, pero a veces involucran un problema de optimización difícil de resolver. El algoritmo EM (<em>Expectation-Maximization</em>) es un método para calcular el estimador de máxima verosimilitud indicado en casos en los que falta cierta información tal que el problema sería mucho más sencillo si se dispusiera de ella. Esto ocurre, por ejemplo, cuando hay datos faltantes, cuando los datos están censurados o cuando corresponden a una mezcla de distribuciones, sin que se sepa a qué distribución corresponde cada observación.</p>
<p>El algoritmo fue propuesto por <a href="https://doi.org/10.1111/j.2517-6161.1977.tb01600.x">Dempster, Laird y Rubin (1977)</a> en un famoso artículo que acumula más de 70.000 citas en Google Scholar. En 2021, Nan Laird recibió el Premio Internacional de Estadística. En <a href="https://mujeresconciencia.com/2021/07/13/nan-laird-premio-internacional-de-estadistica-2021/">este enlace</a> se puede encontrar un artículo de <a href="https://twitter.com/Altea_Lorenzo">Altea Lorenzo</a> muy recomendable sobre su vida y contribuciones.</p>
<p>Explico a continuación brevemente la idea del algoritmo y lo ilustro con el ejemplo más sencillo que se me ha ocurrido.</p>
<section id="planteamiento-e-idea-básica" class="level2">
<h2 class="anchored" data-anchor-id="planteamiento-e-idea-básica">Planteamiento e idea básica</h2>
<p>Disponemos de una muestra <img src="https://latex.codecogs.com/png.latex?x=(x_1,%5Cldots,x_n)"> procedente de una distribución que depende de un parámetro <img src="https://latex.codecogs.com/png.latex?%5Ctheta"> y queremos calcular el estimador de máxima verosimilitud de <img src="https://latex.codecogs.com/png.latex?%5Ctheta">.</p>
<p>Llamamos <img src="https://latex.codecogs.com/png.latex?y=(y_1,%5Cldots,y_m)"> a otros datos correspondientes a información adicional que convertiría el problema en otro mucho más fácil. Normalmente estos datos <img src="https://latex.codecogs.com/png.latex?y"> son en realidad inaccesibles, pero eso no importa en la aplicación del método.</p>
<p>En esta situación podemos plantearnos dos problemas:</p>
<ul>
<li>El problema que realmente tenemos que resolver, que requiere maximizar el logaritmo de la verosimilitud para <img src="https://latex.codecogs.com/png.latex?x">, llamémosla <img src="https://latex.codecogs.com/png.latex?%5Cell%20(%5Ctheta;%20x)">.</li>
<li>El problema <em>simplificado</em>, que requiere maximizar el logaritmo de la verosimilitud completa para <img src="https://latex.codecogs.com/png.latex?(x,y)"> que denotamos <img src="https://latex.codecogs.com/png.latex?%5Cell_c(%5Ctheta;%20x,y)">.</li>
</ul>
<p>Aunque <img src="https://latex.codecogs.com/png.latex?y"> sea en realidad inobservable, si maximizar <img src="https://latex.codecogs.com/png.latex?%5Cell_c"> es más fácil que maximizar <img src="https://latex.codecogs.com/png.latex?%5Cell"> la siguiente idea puede ser útil:</p>
<div class="my-box">
<p><strong>Idea:</strong> Sustituir la verosimilitud completa por una aproximación a partir de la información que realmente tenemos. Para ello, se aproxima <img src="https://latex.codecogs.com/png.latex?%5Cell_c(%5Ctheta;X,Y)"> calculando su esperanza condicionada dado <img src="https://latex.codecogs.com/png.latex?X=x">. Como hay que elegir un valor del parámetro, se usa el más reciente obtenido en la aplicación del algoritmo.</p>
</div>
</section>
<section id="algoritmo" class="level2">
<h2 class="anchored" data-anchor-id="algoritmo">Algoritmo</h2>
<p>La aplicación de la idea anterior lleva al algoritmo EM:</p>
<div class="my-box">
<p>Iniciamos el método con algún valor sensato <img src="https://latex.codecogs.com/png.latex?%5Ctheta_0">. Sea <img src="https://latex.codecogs.com/png.latex?%5Ctheta_k"> el valor del parámetro tras <img src="https://latex.codecogs.com/png.latex?k"> iteraciones. En cada iteración hay que dar los dos pasos siguientes:</p>
<ul>
<li><strong>PASO E (Esperanza)</strong> Se sustituye la log-verosimilitud completa por su esperanza condicionada a <img src="https://latex.codecogs.com/png.latex?x">, suponiendo que <img src="https://latex.codecogs.com/png.latex?%5Ctheta_k"> fuese el verdadero valor del parámetro:</li>
</ul>
<p><img src="https://latex.codecogs.com/png.latex?Q(%5Ctheta;%5Ctheta_k,x):=%20%5Cmbox%7BE%7D_%7BY%7Cx;%5Ctheta_k%7D%5B%5Cell_c(%5Ctheta;x,Y)%5D."></p>
<ul>
<li><strong>PASO M (Maximización)</strong> Se maximiza en <img src="https://latex.codecogs.com/png.latex?%5Ctheta"> la función <img src="https://latex.codecogs.com/png.latex?Q(%5Ctheta;%5Ctheta_k,x)">, lo que da lugar al siguiente valor del parámetro, <img src="https://latex.codecogs.com/png.latex?%5Ctheta_%7Bk+1%7D">.</li>
</ul>
<p>Se reiteran los pasos E y M hasta que se cumple algún criterio de convergencia.</p>
</div>
<p><br></p>
<p>Bajo condiciones de regularidad (hay muchos artículos que analizan el comportamiento de este método) puede demostrarse que en cada paso se mejora el objetivo del problema que realmente queremos resolver, es decir, <img src="https://latex.codecogs.com/png.latex?%5Cell(%5Ctheta_%7Bk+1%7D;%20x)%5Cgeq%20%5Cell(%5Ctheta_k;%20x)"> y que la sucesión de valores generada converge a <img src="https://latex.codecogs.com/png.latex?%5Chat%5Ctheta">, el estimador de máxima verosimilitud <strong>correspondiente a la muestra <img src="https://latex.codecogs.com/png.latex?x"> que realmente tenemos</strong>.</p>
</section>
<section id="ejemplo" class="level2">
<h2 class="anchored" data-anchor-id="ejemplo">Ejemplo</h2>
<p>Este es un ejemplo sencillo que sirve para ilustrar las ideas anteriores. Para resolver el mismo problema podría usarse cualquier otro método de optimización razonable.</p>
<p>Supongamos que las observaciones <img src="https://latex.codecogs.com/png.latex?x_1,%5Cldots,x_n"> son independientes y vienen con probabilidad <img src="https://latex.codecogs.com/png.latex?1-p"> de una distribución con densidad <img src="https://latex.codecogs.com/png.latex?f_0"> y con probabilidad <img src="https://latex.codecogs.com/png.latex?p"> de otra distribución <img src="https://latex.codecogs.com/png.latex?f_1">. Tanto <img src="https://latex.codecogs.com/png.latex?f_0"> como <img src="https://latex.codecogs.com/png.latex?f_1"> son conocidas y el objetivo es estimar la proporción de observaciones <img src="https://latex.codecogs.com/png.latex?p"> que vienen de <img src="https://latex.codecogs.com/png.latex?f_1">. La función de densidad de los datos es <img src="https://latex.codecogs.com/png.latex?f(x)%20=%20(1-p)f_0(x)%20+%20pf_1(x)"> (para comprobarlo, se usa la fórmula de la probabilidad total). Por lo tanto, la log-verosimilitud que tenemos que maximizar es <img src="https://latex.codecogs.com/png.latex?%5Cell(p;%20x)%20=%20%5Csum_%7Bi=1%7D%5En%20%5Clog%20%5B(1-p)f_0(x_i)%20+%20p%20f_1(x_i)%5D."> No es posible encontrar explícitamente el valor de <img src="https://latex.codecogs.com/png.latex?p"> que maximiza esta función por lo que hay que recurrir a algún método numérico.</p>
<p>Si alguien nos dijera a qué distribución pertenece cada observación el problema sería inmediato de resolver. Escribimos <img src="https://latex.codecogs.com/png.latex?y_i=1"> si la observación <img src="https://latex.codecogs.com/png.latex?x_i"> viene de <img src="https://latex.codecogs.com/png.latex?f_1"> e <img src="https://latex.codecogs.com/png.latex?y_i=0"> si viene de <img src="https://latex.codecogs.com/png.latex?f_0">. La verosimilitud completa correspondiente a <img src="https://latex.codecogs.com/png.latex?(x,y)"> es <img src="https://latex.codecogs.com/png.latex?%0AL_c(p;x,y)%20:=%20%5Cprod_%7Bi=1%7D%5En%20%5B(1-p)f_0(x_i)%5D%5E%7B1-y_i%7D%5Bp%20f_1(x_i)%5D%5E%7By_i%7D,%0A"> y tomando logaritmos, <img src="https://latex.codecogs.com/png.latex?%0A%5Cell_c(p;%20x,y)%20=%20%5Csum_%7Bi=1%7D%5En%20%5B(1-y_i)%5Clog(1-p)+y_i%5Clog%20p%20%20%20%5D%20+%20C,%0A"> donde <img src="https://latex.codecogs.com/png.latex?C"> no depende del parámetro <img src="https://latex.codecogs.com/png.latex?p">, por lo que es irrelevante para nuestros propósitos. Derivando respecto a <img src="https://latex.codecogs.com/png.latex?p"> es fácil ver que el óptimo se alcanza en el valor <img src="https://latex.codecogs.com/png.latex?n%5E%7B-1%7D%5Csum_%7Bi=1%7D%5En%20y_i">. Como no podía ser de otra manera, si conocemos de dónde viene cada observación estimamos <img src="https://latex.codecogs.com/png.latex?p"> como la proporción de valores muestrales que vienen de <img src="https://latex.codecogs.com/png.latex?f_1">.</p>
<p>Nosotros no sabemos de qué distribución viene cada <img src="https://latex.codecogs.com/png.latex?x_i"> pero si aplicamos la fórmula de Bayes y usamos el valor <img src="https://latex.codecogs.com/png.latex?p_k"> del parámetro,</p>
<p><span id="eq-esperanza"><img src="https://latex.codecogs.com/png.latex?%0Ay_%7Bi,k%7D%20:=%5Cmbox%7BE%7D(Y_i%7Cx_i;p_k)%20=%20%5Cfrac%7Bp_kf_1(x_i)%7D%7Bp_kf_1(x_i)%20+%20(1-p_k)f_0(x_i)%7D.%0A%5Ctag%7B1%7D"></span></p>
<p>Como consecuencia, los dos pasos del algoritmo se reducen a:</p>
<p><strong>PASO E:</strong></p>
<p>Salvo sumandos que no dependen de <img src="https://latex.codecogs.com/png.latex?p">,</p>
<p><img src="https://latex.codecogs.com/png.latex?Q(p;p_k)%20=%20%20%5Csum_%7Bi=1%7D%5En%20%5B(1-y_%7Bi,k%7D)%5Clog(1-p)%20+%20y_%7Bi,k%7D%5Clog%20p%5D,"> donde <img src="https://latex.codecogs.com/png.latex?y_%7Bi,k%7D"> se calcula mediante la ecuación (1).</p>
<p><strong>Paso M:</strong></p>
<p>Maximizamos <img src="https://latex.codecogs.com/png.latex?Q(p;p_k)">. Para ello derivamos e igualamos a cero y obtenemos <img src="https://latex.codecogs.com/png.latex?%0Ap_%7Bk+1%7D%20=%20%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi=1%7D%5En%20y_%7Bi,k%7D.%0A"> Un ejemplo numérico con datos simulados se muestra a continuación. Primero simulamos <img src="https://latex.codecogs.com/png.latex?n=100"> datos que pueden venir de una normal estándar (con probabilidad <img src="https://latex.codecogs.com/png.latex?p=0.8">), o de una normal de media 4 y varianza 1 (con probabilidad <img src="https://latex.codecogs.com/png.latex?1-p=0.2">):</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb1" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb1-1"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Generamos datos de una N(0,1) o de una N(4,1)</span></span>
<span id="cb1-2"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">set.seed</span>(<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">156</span>)</span>
<span id="cb1-3">n <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">100</span></span>
<span id="cb1-4">p <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fl" style="color: #AD0000;
background-color: null;
font-style: inherit;">0.8</span>  <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># objetivo a estimar</span></span>
<span id="cb1-5">media <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">4</span></span>
<span id="cb1-6"></span>
<span id="cb1-7">y <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">rbinom</span>(n, <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span>, p)  </span>
<span id="cb1-8">x <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">rnorm</span>(n)</span>
<span id="cb1-9">n0 <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">sum</span>(y<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">==</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">0</span>)</span>
<span id="cb1-10">x[y<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">==</span><span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">0</span>] <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">rnorm</span>(n0, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">mean =</span> media)</span>
<span id="cb1-11"></span>
<span id="cb1-12"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Representa histograma de los datos</span></span>
<span id="cb1-13"></span>
<span id="cb1-14"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">library</span>(ggplot2)</span>
<span id="cb1-15"><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">ggplot</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">data.frame</span>(x)) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span></span>
<span id="cb1-16">  <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">geom_histogram</span>(<span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">aes</span>(<span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">x =</span> x), <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">col =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">'black'</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">fill =</span> <span class="st" style="color: #20794D;
background-color: null;
font-style: inherit;">'olivedrab4'</span>, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">bins =</span> <span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">20</span>)</span></code></pre></div></div>
<div class="cell-output-display">
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="/~joser.berrendero/caminos_aleatorios/posts/018-em/index_files/figure-html/unnamed-chunk-1-1.png" class="img-fluid quarto-figure quarto-figure-center figure-img" style="width:75.0%"></p>
</figure>
</div>
</div>
</div>
<p>En el histograma se observa claramente la bimodalidad correspondiente a las dos posibles distribuciones de las que pueden venir los datos. Ahora fingimos que no conocemos que <img src="https://latex.codecogs.com/png.latex?p=0.8"> y aplicamos el algoritmo EM a la muestra <code>x</code> (no usamos para nada <code>y</code>, que es la variable que nos informa de qué distribución viene cada observación). Usamos el valor inicial <img src="https://latex.codecogs.com/png.latex?p_0=1/2">.</p>
<div class="cell" data-layout-align="center">
<div class="code-copy-outer-scaffold"><div class="sourceCode cell-code" id="cb2" style="background: #f1f3f5;"><pre class="sourceCode r code-with-copy"><code class="sourceCode r"><span id="cb2-1"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Iniciamos el algoritmo</span></span>
<span id="cb2-2">p_k <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fl" style="color: #AD0000;
background-color: null;
font-style: inherit;">0.5</span></span>
<span id="cb2-3">tol <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fl" style="color: #AD0000;
background-color: null;
font-style: inherit;">0.1</span></span>
<span id="cb2-4"></span>
<span id="cb2-5"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Pasos E-M</span></span>
<span id="cb2-6"><span class="cf" style="color: #003B4F;
background-color: null;
font-weight: bold;
font-style: inherit;">while</span>(tol <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">&gt;</span> <span class="fl" style="color: #AD0000;
background-color: null;
font-style: inherit;">0.001</span>){</span>
<span id="cb2-7">  p_0 <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> p_k</span>
<span id="cb2-8">  y_k <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> p_0<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">dnorm</span>(x)<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">/</span>(p_k<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">dnorm</span>(x) <span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">+</span> (<span class="dv" style="color: #AD0000;
background-color: null;
font-style: inherit;">1</span><span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">-</span>p_0)<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">*</span><span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">dnorm</span>(x, <span class="at" style="color: #657422;
background-color: null;
font-style: inherit;">mean =</span> media))  <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Paso E</span></span>
<span id="cb2-9">  p_k <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">mean</span>(y_k) <span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;"># Paso M</span></span>
<span id="cb2-10">  tol <span class="ot" style="color: #003B4F;
background-color: null;
font-style: inherit;">&lt;-</span> <span class="fu" style="color: #4758AB;
background-color: null;
font-style: inherit;">abs</span>(p_k<span class="sc" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">-</span>p_0)</span>
<span id="cb2-11">}</span>
<span id="cb2-12">p_k</span>
<span id="cb2-13"><span class="co" style="color: #5E5E5E;
background-color: null;
font-style: inherit;">#&gt; [1] 0.8179144</span></span></code></pre></div></div>
</div>
<p>Se obtiene el valor 0.818, cercano al valor verdadero. Hemos supuesto las dos distribuciones conocidas. Una situación de más interés y más complicada sería no suponer las medias conocidas y tratar de estimar por máxima verosimilitud tanto <img src="https://latex.codecogs.com/png.latex?p"> como las dos medias.</p>


</section>

 ]]></description>
  <category>Estimación</category>
  <guid>/~joser.berrendero/caminos_aleatorios/posts/018-em/</guid>
  <pubDate>Thu, 28 Mar 2024 23:00:00 GMT</pubDate>
  <media:content url="/~joser.berrendero/caminos_aleatorios/posts/018-em/em.png" medium="image" type="image/png" height="103" width="144"/>
</item>
</channel>
</rss>
