Ejercicio 1 Un fabricante de equipo deportivo afirma que un nuevo sedal sintético tiene una resistencia media a la tensión de 8 kg. Se sabe que la resistencia a la tensión es una v.a. con distribución normal con desviación típica \(\sigma = 0.5\). Se prueba una muestra de 50 sedales y se obtiene, para la muestra, una resistencia media de 7.8 kg.
Si queremos encontrar evidencia estadística de que lo que dice el fabricante es falso, ¿cuál es la hipótesis nula y la alternativa del contraste que hay que llevar a cabo?
Al nivel \(\alpha = 0.05\), ¿podemos afirmar que la especificación del fabricante no es cierta?
Calcula el p-valor del contraste. ¿Qué decisión se tomaría para \(\alpha = 0.001\)?
Para el nivel de significación \(\alpha = 0.05\), ¿cuál es la probabilidad de error de tipo 2 que se comete si realmente la resistencia media fuese de 7.8 kg?
Ejercicio 2 La aterosclerosis coronaria (AC) es una de las principales causas de mortalidad en los países occidentales. Se cree que la oxidación del colesterol de baja densidad [ver, por ejemplo, Steinberg et al. (1989),
Se han determinado los valores de epicatequina (una sustancia fenólica) en 10 muestras de vino tinto, encontrando que la media muestral era 195.1 mg/l y el error típico 10.051. Los correspondientes valores para 10 muestras de cerveza fueron 65.5 mg/L y 3.4184. En vista de estos resultados ¿puede decirse que son significativamente diferentes los contenidos medios de esta sustancia en el vino tinto y en la cerveza?
Responde a la misma pregunta para el caso del ácido ferúlico en el que los resultados obtenidos fueron, para el vino tinto, 7.2 mg/l (media) y 0.4541 mg/l (error típico) (tamaño muestral = 10) y para la cerveza 6.8 mg/l (media) y 0.3571 mg/l (error típico) (tamaño muestral = 10).
Ejercicio 3 Se realiza un experimento para comparar los incrementos en los niveles plasmáticos de insulina producidos por la ingesta de carne y de pescado. Para ello se midieron los incrementos (medidos en picomoles por litro) producidos en la concentración de insulina en la sangre de 6 voluntarios, 90 minutos después de comer un bistec de 250 gr. Dos días más tarde se realizó de nuevo el experimento con las mismas 6 personas, después de consumir un filete de pescado. En la siguiente tabla se indican los respectivos incrementos en la concentración de insulina producidos por la carne y por el pescado:
¿Proporcionan estos datos suficiente evidencia estadística, al nivel de significación 0.05, para afirmar que el incremento medio en la concentración de insulina producido por el consumo de carne es mayor que el producido por el consumo de pescado? Responde a la misma pregunta anterior utilizando un nivel de significación de 0.01. Indica las suposiciones previas necesarias para garantizar la validez del procedimiento empleado.
Calcula el tamaño muestral que sería necesario para estimar el incremento medio producido por el consumo de carne, de manera que se tenga una probabilidad 0.95 de cometer, como máximo, un error de 0.2 unidades.
Ejercicio 4 Se sospecha que ciertos riesgos ambientales y laborales pueden alterar la proporción de nacimientos de varones. En particular, hay controversia respecto al efecto que la exposición a radiación ionizante tiene sobre el sex ratio o cociente del número de nacimientos masculinos respecto a aquél de nacimientos femeninos. Scherb et al. (2013) 1 estudiaron el efecto sobre el sex ratio del accidente en la Central Nuclear de Chernóbil (Ucrania) en abril de 1986. Concretamente, desde 1959 hasta 1986 (ambos años incluidos) nacieron en Rusia 31706752 varones de un total de 61890823 nacimientos. Desde 1987 hasta el 2010 (ambos años incluidos) en Rusia nacieron 38360531 bebés de los que 19727605 fueron varones.
A nivel \(\alpha=0.05\), ¿hay suficiente evidencia estadística de que el accidente de Chernóbil redujo la proporción de nacimientos de niñas (sobre el total de nacimientos) en Rusia?
Explica el siguiente código de R e interpreta la correspondiente salida:
2-sample test for equality of proportions without continuity
correction
data: c(31706752, 19727605) out of c(61890823, 38360531)
X-squared = 366.74, df = 1, p-value < 2.2e-16
alternative hypothesis: less
95 percent confidence interval:
-1.000000000 -0.001798013
sample estimates:
prop 1 prop 2
0.5123013 0.5142683
A nivel de significación del 5 %, ¿hay evidencia a favor de la hipótesis de que la proporción de nacimientos de varones sobre el total de nacimientos después del accidente nuclear es diferente de la proporción análoga a nivel mundial, que es de 0.517?
Ejercicio 5 En una piscifactoría se desea contrastar la hipótesis nula de que el porcentaje de peces adultos que miden menos de 20 cm es como máximo del 10%. Para ello, se toma una muestra de 6 peces y se rechaza \(H_0\) si se encuentra más de uno con longitud inferior a 20 cm.
¿Cuál es el nivel de significación de este contraste?
Calcula la potencia del contraste si en realidad hay un 20% de peces que miden menos de 20 cm.
Ejercicio 6 Se desea obtener una muestra de vaiid de una población normal con desviación típica conocida \(\sigma=2\). El objetivo es contrastar la hipótesis nula \(H_0:\mu=5\) frente a \(H_1:\mu=6\) con una probabilidad de error de tipo I igual a \(0.05\) y una probabilidad de error de tipo II igual a \(0.363\). Si se utiliza el contraste uniformemente más potente que da el lema de Neyman-Pearson, ¿cuál es el tamaño muestral necesario?
Ejercicio 7 Consideramos una muestra \(X_1,\ldots,X_n\) de vaiid de una población con función de densidad \(f(x,\theta) = \theta(1-x)^{\theta-1}\), si \(0\leq x\leq 1\) (y 0 en el resto), donde \(\theta>0\). Se desea contrastar \(H_0:\theta=2\) frente a \(H_1:\theta\neq 2\). Si \(n=60\) y \(\prod_{i=1}^{60}(1-x_i) = 0.0003\), ¿cuál es la decisión que hay que adoptar si se utiliza el comportamiento asintótico del contraste de razón de verosimilitudes?
Ejercicio 8 Se desea contrastar la hipótesis nula de que una muestra aleatoria simple de tamaño \(n\) procede de una distribución uniforme en el intervalo [0,1] frente a la hipótesis alternativa de que procede de una distribución con función de densidad \(f(x)=2x\), si \(0\leq x\leq 1\).
Si \(n=1\), es decir, se dispone de una única observación, calcula la región crítica del contraste uniformemente más potente de nivel \(0.05\).
¿Cuál es la probabilidad de error de tipo II de este contraste?
Si \(n=12\) y \(\sum_{i=1}^{12} \log x_i= -4.5\), ¿qué decisión hay que tomar de acuerdo con el contraste uniformemente más potente de nivel \(\alpha = 0.05\)?
Ejercicio 9 Se mide el grado \(X\) de expresión de un gen en el tejido ovárico de 23 mujeres sanas 2, obteniéndose los siguientes datos:
Determina si hay suficiente evidencia muestral de que el nivel esperado de expresión de ese gen es diferente en mujeres sanas y en pacientes con cáncer de ovario. ¿Se puede aceptar la igualdad de varianzas?
Ejercicio 10 Sean \(X_1,\ldots, X_n\) vaiid de una población con función de densidad \(f(x,\theta)=e^{-(x-\theta)}\), si \(x\geq\theta\) (y 0 en caso contrario). Escribe la región crítica del contraste de razón de verosimilitudes de nivel \(\alpha\) para contrastar \(H_0:\theta\leq\theta_0\) frente a \(H_1:\theta>\theta_0\)
Ejercicio 11 La gerente de un hospital privado afirma que, durante los fines de semana, el tiempo medio de espera en urgencias es de 10 minutos. Basándose en su experiencia personal, un facultativo afirma, por el contrario, que el tiempo medio que un paciente de urgencias espera, durante el fin de semana, hasta que es atendido es superior a lo que dice la dirección del hospital. El facultativo recoge durante varios fines de semana los tiempos de espera de 40 pacientes elegidos al azar en el servicio de urgencias. El promedio de tiempos de espera de los 40 pacientes es 11 minutos con una desviación típica de 3 minutos. A nivel de significación del 5 %, ¿hay suficiente evidencia muestral a favor de la opinión del facultativo? ¿Qué puedes decir sobre el p-valor del contraste? (Se supone que los datos tienen distribución normal.)
Ejercicio 12 Sean \(X_1,\ldots,X_n\) vaiid cuya distribución \(F_\theta\) es tal que \(F_\theta(x)=F(x-\theta)\), donde \(F\) es continua, estrictamente creciente y \(F(0)=1/2\) (es decir, \(F\) tiene mediana 0 y \(\theta\) es la mediana de \(F_\theta\)). Queremos contrastar \(H_0:\, \theta\leq 0\) frente a \(H_1:\theta> 0\). Para ello utilizamos el contraste definido por la región crítica \(R=\{ T_n > c\}\), donde \(T_n = \#\{i:\, X_i>0\}\) es el número de observaciones positivas en la muestra.
¿Cuál es la distribución de \(T_n\)? ¿Cuánto valen, en función de \(\theta\), \(\mbox{E}(T_n)\) y \(\mbox{Var}(T_n)\)?
Determina cuánto debe valer el valor crítico \(c\) para que el contraste tenga nivel de significación aproximado \(\alpha\).
Supongamos que la muestra es de tamaño \(n=36\) y procede de una distribución normal de media \(\theta\) y varianza 1. Calcula la función de potencia aproximada del contraste anterior si \(\alpha=0.05\).
Ejercicio 13 Sea \(X_1,\ldots,X_n\) una muestra de una v.a. exponencial con parámetro \(\theta\). Se desea contrastar, al nivel de significación \(\alpha=0.01\), \(H_0:\theta=5\) frente a \(H_1:\theta=\theta_1\) (siendo \(\theta_1>5\) un valor prefijado).
Calcula la región crítica del test UMP.
Calcula la probabilidad de error de tipo II en este test.
Supongamos que para una determinada muestra, se obtiene \(\sum_{i=1}^5x_i=5\). ¿Qué decisión habría que adoptar si se utiliza el test construido en el primer apartado?
Ejercicio 14 Sea \(X_1,\ldots,X_{16}\) una muestra de tamaño 16 de una población normal de esperanza \(\mu\) y varianza \(\sigma^2=1\). Se desea contrastar \(H_0:\, \mu=0\) frente a \(H_1:\, \mu\neq 0\).
Calcula la región crítica del contraste de razón de verosimilitudes de nivel \(\alpha=0.05\). ¿Qué decisión se toma a nivel \(\alpha =0.05\) si con 16 datos se ha obtenido una media muestral \(\bar{x}=1\)?
Para el contraste anterior, ¿cuál es el valor de la función de potencia evaluada en \(\mu = 0.75\)?
Ejercicio 15 Una variable aleatoria positiva \[f(x;\theta) = \frac{\theta}{(\theta+x)^2}, \quad x>0, \quad \theta>0.\] Consideramos el contraste de hipótesis \(H_0:\theta=2\) frente a \(H_1:\theta=3\). Supongamos que tenemos una muestra \(x\) de tamaño \(n=1\). Calcula la expresión explícita de la región crítica del test uniformemente más potente de nivel \(\alpha=0.05\).
Notas
Scherb, H. Kusmierz, R. y Voigt, K. (2013). Increased sex ratio in Russia and Cuba after Chernobyl: a radiological hypothesis. Environmental Health, 12:63.↩︎
Pepe et al. (2003). Selecting Differentially Expressed Genes from Microarray Experiments. Biometrics, 59, 133–142.↩︎