El fichero star.txt contiene la temperatura y la intensidad de la luz en un conjunto de estrellas. Calcula y representa la recta de mínimos cuadrados para explicar la temperatura en función de la intensidad de la luz. Comenta el resultado.


Solución:

X = read.table("http://verso.mat.uam.es/~amparo.baillo/MatEstI/star.txt",header=T)

recta = lm(X$Temp~X$Intens)
summary(recta)
## 
## Call:
## lm(formula = X$Temp ~ X$Intens)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.74310 -0.09414  0.06371  0.17744  0.37512 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  4.84691    0.37422  12.952   <2e-16 ***
## X$Intens    -0.10712    0.07419  -1.444    0.156    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2875 on 45 degrees of freedom
## Multiple R-squared:  0.04427,    Adjusted R-squared:  0.02304 
## F-statistic: 2.085 on 1 and 45 DF,  p-value: 0.1557
plot(X$Intens,X$Temp,pch=20,xlab="Intensidad",ylab="Temperatura")
abline(recta, col="red", lwd=2)

Vemos que no es razonable ajustar la recta a la muestra con todos los puntos. En comparación con el resto de la muestra, hay al menos cuatro puntos que tienen un valor muy bajo de temperatura teniendo en cuenta su alta intensidad de luz. Seguramente se hayan juntado observaciones de dos poblaciones (o tipos) de estrellas diferentes y esto da lugar a dos grupos de observaciones (uno de ellos con cuatro puntos) que no son homogéneos.