lunes, 20 de octubre de 2008

Distribución normal, campana de Gauss y algunas confusiones(ii)

Se sabe que mucho de lo que pasa y somos tiene relación con la probabilidad y la estadística. Desde cuánto medimos a la evolución del clima en Indonesia están por un lado sujetos a cierta grado de incertidumbre y por otro son susceptibles de ser observados y medidos.

De entre muchas de las cosas que cumplen las dos anteriores condiciones, hay una gran parte cuya medición utiliza una escala real y contínua. Los sueldos, el peso, la estatura, el consumo energético, el error en micras en la fabricación de un tornillo y podríamos seguir ad infinitum. Cuando observamos estas magnitudes en muchas mediciones (sujetas en algún momento al "azar") tenemos una sucesión de variables aleatorias. Tendremos distintas medidas para cada medición. Cada una dependerá de muchos factores que los harán variar de una a otra.

Bien , aquí viene el objetivo de esta serie de artículos. Resulta que cuando uno estudia o lee acerca de la distribución Normal o Gaussiana se le suele decir que este tipo de magnitudes (o la colección de mediciones) tiende a una normal con unos determinados parámetros. ¿Por qué? ¿por acto de fe? ¿es esto cierto?

Bien, en la realidad ninguna magnitud poblacional contínua tiene una distribución teórica a priori, a menos que sea un experimento no afectado por el azar. Ni sueldos, ni estaturas, ni pesos tendrían en principio por qué seguirla. Pueden ser normales , pero podrían no serlo. Ahora bien, si lo que hacemos es extraer muestras , entonces los valores de esa muestra , de alguna manera, sí. Si lo que medimos lo expresamos en función de "cúmulos" de azar, entonces podemos empezar a ver la luz. Tiene una explicación, un tanto compleja, pero que intentaré resumir de la manera más sencilla posible.

Empezaremos por el final, por el teorema que da forma a la demostración de nuestra tésis. Este es el Teorema Central del Límite (TCL). A partir de una serie de resultados previos, este lema enuncia que la suma (consecuentemente el promedio) de una gran cantidad de variables aleatorias (en adelante v.a.) sigue una distribución Normal. ¿Las condiciones? Media y variabilidad finitas. Ya vemos cómo aparece la observación de muchos datos y la distribución normal.

Aclararemos eso de la suma de v.a. Consideremos X1,X2,..,Xn una muestra de la población , por ejemplo la estatura de n niños de 10 años de un mismo colegio. Lo que dice el TCL es que a medida que ese n es grande , el promedio de alturas sigue una distribución Normal. Es decir, si cogiéramos varias muestras de por ejemplo 15 alumnos y calculásemos la media de altura, esas medias seguirían una distribución Normal independientemente de cual fuera la distribución de probabilidad original. En concreto el promedio de estas alturas seguirá una N(μ,σ2/n) donde μ es la media poblacional y σ2 es la varianza de la población.

Visto el concepto del TCL , podemos aclarar porqué muchas magnitudes que se dan en la naturaleza siguen una distribución aproximadamente normal. Si algo se produce por acumulación de muchos factores provinientes del azar y el conjunto de estos factores es el mismo, podemos de lo anterior inferir que cada medición es el resultado de la suma de muchas v.a. idénticamente distribuidas, que como hemos visto converge una distribución Normal.

Según lo ve un servidor, es más bien que observamos una normal en los pesos y deducimos que su distribución está condicionada por muchos factores aditivos determinados por el azar. El resultado de convergencia a eso que llamaos normal es algo teórico, lo observado y su similitud , algo práctico. Como lo observado parece similar a lo teórico, llegamos a las hipótesis. Es muy difícil asegurar si no, que el peso de los habitantes de un pueblo tiene una distribución Normal "per se".

Para terminar os pondré una gráfica vista en el estudio Variación del peso durante el primer mes de vida en recién nacidos de término sanos con lactancia materna exclusiva


























Nada más que añadir. En la siguiente y última entrega veremos la demostración formal de todo esto.

Salimos hasta la próxima entrada. Para seguir el artículo podéis ir aquí.

No hay comentarios: