miércoles, 15 de octubre de 2008

Distribución normal, campana de Gauss y algunas confusiones(i)

Esta entrada, que será primera parte de una serie de entradas, la vamos a dedicar a la más normal de las distribuciones de probabilidad, aquella que se representa con la campana de Gauss y que parece estar detrás de la estructura y composición de muchas cosas en las que el azar interviene. Al traducir al lenguaje matemático no encontramos a menudo con la denominada distribución Normal.

Durante mis estudios y todavía hoy siento gran interés por saber el porqué de ciertas cosas que se dan por sentadas. Todo el mundo sabe por ejemplo que los barcos flotan, pero no todo el mundo sabe realmente por qué. Este ejemplo puede ser un poco infantil, pero quizá refleja el objetivo de este artículo.

El caso es que adentrándonos ya en la estadística y la probabilidad , desde muy pronto se nos plantea que muchas distribuciones , expresadas en suma o sucesión acaban como por arte de magia siendo una distribución normal y se nos dice que de manera "natural" pesos, estaturas, sueldos siguen una distribución normal,e incluso para muchos análisis de datos, normalmente de varias variables, solemos suponer "normalidad" , casi dando por sentado que una sucesión de datos tendrá esta distribución.

Pero realmente, ¿cuál es el fundamento de esto? Veremos como no todo lo dicho en el párrafo enterior es cierto. En concreto se asocia muchas veces la normalidad de ciertas magnitudes como el peso o la estatura , pero eso no quiere decir que sea así "por ley". Sin embargo, sí es cierto que la suma o el promedio de alturas y pesos siempre lo son.

No obstante es cierto que muchas magnitudes se distribuyen como una Normal. Pero, ¿Qué es exactamente una distribución normal? .Se dice que una variable aleatoria sigue una distribución normal cuando su función de densidad es:


f(x)=

donde μ representa la media y σ la desviación típica. Esta función fué descubierta por Carl Friederich Gauss y en su honor es comunmente denominada , entre otros nombres, como "campana de Gauss". En wikipedia podemos encontrar este gráfico de cuatro funciones de Gauss , donde varían μ y σ

















Como véis se trata de una distribución continua y simétrica, donde la media , la mediana y la moda son el mismo punto, justo la "cima" de la montaña. El parámetro μ determinará el punto central de la función (media de la v.a.) y σ determinará lo "achatada" o "picuda" que sea la gráfica. σ es la desviación típica, una medida de dispersión de los datos con respecto a su media. A mayor dispersión, más achatada será la campana, y a menor desviación, más agrupados estarán los datos en torno al centro de la curva.

Bueno, por ahora ya sabemos algo de esta distribución de probabilidad tan tan útil y popular. En las siguientes entregas nos adentraremos ya en ver el porqué de tanta popularidad y por qué algo tan aparentemente raro es tan común...

Hasta entonces, salimos hasta la próxima entrada. Para seguir el artículo podeís ir aquí.

No hay comentarios: