Portada » Matemáticas » Serie estadistica y distribucion de frecuencia
ESTADISTICA DESCRIPTIVA
estadística descriptiva ciencia que analiza series de datos y trata de extraer conclusiones sobre el comportamiento de estas variables.
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).
Tienen valor numérico (edad, precio de un producto, ingresos anuales).
las variables cuantitativas se pueden clasificar en discretas y continuas:
Sólo pueden tomar valores enteros (1 ). Por ejemplo: número de hermanos Continuas:
Pueden tomar cualquier distribución de frecuencia es la representación de toda la información que se ha recogido sobre Las medidas de posición son de dos tipos:
informan sobre los valores medios de la serie de datos. b) Medidas de posición no centrales: informan de como se distribuye el resto de los valores de la serie.
1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo las más utilizadas:
se calcula multiplicando cada valor por el número de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra:
es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores).
Se suelen utilizar una serie de valores que dividen la muestra en tramos iguales:
son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados.
son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.
son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.
medidas de dispersión:
mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo.
Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las difrencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.
Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.
El interés del coeficiente de variación es que al ser un porcentaje permite comparar el nivel de dispersión de dos muestras. Esto no ocurre con la desvación típica, ya que viene expresada en las mismas unidas que los datos de la serie.
Las medidas de forma permiten conocer que forma tiene la curva que representa la serie de datos de la muestra. En concreto, podemos estudiar las siguientes características de la curva:
mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la muestra.
mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma (centro de simetría) los segmentos de curva que quedan a derecha e izquierda son similares.
Hemos comentado que el concepto de asimetría se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media aritemética)
Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher, que viene definido:
g1 = 0 (distribución simétrica;
Existe la misma concentración de valores a la derecha y a la izquierda de la media)
g1 > 0 (distribución asimétrica positiva;
Existe mayor concentración de valores a la derecha de la media que a su izquierda)
g1 <> (distribución asimétrica negativa;
Existe mayor concentración de valores a la izquierda de la media que a su derecha)
mide si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra.
El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución.
Se definen 3 tipos de distribuciones según su grado de curtosis:
presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).
: presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
Presenta un reducido grado de concentración alrededor de los valores centrales de la variable.
El Coeficiente de Curtosis viene definido por la siguiente fórmula:
Los resultados pueden ser los siguientes:
g2 < 0=»» (distribución=»»>)
.
El Teorema del Límite Centraldice que si tenemos un grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribución (cualquiera que éste sea), la suma de ellas se distribuye según una distribución normal.