Portada » Filosofía » Ejercicios de estadistica datos agrupados
de la media porque no le afectan los valores extremos.4. Diagrama de caja y bigotes: ¿para qué tipo de variables se usan? ¿cómo se construyen? ¿qué tipo de información descriptiva aportan?Se utilizan para variables cuantitativas continuas. Describen medidas de posición (mediana y cuantiles), medidas de dispersión ( RQ o bigotes) y medidas de simetría.Tiene dos partes: –La caja, que tiene dos lados, divididos por tres líneas. La primera línea representa el primer cuantil, la segunda (la que divide el cuadro) el segundo cuantil y la tercera el tercer cuantil. El segundo cuantil representa la mediana. Cuando más anchos sean los cuantiles significa que más dispersos están los datos. También posee un segmento vertical que nos da la mediana (Q2,P50). Esta caja se ubica sobre un segmento que tiene como extremos los valores mínimos y máximos de la variable.-Los bigotes: para construir los bigotes primero tenemos que calcular el rango intercuartílico que es la distancia entre el cuantil 3 y el cuantil 1. RQ=Q3-Q1.Calculamos la longitud de los bigotes multiplicando el RQ x 1.5 y ahí cortamos los bigotes. Todos los valores que estén fuera los llamaremos outliers. La principal desventaja es que no aportan información sobre la frecuencia de los datos.El diagrama de cajas y bigotes se construye:1º) Dibujamos la caja indicando el lado inferior (Q1, P25) y el lado superior (Q3,P75).2º) Se calcula el rango intercuantílico RQ=Q3-Q1 que nos dará la anchura de la caja, y nos indica la concentración del 50%.3º) Hallamos la longitud de los bigotes mediante la fórmula: L=1’5xRQ.4º) Una vez calculada la longitud de los bigotes, Nos aporta mucha información descriptiva ya que además de medida de posición, medidas de dispersión y medidas de simetría, nos aportan:1º) Proporcionan una visión general de la simetría de la distribución de los datos. Si la mediana no esta en el centro del rectángulo, la distribución no es simetrica.2º) Son utiles para ver la presencia de valores atípicos (outliers).3º)la caja concentra el 50% de los datos centrales, con lo cual esto nos dará la dispersión del 50% de los datos centrales.De todas formas la información que nos da no es concluyente por lo que nos obliga a realizar otros estudios.5. Media Muestral: definición y formula, interpretación y ejemplo real.La media se define como la suma de valores observados dividida por el número de observaciones.Fórmula:Por ejemplo, si un equipo marca 60 goles en 38 partidos, la media muestral seria: 60/38=1´57 goles por partido.6. Desviación típica : definición y formula, interpretación y ejemplo real.La desviación típica se presenta como la raíz cuadrada de la varianza, es decir, la raíz de la media de los cuadrados de las puntuaciones de desviación. Siempre va a depender de la media, ya que es la desviación respecto a esta. Se presenta con la letra sigma y se representa como σ2. Se debe interpretar como que si la desviación típica es más grande, hay más dispersión en los datos y viceversa. También es muy sensible a los valores extremos. Su fórmula es esta:La desviación típica por lo tanto nos ofrece información sobre cómo están distribuidos los datos alrededor de la media, es decir, si los datos están muy lejos o no de la media.La desviación típica es necesaria para conocer con detalle