martes, 17 de diciembre de 2013

Medidas de Dispersión - Varianza y Desviación


Así como las medidas de tendencia central nos permiten identificar el punto central de los datos, las Medidas de dispersión nos permiten reconocer que tanto se dispersan los datos alrededor del punto central; es decir, nos indican cuanto se desvían las observaciones alrededor de su promedio aritmético (Media). Este tipo de medidas son parámetros informativos que nos permiten conocer como los valores de los datos se reparten a través de eje X, mediante un valor numérico que representa el promedio de dispersión de los datos. Las medidas de dispersión más importantes y las más utilizadas son la Varianza y la Desviación estándar (o Típica).

1. VARIANZA

Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el número de observaciones que se tengan. Si la varianza es calculada a una población (Total de componentes de un conjunto), la ecuación sería:

Ecuación de la varianza para Poblaciones - Medidas de Dispersion


Donde () representa la varianza, (Xi) representa cada uno de los valores, () representa la media poblacional y (N) es el número de observaciones ó tamaño de la población. En el caso que estemos trabajando con una muestra la ecuación que se debe emplear es:

Ecuacion de la Varianza para una muestra - Medidas de dispersion


Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, () representa la media de la muestra y (n) es el número de observaciones ó tamaño de la muestra. Si nos fijamos en la ecuación, notaremos que se le resta uno al tamaño de la muestra; esto se hace con el objetivo de aplicar una pequeña medida de corrección a la varianza, intentando hacerla más representativa para la población. Es necesario resaltar que la varianza nos da como resultado el promedio de la desviación, pero este valor se encuentra elevado al cuadrado.

2. Desviación estándar o Típica

Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo tanto su ecuación sería:

Ecuacion de la Desviación Estándar o Típica - Medidas de Dispersion

Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta porseleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.

Por lo que su media es:


La varianza sería:


Por lo tanto la desviación estándar sería:


Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta información le permite al gerente determinar cuanto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los correctivos necesarios en el proceso de empacado.

jueves, 12 de diciembre de 2013

Como construir una tabla de frecuencia para datos no agrupados en Excel.


En este vídeo nos enseña como calcular la media, varianza, desviación estándar, usando la calculadora científica (CASIO fx-82MS) para datos simples.


GRAFICOS ESTADISTICOS EN RAZONAMIENTO MATEMATICO


IMPORTANCIA Y FUNCIONES DE LA ESTADISTICA EN NUETRA VIDA COTIDIANA

IMPORTANCIA Y FUNCIONES DE LA ESTADISTICA EN NUESTRA VIDAS
La estadística es una de las ramas de la ciencia matemática que se centra en el trabajo con datos e informaciones que son ya de por sí numéricos o que ella misma se encarga de transformar en números.
Podemos decir que la función principal de la estadística es justamente la recolección y agrupamiento de datos de diverso tipo para construir con ellos informes estadísticos que nos den idea sobre diferentes y muy variados temas.
Lo interesante de la estadística como ciencia es que en muchos casos, la información cuantitativa que nos brinda nos permite conocer a ese nivel mucho mejor a una sociedad:
Por ejemplo:
1.-cuántas personas viven en un país
2.-cuál es la tasa de desempleo
3.-cuál es la tasa de indigencia o pobreza
4.-cuál es el nivel promedio de educación de esa sociedad
La estadística tiene una utilidad no sólo en aspectos sociales si no que también sirve para todo tipo de investigación científica si se tiene en cuenta que los datos estadísticos son el resultado de varios casos de entre los cuales se toma un promedio.
TIPOS DE ESTADISTICA:
  • En estadística descriptiva representa todos los tipos de gráficos y calcula la media, moda, mediana, recorrido, varianza y desviación típica.
  • En estadística bidimensional representa la nube de puntos y la recta de regresión. Calcula el centro de gravedad, las desviaciones típicas marginales, la covarianza, el coeficiente de correlación, la recta de regresión y buscar objetivos.
  • En la distribución binomial, calcula cualquier probabilidad, la media, varianza y desviación típica.
  • En la distribución normal, calcula cualquier probabilidad en la normal estándar N(0, 1) y en cualquier normal N(m, s) y genera la tabla N(0, 1)
  • En inferencia estadística calcula los intervalos de confianza, el tamaño de la muestra y se puede aplicar al contraste de hipótesis, tanto en el bilateral como en el unilateral.
  • En probabilidad simula todo tipo de lanzamientos. 
Estadistica cuantitativa y cualitativa
CUANTITATIVA:
Son aquellos que se pueden medir, como pueden ser:
Discretas
Sólo pueden tomar un número finito de valores enteros, los valores posibles de estas variables son aislados.
Ejemplos de variables estadísticas cuantitativas discretas

  •    Número de hermanos: pueden ser 1, 2, 3 …, pero nunca podrá ser 3,45. Número de hijos
  •    Número de empleados de una fábrica.
  •    Número de goles marcados por un equipo de futbol en la liga.
Continuas
Pueden tomar cualquier valor real (infinitos) dentro de un intervalo.   
Ejemplos de variables estadísticas cuantitativas continuas
  •    Velocidad de un vehículo: puede ser 20; 54,2; 100 ; … km/h   •    Temperaturas registradas en un observatorio cada hora.
  •    Peso en kg de los recién nacidos en un día en la cuidad de ecuador.
CUALITATIVOS
No se pueden medir numéricamente.
Ejemplos de variables estadísticas cualitativas
  •    Color de los ojos.   •    Bondad de una persona.
  •    Profesión de una persona.
 RAZONAMIENTO ESTADISTICO
Razonamiento estadístico enseña a los estudiantes cómo hacerse llegar más y mejor información, mostrando el papel de la estadística en muchos aspectos de la vida cotidiana.


.



miércoles, 11 de diciembre de 2013

Construcción de tablas de frecuencias y gráficas estadísticas. Ejercicio...

construcción de tablas de frecuencias y gráficas estadisticas




Medidas de Dispersión


En este vídeo encontraremos paso a paso como calcular la varianza, la desviación standar y el coeficiente de variación, y podremos conocer sus fórmulas y proceso.







Año Internacional de la Estadística


Este 2013 es el Año Internacional de la Estadística, una iniciativa mundial que resalta la contribución del campo de la estadística en la búsqueda de soluciones a los retos globales. Sus objetivos principales son: incrementar la comprensión y la conciencia pública respecto de la relevancia y el impacto de la estadística en todos los aspectos de la sociedad; promover la estadística como profesión, especialmente entre los jóvenes; y promover la creatividad y el desarrollo de las ciencias de la probabilidad y la estadística.

En México, 52 instituciones, de naturaleza y quehaceres diversos, han programado una serie de actividades para difundir el valor de la estadística, como seminarios, conferencias y talleres para todo tipo de público. Para el Centro de Investigación en Matemáticas es un ejercicio muy significativo documentar la importancia de esa disciplina en voz directa de quienes utilizan métodos estadísticos.

Fórmulas de Estadística


Moda
La moda, Moes el valor que tiene mayor frecuencia absoluta.

1º Todos los intervalos tienen la misma amplitud.

fórmula de la moda
Li-1 es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:
moda

Mediana

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.
Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.
Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.

Mediana para datos agrupados

mediana
cociente es la semisuma de las frecuencias absolutas.
Li-1 es el límite inferior de la clase donde se encuentra cociente.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.

Media aritmética

La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.
fórmula de la media
media

Varianza

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
varianzavarianza

Varianza para datos agrupados

varianzavarianza
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
varianzavarianza

Varianza para datos agrupados

varianzavarianza

Desviación típica

La desviación típica es la raíz cuadrada de la varianza.
de relación típicadesviación

Desviación típica para datos agrupados

desviación típicadesviación
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
desviación típicadesviación típica

Desviación típica para datos agrupados

desviación típicadesviación típica

Coeficiente de variación

El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.
coeficiente de variación

Coeficiente de variación en tanto por ciento

Coeficiente de variación

¿Para qué sirve la Estadística?La Estadística puede dar respuesta a muchas de las necesidades que la sociedad actual nos plantea. Su tarea fundamental es la reducción de datos, con el objetivo de representar la realidad y transformarla, predecir su futuro o simplemente conocerla.
La Estadística responde a las necesidades bélicas y fiscales de los gobernantes. Esto se puede conseguir con  un conocimiento claro de la población con la que se cuenta. La herramienta para conseguirlo es el CENSO DE POBLACIÓN y su hermano pequeño, el PADRÓN MUNICIPAL DE HABITANTES.
La práctica del recuento de la población y de algunas características de esta por los Estados es muy antigua (se remonta a 3000 años antes de Cristo en Egipto y Mesopotamia). En palabras de Bielfed, la Estadística es la ciencia que nos enseña el ordenamiento político de todos los estados del mundo conocido, es decir, está al servicio del Estado, de hecho, la palabra Estadística deriva de Estado.
La Estadística responde a la actividad planificadora de la sociedad. Con la Revolución Industrial aparecen nuevos problemas, sobre todo de desigualdades sociales. La Estadística es un instrumento para identificar estas injusticias y para producir información en el llamado Estado del Bienestar.
La Estadística responde a nuevas demandas sociales. Para realizar investigaciones exhaustivas sobre temas sociales surgen tres problemas básicos a la hora del trabajo de campo, como el tiempo que tardaríamos en entrevistar a toda la población y el costo económico y de personal de estas entrevistas. Con las técnicas de MUESTREO se consigue hacer buenas investigaciones sobre una pequeña parte de esa población, obteniendo resultados válidos para toda ella.
La Estadística responde a las necesidades del desarrollo científico y tecnológico de la sociedad. Tras la Revolución Industrial se produce un desarrollo de la sociedad en todos sus ámbitos y, en particular, en el Científico y Tecnológico. Las Comunicaciones, la Industria, la Agricultura, la Salud... se desarrollan rápidamente y se exige el máximo rendimiento y la mejor utilización de estos sectores.
Las técnicas de Investigación de Mercados permiten saber si un producto cualquiera será bien acogido en el mercado antes de su salida a este, o bien medir la audiencia en Televisión y Radio.
El Control de Calidad permite medir las características de la calidad de un producto, compararlas con ciertos requisitos y tomar decisiones correctivas si hay diferencias entre el funcionamiento real y el esperado. Con estudios estadísticos aplicados a la Agricultura y a la Pesca podemos estimar los rendimientos obtenidos en una cosecha, o encontrar bancos de peces...
En Medicina e Investigación farmacológica es imprescindible la Estadística, probando nuevos tratamientos en grupos de pacientes o bien, obteniendo conclusiones sobre ciertas enfermedades observando durante un tiempo un grupo de pacientes (saber si para el tratamiento de cierto tipo de cáncer es más efectiva la cirugía, la radioterapia o la quimioterapia, sin más que observar un grupo de pacientes tratados con estas técnicas).
Con el estudio de los Procesos Estocásticos se puede tener una mejor comprensión de fenómenos de comportamiento aleatorio como meteorología, física nuclear, campañas de seguridad...
INTERPRETACION DE DATOS DE ESTADISTICA
http://www.voki.com/php/viewmessage/?chsm=ab679b7cd379e10bd273c3bd7b8f3166&mId=2041737

Medidas tendencia central: Media Mediana


Este tipo de medidas nos permiten identificar y ubicar el punto (valor) alrededor del cual se tienden ha reunir los datos (“Punto central”). Estas medidas aplicadas a las características de las unidades de una muestra se les denomina estimadores o estadígrafos; mientras que aplicadas a poblaciones se les denomina parámetros o valores estadísticos de la población. Los principales métodos utilizados para ubicar el punto central son la media, la mediana y la moda.

1. MEDIA

Es la medida de posición central más utilizada, la más conocida y la más sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeños. La media se define como la suma de todos los valores observados, dividido por el número total de observaciones.

Forma de Calcular la Media de los datos
Ecuación 5-1

Cuando los valores representan una población la ecuación se define como:
Ecuacion de La Media para poblaciones
Ecuación 5- 2

Donde (m) representa la media, (N) representa el tamaño de la población y (Xi) representa cada uno de los valores de la población. Ya que en la mayoría de los casos se trabajan con muestras de la población todas las ecuaciones que se presenten a continuación serán representativas para las muestras. La media aritmética para una muestra esta determinada como

Ecuación de la Media para Muestras
Ecuación 5-3

Donde (X) representa la Media para la muestra, (n) el tamaño de la muestra y (Xi) representa cada uno de los valores observados. Esta fórmula únicamente es aplicable si los datos se encuentran desagrupados; en caso contrario debemos calcular la media mediante la multiplicación de los diferentes valores por la frecuencia con que se encuentren dentro de la información; es decir,

Ecuación de la Media para valores Agrupados
Ecuación 5-4

Donde (Yi) representa el punto medio de cada observación, (ni) es la frecuencia o número de observaciones en cada clase y (n) es el tamaño de la muestra siendo igual a la suma de las frecuencias de cada clase.

Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5 personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su interpretación se han generado tres rangos de edad los cuales se han establecido de 21 a 30 años, de 31 a 40 años y de 41 a 50 años. Si nos fijamos en estos rangos notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organización de estos datos se representan en la tabla [5-1].

Ejemplo del calculo de la Media para datos Agrupados - Medidas de Tendencia Central
Figura 5-1

Si aplicamos la fórmula para valores agrupados obtendríamos que la media es igual a

Lo que nos indicaría que el promedio de edad de los encuestados es de 35 años. Si ha estos mismos resultados le aplicamos la ecuación para datos desagrupados (Ecuación 5-3), tomando como referencia cada uno de los valores individuales, obtendríamos que la media es igual a

Lo que nos indicaría que el promedio de edad para los datos desagrupados es de 34 años aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la exactitud de los cálculos, principalmente al aumentar el número de datos. Para evitar estos inconvenientes, SPSS nos permite calcular lasMedias, como si se trataran de valores desagrupados, aunque tiene algunos procedimientos para valores agrupados.

Es importante resaltar que existe una gran variedad de medias como la Media geométrica, la Media ponderada, la Media cuadrática, etc. Por el momento sólo hacemos énfasis en la media aritmética ya que es la más utilizada, aunque se recomienda a los lectores profundizar en estos temas.

2. MEDIANA

Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos después que las observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posición de la mediana se utiliza la fórmula

Ecuación de la Posición de la Mediana
Ecuación 5-5

Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2, 5, 8, 10 y 13), la posición de la mediana sería:


Lo que nos indica que el valor de la mediana corresponde a la tercera posición de la serie, que equivale al número (8). Si por el contrario contamos con un conjunto de datos que contiene un número par de observaciones, es necesario promediar los dos valores medios de la serie. Si en el ejemplo anterior le anexamos el valor 15, tendríamos la serie ordenada (2, 5, 8, 10, 13 y 15) y la posición de la mediana sería,


Es decir, la posición tres y medio. Dado que es imposible destacar la posición tres y medio, es necesario promediar los dos valores de la posiciones tercera y cuarta para producir una mediana equivalente, que para el caso corresponden a  (8 + 10)/2 =9. Lo que nos indicaría que la mitad de los valores se encuentra por debajo del valor 9 y la otra mitad se encuentra por encima de este valor.

En conclusión la mediana nos indica el valor que separa los datos en dos fracciones iguales con el cincuenta porciento de los datos cada una. Para las muestras que cuentan con un número impar de observaciones o datos, la mediana dará como resultado una de las posiciones de la serie ordenada; mientras que para las muestras con un número par de observaciones se debe promediar los valores de las dos posiciones centrales.

3. MODA

La medida modal nos indica el valor que más veces se repite dentro de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se repite es el número 2 quien seria la moda de los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denominaBimodal o en otros casos más de dos valores, lo que se conoce como multimodal.

En conclusión las Medidas de tendencia central, nos permiten identificar los valores más representativos de los datos, de acuerdo a la manera como se tienden a concentrar. La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendría cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por último la Moda nos indica el valor que más se repite dentro de los datos.