Estadística
Ciencia que estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno de estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo Estadística es mas que eso, en otras palabras es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica.
El estudio de la estadística puede dividirse en dos grandes ramas; una de ellas es la estadística descriptiva, que estudia las características de un grupo de datos para conocer los valores que los describen, por ejemplo: la media y la desviación estándar.
Por otra parte la estadística inferencial o inferencia estadística analiza los datos de una muestra para conocer, a partir de esos datos, las características de la población de la cual se tomaron, lo que permite conocer aproximadamente las poblaciones, aunque no se cuente con todos los elementos que las componen. También permite conocer con anticipación las características de una muestra si se conocen algunas propiedades de la población de la cual se tomará la muestra.
Población y Muestra.
Por una población debe entenderse el total de elementos de un grupo que se estudia; por ejemplo: el total de manzanas producidas en la Huerta La Flor, o el total de empleados de una empresa.
Una muestra es un conjunto de elementos extraídos de un conjunto mayor (la población),, con el fin de conocer aproximadamente las características de la población de donde proviene.
El conocimiento exacto de una población requiere un estudio detallado, mientras que una muestra solo permite resultados aproximados, pero su tiempo y costo de realización son, por lo general menores que en el estudio de la población.
Estudio de una Población.
- Conocimiento exacto
- Mucho tiempo requerido
- Alto costo.
Estudio de una muestra.
- Conocimiento aproximado.
- Rápido.
- Económico.
Tipos de Variables.
1. Cualitativas: Son aquellas que no son medibles, es decir aquellas cuyas observaciones no tienen carácter numérico. Expresan cualidades o categorías. Ejemplo: Estado civil, sexo o profesión.
2. Cuantitativas: Son aquellas que son medibles, es decir que sus observaciones tienen carácter numérico. Estas a su vez se dividen en:
- Discretas: Toman valores enteros en un conjunto númerable. Ejemplo: Número de habitaciones de un hotel, número de hijos de una familia, número de obreros de una fabrica.
- Continuas: Toman valores en un conjunto no númerable (los números reales o un intervalo). Ejemplo: Peso, estatura.
Muestreo.
Mientras se obtiene una muestra (proceso conocido como muestreo), la muestra podría destruirse; por ejemplo, al determinar la cantidad de jugo que produce una naranja, o conservarse, como al determinar la estatura o peso de una persona. En el primer caso se dice que el muestreo es destructivo, mientras que en el segundo caso no lo es.
El muestreo puede realizar con reemplazo o sin seleccionarse. Si hay reemplazo el elemento seleccionado se analiza y se regresa a la población, por lo que puede seleccionarse nuevamente, simulando así una población infinita.
En el muestreo sin reemplazo el elemento seleccionado no se regresa a la población de donde se tomó.
Distribución de Frecuencias.
Es una tabla que presenta el número de elementos que pertenece a cada una de las clases o categorías en las que se haya dividido para su estudio un grupo de datos.Las distribuciones de frecuencias son la forma mas común de organizar un gran número de datos, por ejemplo, las calificaciones de los alumnos de primer semestre, y a partir de ellas lograr conclusiones que no eran visibles originalmente.
Pasos para la elaboración de tablas de distribución de frecuencias.
- Recopilación de datos.
- Clasificación de datos de menor a mayor (opcional).
- Especificación del número de clases.
- Cálculo del tamaño exacto del ancho de clase.
- Determinación del tamaño ajustado del ancho de clase.
- Identificación de los límites de la clase.
- Conteo de los datos.
Presentaciones Gráficas.
Una gráfica vale mas que mil palabras. Esto es particularmente cierto en el análisis de datos estadísticos, donde los datos al natural, e incluso tabulados pueden ser abrumadores, difíciles de comprender.Las gráficas estadísticas mas comunes son: el histograma, el polígono y la curva de frecuencias, las gráficas de barra de dos variables, las frecuencias acumuladas u ojivas y las gráficas de pastel.
Histograma y Polígonos de frecuencia.
Un histograma es un diagrama de barras que representa, a escala, el número de elementos que comprende cada una de las clases de una distribución de frecuencias.
La altura de las barras del histograma está dada por la frencuencia de la clase, mientras que los límites horizontales son los límites exactos de cada clase.
El polígono de frecuencias es una figura cerrada delimitada en su base por el eje horizontal, y cuyos vértices son los puntos centrales de la horizontal superior de cada barra del histograma, incluyendo también la clase anterior a la primera y la clase siguiente a la última.
Curva de frecuencias.
Su utilidad consiste en que muestra gráficamente la tendencia de la distribución de frecuencias y que, expresada por medio de una fórmula matemática, facilita el estudio de su comportamiento.
Gráfica de barras de dos variables.
Una variante de los histogramas son las gráficas de barras de dos variables. En ellas se grafican los valores para prresentar gráficamente el comportamiento de una de ellas respecto a la otra, y obtener así conclusiones inmediatas, que son evidentes o fáciles de identificar en los datos originales.
Gráfica de frecuencias acumuladas.
Las frecuencias acumuladas son parte importante de una tabla de distribución de frecuencias, pues presentan las sumas parciales de todas las frecuencias y de esta forma permiten contestar directamente preguntas tales como: ¿Cuántos elementos de la población o muestra en estudio tienen menos de cierto nivel de la variable que se analiza?
La frecuencia acumulada define los puntos de las gráficas u ojivas ascendentes.
Gráficas de Pastel.
Son figuras que representan, por medio de segmentos de círculo, la frecuencia, absoluta o relativa de una tabla de distribución de frecuencias.
Estaas gráficas se preparan con base en el ángulo que resulta de multiplicar 360 por la frecuencia relativa (frecuencia de la clase / total de frecuencias) de cada clase, por lo que el cálculo es muy sencillo.