lunes, 29 de septiembre de 2014

COMO REPRESENTAR TABLAS DE VARIABLES CUANTITATIVAS

CARACTERISTICAS Y FORMAS GRAFICAS PARA REPRESENTAR TABLAS DE VARIABLES CUANTITATIVAS

Para las variables cuantitativas, consideraremos dos tipos de gráficos, en función de que para realizarlos se usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas:
Diagramas diferenciales:
Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el número o porcentaje de elementos que presenta una modalidad dada.
Diagramas integrales:
Son aquellos en los que se representan el número de elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas. 
Según hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a continuación las diferentes representaciones gráficas que pueden realizarse para cada una de ellas así como los nombres específicos que reciben.

Gráficos para variables discretas

Cuando representamos una variable discreta, usamos el diagrama de barras cuando pretendemos hacer una gráfica diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable, forma de escalera. Un ejemplo de diagrama de barras así como su diagrama integral correspondiente están representados en la siguiente figura.


Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el número de caras, X, obteniendose los siguientes resultados: 
\begin{displaymath}X{\leadsto}\, 2,1,0,1,3,2,1,2
\end{displaymath}

Representar gráficamente el resultado.
Solución: En primer lugar observamos que la variable X es cuantitativa discreta, presentando las modalidades:

\begin{displaymath}X\in{0,1,2,3}
\end{displaymath}

Ordenamos a continuación los datos en una tabla estadística, y se representa la misma en la siguiente figura.

Figura: Diagrama diferencial (barras) e integral para una variable discreta. Obsérvese que el diagrama integral (creciente) contabiliza el número de observaciones de la variable inferiores o iguales a cada punto del eje de abscisas.
\includegraphics[angle=0, width=0.8\textwidth]{fig01-06.eps}

xinifiNiFi
011/811/8
133/844/8
233/877/8
311/888/8
n=81

Ejemplo

Clasificadas 12 familias por su número de hijos se obtuvo:

Número de hijos (xi)1234
Frecuencias (ni)1353

Comparar los diagramas de barras para frecuencias absolutas y relativas. Realizar el diagrama acumulativo creciente.
Solución: En primer lugar, escribimos la tabla de frecuencias en el modo habitual:

VariableF. AbsolutasF. RelativasF. Acumuladas
xinifiNi
110,0831
230,2504
350,4169
430,25012
121

Con las columnas relativas a xi y ni realizamos el diagrama de barras para frecuencias absolutas, lo que se muestra en la siguiente figura. Como puede verse es identico (salvo un cambio de escala en el eje de ordenadas) al diagrama de barras para frecuencias relativas y que ha sido calculado usando las columnas de xi y fi. El diagrama escalonado (acumulado) se ha construido con la información procedente de las columnas xi y Ni.

Figura: Diagramas de frecuencias para una variable discreta
\includegraphics[angle=0, width=0.8\textwidth]{fig01-07.eps}

Gráficos para variables continuas

Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polígonos de frecuencias.

Un histograma se construye a partir de la tabla estadística, representando sobre cada intervalo, un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.

El polígono de frecuencias se construye fácilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante lineas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el polígono de frecuencias en el primer y último intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una línea recta los puntos del histograma que corresponden a sus marcas de clase. Obsérvese que de este modo, el polígono de frecuencias tiene en común con el histograma el que las áreas de la gráficas sobre un intervalo son idénticas. 

El diagrama integral para una variable continua se denomina también polígono de frecuencias acumulado, y se obtiene como la poligonal definida en abcisas a partir de los extremos de los intervalos en los que hemos organizado la tabla de la variable, y en ordenadas por alturas que son proporcionales a las frecuencias acumuladas. Dicho de otro modo, el polígono de frecuencias absolutas es una primitiva del histograma. Véase la parte inferior de la figura en la que se representa a modo de ilustración los diagramas correspondientes a la variable cuantitativa continua expresada en la tabla siguiente:

IntervalosciniNi
0 -- 2122
2 -- 4313
4 -- 6547
6 -- 87310
8 - 109212
12

Figura: Diagramas diferenciales e integrales para una variable continua.
\includegraphics[angle=0, width=0.5\textwidth]{fig01-08.epsi}

Ejemplo

La siguiente distribución se refiere a la duración en horas (completas) de un lote de 500 tubos:

Duración en horasNúmero de tubos
300 -- 50050
500 -- 700150
700 -- 1.100275
más de 1.10025
Total 500
  • Representar el histograma de frecuencias relativas y el polígono de frecuencias.
  • Trazar la curva de frecuencias relativas acumuladas.
  • Determinar el número mínimo de tubos que tienen una duración inferior a 900 horas.
Solución: En primer lugar observamos que la variable en estudio es discreta (horas completas), pero al tener un rango tan amplio de valores resulta más conveniente agruparla en intervalos, como si de una variable continua se tratase. La consecuencia es una ligera perdida de precisión.
El último intervalo está abierto por el límite superior. Dado que en él hay 25 observaciones puede ser conveniente cerrarlo con una amplitud ``razonable''. Todos los intervalos excepto el tercero tienen una amplitud de 200 horas, luego podríamos cerrar el último intervalo en 1.300 horas.

Antes de realizar el histograma conviene hacer una observación importante. El histograma representa las frecuencias de los intervalos mediante áreas y no mediante alturas. Sin embargo nos es mucho más fácil hacer representaciones gráficas teniendo en cuenta estas últimas. Si todos los intervalos tienen la misma amplitud no es necesario diferenciar entre los conceptos de área y altura, pero en este caso el tercer intervalo tiene una amplitud doble a los demás, y por tanto hay que repartir su área en un rectángulo de base doble (lo que reduce su áltura a la mitad). 
Así será conveniente añadir a la habitual tabla de frecuencias una columna que represente a las amplitudes ai de cada intervalo, y otra de frecuencias relativas rectificadas, fi', para representar la altura del histograma. 

Intervalosainififi'Fi
300 -- 500200500,100,100,10
500 -- 7002001500,300,300,40
700 -- 1.1004002750,550,2750,95
1.100 -- 1.300200250,050,051,00
n=500

Figura: Histograma. Obsérvese que la altura del histograma en cada intervalo es fi' que coincide en todos con fisalvo en el intervalo 700 -- 1.100 en el que $f_i{\mbox{$'$ }}= 1/2\, f_i$ ya que la amplitud de ese intervalo es doble a la de los demás.
\includegraphics[angle=0, width=0.7\textwidth]{fig01-09.eps}


Figura: Diagrama acumulativo de frecuencias relativas
\includegraphics[angle=0, width=0.8\textwidth]{fig01-10.eps}

Por otro lado, se ve que sumando frecuencias relativas, hasta las 900 horas de duración hay
0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los tubos.
Esta cantidad se obtiene de modo más directo viendo a qué altura corresponde al valor 900 en el diagrama de frecuencias acumuladas.
Como en total son 500 tubos, el número de tubos con una duración igual o menor que 900 horas es $
0,675 \times 500= 337,5
$, redondeando, 338 tubos.


Tabla: Principales diagramas según el tipo de variable.
Tipo de variableDiagrama
V. CualitativaBarras, sectores, pictogramas
V. DiscretaDiferencial (barras)
Integral (en escalera)
V. ContinuaDiferencial (histograma, polígono de frecuencias)
Integral (diagramas acumulados)
COMO REPRESENTAR TABLAS DE VARIABLES CUALITATIVAS
(CARACTERISTICAS Y FORMAS GRAFICAS)



Los gráficos más usuales para representar variables de tipo nominal son los siguientes:
Diagramas de barras:
Representamos en el eje de ordenadas las modalidades y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el gráfico, se intenta comparar varias poblaciones entre sí, existen otras modalidades, como las mostradas en la segundo figura. Cuando los tamaños de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podrían resultar engañosas.

Figura: Diagrama de barras para una variable cualitativa.
\includegraphics[angle=0, width=0.5\textwidth]{fig01-01.eps}


Figura: Diagramas de barras para comparar una variable cualitativa en diferentes poblaciones. Se ha de tener en cuenta que la altura de cada barra es proporcional al número de observaciones (frecuencias relativas).
\includegraphics[angle=-90, width=0.5\textwidth]{fig01-02.eps}


Diagramas de sectores
Se divide un círculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa.

Figura: Diagrama de sectores.
\includegraphics[angle=-90, width=0.6\textwidth]{fig01-03.epsi}

El arco de cada porción se calcula usando la regla de tres:

\begin{eqnarray}\html{eqn1}n & \longrightarrow & 360^{\circ} \nonumber
\\
n_i & \longrightarrow &x_i = \frac{360 \cdot n_i}{n} \nonumber
\end{eqnarray}

Como en la situación anterior, puede interesar comparar dos poblaciones. En este caso también es aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre gráficos como los anteriores. Otra posibilidad es comparar las 2 poblaciones usando para cada una de ellas un diagrama semicircular, al igual que en la segunda figura. Sean $n_1 \leq n_2$ los tamaños respectivos de las 2 poblaciones. La población más pequeña se representa con un semicírculo de radio r1y la mayor con otro de radio r2. La relación existente entre los radios, es la que se obtiene de suponer que la relación entre las areas de las circunferencias es igual a la de los tamaños de las poblaciones respectivas, es decir:


\begin{displaymath}\frac{r_2^2}{r_1^2} = \frac{n_2}{n_1} \Longleftrightarrow
r_2 = r_1 \cdot \sqrt{\frac{n_2}{n_1}}
\end{displaymath}



Figura: Diagrama de sectores para comparar dos poblaciones
\includegraphics[angle=-90, width=0.6\textwidth]{fig01-04.epsi}

CONSTRUIR TABLAS DE FRECUENCIAS POR INTERVALOS

La frecuencia absoluta de un dato es el número de veces que se da un resultado concreto y la frecuencia relativa es el porcentaje que representa la frecuencia absoluta respecto del total.

La media aritmética representa el valor medio que toman los datos de una observación estadística. Se calcula sumando todos los resultados y dividiendo la suma entre el número de registros. La media aritmética tan sólo se puede calcular con datos numéricos (no se puede calcular con datos cualitativos).

Moda: es el resultado más repetido en una observación estadística (se puede calcular con datos numéricos y cualitativos).


La media la hemos calculado sumando las 20 estaturas (33,23 cm) y dividiéndolo entre el número de datos (20).

Las frecuencias absolutas o relativas se pueden representar sobre una gráfica de barras en la que la altura de cada barra representa el valor de la frecuencia.


En este gráfico hemos representado la frecuencia absoluta.

También se puede utilizar el diagrama de sectores para representar las frecuencias (absolutas o relativas). Se utiliza un círculo dividido en sectores; cada sector representa cada uno de los posibles valores que toma la variable que se mide; la superficie del sector mide el valor de la frecuencia (absoluta o relativa). 


COMO CONSTRUIR TABLAS DE VARIABLES CUALITATIVAS


Una tabla estadística sirve para presentar de forma ordenada las distribuciones de frecuencias. Su forma general es la siguiente: 


ModalidadFrecuencia AbsolutaFrecuencia RelativaPorcentajeFrecuencia Absoluta AcumuladaFrecuencia Relativa Acumulada
ci, xinipi=100 fi


TABLA PARA VARIABLE CUALITATIVA

En el caso de variable cualitativa no se pueden calcular las frecuencias acumuladas pues no es posible establecer un orden en las clases dentro de la modalidad.Colocamos en la tabla aquellos valores que son independientes del lugar en que se pongan las modalidades. 
Calculemos la tabla de frecuencias para una variable cualitativa.
Inactivos por tipos de inactividad declarada (miles de personas).

Modalidadnifipi
Estudiante522,60,138013,80%
Percibiendo una pensión de jubilación o unos ingresos de prejubilación712,30,188218,82%
Labores del hogar1.480,000,391039,10%
Incapacitado permanente 265,90,07027,02%
Percibiendo una pensión distinta de la jubilación o prejubilación525,30,138813,88%
Otras situaciones279,50,07387,38%
 3785,61100,00%
ESTRUCTURA PARA DISEÑAR TABLAS ESTADISTICAS


Cuando se realiza un estudio estadístico sobre una variable (por ejemplo, altura de los niños de una clase, equipo de futbol preferido por los alumnos de un colegio, etc.) se comienza por obtener información (se mide a los niños, se les pregunta, etc.)

Dato estadístico es cada una de las informaciones que se obtiene (por ejemplo, Pedro mide 1,65 cm; Julián es aficionado del Barcelona, etc).

Vemos que el dato estadístico puede ser numérico (por ejemplo, estatura) o cualitativo (por ejemplo, equipo de fútbol preferido).

Los datos obtenidos en la observación hay que ordenarlos y recogerlos en una tabla que se denomina tabla estadística.


El número de observaciones realizadas se denomina tamaño de la muestra.

martes, 2 de septiembre de 2014

LA ESTADISTICA Y EL METODO CIENTIFICO

LA ESTADISTICA Y EL METODO CIENTIFICO, UN PROCEDIMIENTO ANALITICO

 
Podemos definir Estadística como la ciencia de los datos y el método científico como un conjunto de principios y procedimientos para la búsqueda sistemática del conocimiento.
El método científico es un procedimiento iterativo de aprendizaje, no podemos tener certeza
de la veracidad de las teorías que probemos usando el método científico.
La Estadística no es un conjunto de diferentes técnicas aisladas unas de otras, sino que la
Estadística, en conjunto con el método científico, nos entrega un procedimiento analítico
para tomar decisiones.
 
LA ESTADISTICA EN EL METODO CIENTIFICO
 
La estadística descriptiva es la herramienta más útil en la etapa de observación, ya que nos permite extraer información para realizar nuestras hipótesis fundadas en estos resultados. También es utilizada para valorar los resultados del experimento.
 
La estadística analítica se utiliza a partir de la observación, ya que dependiendo de los datos observados, se utilizará una técnica u otra, y por supuesto en el proceso del experimento, ya que su diseño dependerá en cierta medida de las técnicas estadísticas más apropiadas, además, la estadística analítica es el primer y principal razonamiento válido.
Como vemos, la estadística proporciona un gran apoyo al Método Científico en las fases de observación y experimentación, pero en el proceso de hipótesis y en el de la obtención de una ley científica son otras las bases.

EL METODO CIENTIFICO

METODO CIENTIFICO

 
El método científico es un método de investigación usado principalmente en la producción de conocimiento en las ciencias. Para ser llamado científico, un método de investigación debe basarse en la empírica y en la medición, sujeto a los principios específicos de las pruebas de razonamiento.
El método científico es un proceso destinado a explicar fenómenos, establecer relaciones entre los hechos y enunciar leyes que expliquen los fenómenos físicos del mundo y permitan obtener, con estos conocimientos, aplicaciones útiles al hombre.

ETAPAS:
 
1. Observación
 
Cuando un científico encuentra un hecho o fenómeno interesante lo primero que hace es observarlo con atención.

La Observación consiste en examinar atentamente los hechos y fenómenos que tienen lugar en la naturaleza y que pueden ser percibidos por los sentidos.
 
2. Formulación de hipótesis
 
Después de las observaciones, el científico se plantea el cómo y el porqué de lo que ha ocurrido y formula una hipótesis.
Formular una hipótesis consiste en elaborar una explicación provisional de los hechos observados y de sus posibles causas.
 
3. Experimentación
 
Una vez formulada la hipótesis, el científico debe comprobar si es cierta. Para ello realizará múltiples experimentos modificando las variables que intervienen en el proceso y comprobará si se cumple su hipótesis.
Experimentar consiste en reproducir y observar varias veces el hecho o fenómeno que se quiere estudiar, modificando las circunstancias que se consideren convenientes.
Durante la experimentación, los científicos acostumbran a realizar múltiples medidas de diferentes magnitudes físicas. De esta manera pueden estudiar qué relación existe entre una magnitud y la otra.
 
4. Emisión de conclusiones
 
El análisis de los datos experimentales permite al científico comprobar si su hipótesis era correcta y dar una explicación científica al hecho o fenómeno observado.
La emisión de conclusiones consiste en la interpretación de los hechos observados de acuerdo con los datos experimentales.
A veces se repiten ciertas pautas en todos los hechos y fenómenos observados. En este caso puede enunciarse una ley. Una ley científica es la formulación de las regularidades observadas en un hecho o fenómeno natural. Por lo general, se expresa matemáticamente.
Las leyes científicas se integran en teorías. Una teoría científica es una explicación global de una serie de observaciones y leyes interrelacionadas.
 
 

LA ESTADISTICA Y SU RELACION CON MULTIPLES AREAS DE CONOCIMIENTO

LA ESTADISITCA Y LAS MATEMATICAS

La estadística matemática es escala previa en el estudio de la estadística desde un punto de vista puramente formal. La estadística matemática trata de la obtención de la poeta a partir de los datos.
La estadística matemática se divide en:
  • Estadística descriptiva: parte que se encarga de describir los datos, esto es, de realizar un resumen y describir sus propiedades típicas.
  • Inferencia estadística: parte que elabora conclusiones a partir de una muestra de los datos, en otras palabras, comprueba el ajuste de los datos a determinadas condiciones y proporciona una medida de la bondad de los mismos en términos probabilísticos.
La estadística matemática es la base teórica para muchas prácticas en la estadística aplicada.
 
LA ESTADISTICA Y LA ECONOMIA

La economía necesita de la Estadística, con la ayuda de esta se confeccionan los planes de desarrollo de la economía nacional, se supervisa el control de su cumplimiento y se determinan las necesidades de recursos por territorios, así como las reservas con que cuenta la economía a cualquier nivel. Además la estadística constituye un instrumento de suma importancia para que se conozca el comportamiento de la economía a diferentes niveles ya sea en una empresa, municipio, provincia, nación, así como a escala internacional.
El conocimiento de la Estadística Económica permite apoyar la toma de decisiones para la aplicación de la política económica que se proponen los países para conducir la sociedad, así como para trazar la estrategia de desarrollo acorde con los programas que se consideran según las condiciones imperantes en cada nación.
 
La Estadística Económica da una caracterización cuantitativa y cualitativa del volumen, composición y dinamismo de las fuerzas productivas y además refleja el comportamiento de las relaciones de producción en cada economía. Estudiar las fuerzas productivas de un país, las condiciones de producción, es el fin de esta ciencia.
Esta ciencia además de reunir los hechos, posibilita analizarlos profundamente y generalizarlos, colocándose en el centro de los fenómenos, convirtiéndose así en un elemento activo que interviene en la solución de los problemas sociales.  
 
 LA ESTADISITCA Y LA SOCIOLOGIA

La estadística te brinda los conocimientos y herramientas necesarias para que seas capaz de aplicarlos en el estudio e interpretación de los fenómenos sociales. 

LA ESTADISTICA Y LA DEMOGRAFIA

La demografía es la ciencia que tiene como objetivo el estudio de las poblaciones humanas, de su dimensión, estructura, evolución y características generales.
La demografía estudia estadísticamente la estructura y la dinámica de las poblaciones, así como los procesos concretos que determinan su formación, conservación y desaparición. Tales procesos, en su forma más agregada, son los de fecundidad, mortalidad y migración: emigración e inmigración.
 
LA ESTADISTICA Y LA GEOGRAFIA

Gracias a la estadística podemos saber o calcular la dinámica natural de la población: fecundidad, natalidad, nupcialidad, mortalidad y crecimiento natural, también calcular la estructura sociodemográfica de la población: edad, sexo, estado civil, actividad, instrucción, etc.
A través de encuestas podemos hacer censos y con ello elaborar graficas que nos proporcione datos estadísticos que sirvan para alguna investigación.
 


 

FAMILIARIZATE CON LA ESTADISTICA APRENDIENDO ALGUNOS CONCEPTOS

POBLACION:
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.
POBLACION FINITA:
Es el conjunto compuesto por una cantidad limitada de elementos como el numero de especies, el numero de estudiantes, el numero de obreros.

POBLACION INFINITA:
Es la que tiene un numero extremadamente grande de componentes, como el conjunto de especies que tiene el reino animal.

MUESTRA:
La muestra es una representación significativa de las características de una población, que bajo, la asunción de un error (generalmente no superior al 5%) estudiamos las características de un conjunto poblacional mucho menor que la población global.

ESTADISTICA DESCRIPTIVA:
Es una gran parte de la estadística que se dedica a recolectar, ordenar, analizar y representar un conjunto de datos con el fin de describir apropiadamente las características de este.

ESTADISTICA INFERENCIAL:
Es una parte de la estadística que comprende dos métodos y procedimientos que por medio de la inducción determina propiedades de una población.

PROBABILIDAD:
Es un método por el cual se obtiene la frecuencia de un acontecimiento determinado mediante la realización de un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables.

DATO VARIABLE:
Es un símbolo que puede ser reemplazado o que toma un valor numérico en una ecuación o expresión  matemática en general.

VARIABLE CUALITATIVA:
Se refieren a características o cualidades que no pueden ser medidas con números.

VARIABLE CUANTITATIVA:
Es la que se expresa mediante un numero, por tanto se pueden realizar operaciones aritméticas con ella.
VARIABLE DISCRETA:
Es aquella que solo puede tomar valores dentro de un conjunto finito, como los números naturales.

VARIABLE CONTINUA:
Es aquella que toma valores dentro de un conjunto en uno o varios intervalos de la recta real.

FENOMENO:
Es el aspecto que las cosas ofrecen ante nuestros sentidos, es decir, el primer contacto que tenemos con las cosas, lo que denominamos experiencia.

FENOMENO ALEATORIO:
Es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes, no se puede predecir el resultado exacto.

FENOMENO DETERMINISTA:
Es un experimento que da lugar a un resultado ciego o seguro, es decir, cuando partiendo de unas mismas condiciones iniciales tenemos la certeza de lo que va a suceder.

PARAMETRO ESTADISTICO:
En estadística, un parámetro es un número que resume la gran cantidad de datos que pueden derivarse del estudio de una variable estadística. El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población.

ESCALA O NIVEL DE MEDIDA:
El nivel de medida de una variable en matemáticas y estadísticas, también llamado escala de medición, es una clasificación acordada con el fin de describir la naturaleza de la información contenida dentro de los números asignados a los objetos y, por lo tanto, dentro de una variable.

ESCALA NOMINAL:
El nivel nominal de medición describe variables de naturaleza categórica que difieren en cualidad más que en cantidad. Ante las observaciones que se realizan de la realidad, es posible asignar cada una de ellas exclusivamente a una categoría o grupo. Cada grupo o categoría se denomina con un nombre o número de forma arbitraria, es decir, que se etiqueta en función de los deseos o conveniencia del investigador. Este nivel de medición es exclusivamente cualitativo y sus variables son por lo tanto cualitativas.

ESCALA ORDINAL:
El nivel ordinal describe las variables a lo largo de un continuo sobre el que se pueden ordenar los valores. En este caso las variables no sólo se asignan a grupos sino que además pueden establecerse relaciones de mayor que, menor que o igual que, entre los elementos.