Conceptos básicos
La estadística se ocupa de sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
Dentro de la estadística, tenemos 2 apartados:
Estadística Descriptiva: Es la encargada de organizar y resumir conjuntos de observaciones procedentes de una muestra.
Tendremos 1 o 2 variables.
Estadística Inferencial: Se utiliza para hacer inferencias (sacar conclusiones) sobre una población a partir de los datos de una muestra.
Veamos los datos que necesitaremos a la hora de realizar una investigación:
Población: Es el conjunto de todos los elementos que cumplen una característica.
Muestra: Es un subconjunto de la población.
Parámetro: Es una propiedad de la población.
Estadístico: Es una propiedad de la muestra.
Normalmente se distinguen los parámetros de los estadísticos porque los primeros se escriben con el alfabeto griego y los segundos con el alfabeto latino.
Medición y escalas de medida:
Para poder utilizar los elementos de una población, necesitaremos medir la característica (propiedad) de cada objeto de la población. Al proceso por el que se asigna números a las características se llama "medición".
Esto es, si cogemos la población de "los alumnos del colegio" y queremos medir la altura (característica), mediremos a todos los alumnos apuntando su altura para poder realizar el estudio estadístico.
Para poder medir las variables (características) tenemos diferentes escalas, dependiendo del tipo que sean:
Escala Nominal: Variables que sólo tienen relación de igualdad o desigualdad, se pueden asignar números a las categorías pero no hay un orden entre éstos. La asignación numérica de los valores se realiza de forma arbitraria.
Ejemplo: Color de ojos (pueden ser negros, marrones, verdes, azules) pero no hay un orden entre ellos) En este caso, la asignación numérica podría ser:
negro --> 1
marrones --> 2
verdes --> 3
azules --> 4
Pero podría haber sido cualquier otra, ya que no hay un orden preestablecido en los valores de la variable.
Escala Ordinal: Variables que tienen un cierto orden, aunque no sean numéricas. Se pueden comparar con "mayor que" o "menor que". Se puede asignar números a los valores, en este sí habrá que asignarlos con un orden.
Ejemplo:
Cuando estamos midiendo alturas, podemos decir que una persona es "alta", "media" o "baja". Esta variable es ordinal ya que "alto" es mayor que "bajo".
En este caso, la asignación numérica podría ser:
Alta --> 3
Media --> 2
Baja --> 1
En este caso, se ve que 3 es mayor que 1 (es decir, alto es más que bajo), con lo que los números no se pueden asignar aleatoriamente.
Las notas en los exámenes de cambridge son "A, B, C, B1, Suspenso", según la puntuación que saques. La variable nota es de tipo ordinal. De nuevo aquí se pueden hacer asignaciones numéricas a los valores, pero es necesario un orden.
Escala de Intervalo: Ordena los objetos según la magnitud que se estudia, los valores se pueden sumar y restar (y éstos multiplicar y dividir) y están ordenados, pero el 0 no indica ausencia.
Ejemplo:
La temperatura es un ejemplo ya que podemos sumar y restar grados, tenemos un orden entre ellos (estar a 20º es más que estar a 10º), pero 0º no es ausencia de temperatura, es otra temperatura más.
Escala de Razón: Los números ordenados según la magnitud y además existe un origen (un valor absoluto o valor cero donde empiezan los datos, que indica la ausencia de la variable).
Ejemplo:
El peso de un objeto, está claro que un objeto puede pesar más o menos que otro (conjunto ordenado), se pueden sumar o restar pesos, pero si un objeto pesa 0 es porque no pesa (hay ausencia de la variable).
Clasificación de las variables:
Una variable es la representación de la característica objeto del estudio.
Tiene que tener varios valores (modalidades), si tuviera sólo un valor sería una constante.
Tenemos 3 tipos de variables:
Cualitativa:
-
Corresponde a la escala Nominal, es decir, estudia cualidades.
-
En función del número de modalidades (posibles valores que tenga) tendremos las siguientes subclases:
-
Variable Dicotómica: 2 categorías (cara/cruz, si/no,...)
-
Variable Politómica: más de 2 categorías.
-
Ejemplos: Color de ojos, llevar gafas, aprobar una asignatura...
Cuasicuantitativa:
-
Corresponde a la escala Ordinal.
-
Son las variables que no siendo numéricas sí tienen un orden predefinido.
Ejemplos: Altura (alto, medio, bajo), talla de camiseta (s, m, l, xl,...)
Cuantitativa:
-
Corresponde con las escalas Intervalo y de Razón.
-
Son variables numéricas (son números)
-
En función de los valores numéricos pueden ser:
-
Variable Continua: valores en los que existe cualquier punto. Como ejemplo se puede poner la altura (ya que se puede medir en metros 1,65 ó 1,66 ó ....), también el peso. (como idea nos vamos a quedar que son valores con decimales).
-
Variable Discreta: Valores en los que no hay intermedios, por ejemplo el número de monedas que llevas en la cartera (no existe media moneda), o el número de personas en una clase.
-
Las variables se denotan con letra mayúscula, y los valores de las variables con esa letra mayúscula y un subínidice.
Ejemplo:
Tenemos la variable X número de hijos, que tiene 4 valores: X1 = 0, X2 = 1, X3 = 2 y X4 = 3.
Esta variable tiene 4 valores (0, 1, 2 y 3).
Revisaremos esta notación más adelante.