Karl Pearson (1857-1936), matemático inglés conocido por sus aportaciones a la estadística moderna, de la que es considerado como unso de sus fundadores. Se destacó especialmente en le campo de la bioestadística y fue uno de los personajes que contribuyeron en la época al desarrollo de la eugenesia, disciplina que perseguía la supuesta mejora de la especie humana a través de los mecanismos de la herencia. Entre sus contribuciones concretas, destacan el coeficiente de correlación que lleva su nombre, la prueba chi cuadrado, el método de los momentos y el análisis de componentes principales.
Error muestral
El error muestral hace referencia al error que se comete al extrapolar un valor o característica relativa a la muestra al conjunto de la población que representa. Por ejemplo, cuando se calcula la media aritmética de una muestra concreta y se considera como una estimación de la media poblacional o general, se comete un error que tiene como magnitud la diferencia entre la media muestral y poblacional. Puede controlarse el error muestral con el tamaño de muestra y con el nivel de confianza requerido.
Variable dicotómica
Una variable dicotómica, también denominada variable binaria, es una variable cualitativa o categórica que toma unicamente dos valores, por ejemplo el sexo (hombre/mujer), resultado de un examen (aprobado/suspendido) o el haber sido comprador alguna vez de un determinado producto (si/no). En estadística, las variables dicotómicas se codifican habitualmente para la realización de cálculos con los valores 0 (no) y 1 (si).
Diagrama de dispersión
Un diagrama de dispersión es una representación en coordenadas cartesianas de los valores correspondientes a dos variables cuantitativas. Se utiliza para explorar la correlación o covariación existente entre dos variables, sobre todo el sentido (positivo o negativo) de dicha correlación, que puede calcularse también a través de la covarianza, y no tanto su intensidad, generalmente imposible de estimar a simple vista y para lo que habrá que calcular el coeficiente de correlación.
Se distinguen dos tipos de diagramas de dispersión: la nube de puntos surge como resultado de representar graficamente dos variables continuas (o una continua y la otra discreta) y el diagrama de burbujas, cuando se representan conjuntamente dos variables discretas.
Nube de puntos
Una nube de puntos, el tipo más frecuente de diagrama de dispersión, es la representación en coordenadas cartesianas de los valores correspondientes a dos variables cuantitativas continuas. El nombre hace referencia a la nube o cúmulo de puntos que surge como resultado de representar dichos valores, que permitirá explorar la correlación entre ambas variables.