• Ir a navegación principal
  • Ir al contenido principal
Sigmalitika

Sigmalitika

La enciclopedia de la probabilidad, estadística y machine learning

  • Inicio
  • Últimos artículos
  • Recursos
  • Términos
  • Contacto
  • Show Search
Hide Search

Media cuadrática

· May 5, 2020 ·

La media cuadrática es un promedio utilizado principalmente para situaciones en la que en un mismo conjunto de datos existen datos positivos y negativos. Por ello, es un promedio especialmente adecuado para calcular el valor medio de una serie de errores, que pueden tanto negativos como positivos, por defecto o por exceso. Para los datos x_1,x_2,\ldots,x_n, se calcula de acuerdo a esta formula:

    \[C=\sqrt{\cfrac{\sum_{i=1}^nx_i^2}{n}}\]

Si utilizamos la media aritmética para el conjunto de errores -2/-3/1/6, la media aritmética da como resultado 0.5, valor que evidentemente no refleja adecuadamente el error promedio, y ello por un efecto de compensación entre datos negativos y positivos. La media cuadrática resuelve ese obstáculo sumando los cuadrados de los valores, de forma que tanto los datos positivos y negativos quedan transformados en positivos; se suman dichos cuadrados; se calcula su media, y finalmente para deshacer la transformación cuadrática se calcula la raíz cuadrada del resultado:

    \[C=\sqrt{\cfrac{(-2)^2+(-3)^2+1^2+6^2}{4}}=3.53\]

Este valor sí que refleja adecuadamente el error medio representativo de los errores medidos.

Dicha aplicación de la media cuadrática para el cálculo del error medio, encuentra su lugar en otra medida habitual en estadística, la desviación típica, medida de dispersión que no es más que la media cuadrática de las distancias de cada dato a la media aritmética.

El inconveniente de la media cuadrática radica en su sensibilidad a los valores extremos y atípicos, que exageran su resultado y por lo tanto restan representatividad como promedio. Así pues, se trata de una medida no robusta.

Macrodato

· May 4, 2020 ·

Los macrodatos son los datos que resultan de la agregación u otro tipo de operaciones con datos más simples, en último extremo de microdatos. Por ejemplo, las calificaciones medias por aula son macrodatos obtenidos a partir de las calificaciones individuales de los estudiantes.

Sucesos complementarios y probabilidad complementaria

· May 4, 2020 ·

En teoría de probabilidad, dos sucesos son complementarios o contrarios cuando debe ocurrir uno u otro (es decir, son mutuamente excluyentes) y al mismo tiempo no pueden ocurrir los dos a la vez. Por ejemplo, si se trata de elegir al azar a una persona en un grupo, el suceso complementario de "hombre" es "mujer".

Generalmente, dado un suceso A, se denomina a su suceso complementario \overline{A}. Las probabilidades de dos sucesos complementarios suman 1, de forma que puede establecerse la siguiente regla de la probabilidad del complemento:

    \[P(A)+P(\overline{A})=1 \rightarrow P(\overline{A})=1-P(A)\]

La regla del complemento se utiliza frecuentemetne y permite simplificar el cálculo de probabilidades en multitud de problemas. Una aplicación frecuente consiste en calcular la probabilidad de que ocurra al menos un evento (uno o dos o tres o ...), que puede resultar harto compleja, como el complemento de que no ocurra ninguno (el complemento de cero).

Tipificación

· May 4, 2020 ·

La tipificación o estandarización es la operación que sustrae a cada valor de una variable cuantitativa la media de la distribución y divide el resultado entre la desviación típica. Los valores resultante se denominan valores z.  El objetivo es reducir los datos a una escala típica o estándar de modo que datos de diferentes distribuciones puedan ser comparados entre sí o puedan ser agregados de forma homogénea. En el caso de la distribución normal, la tipificacion transforma un valor de cualquier distribución normal a la distribución normal estándar N(0,1), de forma que se pueda calcular su probabilidad a través de la tabla estadística de dicha distribución estándar.

Corrección por continuidad

· May 2, 2020 ·

La corrección por continuidad o corrección de continuidad es una corrección a realizar en el cálculo de una probabilidad relativa a una distribución discreta cuando para ello se utiliza una distribución continua.

Las probabilidades de una distribución discreta como la de la imagen se calculan más facilmente a través de una distribución continua que se ajuste a las probabilidades discretas determinadas por la altura de cada barra. En este caso, la distrubución continua a utilizar como aproximación sería la distribución normal.

Lo más comodo a la hora de modelizar una variable aleatoria discreta que toma muchos valores diferentes es utilizar una distribución de probabilidad continua: operar con probabilidades en distribuciones discretas supone operar con sumatorios, que frecuentemente resultan de difícil desarrollo, mientras que con una distribución continua el cálculo de probabilidades se realiza mediante la aplicación directa de una función. Sin embargo, cuando utilizamos una distribución continua son posibles valores como 3.23, 10.532, 0.22222, que en la distribución discreta normalmente no tienen un significado claro. Por otra parte, en una distribución discreta tiene sentido la probabilidad de un valor en concreto, mientras que cuando utilizamos la distribución continua la probabilidad de un valor concreto, un mero punto en un intervalo continuo, es teoricamente 0. Para corregir esos desajustes se utiliza la corrección de continuidad: por ejemplo, un valor continuo de 3.23 se redondea a un valor discreto de 3; y un valor de 3.66 a 4. Asi para calcular la probabilidad que la variable aleatoria discreta tome el valor 3, determinariamos en la variable continua la probabilidad de que la variable se encuentre entre 2.5 y 3.5. De esta forma,  la corrección de continuidad se realiza de esta forma:

    \[P[X_{discreta}=x]=P[x-0.5<X_{continua}<x+0.5]\]

Para probabilidades acumuladas la corrección de continuidad se ejecuta de forma análoga:

    \[P[X_{discreta}\leqx]=P[X_{discreta}<x+0.5]\]

    \[P[X_{discreta}<x]=P[X_{discreta}<x-0.5]\]

    \[P[X_{discreta}\geqx]=P[X_{discreta}>x-0.5]\]

    \[P[X_{discreta}>x]=P[X_{discreta}x+0.5]\]

La corrección por continuidad se aplica especialmente en la aproximación normal, es decir mediante la distribución continua normal,  de las distribuciones discretas binomial (a través del teorema de De Moivre-Laplace) y de Poisson.

Frecuentemente se denonima la corrección por continuidad como corrección de Yates. Es una denonomiación equivocada ya que la corrección de Yates es solo un tipo concreto de corrección por continuidad que se aplica al cálculo del estadístico chi cuadrado en las tablas de contingencia.

  • « Ir a la página anterior
  • Ir a la página 1
  • Ir a la página 2
  • Ir a la página 3
  • Ir a la página 4
  • Ir a la página 5
  • Ir a la página 6
  • Ir a la página siguiente »

Sigmalitika

Copyright © 2020 · Monochrome Pro on Genesis Framework · WordPress · Iniciar sesión