• Ir a navegación principal
  • Ir al contenido principal
Sigmalitika

Sigmalitika

La enciclopedia de la probabilidad, estadística y machine learning

  • Inicio
  • Últimos artículos
  • Recursos
  • Términos
  • Contacto
  • Show Search
Hide Search

Recorrido (rango)

· May 2, 2020 ·

El recorrido, tambien llamado rango (en inglés, range), expresado generalmente con la letra R,  es la medida de dispersión más intuitiva y fácil de calcular. Se trata simplemente de la distancia o diferencia entre el dato mayor, el máximo de la distribución, y el dato menor. Así pues, cuanto mayor es el recorrido, mayor es la dispersión absoluta. Sin embargo, su facilidad de cálculo no compensa en cambio su sensibilidad a la existencia de datos atípicos. Basta con que aparezca un dato atípico para que el valor del recorrido cambien totalmente de magnitud. El recorrido es, por lotanto, una medida no robusta, con lo que su utilización ante la posible presencia de datos atípicos debe ser limitada. Como medida de dispersión relativa, se utiliza generalmente el recorrido dividido entre la media aritmética.

El recorrido se aplica frencuentemente en control de calidad para controlar la variabilidad de un proceso o característica de un producto, estableciendo alrededor de la media de los recorridos muestrales unos intervalos de tolerancia para los recorridos individuales, de forma que si el recorrido se sitúa fuera de esos límites, pueda concluirse con un nivel de certidumbre alto que la variabilidad del proceso ha aumentado de forma ostensible, afectando a la calidad del proceso o producto.

Medidas de tendencia central

· May 1, 2020 ·

Las medidas de tendencia central o medidas de centralización son el conjunto de medidas estadísticas que indican el valor alrededor del cual se distribuye una variable estadística cuantitativa. Las medidas de tendencia tienen como objetivo proporcionar un valor que resuma o represente al conjunto de datos, de forma significativa. Por ejemplo, para el conjunto de datos 3-4-4-5-5-5-6-6-7, una medida de tendencia central intuitiva (que por otro lado coincide con las medidas de tendencia central típicas) sería el valor 5, ya que alrededor de este valor se distribuyen todos los datos. Las medidas de tendencia central más utilizadas son la media aritmética simple, la mediana y la moda. Sin embargo, existen otras muchas medidas de tendencia central, con propiedades y aplicaciones interesantes: la media ponderada da diferente peso a cada dato, la media geométrica es especialmente útil para calcular tasas medias de variación, la media cuadrática para determinar errores medios, y la media armónica para rendimientos medios. Otras medidas de tendencia central pueden resultar especialmente útiles para mitigar la influencia de los datos atípicos o pueden tener propiedades interesantes como estimadores de parámetros poblacionales.

Población estadística

· May 1, 2020 ·

La población estadística está formada por el conjunto de elementos o individuos con características variables pero homogéneas del que se desea conocer algo en una investigación estadística. La homogeneidad es importante a la hora de definir una población, con el objetivo de evitar problemas de significatividad de los resultados obtenidos; por ejemplo si se desea investigar el número de trabajadores en las empresas, sería conveniente distinguir poblaciones por sector, teniendo en cuenta que los sectores económicos presentan grandes diferencias en relación a esa variable.

Generalmente es inviable recoger datos referidos a cada uno de los elementos que conforman la población, por lo que se hace necesario escoger una muestra de dicha población, que la represente de forma más o menos significativa. Analizando las características de la muestra, se estiman los parámetros o características del conjunto de la población, teniendo por supuesto en cuenta el error muestral que existe en ese proceso de inferencia.

Números índice

· May 1, 2020 ·

Los números índice son series de valores que indican la evolución en el tiempo de una o mas variables. Se utilizan sobre todo en el ámbito económico, por ejemplo para medir la evolución de los precios (tal como el IPC, Índice de Precios al Consumo). Para calcular una serie de números índice es necesario fijar una base o periodo de referencia, con cuyo valor se compararán los valores de los periodos posteriores. El número índice en este periodo base toma el valor 100. A partir de ahí existen múltiples fórmulas para el calculos de los índices. Los números índice simples determinan la evolución de una única variables a través de una simple división. Por ejemplo, si los precios de un mismo producto en 2018 y 2019 fueron 4€ y 5€ respectivamente y tomamos como base 2018, el índice correspondiente al año 2019 es 5/4x100=125, determinando de esta forma que el precio en 2019 subió un 25%. En la práctica es frecuente en cambio tener que agregar precios de diferentes productos y calcular su evolución conjunta. Para ello se calculan los números índice complejos, que pueden ser sin ponderar y ponderados. Los índices complejos sin ponderar agregan las diferentes variables de forma directa (en el caso de los precios, se sumarían directamente por ejemplo), pero generalmente hay que tener en cuenta que los precios vienen referidos a productos con diferentes consumos o producciones, por lo que deben ser ponderados o tratados de forma diferente según dichos consumos o producciones. Existen diferentes fórmulas de índices complejos ponderados: los índices de tipo Laspeyres ponderan los precios según la cantidad (consumo o producción) del periodo base, de modo que su cálculo es relativamente simple al requerir únicamente las cantidades del periodo inicial; los índice Paasche ponderan los precios según las cantidades de cada periodo, de modo que la evolución cuantitativa que se obtiene puede ser más realista, pero requiere también de más información, más concretamente de las cantidades de cada periodo.

Covarianza

· Abr 30, 2020 ·

La covarianza es un estadístico que indica la variabilidad conjunta de dos variables cuantitativas: cuando valores grandes en una de las variables se corresponden con valores grandes en la otra (y pequeños en una con pequeños en la otra), la covarianza es positiva; si por el contrario valores grandes en una variable se corresponden con valores pequeños en la otra la covarianza es negativa. Más concretamente, la covarianza es una medida de la correlación lineal entre variables: cuando al incrementar el valor de una variable, la otra variable ve asimismo incrementar sus valores, en general y aproximadamente de forma lineal, la covarianza será positiva; si al incrementar una variable, la otra en general ve disminuir sus valores, la covarianza es negativa.

  • « Ir a la página anterior
  • Ir a la página 1
  • Páginas intermedias omitidas …
  • Ir a la página 3
  • Ir a la página 4
  • Ir a la página 5
  • Ir a la página 6
  • Ir a la página siguiente »

Sigmalitika

Copyright © 2020 · Monochrome Pro on Genesis Framework · WordPress · Iniciar sesión