Una distribución conjunta de datos es un conjunto de datos o una representación de estos que especifica los valores que toman las variables consideradas para cada elemento o individuo, o las frecuencias cruzadas entre los valores de las diferentes variables. Cuando la distribución conjunta incluye dos variables se dice que es bidimensional o bivariada, y multidimensional o bivariada cuando incluye más de dos variables estadísticas.
Hay que recalcar el hecho de que una distribución conjunta no resulta de unir simplemente dos variables estadísticas. Por ejemplo, si tenemos las notas de matemáticas de 10 alumnos de una clase A y 10 notas de lenguaje de una clase B, al unir los dos grupos de datos tendremos dos distribuciones univariadas, pero no una distribución bivariada, porque los datos se refieren a diferentes individuos; para que se pudiera considerar como una distribución conjunta, los datos de notas deberían ser obtenidos de los mismos individuos y además tener identificados cada par de notas de cada individuo, aunque no conozcamos su identificación.
Una distribución conjunta original o cruda de datos se puede resumir y representar de múltiples maneras: una tabla de doble entrada resume los datos agrupando los pares de datos con los mismos valores; una nube de puntos representa gráficamente una distribución de dos variables continuas y una tabla de contingencia resume por categorías cruzadas una distribución conjunta de dos variables cuantitativas.