ESTADÍSTICA BIDIMENSIONAL: DIAGRAMA DE DISPERSIÓN Y CORRELACIÓN

1. Variables dobles: qué medimos

Cuando a cada individuo le tomamos dos valores, obtenemos una “pareja” (x, y).
Ejemplos típicos:

  • (horas de estudio, nota)
  • (edad, altura)
  • (temperatura, consumo eléctrico)

El objetivo es averiguar si esos dos valores están relacionados y cómo.


2. Tabla de datos y frecuencias conjuntas

AlumnoHoras xNota y
A14
B25
C26
D37
  1. Registra cada pareja.
  2. Cuenta repeticiones si hay valores iguales → frecuencia conjunta.

3. Diagrama de dispersión

  • En un eje colocas x (variable explicativa).
  • En el otro eje colocas y (variable respuesta).
  • Cada pareja (x, y) se dibuja como un punto.

Lo que ves a simple vista

Patrón de puntosRelación
Nube con tendencia ascendentex ↑ → y ↑ (relación directa)
Nube con tendencia descendentex ↑ → y ↓ (relación inversa)
Nube sin forma claraSin relación lineal

4. Covarianza (idea simplificada)

  • Resta a cada x su media x–x̄.
  • Resta a cada y su media y–ȳ.
  • Multiplica esas diferencias y suma.
    Signo de la suma → indica el sentido de la relación.
    (Tabla completa está en el libro; aquí basta la idea).

5. Coeficiente de correlación r

Fórmula práctica (sin símbolos raros):

r =  [ n*sum(xy) – sum(x)*sum(y) ] /
√[ ( n*sum(x^2) – (sum x)^2 ) * ( n*sum(y^2) – (sum y)^2 ) ]
Valor rInterpretación
r ≈ 1Relación lineal fuerte, directa
0.5 < r < 0.8Relación moderada, directa
–0.5 < r < 0.5Relación débil o nula
–1 < r < –0.8Relación moderada-fuerte, inversa
r ≈ –1Relación lineal fuerte, inversa

6. Recta de regresión (mínimos cuadrados)

Ecuación: y = m×x + n

Cálculo rápidoFórmula
Pendiente mm = [ n*sum(xy) – sum(x)sum(y) ] / [ nsum(x^2) – (sum x)^2 ]
Ordenada nn = ȳ – m×x̄

Esta recta pasa “por el medio” de la nube de puntos y minimiza los errores verticales.


7. Cómo usar la recta (predicción)

  1. Sustituye un valor nuevo de x en la ecuación → obtienes y estimada.
  2. No te alejes demasiado del rango observado (extrapolar lejos suele fallar).
  3. Comprueba si el |r| es al menos 0.5 antes de fiarte de la predicción.

8. Errores frecuentes y mini-reto

ErrorSolución rápida
Confundir causa y efectoCorrelación ≠ causalidad. Necesitas un estudio aparte para demostrar causa.
Usar unidades mezcladas (cm y m)Homogeneiza unidades antes de calcular.
Incluir “puntos raros” (outliers) sin revisarComprueba si son errores o casos especiales que distorsionan r.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *