ESTADÍSTICA BIDIMENSIONAL: DIAGRAMA DE DISPERSIÓN Y CORRELACIÓN
1. Variables dobles: qué medimos
Cuando a cada individuo le tomamos dos valores, obtenemos una “pareja” (x, y).
Ejemplos típicos:
- (horas de estudio, nota)
- (edad, altura)
- (temperatura, consumo eléctrico)
El objetivo es averiguar si esos dos valores están relacionados y cómo.
2. Tabla de datos y frecuencias conjuntas
| Alumno | Horas x | Nota y |
|---|---|---|
| A | 1 | 4 |
| B | 2 | 5 |
| C | 2 | 6 |
| D | 3 | 7 |
| … | … | … |
- Registra cada pareja.
- Cuenta repeticiones si hay valores iguales → frecuencia conjunta.
3. Diagrama de dispersión
- En un eje colocas x (variable explicativa).
- En el otro eje colocas y (variable respuesta).
- Cada pareja (x, y) se dibuja como un punto.
Lo que ves a simple vista
| Patrón de puntos | Relación |
|---|---|
| Nube con tendencia ascendente | x ↑ → y ↑ (relación directa) |
| Nube con tendencia descendente | x ↑ → y ↓ (relación inversa) |
| Nube sin forma clara | Sin relación lineal |
4. Covarianza (idea simplificada)
- Resta a cada x su media x–x̄.
- Resta a cada y su media y–ȳ.
- Multiplica esas diferencias y suma.
Signo de la suma → indica el sentido de la relación.
(Tabla completa está en el libro; aquí basta la idea).
5. Coeficiente de correlación r
Fórmula práctica (sin símbolos raros):
r = [ n*sum(xy) – sum(x)*sum(y) ] /
√[ ( n*sum(x^2) – (sum x)^2 ) * ( n*sum(y^2) – (sum y)^2 ) ]
| Valor r | Interpretación |
|---|---|
| r ≈ 1 | Relación lineal fuerte, directa |
| 0.5 < r < 0.8 | Relación moderada, directa |
| –0.5 < r < 0.5 | Relación débil o nula |
| –1 < r < –0.8 | Relación moderada-fuerte, inversa |
| r ≈ –1 | Relación lineal fuerte, inversa |
6. Recta de regresión (mínimos cuadrados)
Ecuación: y = m×x + n
| Cálculo rápido | Fórmula |
|---|---|
| Pendiente m | m = [ n*sum(xy) – sum(x)sum(y) ] / [ nsum(x^2) – (sum x)^2 ] |
| Ordenada n | n = ȳ – m×x̄ |
Esta recta pasa “por el medio” de la nube de puntos y minimiza los errores verticales.
7. Cómo usar la recta (predicción)
- Sustituye un valor nuevo de x en la ecuación → obtienes y estimada.
- No te alejes demasiado del rango observado (extrapolar lejos suele fallar).
- Comprueba si el |r| es al menos 0.5 antes de fiarte de la predicción.
8. Errores frecuentes y mini-reto
| Error | Solución rápida |
|---|---|
| Confundir causa y efecto | Correlación ≠ causalidad. Necesitas un estudio aparte para demostrar causa. |
| Usar unidades mezcladas (cm y m) | Homogeneiza unidades antes de calcular. |
| Incluir “puntos raros” (outliers) sin revisar | Comprueba si son errores o casos especiales que distorsionan r. |
