Correlation 相关系数
一句话定义
相关系数 (correlation coefficient) 是协方差的标准化版本,衡量两个变量之间线性关系的强度和方向,取值范围为 ,无单位。
概念解析 Explanation
为什么需要相关系数? 协方差告诉我们两个变量是同向还是反向运动,但其数值大小取决于变量的单位,无法比较不同变量对之间关系的强弱。相关系数通过除以两个变量各自的标准差来标准化,使得:
- 无单位:可以跨不同变量对进行比较
- 有界:,有明确的解读
解读指南:
- :完美正线性关系(散点图上所有点在一条正斜率直线上)
- :完美负线性关系
- :无线性关系(但可能存在非线性关系!)
- 0 < |\rho| < 0.3$:弱相关
- 0.3 < |\rho| < 0.7$:中度相关
- :强相关
重要警告:
- Correlation ≠ Causation:相关不代表因果
- Spurious correlation 虚假相关:两个不相关的变量可能因第三变量或纯粹巧合而显示高相关
- 相关系数只能捕捉线性关系;散点图可以揭示非线性关系
- 异常值可以极大地影响相关系数
核心公式 Formula
Covariance 协方差:
Correlation 相关系数:
反解:
检验 的 t 统计量:
Spearman 秩相关(非参数):
图解 Visual
graph LR A["协方差 Cov(X,Y)<br/>有单位,数值难以比较"] -->|"÷ σ_X × σ_Y"| B["相关系数 ρ<br/>无单位,[-1, +1]"] B -->|"ρ > 0"| C["正相关<br/>同涨同跌"] B -->|"ρ < 0"| D["负相关<br/>一涨一跌"] B -->|"ρ = 0"| E["无线性关系"]
计算示例 Worked Example
问题:Stock A 收益方差 0.0028,Stock B 收益方差 0.0124,两者协方差 0.0058。求相关系数并解读。
Step 1 标准差:
Step 2 相关系数:
解读:接近 +1,说明 A 和 B 之间存在非常强的正线性关系——当一只股票的收益高于其均值时,另一只几乎总是也高于均值。从分散化角度看,这两只股票组合在一起几乎无法降低风险。
考试要点 Exam Focus
必考
- 相关系数 = 协方差/两个标准差之积
- 取值范围 ,无单位
- 不代表”无关”,只代表”无线性关系”
- 在组合方差公式中,相关系数是核心参数:
- 越低 → 分散化效果越好
- 简单回归中
涉及科目 Appears In
- 数量方法 R3 (Statistical Measures), R5 (Portfolio Math), R9 (Tests of Independence), R10 (Regression)
- 组合管理 — 有效前沿、资产配置
- 权益投资 — 因子模型中的相关性