数量方法 Quantitative Methods

考试占比 Exam Weight: 6-9% | Readings: 1-11

科目概览 Overview

数量方法是 CFA Level I 的数学基础科目，覆盖从利率、TVM 到统计学、假设检验和回归分析。这是公式最多的科目，但概念间的逻辑链条清晰。掌握本科目不仅服务于考试本身，还为 Fixed Income（债券定价）、Equity（DDM 估值）、Portfolio Management（组合方差）和 Derivatives（二叉树定价）提供核心工具。

graph LR
  ROOT((数量方法<br/>Quantitative Methods))
  ROOT --- A["收益率与TVM<br/>Rates & TVM"]
  A --- A1("利率分解 Interest Rate Decomposition")
  A --- A2("HPR与年化 HPR & Annualization")
  A --- A3("TVM计算 TVM Calculations")
  A --- A4("年金与永续 Annuity & Perpetuity")
  ROOT --- B["统计学 Statistics"]
  B --- B1("集中趋势 Central Tendency")
  B --- B2("离散度 Dispersion")
  B --- B3("偏度与峰度 Skewness & Kurtosis")
  B --- B4("相关系数 Correlation")
  ROOT --- C["概率与组合 Probability & Portfolio"]
  C --- C1("期望值与方差 Expected Value & Variance")
  C --- C2("贝叶斯公式 Bayes")
  C --- C3("概率树 Probability Tree")
  C --- C4("组合收益与风险 Portfolio Risk & Return")
  ROOT --- D["推断统计 Inferential Statistics"]
  D --- D1("抽样方法 Sampling")
  D --- D2("CLT 中心极限定理")
  D --- D3("置信区间 Confidence Interval")
  D --- D4("假设检验 Hypothesis Testing")
  ROOT --- E["回归与技术 Regression & Tech"]
  E --- E1("线性回归 Linear Regression")
  E --- E2("ANOVA 方差分析")
  E --- E3("模拟方法 Simulation")
  E --- E4("大数据 Big Data")

R1: 利率与收益率 Rates and Returns

1.1 利率的三重身份

利率 (interest rate) 可以从三个角度理解：

角度	含义
Required rate of return 必要收益率	投资者愿意出借资金所要求的最低回报
Discount rate 折现率	将未来现金流折算为现值时使用的比率
Opportunity cost 机会成本	选择消费而放弃投资所损失的收益

1.2 利率分解 Interest Rate Decomposition

名义利率可以分解为多个风险溢价的叠加：

$Nominal Rate = Real Risk-Free Rate + Inflation Premium + Default Risk Premium + Liquidity Premium + Maturity Premium$

直觉理解

Real risk-free rate 反映人们对”现在消费 vs 未来消费”的时间偏好 (time preference)。其余每一项溢价都是对投资者承担某种特定风险的补偿。

精确关系 (Fisher equation)：

$(1 + Nominal risk-free rate) = (1 + Real risk-free rate) (1 + Expected inflation)$

近似关系： $Nominal risk-free rate \approx Real risk-free rate + Expected inflation$

1.3 持有期收益率 Holding Period Return (HPR)

$HPR = \frac{P _{1} + D _{1}}{P _{0}} - 1 = \frac{P _{1} - P _{0} + D _{1}}{P _{0}}$

例题：买入价 20，期末价 22，期间收到 1 股利。 $HPR = \frac{22 + 1}{20} - 1 = \frac{23}{20} - 1 = 15%$

多期 HPR 用复利连乘： $HPR_{t o t a l} = (1 + HPR_{1}) (1 + HPR_{2}) \dots (1 + HPR_{n}) - 1$

1.4 各类均值 Types of Means

算术平均 Arithmetic Mean (AM)

$\overset{ˉ}{R} = \frac{R _{1} + R _{2} + \dots + R _{n}}{n}$

用途：包含所有观测值，是总体均值的无偏估计量
特点：受异常值影响大

几何平均 Geometric Mean (GM)

$R_{G} = n (1 + R_{1}) (1 + R_{2}) \dots (1 + R_{n}) - 1$

用途：计算多期复合年化收益率
特点：反映真实的累积增长

例题：三年收益率分别为 -9.34%、23.45%、8.92%。 $R_{G} = 3 (1 - 0.0934) (1 + 0.2345) (1 + 0.0892) - 1 = 3 0.9066 \times 1.2345 \times 1.0892 - 1$ $= 3 1.21903 - 1 = 1.06825 - 1 = 6.825%$

调和平均 Harmonic Mean (HM)

$\overset{ˉ}{X}_{H} = \frac{N}{\sum _{i = 1}^{N} \frac{1}{X _{i}}}$

用途：计算定额投资（dollar-cost averaging）的平均成本
特点：只能用于正数

例题：每月投 1,000 买基金，三个月单价分别为 8、9、10。 $\overset{ˉ}{X}_{H} = \frac{3}{\frac{1}{8} + \frac{1}{9} + \frac{1}{10}} = \frac{3}{0.125 + 0.111 + 0.100} = \frac{3}{0.336} = 8.93$

必考关系

当数据不全相等时：HM < GM < AM（调和 < 几何 < 算术）仅当所有数值相同时三者相等。

graph LR
    HM["调和平均 HM"] -->|"<="| GM["几何平均 GM"] -->|"<="| AM["算术平均 AM"]
    style HM fill:#e8f5e9
    style GM fill:#fff3e0
    style AM fill:#fce4ec

均值类型	适用场景	示例
Arithmetic Mean	估计期望收益（含异常值）	预测下一年的平均收益
Geometric Mean	多期复合收益	计算过去 5 年的年化收益
Harmonic Mean	定额投资的平均成本	Dollar-cost averaging 的平均买入价
Trimmed Mean	排除异常值	去除最高和最低 5% 后的均值
Winsorized Mean	替代异常值	将极端值替换为边界百分位数

1.5 货币加权与时间加权收益率

Money-Weighted Rate of Return (MWRR)

MWRR 本质上就是内部收益率 (IRR)——使得所有现金流入的现值等于所有现金流出的现值的折现率。

$\sum_{t = 0}^{T} \frac{C F _{t}}{( 1 + M W RR ) ^{t}} = 0$

受现金流进出时点影响
如果大额资金恰好在高收益期前投入，MWRR > TWRR

Time-Weighted Rate of Return (TWRR)

三步法：

在每次外部现金流发生时分割子期间
计算每个子期间的 HPR
将所有子期间的 (1 + HPR) 连乘，再取几何平均

$TWRR = [\prod_{t = 1}^{n} (1 + H P R_{t})]^{1/ n} - 1$

考试必考对比

TWRR 是投资管理行业首选，衡量基金经理的选股能力（不受投资者存取款影响）

MWRR 在基金经理能控制现金流进出时更合适

若资金在高收益期前涌入：MWRR > TWRR

若资金在低收益期前涌入：MWRR < TWRR

例题：投资者在 t=0 以 100 买入 1 股，t=1 时以 120 再买 1 股（当年股利 2/股），t=2 时以 130 卖出两股（股利 2/股）。

TWRR 计算：

HPR₁ = (120 + 2) / 100 - 1 = 22%
HPR₂ = (260 + 4) / 240 - 1 = 10%
TWRR = $1.22 \times 1.10 - 1 = 1.342 - 1 = 15.84%$

MWRR 计算：

CF₀ = +100, CF₁ = +118, CF₂ = -264
求解 IRR = 13.86%

MWRR (13.86%) < TWRR (15.84%)，因为更多资金在第二年（低收益期 10%）投入。

1.6 年化收益与连续复利

年化收益 (Annualized Return)：

$Annualized Return = (1 + H PR)^{365/ days} - 1$

例题：90 天赚了 0.75%。 $Annualized = (1.0075)^{365/90} - 1 = 3.08%$

连续复利收益 (Continuously Compounded Return)：

$R_{cc} = ln (1 + H PR) = ln (\frac{P _{1}}{P _{0}})$

连续复利收益的关键特性：跨期可加。从 t=0 到 t=2 的连续复利收益 = t=0 到 t=1 + t=1 到 t=2。

例题：100 买入，120 卖出。 $R_{cc} = ln (120/100) = ln (1.20) = 18.23%$

1.7 其他收益率概念

概念	定义
Gross return	扣除交易佣金后、扣除管理费前的总收益
Net return	扣除管理费和行政费后的收益
Pretax nominal return	税前名义收益
After-tax nominal return	税后名义收益
Real return	扣除通胀后的收益，衡量购买力变化
Leveraged return	使用杠杆放大后的收益率

精确实际收益： $(1 + Real Return) = \frac{( 1 + Nominal Return )}{( 1 + Inflation )}$

杠杆收益公式：

$Leveraged Return = \frac{r ( V _{0} + V _{B} ) - r _{B} \cdot V _{B}}{V _{0}}$

其中 $V_{0}$ 是自有资金， $V_{B}$ 是借入资金， $r_{B}$ 是借款利率。

R2: 货币时间价值 The Time Value of Money in Finance

跨科关联

TVM 是整个 CFA 课程的基石：Fixed Income 的债券定价、Equity 的 DDM 估值、Corporate Finance 的 NPV/IRR 决策全部依赖 TVM。

2.1 核心公式

$F V = P V (1 + r)^{t}$

$P V = \frac{F V}{( 1 + r ) ^{t}} = F V (1 + r)^{- t}$

连续复利： $F V = P V \cdot e^{r t}$ ， $P V = F V \cdot e^{- r t}$

2.2 固定收益证券定价

零息债券 (Zero-Coupon Bond)：

$P V = \frac{Face Value}{( 1 + r ) ^{N}}$

例题：面值 1,000，到期 15 年，YTM = 4%。 $P V = \frac{1000}{( 1.04 ) ^{15}} = 555.26$

附息债券 (Coupon Bond)：

$P V = \sum_{t = 1}^{N} \frac{C}{( 1 + r ) ^{t}} + \frac{F V}{( 1 + r ) ^{N}}$

用计算器：N = 期数，I/Y = 折现率，PMT = 票息，FV = 面值，CPT PV。

价格与收益率反向关系

价格上升 → 收益率下降；收益率上升 → 价格下降。这是 Fixed Income 的核心原理。

2.3 永续年金与普通年金

永续年金 (Perpetuity)：

$P V = \frac{PMT}{r}$

例题：优先股每年派息 5，要求回报率 8%。 $P V = \frac{5}{0.08} = 62.50$

年金支付额 (Annuity Payment)：

$PMT = \frac{r \times P V}{1 - ( 1 + r ) ^{- t}}$

2.4 股票估值模型 (DDM)

Gordon Growth Model（恒定增长 DDM）：

$V_{0} = \frac{D _{1}}{k _{e} - g _{c}}$

其中 $D_{1}$ 是下期预期股利， $k_{e}$ 是股权要求回报率， $g_{c}$ 是永续增长率。

要求： $k_{e} > g_{c}$

例题：预期股利 1.62，增长率 8%，要求回报率 12%。 $V_{0} = \frac{1.62}{0.12 - 0.08} = 40.50$

反解求隐含回报率： $k_{e} = \frac{D _{1}}{V _{0}} + g_{c}$

反解求隐含增长率： $g_{c} = k_{e} - \frac{D _{1}}{V _{0}}$

2.5 现金流可加性与无套利

Cash Flow Additivity Principle：任何现金流序列的现值 = 各组成部分现值之和。

这是 no-arbitrage principle（一价定律）的基础：两组相同的未来现金流必须有相同的当前价值。

远期利率推导：

$(1 + S_{n})^{n} = (1 + S_{1}) (1 +_{1} f_{1}) (1 +_{2} f_{1}) \dots$

例题： $S_{1} = 4%$ ， $S_{2} = 8%$ ，求 $_{1} f_{1}$ （一年后的一年期远期利率）。 $(1.08)^{2} = (1.04) (1 +_{1} f_{1})$ $_{1} f_{1} = \frac{1.1664}{1.04} - 1 = 12.15%$

远期汇率的无套利关系：

$\frac{Forward}{Spot} = \frac{1 + r _{price currency}}{1 + r _{base currency}}$

R3: 资产收益的统计度量 Statistical Measures of Asset Returns

3.1 集中趋势 Measures of Central Tendency

指标	定义	特点
Arithmetic Mean $\overset{ˉ}{X}$	$\frac{\sum X _{i}}{n}$	受异常值影响
Median 中位数	排序后的中间值	不受异常值影响
Mode 众数	出现频率最高的值	可无/可多个
Trimmed Mean	去除两端极值后的均值	减少异常值影响
Winsorized Mean	将极端值替换为边界值后的均值	替代而非删除

分位数 (Quantiles)：

Quartile（四分位）、Quintile（五分位）、Decile（十分位）、Percentile（百分位）
Interquartile Range (IQR) = Q3 - Q1

3.2 离散度 Measures of Dispersion

在投资中，集中趋势衡量 reward，离散度衡量 risk。

Range = Max - Min

Mean Absolute Deviation (MAD)：

$M A D = \frac{\sum _{i = 1}^{n} ∣ X _{i} - X ˉ ∣}{n}$

Sample Variance $s^{2}$ ：

$s^{2} = \frac{\sum _{i = 1}^{n} ( X _{i} - X ˉ ) ^{2}}{n - 1}$

为什么除以 n-1？

使用 $n - 1$ （自由度）而非 $n$ 作为分母，是因为用 $n$ 会系统性地低估总体方差（特别是小样本）。 $n - 1$ 使样本方差成为总体方差的无偏估计量 (unbiased estimator)。

标准差 $s$ ：

$s = s^{2} = \frac{\sum _{i = 1}^{n} ( X _{i} - X ˉ ) ^{2}}{n - 1}$

例题：5 位基金经理的年化收益为 30%、12%、25%、20%、23%。 $\overset{ˉ}{X} = \frac{30 + 12 + 25 + 20 + 23}{5} = 22%$ $s^{2} = \frac{( 30 - 22 ) ^{2} + ( 12 - 22 ) ^{2} + ( 25 - 22 ) ^{2} + ( 20 - 22 ) ^{2} + ( 23 - 22 ) ^{2}}{5 - 1} = \frac{64 + 100 + 9 + 4 + 1}{4} = 44.5 (%^{2})$ $s = 44.5 = 6.67%$

变异系数 Coefficient of Variation (CV)：

$C V = \frac{s}{X ˉ}$

衡量每单位收益承担的风险。CV 越低越好。

例题：T-bills 均值 0.25%，标准差 0.36%；S&P 500 均值 1.09%，标准差 7.30%。 $C V_{T - bi ll s} = 0.36/0.25 = 1.44 C V_{S & P} = 7.30/1.09 = 6.70$ T-bills 的单位收益风险更低。

Target Downside Deviation（半偏差）：

$s_{t a r g e t} = \frac{\sum _{all X_{i} < B} ( X _{i} - B ) ^{2}}{n - 1}$

其中 $B$ 是目标收益。注意分母仍是 $n - 1$ （全样本量减一），即使只用了低于目标的观测值。

3.3 偏度与峰度 Skewness and Kurtosis

Skewness（偏度）衡量分布的不对称性：

Positive skew（右偏）：右尾长 → Mean > Median > Mode
Negative skew（左偏）：左尾长 → Mean < Median < Mode
Symmetric：Mean = Median = Mode

记忆口诀

均值被偏度的方向”拉走”，中位数永远在均值和众数之间。

Kurtosis（峰度）衡量尾部厚度：

类型	Excess Kurtosis	特征
Mesokurtic	= 0	正态分布
Leptokurtic	> 0	尖峰、肥尾，极端值概率更大
Platykurtic	< 0	扁平、薄尾

Excess Kurtosis = Kurtosis - 3（正态分布的 kurtosis = 3）

风险管理视角

实际金融收益通常具有负偏度 + 正超额峰度（即左偏 + 肥尾），这意味着极端亏损的概率比正态分布预测的更大。风险管理者重点关注尾部风险。

3.4 相关系数与协方差

Covariance 协方差：

$s_{X Y} = \frac{\sum _{i = 1}^{n} ( X _{i} - X ˉ ) ( Y _{i} - Y ˉ )}{n - 1}$

协方差的数值大小取决于单位，难以直接比较。

Correlation 相关系数（标准化的协方差）：

$ρ_{X Y} = \frac{s _{X Y}}{s _{X} \cdot s _{Y}}$

性质：

$- 1 \leq ρ \leq + 1$
$ρ = + 1$ ：完美正相关
$ρ = - 1$ ：完美负相关
$ρ = 0$ ：无线性关系（但可能有非线性关系！）
无单位

例题：Stock A 方差 0.0028，Stock B 方差 0.0124，协方差 0.0058。 $ρ_{A B} = \frac{0.0058}{0.0028 \times 0.0124} = \frac{0.0058}{0.0529 \times 0.1114} = 0.984$

Correlation ≠ Causation

相关性不意味着因果关系。Spurious correlation（虚假相关）可能由第三变量或纯粹巧合导致。

R4: 概率树与条件期望 Probability Trees and Conditional Expectations

4.1 期望值与方差

期望值 (Expected Value)：

$E (X) = \sum_{i} P (x_{i}) \cdot x_{i}$

方差（基于概率模型）：

$Var (X) = \sum_{i} P (x_{i}) [x_{i} - E (X)]^{2}$

$σ = Var (X)$

样本方差 vs 概率模型方差

样本方差除以 $n - 1$ ；概率模型方差用概率加权求和（没有 $n$ ，因为描述的是完整分布）。

例题：Stock A 在三种经济情景下的表现：

情景	概率	收益
Boom	30%	20%
Normal	50%	12%
Slow	20%	5%

$E (R_{A}) = 0.30 (0.20) + 0.50 (0.12) + 0.20 (0.05) = 0.06 + 0.06 + 0.01 = 13%$ $Var (R_{A}) = 0.30 (0.20 - 0.13)^{2} + 0.50 (0.12 - 0.13)^{2} + 0.20 (0.05 - 0.13)^{2}$ $= 0.30 (0.0049) + 0.50 (0.0001) + 0.20 (0.0064) = 0.00147 + 0.00005 + 0.00128 = 0.0028$ $σ_{A} = 0.0028 = 5.29%$

4.2 概率树 Probability Tree

概率树将复杂的联合概率分解为一系列条件概率的乘积，适合可视化多层决策/事件。

Conditional expected value 条件期望值：取决于某个先决事件的结果。当新信息到达时，分析师用条件期望值更新预测。

4.3 贝叶斯公式 Bayes’ Formula

$P (A ∣ B) = \frac{P ( B ∣ A ) \cdot P ( A )}{P ( B )}$

直觉：根据新证据 B 的出现，更新对事件 A 发生概率的判断。

$Updated probability = \frac{P(new info | event) \times P(event prior)}{P(new info)}$

例题：经济表现好的概率 60%（若表现好，股票上涨概率 70%）；经济表现差的概率 40%（若表现差，股票上涨概率 20%）。已知股票上涨了，求经济表现好的概率。

P(stock up) = 0.60(0.70) + 0.40(0.20) = 0.42 + 0.08 = 0.50

$P (good economy ∣ stock up) = \frac{0.42}{0.50} = 84%$

Prior 从 60% 更新到了 84%——股票上涨这一信息大幅提升了我们对经济向好的信心。

R5: 组合数学 Portfolio Mathematics

5.1 组合收益与方差

Portfolio expected return 组合期望收益：

$E (R_{p}) = \sum_{i = 1}^{n} w_{i} \cdot E (R_{i})$

Two-asset portfolio variance 两资产组合方差：

$σ_{p}^{2} = w_{A}^{2} σ_{A}^{2} + w_{B}^{2} σ_{B}^{2} + 2 w_{A} w_{B} Cov_{A B}$

等价于：

$σ_{p}^{2} = w_{A}^{2} σ_{A}^{2} + w_{B}^{2} σ_{B}^{2} + 2 w_{A} w_{B} ρ_{A B} σ_{A} σ_{B}$

分散化的数学基础

只要 $ρ_{A B} < 1$ ，组合标准差就低于各资产标准差的加权平均。 $ρ$ 越低，分散化效果越好。当 $ρ = - 1$ 时可以构造零风险组合。这是分散化的数学本质。

三资产组合方差：

$σ_{p}^{2} = w_{A}^{2} σ_{A}^{2} + w_{B}^{2} σ_{B}^{2} + w_{C}^{2} σ_{C}^{2} + 2 w_{A} w_{B} Cov_{A B} + 2 w_{A} w_{C} Cov_{A C} + 2 w_{B} w_{C} Cov_{BC}$

一般规则： $n$ 个资产有 $n$ 个方差项和 $\frac{n ( n - 1 )}{2}$ 个唯一协方差项。

例题：60% 国内股票、30% 国内债券、10% 国际股票。协方差矩阵如下：

	股票	债券	国际
股票	400	44	180
债券	44	70	35
国际	180	35	450

$σ_{p}^{2} = (0. 6^{2}) (400) + (0. 3^{2}) (70) + (0. 1^{2}) (450) + 2 (0.6) (0.3) (44) + 2 (0.6) (0.1) (180) + 2 (0.3) (0.1) (35)$ $= 144 + 6.3 + 4.5 + 15.84 + 21.6 + 2.1 = 194.34$ $σ_{p} = 194.34 = 13.94%$

5.2 Shortfall Risk 与 Roy’s Safety-First Criterion

Shortfall risk 缺口风险：组合收益低于目标值的概率。

Safety-First Ratio (SFRatio)：

$SFR a t i o = \frac{E ( R _{p} ) - R _{L}}{σ _{p}}$

其中 $R_{L}$ 是最低可接受收益（threshold）。

Roy’s criterion：选择 SFRatio 最大的组合（即缺口风险最小的组合）。

例题：目标收益 3%，三个组合：

组合	E(R)	$σ$	SFRatio
A	9%	12%	(9-3)/12 = 0.50
B	11%	20%	(11-3)/20 = 0.40
C	6.6%	8.2%	(6.6-3)/8.2 = 0.44

选择 Portfolio A（SFRatio 最大 = 0.50）。

R6: 模拟方法 Simulation Methods

6.1 对数正态分布

若 $x$ 服从正态分布，则 $e^{x}$ 服从对数正态分布 (lognormal distribution)。

$P_{T} = P_{0} \cdot e^{r_{0, T}}$

对数正态分布用于建模资产价格：

不会为负（资产价格 ≥ 0）
右偏（大幅上涨可能，但下跌有限于本金）

若连续复利收益独立同分布 (i.i.d.)，则价格为对数正态分布。

6.2 Monte Carlo Simulation

步骤：

指定风险因子的概率分布及参数
随机生成大量风险因子值
用定价模型计算每组随机值对应的证券价值
重复成百上千次，统计分布特征

优点：可以模拟历史中未出现的极端情景（what-if 分析）缺点：结果只与假设一样好；复杂度高；是统计方法而非解析方法

应用：复杂衍生品定价、VaR 估计、养老金资产负债模拟、策略回测。

6.3 Bootstrap Resampling

Bootstrap：从已有样本中有放回地反复抽取子样本，计算统计量的分布。

$SE (\overset{ˉ}{X}) \approx sd of bootstrap sample means$

优点：不需要关于总体分布的假设；能为复杂统计量构建置信区间
缺点：受限于原始样本的分布范围

R7: 估计与推断 Estimation and Inference

7.1 抽样方法

方法	类型	描述	抽样误差
Simple random	概率	每个个体等概率被选中	基准
Systematic	概率	每隔 n 个抽一个	近似随机
Stratified random	概率	按特征分层，每层随机抽样	通常更小
Cluster	概率	随机选簇，簇内全部或随机抽样	通常更大
Convenience	非概率	方便获取的数据	可能很大
Judgmental	非概率	研究者主观选取	取决于判断质量

7.2 中心极限定理 (CLT)

CLT 核心表述

对于均值为 $μ$ 、方差为 $σ^{2}$ 的总体，当样本量 $n$ 足够大（通常 $n \geq 30$ ）时，样本均值 $\overset{ˉ}{X}$ 的抽样分布近似正态分布： $\overset{ˉ}{X} \sim N (μ, \frac{σ ^{2}}{n})$ 无论总体本身是什么分布。

这意味着：

样本均值的期望值 = 总体均值 $μ$
样本均值的方差 = $σ^{2} / n$ （样本越大，估计越精确）

Standard Error of the Sample Mean 样本均值的标准误：

$σ_{\overset{ˉ}{X}} = \frac{σ}{n} (σ known)$

$s_{\overset{ˉ}{X}} = \frac{s}{n} (using sample s)$

例题：30 个月度收益，均值 2%，样本标准差 20%。 $s_{\overset{ˉ}{X}} = \frac{20%}{30} = 3.65%$

7.3 Resampling: Jackknife vs Bootstrap

方法	原理	优点	缺点
Jackknife	每次移除一个观测值，计算 n 个样本均值	计算简单；可去除偏差	精度有限
Bootstrap	有放回抽取大量等大样本	可为复杂统计量构建 CI	计算量大；受限于样本

R8: 假设检验 Hypothesis Testing

跨科关联

假设检验不仅在数量方法中考，也是理解 Economics 中政策检验、Equity 中 Alpha 检验的基础。

8.1 假设检验基本框架

七步流程：

State the hypotheses（ $H_{0}$ 和 $H_{a}$ ）
Select the appropriate test statistic
Specify the significance level $α$
State the decision rule
Collect sample and calculate the test statistic
Make a decision (reject or fail to reject $H_{0}$ )
Make a decision based on the test results

Null hypothesis $H_{0}$ ：希望被拒绝的假设（始终包含”=”） Alternative hypothesis $H_{a}$ ：希望被支持的假设

8.2 Type I & Type II Errors

	$H_{0}$ 为真	$H_{0}$ 为假
不拒绝 $H_{0}$	正确决策	Type II Error ( $β$ )
拒绝 $H_{0}$	Type I Error ( $α$ )	正确决策 (Power)

Significance level $α$ = P(Type I Error) = P(拒绝真的 $H_{0}$ )
Power = 1 - \beta $= P (拒绝假的$ H_0$)
降低 $α$ （更严格）→ $β$ 增大 → Power 降低
增大样本量 → 可同时降低 Type I 和 Type II Error

统计用语

我们说 “fail to reject $H_{0}$ “，不说 “accept $H_{0}$ ”。

p-value：使得 $H_{0}$ 被拒绝的最小显著性水平。若 $p < α$ ，则拒绝 $H_{0}$ 。

8.3 检验统计量

$Test statistic = \frac{Sample statistic - Hypothesized value}{Standard error of the sample statistic}$

常用 z 临界值：

显著性水平 $α$	单尾	双尾
10%	1.28	1.65
5%	1.65	1.96
1%	2.33	2.58

8.4 各类检验汇总

flowchart TD
    A["要检验什么？"] --> B{"关于均值？"}
    A --> C{"关于方差？"}
    B -->|"单总体均值"| D["t-test<br/>df = n-1"]
    B -->|"两总体均值差异"| E{"样本独立？"}
    E -->|"独立"| F["t-test (差异检验)<br/>df = n₁+n₂-2"]
    E -->|"不独立"| G["Paired t-test<br/>df = n-1"]
    C -->|"单总体方差"| H["Chi-square test<br/>df = n-1"]
    C -->|"两总体方差比较"| I["F-test<br/>df = n₁-1, n₂-1"]
    style D fill:#e3f2fd
    style F fill:#e3f2fd
    style G fill:#e3f2fd
    style H fill:#fff3e0
    style I fill:#fce4ec

检验对象	检验方法	检验统计量	自由度
单总体均值	t-test	$t = \frac{X ˉ - μ _{0}}{s / n}$	$n - 1$
两总体均值（独立）	t-test	$t = \frac{( X ˉ _{1} - X ˉ _{2} ) - ( μ _{1} - μ _{2} )}{s _{p} 1/ n _{1} + 1/ n _{2}}$	$n_{1} + n_{2} - 2$
配对比较	Paired t-test	$t = \frac{d ˉ - μ _{d 0}}{s _{\overset{ˉ}{d}}}$	$n - 1$
单总体方差	Chi-square	$χ^{2} = \frac{( n - 1 ) s ^{2}}{σ _{0}^{2}}$	$n - 1$
两总体方差	F-test	$F = \frac{s _{1}^{2}}{s _{2}^{2}}$ （大的放分子）	$n_{1} - 1, n_{2} - 1$

z-test vs t-test

理论上，已知 $σ$ 用 z-test，未知 $σ$ 用 t-test。但当 $n \geq 30$ 时，t 分布近似正态分布，两者结果几乎一样。实务中几乎总是用 t-test（因为 $σ$ 几乎永远未知）。

例题：单总体均值检验

250 天的期权组合日均收益 0.1%，样本标准差 0.25%。检验均值是否 ≠ 0（ $α = 5%$ ，双尾）。

$s_{\overset{ˉ}{X}} = \frac{0.25%}{250} = 0.0158%$ $t = \frac{0.1% - 0}{0.0158%} = 6.33$

6.33 > 1.96 $（双尾临界值），拒绝$ H_0$，日均收益显著不为零。

Chi-square test 例题：

某基金宣称月度收益标准差为 4%。24 个月数据显示 s = 3.8%。 $α = 5%$ ，双尾检验。

$H_{0} : σ^{2} = 0.0016 H_{a} : σ^{2} \neq = 0.0016$

df = 23，临界值： $χ_{0.975}^{2} = 11.689$ ， $χ_{0.025}^{2} = 38.076$

$χ^{2} = \frac{23 \times ( 0.038 ) ^{2}}{( 0.04 ) ^{2}} = \frac{23 \times 0.001444}{0.0016} = 20.76$

11.689 < 20.76 < 38.076 $，不拒绝$ H_0$。

8.5 参数检验 vs 非参数检验

	Parametric 参数检验	Nonparametric 非参数检验
假设	需要分布假设（如正态）	很少或不需要分布假设
适用	连续数据、满足假设时	排序数据、不满足参数假设时
示例	t-test, z-test, F-test	Runs test, Spearman rank
Power	假设成立时更强	通常较弱

R9: 独立性的参数与非参数检验 Parametric and Non-Parametric Tests of Independence

9.1 相关系数的检验

检验 $H_{0} : ρ = 0$ （两变量正态分布时）：

$t = \frac{r n - 2}{1 - r ^{2}}$

$df = n - 2$ ，双尾检验。

例题： $r = 0.35$ ， $n = 42$ ， $α = 5%$ 。 $t = \frac{0.35 40}{1 - 0.1225} = \frac{0.35 \times 6.325}{0.937} = 2.363$

$t_{cr i t i c a l}$ (df=40, two-tailed 5%) = 2.021。2.363 > 2.021 $，拒绝$ H_0$，相关系数显著不为零。

9.2 Spearman 秩相关

非参数方法，用于排序数据或检验非线性关联：

$r_{s} = 1 - \frac{6 \sum d _{i}^{2}}{n ( n ^{2} - 1 )}$

其中 $d_{i}$ 是两组排名的差。

检验统计量与 Pearson 相同： $t = \frac{r _{s} n - 2}{1 - r _{s}^{2}}$ （ $n > 30$ 时近似 t 分布）

9.3 列联表检验 Contingency Table (Chi-Square Test of Independence)

目的：检验两个分类变量是否独立。

$χ^{2} = \sum_{i} \sum_{j} \frac{( O _{ij} - E _{ij} ) ^{2}}{E _{ij}}$

其中 $E_{ij} = \frac{Row i total \times Column j total}{Grand total}$

$df = (r - 1) (c - 1)$

若 $χ^{2} > χ_{cr i t i c a l}^{2}$ ，拒绝独立性假设。

R10: 简单线性回归 Simple Linear Regression

10.1 回归模型基础

$Y_{i} = b_{0} + b_{1} X_{i} + ε_{i}$

$Y$ : 因变量 (dependent variable)
$X$ : 自变量 (independent variable)
$b_{0}$ : 截距 (intercept)
$b_{1}$ : 斜率 (slope coefficient)
$ε_{i}$ : 残差 (error term)

OLS（普通最小二乘法）估计：

$\hat{b}_{1} = \frac{Cov ( X , Y )}{Var ( X )} = \frac{Cov _{X Y}}{σ _{X}^{2}}$

$\hat{b}_{0} = \overset{ˉ}{Y} - \hat{b}_{1} \overset{ˉ}{X}$

关键性质

回归线一定经过 $(\overset{ˉ}{X}, \overset{ˉ}{Y})$ 这个点。

例题：Cov(S&P 500, ABC) = 0.000336, Var(S&P 500) = 0.000522, Mean S&P = -2.70%, Mean ABC = -4.05%。 $\hat{b}_{1} = \frac{0.000336}{0.000522} = 0.64$ $\hat{b}_{0} = - 4.05% - 0.64 (- 2.70%) = - 4.05% + 1.73% = - 2.32%$

斜率 0.64 的含义：S&P 500 超额收益每变化 1%，ABC 超额收益预期变化 0.64%。这就是 ABC 的 Beta。

10.2 回归假设

X 和 Y 之间存在线性关系
残差方差恒定（Homoskedasticity 同方差性）
残差彼此独立（无自相关）
残差服从正态分布

违反这些假设时，残差图 (residual plot) 会出现模式：

非线性 → 残差呈 U 形
异方差 → 残差的散布随 X 增大
非独立 → 残差呈周期性模式

10.3 ANOVA 方差分析与拟合优度

Total variation 分解： $SST = SSR + SSE$

来源	自由度 df	平方和	均方
Regression (explained)	1	SSR	MSR = SSR/1 = SSR
Error (unexplained)	n-2	SSE	MSE = SSE/(n-2)
Total	n-1	SST

Coefficient of Determination $R^{2}$ ：

$R^{2} = \frac{SSR}{SST} = 1 - \frac{SSE}{SST}$

$R^{2}$ 表示自变量解释了因变量总变异的百分比
简单回归中 $R^{2} = r^{2}$ （相关系数的平方）

Standard Error of Estimate (SEE)：

$SEE = MSE = \frac{SSE}{n - 2}$

SEE 越小，模型拟合越好。

F-statistic（回归整体显著性）：

$F = \frac{MSR}{MSE}$

$d f_{1} = 1$ ， $d f_{2} = n - 2$ 。单尾检验： $F > F_{cr i t i c a l}$ 则拒绝 $H_{0} : b_{1} = 0$ 。

在简单回归中，F 检验等价于对斜率的 t 检验（ $F = t^{2}$ ）。

例题：ANOVA 表解读

36 个观测值的 ANOVA 表：SSR = 0.0076，SSE = 0.0406，SST = 0.0482。 $R^{2} = \frac{0.0076}{0.0482} = 15.8%$ $MSE = \frac{0.0406}{34} = 0.0012$ $SEE = 0.0012 = 0.035$ $F = \frac{0.0076}{0.0012} = 6.33$

10.4 斜率系数的假设检验

$t_{b_{1}} = \frac{b ^ _{1} - b _{1}}{s _{\hat{b}_{1}}}$

$df = n - 2$ 。

例题： $\hat{b}_{1} = 0.64$ ， $s_{\hat{b}_{1}} = 0.26$ ， $n = 36$ ，检验 $H_{0} : b_{1} = 0$ 。 $t = \frac{0.64 - 0}{0.26} = 2.46$ $t_{cr i t i c a l}$ (df=34, two-tailed 5%) = 2.03。2.46 > 2.03 $，拒绝$ H_0$。

10.5 预测值与置信区间

$\hat{Y} = \hat{b}_{0} + \hat{b}_{1} X_{p}$

置信区间： $\hat{Y} \pm t_{c} \times s_{f}$

其中 $s_{f}$ 是预测的标准误， $t_{c}$ 是 $df = n - 2$ 下的临界 t 值。

10.6 回归的函数形式

flowchart TD
    A["数据关系是线性的吗？"] -->|"是"| B["Lin-Lin Model<br/>Y = b₀ + b₁X<br/>b₁ = Y的绝对变化/X的绝对变化"]
    A -->|"Y呈指数增长"| C["Log-Lin Model<br/>ln(Y) = b₀ + b₁X<br/>b₁ = Y的相对变化/X的绝对变化"]
    A -->|"X变化率影响Y"| D["Lin-Log Model<br/>Y = b₀ + b₁ln(X)<br/>b₁ = Y的绝对变化/X的相对变化"]
    A -->|"弹性关系"| E["Log-Log Model<br/>ln(Y) = b₀ + b₁ln(X)<br/>b₁ = Y的相对变化/X的相对变化（弹性）"]
    style B fill:#e8f5e9
    style C fill:#e3f2fd
    style D fill:#fff3e0
    style E fill:#fce4ec

模型	形式	斜率解读
Lin-Lin	$Y = b_{0} + b_{1} X$	X 变 1 单位 → Y 变 $b_{1}$ 单位
Log-Lin	$ln Y = b_{0} + b_{1} X$	X 变 1 单位 → Y 变 $b_{1} \times 100%$
Lin-Log	$Y = b_{0} + b_{1} ln X$	X 变 1% → Y 变 $b_{1} /100$ 单位
Log-Log	$ln Y = b_{0} + b_{1} ln X$	X 变 1% → Y 变 $b_{1} %$ （弹性）

R11: 大数据技术入门 Introduction to Big Data Techniques

11.1 Fintech

Fintech 指应用于金融服务业的技术创新，包括：

处理大规模多源数据的能力提升
AI/ML 等分析工具的应用

11.2 Big Data 的 3V 特征

特征	含义
Volume 体量	数据量级从 GB → TB → PB
Velocity 速度	数据生成和传输的速度（低延迟 vs 高延迟）
Variety 多样性	结构化 / 半结构化 / 非结构化

数据来源：

传统：财务报表、经济统计、市场数据
Alternative data：社交媒体、卫星图像、信用卡数据（corporate exhaust）、IoT 传感器

Data Science 处理流程：Capture → Curation → Storage → Search → Transfer

11.3 AI 与机器学习

概念	定义
Artificial Intelligence	模拟人类认知的计算机系统
Neural Networks	模仿人脑结构的 AI 方法
Machine Learning	算法从数据中自动学习模式
Deep Learning	多层神经网络，从简单模式到复杂模式

ML 流程：Training dataset → Validation dataset → Test dataset

ML 类型	特征
Supervised Learning	有标签的输入输出数据
Unsupervised Learning	无标签，发现数据结构
Deep Learning	多层神经网络

常见问题：

Overfitting 过拟合：模型在训练数据上表现好但泛化差（把噪音当信号）
Underfitting 欠拟合：模型过于简单，无法捕捉真实模式
Black box 问题：结果不可解释

11.4 投资管理中的应用

应用	描述
Text Analytics	分析非结构化文本/语音数据
NLP	自然语言处理：情感分析、监管合规
Risk Governance	风险评估、压力测试
Algorithmic Trading	基于规则的自动交易执行
High-Frequency Trading	利用日内微小价差的算法交易

核心公式速查表 Formula Quick Reference

收益率

公式	表达式
HPR	$(P_{1} + D) / P_{0} - 1$
Annualized Return	$(1 + H PR)^{365/ days} - 1$
Continuously Compounded	$ln (1 + H PR)$
Geometric Mean	$[\prod (1 + R_{i})]^{1/ n} - 1$
Harmonic Mean	$N / \sum (1/ X_{i})$

TVM

公式	表达式
FV	$P V (1 + r)^{t}$
PV	$F V / (1 + r)^{t}$
Perpetuity PV	$PMT / r$
Gordon Growth	$D_{1} / (k_{e} - g_{c})$
Forward Rate	$(1 + S_{n})^{n} = (1 + S_{1}) (1 +_{1} f_{1}) \dots$

统计

公式	表达式
Sample Variance	$\sum (X_{i} - \overset{ˉ}{X})^{2} / (n - 1)$
CV	$s / \overset{ˉ}{X}$
Correlation	$Cov_{X Y} / (s_{X} \cdot s_{Y})$
Portfolio Variance (2)	$w_{A}^{2} σ_{A}^{2} + w_{B}^{2} σ_{B}^{2} + 2 w_{A} w_{B} ρ_{A B} σ_{A} σ_{B}$
SFRatio	$[E (R_{p}) - R_{L}] / σ_{p}$

假设检验

公式	表达式
Test Statistic	(sample stat - hypothesized value) / SE
Standard Error	$s / n$
Chi-square	$(n - 1) s^{2} / σ_{0}^{2}$
F-stat	$s_{1}^{2} / s_{2}^{2}$
Correlation test	$r n - 2 / 1 - r^{2}$

回归

公式	表达式
Slope	$Cov_{X Y} / Var (X)$
Intercept	$\overset{ˉ}{Y} - \hat{b}_{1} \overset{ˉ}{X}$
$R^{2}$	$SSR / SST$
SEE	$SSE / (n - 2)$
F-stat	$MSR / MSE$
t-test for slope	$(\hat{b}_{1} - 0) / s_{\hat{b}_{1}}$

CFA L1 Notes

探索

数量方法 Quantitative Methods

数量方法 Quantitative Methods

科目概览 Overview

R1: 利率与收益率 Rates and Returns

1.1 利率的三重身份

1.2 利率分解 Interest Rate Decomposition

1.3 持有期收益率 Holding Period Return (HPR)

1.4 各类均值 Types of Means

算术平均 Arithmetic Mean (AM)

几何平均 Geometric Mean (GM)

调和平均 Harmonic Mean (HM)

1.5 货币加权与时间加权收益率

Money-Weighted Rate of Return (MWRR)

Time-Weighted Rate of Return (TWRR)

1.6 年化收益与连续复利

1.7 其他收益率概念

R2: 货币时间价值 The Time Value of Money in Finance

2.1 核心公式

2.2 固定收益证券定价

2.3 永续年金与普通年金

2.4 股票估值模型 (DDM)

2.5 现金流可加性与无套利

R3: 资产收益的统计度量 Statistical Measures of Asset Returns

3.1 集中趋势 Measures of Central Tendency

3.2 离散度 Measures of Dispersion

3.3 偏度与峰度 Skewness and Kurtosis

3.4 相关系数 与协方差

R4: 概率树与条件期望 Probability Trees and Conditional Expectations

4.1 期望值与方差

4.2 概率树 Probability Tree

4.3 贝叶斯公式 Bayes’ Formula

R5: 组合数学 Portfolio Mathematics

5.1 组合收益与方差

5.2 Shortfall Risk 与 Roy’s Safety-First Criterion

R6: 模拟方法 Simulation Methods

6.1 对数正态分布

6.2 Monte Carlo Simulation

6.3 Bootstrap Resampling

R7: 估计与推断 Estimation and Inference

7.1 抽样方法

7.2 中心极限定理 (CLT)

7.3 Resampling: Jackknife vs Bootstrap

R8: 假设检验 Hypothesis Testing

8.1 假设检验基本框架

8.2 Type I & Type II Errors

8.3 检验统计量

8.4 各类检验汇总

8.5 参数检验 vs 非参数检验

R9: 独立性的参数与非参数检验 Parametric and Non-Parametric Tests of Independence

9.1 相关系数的检验

9.2 Spearman 秩相关

9.3 列联表检验 Contingency Table (Chi-Square Test of Independence)

R10: 简单线性回归 Simple Linear Regression

10.1 回归模型基础

10.2 回归假设

10.3 ANOVA 方差分析与拟合优度

10.4 斜率系数的假设检验

10.5 预测值与置信区间

10.6 回归的函数形式

R11: 大数据技术入门 Introduction to Big Data Techniques

11.1 Fintech

11.2 Big Data 的 3V 特征

11.3 AI 与机器学习

11.4 投资管理中的应用

核心公式速查表 Formula Quick Reference

收益率

TVM

统计

假设检验

回归

关系图谱

目录

反向链接

3.4 相关系数与协方差