数量方法 Quantitative Methods

考试占比 Exam Weight: 6-9% | Readings: 1-11

科目概览 Overview

数量方法是 CFA Level I 的数学基础科目,覆盖从利率、TVM 到统计学、假设检验和回归分析。这是公式最多的科目,但概念间的逻辑链条清晰。掌握本科目不仅服务于考试本身,还为 Fixed Income(债券定价)、Equity(DDM 估值)、Portfolio Management(组合方差)和 Derivatives(二叉树定价)提供核心工具。

graph LR
  ROOT((数量方法<br/>Quantitative Methods))
  ROOT --- A["收益率与TVM<br/>Rates & TVM"]
  A --- A1("利率分解 Interest Rate Decomposition")
  A --- A2("HPR与年化 HPR & Annualization")
  A --- A3("TVM计算 TVM Calculations")
  A --- A4("年金与永续 Annuity & Perpetuity")
  ROOT --- B["统计学 Statistics"]
  B --- B1("集中趋势 Central Tendency")
  B --- B2("离散度 Dispersion")
  B --- B3("偏度与峰度 Skewness & Kurtosis")
  B --- B4("相关系数 Correlation")
  ROOT --- C["概率与组合 Probability & Portfolio"]
  C --- C1("期望值与方差 Expected Value & Variance")
  C --- C2("贝叶斯公式 Bayes")
  C --- C3("概率树 Probability Tree")
  C --- C4("组合收益与风险 Portfolio Risk & Return")
  ROOT --- D["推断统计 Inferential Statistics"]
  D --- D1("抽样方法 Sampling")
  D --- D2("CLT 中心极限定理")
  D --- D3("置信区间 Confidence Interval")
  D --- D4("假设检验 Hypothesis Testing")
  ROOT --- E["回归与技术 Regression & Tech"]
  E --- E1("线性回归 Linear Regression")
  E --- E2("ANOVA 方差分析")
  E --- E3("模拟方法 Simulation")
  E --- E4("大数据 Big Data")

R1: 利率与收益率 Rates and Returns

1.1 利率的三重身份

利率 (interest rate) 可以从三个角度理解:

角度含义
Required rate of return 必要收益率投资者愿意出借资金所要求的最低回报
Discount rate 折现率将未来现金流折算为现值时使用的比率
Opportunity cost 机会成本选择消费而放弃投资所损失的收益

1.2 利率分解 Interest Rate Decomposition

名义利率可以分解为多个风险溢价的叠加:

直觉理解

Real risk-free rate 反映人们对”现在消费 vs 未来消费”的时间偏好 (time preference)。其余每一项溢价都是对投资者承担某种特定风险的补偿。

精确关系 (Fisher equation):

近似关系:

1.3 持有期收益率 Holding Period Return (HPR)

例题:买入价 20,期末价 22,期间收到 1 股利。

多期 HPR 用复利连乘:

1.4 各类均值 Types of Means

算术平均 Arithmetic Mean (AM)

  • 用途:包含所有观测值,是总体均值的无偏估计量
  • 特点:受异常值影响大

几何平均 Geometric Mean (GM)

  • 用途:计算多期复合年化收益率
  • 特点:反映真实的累积增长

例题:三年收益率分别为 -9.34%、23.45%、8.92%。

调和平均 Harmonic Mean (HM)

  • 用途:计算定额投资(dollar-cost averaging)的平均成本
  • 特点:只能用于正数

例题:每月投 1,000 买基金,三个月单价分别为 8、9、10。

必考关系

当数据不全相等时:HM < GM < AM(调和 < 几何 < 算术) 仅当所有数值相同时三者相等。

graph LR
    HM["调和平均 HM"] -->|"<="| GM["几何平均 GM"] -->|"<="| AM["算术平均 AM"]
    style HM fill:#e8f5e9
    style GM fill:#fff3e0
    style AM fill:#fce4ec
均值类型适用场景示例
Arithmetic Mean估计期望收益(含异常值)预测下一年的平均收益
Geometric Mean多期复合收益计算过去 5 年的年化收益
Harmonic Mean定额投资的平均成本Dollar-cost averaging 的平均买入价
Trimmed Mean排除异常值去除最高和最低 5% 后的均值
Winsorized Mean替代异常值将极端值替换为边界百分位数

1.5 货币加权与时间加权收益率

Money-Weighted Rate of Return (MWRR)

MWRR 本质上就是内部收益率 (IRR)——使得所有现金流入的现值等于所有现金流出的现值的折现率。

  • 受现金流进出时点影响
  • 如果大额资金恰好在高收益期前投入,MWRR > TWRR

Time-Weighted Rate of Return (TWRR)

三步法

  1. 在每次外部现金流发生时分割子期间
  2. 计算每个子期间的 HPR
  3. 将所有子期间的 (1 + HPR) 连乘,再取几何平均

考试必考对比

  • TWRR 是投资管理行业首选,衡量基金经理的选股能力(不受投资者存取款影响)
  • MWRR 在基金经理能控制现金流进出时更合适
  • 若资金在高收益期前涌入:MWRR > TWRR
  • 若资金在低收益期前涌入:MWRR < TWRR

例题:投资者在 t=0 以 100 买入 1 股,t=1 时以 120 再买 1 股(当年股利 2/股),t=2 时以 130 卖出两股(股利 2/股)。

TWRR 计算

  • HPR₁ = (120 + 2) / 100 - 1 = 22%
  • HPR₂ = (260 + 4) / 240 - 1 = 10%
  • TWRR =

MWRR 计算

  • CF₀ = +100, CF₁ = +118, CF₂ = -264
  • 求解 IRR = 13.86%

MWRR (13.86%) < TWRR (15.84%),因为更多资金在第二年(低收益期 10%)投入。

1.6 年化收益与连续复利

年化收益 (Annualized Return):

例题:90 天赚了 0.75%。

连续复利收益 (Continuously Compounded Return):

  • 连续复利收益的关键特性:跨期可加。从 t=0 到 t=2 的连续复利收益 = t=0 到 t=1 + t=1 到 t=2。

例题:100 买入,120 卖出。

1.7 其他收益率概念

概念定义
Gross return扣除交易佣金后、扣除管理费前的总收益
Net return扣除管理费和行政费后的收益
Pretax nominal return税前名义收益
After-tax nominal return税后名义收益
Real return扣除通胀后的收益,衡量购买力变化
Leveraged return使用杠杆放大后的收益率

精确实际收益:

杠杆收益公式

其中 是自有资金, 是借入资金, 是借款利率。


R2: 货币时间价值 The Time Value of Money in Finance

跨科关联

TVM 是整个 CFA 课程的基石:Fixed Income 的债券定价、Equity 的 DDM 估值、Corporate Finance 的 NPV/IRR 决策全部依赖 TVM。

2.1 核心公式

连续复利:

2.2 固定收益证券定价

零息债券 (Zero-Coupon Bond):

例题:面值 1,000,到期 15 年,YTM = 4%。

附息债券 (Coupon Bond):

用计算器:N = 期数,I/Y = 折现率,PMT = 票息,FV = 面值,CPT PV。

价格与收益率反向关系

价格上升 → 收益率下降;收益率上升 → 价格下降。这是 Fixed Income 的核心原理。

2.3 永续年金与普通年金

永续年金 (Perpetuity):

例题:优先股每年派息 5,要求回报率 8%。

年金支付额 (Annuity Payment):

2.4 股票估值模型 (DDM)

Gordon Growth Model(恒定增长 DDM):

其中 是下期预期股利, 是股权要求回报率, 是永续增长率。

要求:

例题:预期股利 1.62,增长率 8%,要求回报率 12%。

反解求隐含回报率

反解求隐含增长率

2.5 现金流可加性与无套利

Cash Flow Additivity Principle:任何现金流序列的现值 = 各组成部分现值之和。

这是 no-arbitrage principle(一价定律)的基础:两组相同的未来现金流必须有相同的当前价值。

远期利率推导:

例题,求 (一年后的一年期远期利率)。

远期汇率的无套利关系:


R3: 资产收益的统计度量 Statistical Measures of Asset Returns

3.1 集中趋势 Measures of Central Tendency

指标定义特点
Arithmetic Mean 受异常值影响
Median 中位数排序后的中间值不受异常值影响
Mode 众数出现频率最高的值可无/可多个
Trimmed Mean去除两端极值后的均值减少异常值影响
Winsorized Mean将极端值替换为边界值后的均值替代而非删除

分位数 (Quantiles):

  • Quartile(四分位)、Quintile(五分位)、Decile(十分位)、Percentile(百分位)
  • Interquartile Range (IQR) = Q3 - Q1

3.2 离散度 Measures of Dispersion

在投资中,集中趋势衡量 reward,离散度衡量 risk。

Range = Max - Min

Mean Absolute Deviation (MAD)

Sample Variance

为什么除以 n-1?

使用 (自由度)而非 作为分母,是因为用 会系统性地低估总体方差(特别是小样本)。 使样本方差成为总体方差的无偏估计量 (unbiased estimator)。

标准差

例题:5 位基金经理的年化收益为 30%、12%、25%、20%、23%。

变异系数 Coefficient of Variation (CV)

衡量每单位收益承担的风险。CV 越低越好

例题:T-bills 均值 0.25%,标准差 0.36%;S&P 500 均值 1.09%,标准差 7.30%。 T-bills 的单位收益风险更低。

Target Downside Deviation(半偏差):

其中 是目标收益。注意分母仍是 (全样本量减一),即使只用了低于目标的观测值。

3.3 偏度与峰度 Skewness and Kurtosis

Skewness(偏度)衡量分布的不对称性:

  • Positive skew(右偏):右尾长 → Mean > Median > Mode
  • Negative skew(左偏):左尾长 → Mean < Median < Mode
  • Symmetric:Mean = Median = Mode

记忆口诀

均值被偏度的方向”拉走”,中位数永远在均值和众数之间。

Kurtosis(峰度)衡量尾部厚度:

类型Excess Kurtosis特征
Mesokurtic= 0正态分布
Leptokurtic> 0尖峰、肥尾,极端值概率更大
Platykurtic< 0扁平、薄尾

Excess Kurtosis = Kurtosis - 3(正态分布的 kurtosis = 3)

风险管理视角

实际金融收益通常具有负偏度 + 正超额峰度(即左偏 + 肥尾),这意味着极端亏损的概率比正态分布预测的更大。风险管理者重点关注尾部风险。

3.4 相关系数 与协方差

Covariance 协方差:

协方差的数值大小取决于单位,难以直接比较。

Correlation 相关系数(标准化的协方差):

性质:

  • :完美正相关
  • :完美负相关
  • :无线性关系(但可能有非线性关系!)
  • 无单位

例题:Stock A 方差 0.0028,Stock B 方差 0.0124,协方差 0.0058。

Correlation ≠ Causation

相关性不意味着因果关系。Spurious correlation(虚假相关)可能由第三变量或纯粹巧合导致。


R4: 概率树与条件期望 Probability Trees and Conditional Expectations

4.1 期望值与方差

期望值 (Expected Value):

方差(基于概率模型):

样本方差 vs 概率模型方差

样本方差除以 ;概率模型方差用概率加权求和(没有 ,因为描述的是完整分布)。

例题:Stock A 在三种经济情景下的表现:

情景概率收益
Boom30%20%
Normal50%12%
Slow20%5%

4.2 概率树 Probability Tree

概率树将复杂的联合概率分解为一系列条件概率的乘积,适合可视化多层决策/事件。

Conditional expected value 条件期望值:取决于某个先决事件的结果。当新信息到达时,分析师用条件期望值更新预测。

4.3 贝叶斯公式 Bayes’ Formula

直觉:根据新证据 B 的出现,更新对事件 A 发生概率的判断。

例题:经济表现好的概率 60%(若表现好,股票上涨概率 70%);经济表现差的概率 40%(若表现差,股票上涨概率 20%)。已知股票上涨了,求经济表现好的概率。

P(stock up) = 0.60(0.70) + 0.40(0.20) = 0.42 + 0.08 = 0.50

Prior 从 60% 更新到了 84%——股票上涨这一信息大幅提升了我们对经济向好的信心。


R5: 组合数学 Portfolio Mathematics

5.1 组合收益与方差

Portfolio expected return 组合期望收益:

Two-asset portfolio variance 两资产组合方差:

等价于:

分散化的数学基础

只要 ,组合标准差就低于各资产标准差的加权平均。 越低,分散化效果越好。当 时可以构造零风险组合。这是 分散化 的数学本质。

三资产组合方差

一般规则: 个资产有 个方差项和 个唯一协方差项。

例题:60% 国内股票、30% 国内债券、10% 国际股票。协方差矩阵如下:

股票债券国际
股票40044180
债券447035
国际18035450

5.2 Shortfall Risk 与 Roy’s Safety-First Criterion

Shortfall risk 缺口风险:组合收益低于目标值的概率。

Safety-First Ratio (SFRatio)

其中 是最低可接受收益(threshold)。

Roy’s criterion:选择 SFRatio 最大的组合(即缺口风险最小的组合)。

例题:目标收益 3%,三个组合:

组合E(R)SFRatio
A9%12%(9-3)/12 = 0.50
B11%20%(11-3)/20 = 0.40
C6.6%8.2%(6.6-3)/8.2 = 0.44

选择 Portfolio A(SFRatio 最大 = 0.50)。


R6: 模拟方法 Simulation Methods

6.1 对数正态分布

服从正态分布,则 服从对数正态分布 (lognormal distribution)。

对数正态分布用于建模资产价格:

  • 不会为负(资产价格 ≥ 0)
  • 右偏(大幅上涨可能,但下跌有限于本金)

若连续复利收益独立同分布 (i.i.d.),则价格为对数正态分布。

6.2 Monte Carlo Simulation

步骤

  1. 指定风险因子的概率分布及参数
  2. 随机生成大量风险因子值
  3. 用定价模型计算每组随机值对应的证券价值
  4. 重复成百上千次,统计分布特征

优点:可以模拟历史中未出现的极端情景(what-if 分析) 缺点:结果只与假设一样好;复杂度高;是统计方法而非解析方法

应用:复杂衍生品定价、VaR 估计、养老金资产负债模拟、策略回测。

6.3 Bootstrap Resampling

Bootstrap:从已有样本中有放回地反复抽取子样本,计算统计量的分布。

  • 优点:不需要关于总体分布的假设;能为复杂统计量构建置信区间
  • 缺点:受限于原始样本的分布范围

R7: 估计与推断 Estimation and Inference

7.1 抽样方法

方法类型描述抽样误差
Simple random概率每个个体等概率被选中基准
Systematic概率每隔 n 个抽一个近似随机
Stratified random概率按特征分层,每层随机抽样通常更小
Cluster概率随机选簇,簇内全部或随机抽样通常更大
Convenience非概率方便获取的数据可能很大
Judgmental非概率研究者主观选取取决于判断质量

7.2 中心极限定理 (CLT)

CLT 核心表述

对于均值为 、方差为 的总体,当样本量 足够大(通常 )时,样本均值 的抽样分布近似正态分布: 无论总体本身是什么分布。

这意味着:

  • 样本均值的期望值 = 总体均值
  • 样本均值的方差 = (样本越大,估计越精确)

Standard Error of the Sample Mean 样本均值的标准误:

例题:30 个月度收益,均值 2%,样本标准差 20%。

7.3 Resampling: Jackknife vs Bootstrap

方法原理优点缺点
Jackknife每次移除一个观测值,计算 n 个样本均值计算简单;可去除偏差精度有限
Bootstrap有放回抽取大量等大样本可为复杂统计量构建 CI计算量大;受限于样本

R8: 假设检验 Hypothesis Testing

跨科关联

假设检验 不仅在数量方法中考,也是理解 Economics 中政策检验、Equity 中 Alpha 检验的基础。

8.1 假设检验基本框架

七步流程

  1. State the hypotheses(
  2. Select the appropriate test statistic
  3. Specify the significance level
  4. State the decision rule
  5. Collect sample and calculate the test statistic
  6. Make a decision (reject or fail to reject )
  7. Make a decision based on the test results

Null hypothesis :希望被拒绝的假设(始终包含”=”) Alternative hypothesis :希望被支持的假设

8.2 Type I & Type II Errors

为真 为假
不拒绝 正确决策Type II Error ()
拒绝 Type I Error ()正确决策 (Power)
  • Significance level = P(Type I Error) = P(拒绝真的 )
  • Power = 1 - \betaH_0$)
  • 降低 (更严格)→ 增大 → Power 降低
  • 增大样本量 → 可同时降低 Type I 和 Type II Error

统计用语

我们说 “fail to reject “,不说 “accept ”。

p-value:使得 被拒绝的最小显著性水平。若 ,则拒绝

8.3 检验统计量

常用 z 临界值

显著性水平 单尾双尾
10%1.281.65
5%1.651.96
1%2.332.58

8.4 各类检验汇总

flowchart TD
    A["要检验什么?"] --> B{"关于均值?"}
    A --> C{"关于方差?"}
    B -->|"单总体均值"| D["t-test<br/>df = n-1"]
    B -->|"两总体均值差异"| E{"样本独立?"}
    E -->|"独立"| F["t-test (差异检验)<br/>df = n₁+n₂-2"]
    E -->|"不独立"| G["Paired t-test<br/>df = n-1"]
    C -->|"单总体方差"| H["Chi-square test<br/>df = n-1"]
    C -->|"两总体方差比较"| I["F-test<br/>df = n₁-1, n₂-1"]
    style D fill:#e3f2fd
    style F fill:#e3f2fd
    style G fill:#e3f2fd
    style H fill:#fff3e0
    style I fill:#fce4ec
检验对象检验方法检验统计量自由度
单总体均值t-test
两总体均值(独立)t-test
配对比较Paired t-test
单总体方差Chi-square
两总体方差F-test(大的放分子)

z-test vs t-test

理论上,已知 用 z-test,未知 用 t-test。但当 时,t 分布近似正态分布,两者结果几乎一样。实务中几乎总是用 t-test(因为 几乎永远未知)。

例题:单总体均值检验

250 天的期权组合日均收益 0.1%,样本标准差 0.25%。检验均值是否 ≠ 0(,双尾)。

6.33 > 1.96H_0$,日均收益显著不为零。

Chi-square test 例题

某基金宣称月度收益标准差为 4%。24 个月数据显示 s = 3.8%。,双尾检验。

df = 23,临界值:

11.689 < 20.76 < 38.076H_0$。

8.5 参数检验 vs 非参数检验

Parametric 参数检验Nonparametric 非参数检验
假设需要分布假设(如正态)很少或不需要分布假设
适用连续数据、满足假设时排序数据、不满足参数假设时
示例t-test, z-test, F-testRuns test, Spearman rank
Power假设成立时更强通常较弱

R9: 独立性的参数与非参数检验 Parametric and Non-Parametric Tests of Independence

9.1 相关系数的检验

检验 (两变量正态分布时):

,双尾检验。

例题

(df=40, two-tailed 5%) = 2.021。2.363 > 2.021H_0$,相关系数显著不为零。

9.2 Spearman 秩相关

非参数方法,用于排序数据或检验非线性关联:

其中 是两组排名的差。

检验统计量与 Pearson 相同: 时近似 t 分布)

9.3 列联表检验 Contingency Table (Chi-Square Test of Independence)

目的:检验两个分类变量是否独立。

其中

,拒绝独立性假设。


R10: 简单线性回归 Simple Linear Regression

10.1 回归模型基础

  • : 因变量 (dependent variable)
  • : 自变量 (independent variable)
  • : 截距 (intercept)
  • : 斜率 (slope coefficient)
  • : 残差 (error term)

OLS(普通最小二乘法)估计

关键性质

回归线一定经过 这个点。

例题:Cov(S&P 500, ABC) = 0.000336, Var(S&P 500) = 0.000522, Mean S&P = -2.70%, Mean ABC = -4.05%。

斜率 0.64 的含义:S&P 500 超额收益每变化 1%,ABC 超额收益预期变化 0.64%。这就是 ABC 的 Beta

10.2 回归假设

  1. X 和 Y 之间存在线性关系
  2. 残差方差恒定(Homoskedasticity 同方差性)
  3. 残差彼此独立(无自相关)
  4. 残差服从正态分布

违反这些假设时,残差图 (residual plot) 会出现模式:

  • 非线性 → 残差呈 U 形
  • 异方差 → 残差的散布随 X 增大
  • 非独立 → 残差呈周期性模式

10.3 ANOVA 方差分析与拟合优度

Total variation 分解

来源自由度 df平方和均方
Regression (explained)1SSRMSR = SSR/1 = SSR
Error (unexplained)n-2SSEMSE = SSE/(n-2)
Totaln-1SST

Coefficient of Determination

  • 表示自变量解释了因变量总变异的百分比
  • 简单回归中 (相关系数的平方)

Standard Error of Estimate (SEE)

SEE 越小,模型拟合越好。

F-statistic(回归整体显著性):

。单尾检验: 则拒绝

在简单回归中,F 检验等价于对斜率的 t 检验()。

例题:ANOVA 表解读

36 个观测值的 ANOVA 表:SSR = 0.0076,SSE = 0.0406,SST = 0.0482。

10.4 斜率系数的假设检验

例题,检验 (df=34, two-tailed 5%) = 2.03。2.46 > 2.03H_0$。

10.5 预测值与置信区间

置信区间:

其中 是预测的标准误, 下的临界 t 值。

10.6 回归的函数形式

flowchart TD
    A["数据关系是线性的吗?"] -->|"是"| B["Lin-Lin Model<br/>Y = b₀ + b₁X<br/>b₁ = Y的绝对变化/X的绝对变化"]
    A -->|"Y呈指数增长"| C["Log-Lin Model<br/>ln(Y) = b₀ + b₁X<br/>b₁ = Y的相对变化/X的绝对变化"]
    A -->|"X变化率影响Y"| D["Lin-Log Model<br/>Y = b₀ + b₁ln(X)<br/>b₁ = Y的绝对变化/X的相对变化"]
    A -->|"弹性关系"| E["Log-Log Model<br/>ln(Y) = b₀ + b₁ln(X)<br/>b₁ = Y的相对变化/X的相对变化(弹性)"]
    style B fill:#e8f5e9
    style C fill:#e3f2fd
    style D fill:#fff3e0
    style E fill:#fce4ec
模型形式斜率解读
Lin-LinX 变 1 单位 → Y 变 单位
Log-LinX 变 1 单位 → Y 变
Lin-LogX 变 1% → Y 变 单位
Log-LogX 变 1% → Y 变 (弹性)

R11: 大数据技术入门 Introduction to Big Data Techniques

11.1 Fintech

Fintech 指应用于金融服务业的技术创新,包括:

  • 处理大规模多源数据的能力提升
  • AI/ML 等分析工具的应用

11.2 Big Data 的 3V 特征

特征含义
Volume 体量数据量级从 GB → TB → PB
Velocity 速度数据生成和传输的速度(低延迟 vs 高延迟)
Variety 多样性结构化 / 半结构化 / 非结构化

数据来源

  • 传统:财务报表、经济统计、市场数据
  • Alternative data:社交媒体、卫星图像、信用卡数据(corporate exhaust)、IoT 传感器

Data Science 处理流程:Capture → Curation → Storage → Search → Transfer

11.3 AI 与机器学习

概念定义
Artificial Intelligence模拟人类认知的计算机系统
Neural Networks模仿人脑结构的 AI 方法
Machine Learning算法从数据中自动学习模式
Deep Learning多层神经网络,从简单模式到复杂模式

ML 流程:Training dataset → Validation dataset → Test dataset

ML 类型特征
Supervised Learning有标签的输入输出数据
Unsupervised Learning无标签,发现数据结构
Deep Learning多层神经网络

常见问题

  • Overfitting 过拟合:模型在训练数据上表现好但泛化差(把噪音当信号)
  • Underfitting 欠拟合:模型过于简单,无法捕捉真实模式
  • Black box 问题:结果不可解释

11.4 投资管理中的应用

应用描述
Text Analytics分析非结构化文本/语音数据
NLP自然语言处理:情感分析、监管合规
Risk Governance风险评估、压力测试
Algorithmic Trading基于规则的自动交易执行
High-Frequency Trading利用日内微小价差的算法交易

核心公式速查表 Formula Quick Reference

收益率

公式表达式
HPR
Annualized Return
Continuously Compounded
Geometric Mean
Harmonic Mean

TVM

公式表达式
FV
PV
Perpetuity PV
Gordon Growth
Forward Rate

统计

公式表达式
Sample Variance
CV
Correlation
Portfolio Variance (2)
SFRatio

假设检验

公式表达式
Test Statistic(sample stat - hypothesized value) / SE
Standard Error
Chi-square
F-stat
Correlation test

回归

公式表达式
Slope
Intercept
SEE
F-stat
t-test for slope