02-2多元线性回归-模型推断

Lingfeng2024-11-16

02-2多元线性回归-模型推断

1. 模型推断

1.1 SSR性质

Theorem (SST分解)

证明
注意到

只需证交叉项为0。注意到

Theorem (SSR性质)

证明
由定义

其中为全为的矩阵,显然有,且,故显然有对称幂等,故
下面只需证

法一
由于

因此正交。而
因此
对于,有。此时
因此
故证毕。

法二

Lemma (矩阵同时对角化)

若矩阵可对角化,则的充要条件为可同时对角化。

此时

注意到秩为1或0,显然有

法三
注意到幂等,因此

Theorem (SSR与SSE关系)

SSR与SSE独立,当

注意到

欲证独立,只需证独立。而其均满足正态分布,故只需考虑
故证毕。

1.2 F检验

Definition (F检验)

1.3 t检验

Definition (t检验)

1.4 偏F检验

Definition (偏F检验)

证明
注意到

因此
故只需证明

首先考虑证明幂等,注意到

而注意到
故证毕。此时
同时
故证毕。

Theorem (偏F检验与t检验等价)

Lemma (Frisch–Waugh–Lovell 定理(特例))

在多元线性回归中,第 个变量的回归系数可以表示为:


其中:

  • 是除去第 列的投影矩阵
  • 表示对其他变量的残差化
    这表明 等价于将 对其他变量的残差对 对其他变量的残差做回归。

证明

从而

Corollary ( 的统计意义)

表示将 对其他所有自变量 做回归后的残差。
具体来说:

  1. 是除去第 列的投影矩阵,表示向其他变量张成空间的投影
  2. 是残差算子
  3. 就是 中不能被其他变量线性表示的部分

这解释了为什么:

    • 分子 衡量了 的"净效应"与 的相关性
    • 分母 衡量了 的"净效应"的大小
    • 如果 很小,说明 几乎可以被其他变量线性表示
    • 这会导致方差 很大,即多重共线性问题
    • 这是 的"净效应"对应的投影矩阵
    • 它反映了 对模型的额外贡献

1.5 置信区间

Definition (置信区间)

的置信区间为

2. 模型预测

2.1 单点预测

Definition (预测值)

对新的观测点 ,其预测值为:

2.2 预测区间

Definition (预测值的方差)

Definition (预测误差的方差)

Theorem (预测区间)

  1. 置信区间为:
  2. 预测区间为:
Last Updated 1/26/2025, 7:48:46 AM