01一元线性回归
01一元线性回归
1. 定义
其中随机误差项满足高斯-马尔可夫条件(Gauss-Markov)条件,即同时满足正态性假定
2. 参数估计方法
2.1 最小二乘法
考虑
此时考虑解得
2.2 极大似然法
注意到因此构建此时同样考虑此时得到相同结果,并得到方差的极大似然估计
2.3 矩估计
对于随机变量,有使用矩估计显然也能得到相同条件。
3. 参数估计性质
3.1 线性
证明
注意到因此
3.2 无偏性
证明
考虑因此同时因此
3.3 和方差
证明
由于相互独立,因此同理
3.4 与的协方差
3.5 高斯-马尔科夫定理
证明
设,且其为的无偏估计。此时有因此得到此时注意到故证毕。
同理,设,也有此时故证毕。
4. 模型推断
4.1 t检验
我们建立统计假设为
此时若原假设成立,有因此构造其中此时自由度为的分布。
4.2 F检验
此时构造服从自由度为的分布。
证明
注意到代入即得结果。
4.3 相关系数
证明
显然
证明
只需证明即证而故显然成立。
5. 残差分析
证明
注意到同时因此此时
下面计算协方差。注意到此时同时因此
证明
法一
注意到同时注意到因此最后
法二
6. 回归系数的区间估计
证明
注意到即得
7. 模型预测
7.1 单值预测
给定一个新样本,其对应预测值为其为目标值的无偏估计。
7.2 因变量新值的区间估计
证明
由之前定理知显然成立。
因此此时得到统计量得到置信度为置信区间为当样本量较大,较小时,接近于零,因此置信度的置信区间近似为
7.3 因变量新值的平均值的区间预测
注意到为常数,因此因此置信度为置信区间为