拟合优度检验
什么是拟合优度?
拟合优度评估观测数据与统计模型的预期值的匹配程度。在深入研究统计学时,您经常会问:“我的模型与数据的拟合程度如何?” 拟合度高?您的模型非常好。 拟合度低?也许应该重新考虑该模型。这就是拟合优度的本质。更具体地说:
- 拟合优度高表示观测值接近模型的预期值。
- 拟合优度低表示观测值与预期值相对较远。
拟合优度度量总结了观测数据与模型预期值之间的差异大小。拟合优度检验确定差异是否具有统计显著性。此外,它们可以指导我们选择提供更好表示的模型。适当的拟合优度测量和测试取决于设置。
回归模型中的拟合优度
在回归模型中,了解拟合优度对于确保准确的预测和有意义的见解至关重要;在这里,我们将深入研究揭示与数据一致性的关键指标。当观察值和预测值之间的差异很小且无偏差时,回归模型可以很好地拟合数据。统计学家将这些差异称为残差。
随着拟合优度的增加,数据点会更接近模型的拟合线。
R 平方 (R²)
R 平方是线性回归模型的拟合优度统计量。它使用方便的 0 – 100% 比例来测量模型解释的因变量变异的百分比。
R 平方评估数据在拟合回归线周围的分布。对于数据集,R 平方值越高,表示样本数据与拟合值之间的差异越小。
分布较宽的模型的 R 平方为 15%,而分布较窄的模型的 R 平方为 85%。
将 R² 视为解释变化的百分比。R² 越高则拟合度越高。
R² 高:您的模型捕获了大量变化。
R² 低:模型无法解释大部分方差。
请记住,它不是唯一的指标。R² 高并不总是意味着模型完美!
回归标准误差 (S)
此回归标准误差是拟合优度度量,它提供观测值和预测值之间绝对差异的典型大小。S 使用因变量 (DV) 的单位。S 值较小:预测值接近数据值。
S 值较大:预测值偏差较大。
假设您的模型使用体重指数 (BMI) 来预测体脂百分比 (DV)。因此,如果您的模型的 S 值为 3.5,那么您就知道其预测值通常比观察到的体脂百分比值高 3.5%,但是,不要孤立地看待它。应当将其与因变量的单位进行比较以了解其背景。