【线性相关中r的计算公式】在统计学中,线性相关系数(通常用字母 r 表示)是衡量两个变量之间线性关系密切程度的一个指标。它的取值范围在 -1 到 1 之间,数值越接近 1 或 -1,表示两变量之间的线性关系越强;数值接近 0,则表示两者线性关系较弱或没有线性关系。
下面将对线性相关系数 r 的计算公式进行总结,并通过表格形式清晰展示其各个组成部分和计算步骤。
一、线性相关系数 r 的定义
线性相关系数 r 的计算公式如下:
$$
r = \frac{n\sum xy - (\sum x)(\sum y)}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}
$$
其中:
- $ n $:样本数量
- $ x $:自变量的观测值
- $ y $:因变量的观测值
- $ \sum xy $:$ x $ 和 $ y $ 对应乘积之和
- $ \sum x $、$ \sum y $:各自变量的总和
- $ \sum x^2 $、$ \sum y^2 $:各自变量平方后的总和
二、计算步骤说明
为了更直观地理解该公式的使用方式,以下是对各部分的详细解释:
| 步骤 | 计算项 | 公式表达式 | 说明 |
| 1 | 样本数 $ n $ | 直接统计数据个数 | 每组数据对应的个数 |
| 2 | $ \sum x $ | $ x_1 + x_2 + \dots + x_n $ | 所有 $ x $ 值的总和 |
| 3 | $ \sum y $ | $ y_1 + y_2 + \dots + y_n $ | 所有 $ y $ 值的总和 |
| 4 | $ \sum xy $ | $ x_1y_1 + x_2y_2 + \dots + x_ny_n $ | $ x $ 与 $ y $ 对应乘积之和 |
| 5 | $ \sum x^2 $ | $ x_1^2 + x_2^2 + \dots + x_n^2 $ | 所有 $ x $ 值的平方和 |
| 6 | $ \sum y^2 $ | $ y_1^2 + y_2^2 + \dots + y_n^2 $ | 所有 $ y $ 值的平方和 |
| 7 | 分子部分 | $ n\sum xy - (\sum x)(\sum y) $ | 线性关系的分子部分 |
| 8 | 分母部分 | $ \sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]} $ | 线性关系的分母部分 |
| 9 | 相关系数 $ r $ | $ r = \frac{分子}{分母} $ | 最终的线性相关系数值 |
三、应用实例(简要说明)
假设我们有以下两组数据:
| x | y |
| 1 | 2 |
| 2 | 4 |
| 3 | 6 |
| 4 | 8 |
根据上述公式,可以计算出:
- $ n = 4 $
- $ \sum x = 1+2+3+4 = 10 $
- $ \sum y = 2+4+6+8 = 20 $
- $ \sum xy = (1×2)+(2×4)+(3×6)+(4×8) = 2+8+18+32 = 60 $
- $ \sum x^2 = 1²+2²+3²+4² = 1+4+9+16 = 30 $
- $ \sum y^2 = 2²+4²+6²+8² = 4+16+36+64 = 120 $
代入公式得:
$$
r = \frac{4×60 - 10×20}{\sqrt{[4×30 - 10^2][4×120 - 20^2]}} = \frac{240 - 200}{\sqrt{[120 - 100][480 - 400]}} = \frac{40}{\sqrt{20×80}} = \frac{40}{\sqrt{1600}} = \frac{40}{40} = 1
$$
结果表明,这两组数据呈现完全正相关关系。
四、小结
线性相关系数 r 是衡量两个变量间线性关系强度的重要工具。其计算公式虽然较为复杂,但通过逐步拆解并结合实际数据进行计算,可以有效评估变量之间的相关性。在实际应用中,建议使用统计软件或编程语言(如 Python、Excel)来提高计算效率和准确性。


