方差公式
方差用来描述一组数据相对于其均值的离散程度。对于一个包含n个观测值的数据集\(X = \{x_1, x_2, ..., x_n\}\),其方差计算公式如下:
\[Var(X) = \frac{\sum_{i=1}^{n}(x_i - \mu)^2}{n}\]
其中,\(\mu\)表示数据集的平均值,即\(\mu = \frac{\sum_{i=1}^{n}x_i}{n}\)。方差越大,说明数据点越分散;反之,则数据较为集中。
协方差公式
协方差则用于衡量两个随机变量之间的线性关系。设有两组数据\(X = \{x_1, x_2, ..., x_n\}\)和\(Y = \{y_1, y_2, ..., y_n\}\),它们之间的协方差可以通过以下公式计算得出:
\[Cov(X, Y) = \frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})}{n}\]
这里,\(\bar{x}\)和\(\bar{y}\)分别代表数据集X和Y的平均值。当\(Cov(X, Y)\)大于0时,表明X和Y正相关;小于0则表示负相关;等于0意味着两者之间没有明显的线性关系。
通过理解和应用这些基本公式,我们可以更好地分析数据间的内在联系,并为后续的预测模型构建提供有力支持。无论是学术研究还是实际应用中,掌握好方差与协方差的概念都是非常必要的。