正态分布是一种在概率统计中非常重要的连续型随机变量分布形式,广泛应用于自然科学、社会科学以及工程领域。当我们研究一个服从正态分布的数据集时,了解其期望(均值)和方差是至关重要的。那么,如何从理论上推导出正态分布的期望和方差呢?
首先,我们定义标准正态分布函数为:
\[ f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \]
这是标准正态分布的概率密度函数。对于一般的正态分布 \( N(\mu, \sigma^2) \),其概率密度函数可以表示为:
\[ g(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \]
接下来,我们来求解正态分布的期望值 \( E(X) \) 和方差 \( Var(X) \)。
一、期望值的计算
根据期望值的定义,我们有:
\[ E(X) = \int_{-\infty}^{+\infty} x \cdot g(x) dx \]
将 \( g(x) \) 代入后得到:
\[ E(X) = \int_{-\infty}^{+\infty} x \cdot \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx \]
通过变量替换 \( z = \frac{x-\mu}{\sigma} \),即 \( x = \mu + \sigma z \),则 \( dx = \sigma dz \),积分区间保持不变,于是:
\[ E(X) = \int_{-\infty}^{+\infty} (\mu + \sigma z) \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \sigma dz \]
分项计算可得:
\[ E(X) = \mu \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} dz + \sigma \int_{-\infty}^{+\infty} z \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} dz \]
注意到第一个积分等于1(因为它是一个标准正态分布的概率密度函数在整个实数域上的积分),而第二个积分由于被积函数是奇函数且积分限是对称的,结果为0。因此:
\[ E(X) = \mu \]
这表明,正态分布的期望值就是其参数 \( \mu \)。
二、方差的计算
方差 \( Var(X) \) 定义为 \( E[(X-E(X))^2] \),即:
\[ Var(X) = \int_{-\infty}^{+\infty} (x - \mu)^2 \cdot g(x) dx \]
同样地,将 \( g(x) \) 代入并进行类似上述的变量替换,最终可以得出:
\[ Var(X) = \sigma^2 \]
综上所述,正态分布 \( N(\mu, \sigma^2) \) 的期望值为 \( \mu \),方差为 \( \sigma^2 \)。这些性质使得正态分布在实际应用中具有很高的实用价值。