![心理与教育研究中的多元统计方法](https://wfqqreader-1252317822.image.myqcloud.com/cover/741/26832741/b_26832741.jpg)
1.6 多元正态分布
正如我们在1.3小节里提及的,多元统计分析属于推论统计的一部分,也需要通过样本统计量的分布来估计、推测总体参数并进行假设检验。因此在本书中,定义多元变量为随机变量,它们具有随机变量的一切性质,并且不同特点的多元变量有着不同的分布规律,例如多元正态分布、多元t分布、多元Gamma分布等;其中应用最广泛、最重要的分布是多元正态分布,它是众多多元分布的基础。本书后面用到的很多检验统计量,它们的分布都与多元正态分布有关。
先回忆一元正态分布的定义,如果连续型随机变量X的概率密度函数为
![](https://epubservercos.yuewen.com/9FB807/15279433305193106/epubprivate/OEBPS/Images/figure_0020_0037.jpg?sign=1739683852-lkcpnsZi1PxkCS1QQGRZyAHUkOJ3BEac-0-b4a97a9568888c8203c026dd4f2c012e)
则称X服从期望为μ、方差为σ2的正态分布,一般记为X~N(μ,σ2)。
正态分布是一族分布(图1.5),其概率密度函数的曲线随着期望与方差的不同而不同。如果将随机变量X标准化为变量Z,则变量Z服从期望为0,标准差为1的标准正态分布,记为Z~N(0,1)。
![](https://epubservercos.yuewen.com/9FB807/15279433305193106/epubprivate/OEBPS/Images/figure_0020_0038.jpg?sign=1739683852-pyL1KmbBMiwanUPGSeImuRiJuZHyCuSJ-0-ebd525cda5e56fb3c6a93c3fb96d2d1c)
图1.5 期望与方差不同的正态分布
如果有两个连续型随机变量X和Y服从二元正态分布,它们的联合概率密度函数为
![](https://epubservercos.yuewen.com/9FB807/15279433305193106/epubprivate/OEBPS/Images/figure_0020_0039.jpg?sign=1739683852-gLv8M09oASAi5uGQqi6xBTIOxGwDUHi0-0-7c89b9b09b76ca583f1f4d5b54426a03)
式中
![](https://epubservercos.yuewen.com/9FB807/15279433305193106/epubprivate/OEBPS/Images/figure_0020_0040.jpg?sign=1739683852-GuQoBvBce7V4RRoAoIL2e2Y2oJkPJbDc-0-c4709e32aa2d95c9528552c48ec47922)
μX与μY分别表示变量X和Y的期望值,σX与σY分别表示变量X和Y的标准差,ρXY表示变量X和Y的相关系数。
图1.6(a)为变量X和Y的相关系数设为0.5条件下,联合概率密度函数z=f(x,y)的三维图。图1.6(b)为图1.6(a)的俯视图,每个椭圆曲线上的概率密度相等。当变量X和Y相互独立(相关系数为0)时,等概率密度曲线为正圆曲线;当变量X和Y完全相关(相关系数为1)时,等概率密度曲线退化为一条直线(图1.6(b)中的虚线)。二元正态分布是二元联合概率分布中最重要的分布。
![](https://epubservercos.yuewen.com/9FB807/15279433305193106/epubprivate/OEBPS/Images/figure_0021_0041.jpg?sign=1739683852-NRAHRnWnyeySXC1H9KeeEtUzUroEHIad-0-0b47af1f04e384fdf62204ea8ef5db23)
图1.6 二元正态分布
如果p维随机变量X=(X1,X2,……,Xp)T服从p元正态分布,则联合概率密度函数为
![](https://epubservercos.yuewen.com/9FB807/15279433305193106/epubprivate/OEBPS/Images/figure_0021_0042.jpg?sign=1739683852-lVel5MuDjQN335vEVsWsUHSVyqoUPvyl-0-7f9e0856243aa381d3497e37032195db)
一般记为Np(μ,Σ),其中μ=(μ1,μ2,……,μp)T为p个变量的期望值向量,Σ表示p个随机变量的协方差矩阵,且是p×p阶正定对称矩阵,Σ-1,|Σ|分别为Σ的逆矩阵与行列式值。
根据上面定义的多元正态分布密度函数,在一定的条件下我们可以求出各个部分变量的边缘分布、多元变量的样本平均值分布或者样本协方差的分布等。
在许多关于多元统计分析的经典书籍里,上述的内容往往置于书本的第1章,因为这些知识是推导多元统计方法的基础。但考虑到本书的使用对象主要是心理学、教育学等社会科学领域的学生或工作者,学习目的主要是为了正确应用多元统计方法。我们认为掌握了最基本的概念之后直接学习分析方法是可行的,相关的概率与统计理论知识可以在达到更高水平以后再继续领会。因此本书中有关多元分布的知识不再展开,有需要的读者可以参考相关的书籍(Anderson,2003)。