公告 |
You are all my reasons!
桃李花林又一在
淫荡一日同风起,风骚直上九万里
仙子凌波微步罗衫飘忽十步一回头
我的最爱:网游,程序,文学
QQ:89636669
|
Blog信息 |
blog名称:一维空间 日志总数:163 评论数量:248 留言数量:33 访问次数:650563 建立时间:2007年10月24日 |

| |
[模式识别]协方差矩阵的详细说明
dskongenius 发表于 2008/3/21 12:56:29 |
此文转自http://hi.baidu.com/jesien/blog/item/a6246a3459ac5b4d251f1481.html
协方差矩阵的详细说明
2007-10-20 12:25
变量说明:
设500)this.width=500'>为一组随机变量,这些随机变量构成随机向量500)this.width=500'>500)this.width=500'>500)this.width=500'>500)this.width=500'> ,每个随机变量有m个样本,则有样本矩阵
500)this.width=500'> (1)
其中 500)this.width=500'>对应着每个随机向量X的样本向量, 500)this.width=500'>对应着第i个随机单变量的所有样本值构成的向量。
单随机变量间的协方差:
随机变量500)this.width=500'> 之间的协方差可以表示为
500)this.width=500'> (2)
根据已知的样本值可以得到协方差的估计值如下:
500)this.width=500'> (3)
可以进一步地简化为:
500)this.width=500'>(4)
协方差矩阵:
500)this.width=500'>
500)this.width=500'> (5)
其中500)this.width=500'> ,从而得到了协方差矩阵表达式。
如果所有样本的均值为一个零向量,则式(5)可以表达成:
500)this.width=500'> (6)
补充说明:
1、协方差矩阵中的每一个元素是表示的随机向量X的不同分量之间的协方差,而不是不同样本之间的协方差,如元素Cij就是反映的随机变量Xi, Xj的协方差。
2、协方差是反映的变量之间的二阶统计特性,如果随机向量的不同分量之间的相关性很小,则所得的协方差矩阵几乎是一个对角矩阵。对于一些特殊的应用场合,为了使随机向量的长度较小,可以采用主成分分析的方法,使变换之后的变量的协方差矩阵完全是一个对角矩阵,之后就可以舍弃一些能量较小的分量了(对角线上的元素反映的是方差,也就是交流能量)。特别是在模式识别领域,当模式向量的维数过高时会影响识别系统的泛化性能,经常需要做这样的处理。
3、必须注意的是,这里所得到的式(5)和式(6)给出的只是随机向量协方差矩阵真实值的一个估计(即由所测的样本的值来表示的,随着样本取值的不同会发生变化),故而所得的协方差矩阵是依赖于采样样本的,并且样本的数目越多,样本在总体中的覆盖面越广,则所得的协方差矩阵越可靠。
4、如同协方差和相关系数的关系一样,我们有时为了能够更直观地知道随机向量的不同分量之间的相关性究竟有多大,还会引入相关系数矩阵。
阅读全文(6020) | 回复(0) | 编辑 | 精华
|
|