引言——变量关系分析的广泛意义
在统计分析中,有这样一类具有普遍意义的问题:在测得了(取样)一个变量系统的数据以后,如何从数据中发现并且验证这些变量之间的关系?了解变量之间的关系,无论是对于知识发掘(knowledge discovery),还是拟合精度的提高,都是很有意义的.比如任何一类回归分析,便是要分析预测变量和响应变量之间的关系.如果我们能用一些方法做回归前的预分析(pre-analysis before regression),比如,使用方差分析去分析各个预测因素之间的关系,是非常有必要的.为什么呢?一个很简单的原因是出于对复线性的考虑.众所周知,复线性是回归分析的大敌.如果大家还记得回归分析系数的协方差矩阵的话,想必也能记得如果预测因素之间的相关系数太大会导致回归方程系数非常不稳定(请参阅 method of multivariate data analysis by rencher).又如结构方程模型,是要分析测量变量(measurement)和结构变量(construct)之间的关系.还有最近十分热门的图模型,便是赤裸裸的声称图模型是所有统计模型的一个大综合.
阅读全文 »
标签 ‘ 可视化 ’
Bootstrap
Confusion Matrix
COS
Logistic回归
P值
R
R语言
SAS
Sensitiveity
Specificity
SPSS
WinBUGS
中国人民大学
中心极限定理
主站
会议
假设检验
分析数据
分类模型
博客
可视化
回归
学习经历
导读
应用统计科学研究中心
收集数据
散点图
数据挖掘
整理数据
期望
概率论
混淆矩阵
相关
空间统计
统计之都
统计功课
统计学
统计学院
维基
表述数据
计量经济学
论坛
论文摘要
贝叶斯
重抽样
大规模系统内变量关系的研究以及可视化-1因果分析
不同版本的散点图矩阵
散点图矩阵是散点图的高维扩展,它从一定程度上克服了在平面上展示高维数据的困难,在展示多维数据的两两关系时有着不可替代的作用。R 软件就包含了各种不同版本的散点图函数,本文主要介绍散点图矩阵的设计及其在R中的实现方法,并比较它们的长短,从而审时度势,选取自己喜欢的表现方式和相应的函数。
阅读全文 »
相关矩阵的可视化及其新方法探究
针对相关系数阵的可视化方法,本文回顾了颜色图和椭圆图,并提出了一种新方法——圆圈图。通过实际数据的比较和分析,阐述了各类图形的不同性质并发现椭圆图具有许多优良性质,是一类优秀的相关系数阵的可视化方法。
阅读全文 »
调和曲线图和轮廓图的比较
调和曲线图和轮廓图都是多元数据的可视化方法,本文利用R软件和iris数据展示了这两种方法并比较了它们的效果。
阅读全文 »
