首页 > 试题广场 >

关于相关系数,下列描述中正确的有:

[不定项选择题]
关于相关系数,下列描述中正确的有:
  • 相关系数为0.8时,说明两个变量之间呈正相关关系
  • 相关系数等于1相较于相关系数等于-1,前者的相关性更强
  • 相关性等于1相较于相关系数等于0,前者的相关性更强
  • Pearson相关系数衡量了两个定序变量之间的相关程度
  • Spearman相关系数可以衡量两个定序变量之间的相关程度
  • 相关系数为0.2相较于-0.8,前者的相关性更强

使用Pearson线性相关系数有2个局限:

  1. 必须假设数据是成对地从正态分布中取得的。
  2. 数据至少在逻辑范围内是等距的。

对于更一般的情况有其他的一些解决方案,Spearman秩相关系数就是其中一种。Spearman秩相关系数是一种无参数(与分布无关) 检验方法, 用于度量变量之间联系的强弱。在没有重复数据的情况下,如果一个变量是另外一个变量的严格单调函数,则Spearman秩相关系数就是+1或-1,称变量 完全Spearman秩相关。注意这和Pearson完全相关的区别,只有当两变量存在线性关系时,Pearson相关系数才为+1或-1

对原始数据xi,yi按从大到小排序,记x'i,y'i为原始xi,yi在排序后列表中的位置,x'i,y'i称为xi,yi的秩次,秩次差di=x'i-y'i。Spearman秩相关系数为:

ρ s = 1 6 d 2 i n ( n 2 1 )
编辑于 2016-08-10 16:38:40 回复(0)

对c选项有疑惑:假设x和y不服从正态分布,它们的pearson相关系数为0(但是x和y是不独立的),m和n服从正态分布,它们的pearson相关系数不为0。应该这两个相关系数的值是没有可比性的吧?或者说如果某一对变量不服从正态分布,不能用pearson系数来比较两对变量的相关性的吧

发表于 2017-08-22 16:15:50 回复(1)
sjd头像 sjd
1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,
  就是效率没有pearson相关系数高。

2.上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数。

3.两个定序测量数据之间也用spearman相关系数,不能用pearson相关系数。
发表于 2015-08-20 15:43:31 回复(3)
Pearson要求连续线性;
Spearman只要求单调就可以了,不一定要连续线性。
发表于 2016-09-09 15:44:59 回复(0)
相关系数ρXY取值在-1到1之间,
ρXY = 0时,称X,Y不相关;
| ρXY | = 1时,称X,Y完全相关,此时,X,Y之间具有线性函数关系; 
| ρXY | < 1时,X的变动引起Y的部分变动,ρXY的绝对值越大,X的变动引起Y的变动就越大, | ρXY | > 0.8时称为高度相关,当 | ρXY | < 0.3时称为低度相关,其它时候为中度相关。
发表于 2015-09-04 22:04:02 回复(0)
定比数据:表现为数值,可以进行加、减运算以精确计算数据。比如身高、体重等

定距数据:表现为数值,有单位,可以做加减运算,不能做乘除运算。比如,温度。

定类数据:按事物某种属性分类或分组,数字大小代表类别。比如性别(男和女)。

定序数据:数据的中间级,用数字表示个体在某个有序状态中所处的位置,不能做四则运算。比如您对天猫的满意情况如何?(非常不满意、比较不满意、中立、比较满意、非常满意)

Pearson相关系数(Pearson CorrelationCoefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系

在 统计学中, 以查尔斯·斯皮尔曼命名的斯皮尔曼等级相关系数,即spearman相关系数。经常用希腊字母ρ表示。 它是衡量两个变量依赖性的 非参数 指标。 它利用单调方程评价两个统计变量的相关性。 如果数据中没有重复值, 并且当两个变量完全单调相关时,斯皮尔曼相关系数则为+1或−1。
发表于 2019-11-27 10:18:15 回复(0)
Pearson系数要求变量连续线性,Spearman系数要求两个相关就行
发表于 2018-09-05 19:34:03 回复(0)
定序测量数据可以用spearman相关系数,不能用pearson相关系数
发表于 2017-04-22 23:23:17 回复(0)
最常见的两种相关系数是皮尔逊相关系数和Spearman相关系数。

1. **皮尔逊相关系数(Pearson Correlation Coefficient):** 皮尔逊相关系数衡量的是两个连续变量之间的线性关系。它的取值范围在-1到1之间,其中:
   - 当相关系数接近1时,表示两个变量之间存在强正相关关系,即一个变量增加时,另一个变量也随之增加。
   - 当相关系数接近-1时,表示两个变量之间存在强负相关关系,即一个变量增加时,另一个变量会减小。
   - 当相关系数接近0时,表示两个变量之间几乎没有线性相关关系。

2. **Spearman相关系数:** Spearman相关系数是用于衡量两个变量之间的等级关系(排名关系),而不需要假设线性关系。它通过比较变量的排名来计算相关性,适用于分类变量、定序变量和非线性关系的情况。

Spearman相关系数主要用于衡量两个变量之间的等级关系(排名关系),特别适用于以下情况:

1. **定序变量:** 定序变量是一种分类变量,其取值之间存在一定的顺序关系,但没有明确的间隔或比率关系。例如,教育程度可以分为"高中以下"、"大学本科"、"硕士研究生"等,这些取值之间有顺序,但不具备数值关系。

2. **分类数据:** 当变量是分类数据,且取值之间没有明确的数值关系时,Spearman相关系数可以用于衡量这些变量之间的关系。例如,产品的评级可以分为"优良"、"一般"、"差"等,这些分类之间的关系可以用Spearman相关系数来分析。

3. **排名数据:** 当你有一组数据,但你更关心它们的相对排名而不是具体的数值时,Spearman相关系数非常有用。这适用于一些主观评价的情况,比如文化活动的满意度调查中的排名。

需要强调的是,Spearman相关系数适用于衡量两个变量之间的单调关系(趋势方向是否一致),而不是线性关系。如果你关心两个变量之间的线性相关性,那么皮尔逊相关系数可能更适合。
Spearman相关系数可以用于衡量连续变量之间的相关程度,但是皮尔逊相关系数可能更适合
编辑于 2023-08-28 17:52:02 回复(0)
Pearson相关系数(Pearson Correlation Coefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系Spearman是衡量两个变量依赖性的 非参数 指标。 它利用单调方程评价两个统计变量的相关性。

编辑于 2022-06-22 21:44:25 回复(0)
都是分析定量数据,满足正态性用Pearson 不满足正态性使用Spearman系数
发表于 2021-10-22 15:56:57 回复(0)
1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以, 
  就是效率没有pearson相关系数高。 
2.两个定序测量数据之间也用spearman相关系数,不能用pearson相关系数。

发表于 2017-09-25 22:17:35 回复(0)
计算积距pearson相关系数,连续性变量才可以计算,当两个连续变量呈线性相关时,适合使用这个;
Spearman秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据
发表于 2016-09-07 20:05:21 回复(0)