期刊问答网 论文发表 期刊发表 期刊问答

论文中常见的统计学错误有哪些情况

  • 回答数

    3

  • 浏览数

    264

晖程晖
首页 > 期刊问答网 > 期刊问答 > 论文中常见的统计学错误有哪些情况

3个回答 默认排序1
  • 默认排序
  • 按时间排序

书海无涯

已采纳
总体:包含所研究的全部个体(数据)的集合。样本:从总体中抽取出来的,作为总体的代表,由部分单位组成的集合体“例如考察某厂生产的灯泡的使用寿命,该厂生产的所有灯泡的使用寿命为总体,每个灯泡的使用寿命为一个个体,从总体中抽取若干个体(100个)灯泡做实验,这100个灯泡就是样本。” 总体和样本关系:1)样本的单位必须取自总体;2) 一个总体可以抽取多个样本;3)确保样本的客观性与代表性统计量:  是统计理论中用来对数据进行分析、检验的变量。从样本推断整体性质,我们通常是通过统计量来推断的,比如上面这个例子我们通过计算100个灯泡的使用寿命平均值推断总体这个工厂生产出灯泡的使用寿命长短。常见的统计量有:样本均值、样本方差、样本矩、样本K阶中心距、样本偏度、样本峰度等分布:在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体单位在各组间的分布。常见的分布类型有:T分布、F分布、卡方分布假设检验(单侧检验和双侧检验):又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。对应不同应用场景,服从不同分布形式,对应不同检验:T检验、F检验、卡方检验等。     这里先说一下如何提出假设,这里分单侧检验和双侧检验。    举例:考虑某工厂袋装盐的重量(服从正态分布),总体均值为第Ⅰ类错误和第 II 类错误第Ⅰ类错误(alpha类错误):原假设是正确的,但拒绝了原假设(弃真)第 II 类错误(beta类错误):原假设是错误的,但没有拒绝原假设(存伪)以上弃真,存伪都是从原假设出发的。放弃原假设就可能发生”弃真”,接受原假设有可能“存伪”。这里我们举个简单的例子说明这个问题,假设我们从某个指标一组检测结果判断某个人是否是肝病病人。原假设:健康人,备择假设:肝病病人。那么,当这组数据表明应该拒绝原假设,那么,我们可能会犯第Ⅰ类错误,将健康人误诊为肝病病人(图中黄色部分)。但是如果我们接受了原假设,认为该人为健康人,我们有可能会犯第II类错误,将肝病病人认为是健康人(图中红色部分),因为有一部分肝病病人该指标的表现和正常人类似,从数据无法判断。

论文中常见的统计学错误有哪些情况

132 评论(10)

qqgdufe

弃真错误,是指拒绝了实际上成立的、正确的假设。存伪错误是指原假设是错误的,但是没有拒绝它。
212 评论(13)

suxia1964

1、变量之间关系可以分为两类函数关系:反映了事物之间某种确定性关系。相关关系:两个变量之间存在某种依存关系,但二者并不是一一对应的;反映了事务间不完全确定关系;2、为什么要对相关系数进行显著性检验?实际上完全没有关系的变量,在利用样本数据进行计算时也可能得到一个较大的相关系数值(尤其是时间序列数值)。当样本数较少,相关系数就很大。当样本量从100减少到40后,相关系数大概率会上升,但上升到多少,这个就不能保证了;取决于你的剔除数据原则,还有这组数据真的可能不存在相关性;改变两列数据的顺序,不会对相关系数,和散点图(拟合的函数曲线)造成影响;对两列数据进行归一化处理,标准化处理,不会影响相关系数;我们计算的相关系数是线性相关系数,只能反映两者是否具备线性关系。相关系数高是线性模型拟合程度高的前提;此外相关系数反映两个变量之间的相关性,多个变量之间的相关性可以通过复相关系数来衡量。3、增加变量个数,R2会增大;P值,F值只要满足条件即可,不必追求其值过小。4、多重共线性与统计假设检验傻傻分不清?多重共线性与统计假设没有直接关联,但是对于解释多元回归的结果非常重要。相关系数反应两个变量之间的相关性;回归系数是假设其他变量不变,自变量变化一个单位,对因变量的影响,而存在多重共线性(变量之间相关系数很大),就会导致解释困难;比如y~x1+x2;x·1与x2存在多重共线性,当x1变化一个单位,x2不变,对y的影响;而x1与x2高度相关,就会解释没有意义。一元回归不存在多重共线性的问题;而多元线性回归要摒弃多重共线性的影响;所以要先对所有的变量进行相关系数分析,初步判定是否满足前提---多重共线性。
333 评论(13)

相关问答