navalboy
摘要:本文用模特卡罗模拟方法研究了样本容量在54以下的DW统计量的分布特征,并给出小样本DW检验临界值表。同时用DW检验提出了一个判别最小二乘估计中是否存在虚假回归的有效方法。关键词:模特卡罗模拟,DW分布,非平稳性,协整 Distribution of Small Sample DW Statistic Zhang Xiaotong1 Zhao Chuxiao2 ( Institute of International Economics, Nankai University, Tianjin 300071) ( Management School, Tianjin University, Tianjin 300072) Abstract In this paper we investigated the DW distribution with sample size under 54 by Monte Carlo simulation method and gave a critical table for small sample DW Based on that we proposed a method for recognizing spurious regression in ordinary least squares Keywords: Monte Carlo simulation, DW distribution, nonstationary, cointegration 1.概述 八十年代以来,Engle-Granger (1987), Engle-Yoo (1987) 和Sargan-Bhargava (1983)都曾提及用DW统计量检验非平稳变量间的协整性问题。在Sargan-Bhargava (1983)中还专门给出一个DW协整检验用表。但在这些论文中均未对小样本DW统计量的分布特征给与研究。 本文采用蒙特卡罗模拟方法对小样本DW统计量的分布特征进行了充分、详细的研究。样本容量分别取为10,20,30,40和50。变量的设定分为三种情形:一 所涉及的两个变量都取自I(1)过程;二 所涉及的两个变量中一个取自I(1)过程,一个取自I(0)过程;三 所涉及的两个变量都取自I(0)过程。 在有些国家以年为单位的时间序列的最大可观测值个数并不是很大,所以对小样本DW统计量分布特征的研究有着非常重要的理论与现实意义。 本文结构如下。第二节推导两个I(1)变量进行最小二乘回归后,由残差计算的DW统计量的极限分布表达式,第三节介绍蒙特卡罗模拟结果及其分析,第四节给出实例,第五节给出结论。 2.DW统计量的极限分布 给定如下随机数据生成系统, yt = yt-1 + ut , y1 = 0, (1) xt = xt-1 + vt , x1 = 0, (2) 其中ut, vt ~ I(0), E(ut) = E(vt) = 0; E(ui uj) = 0, i ¹ j," i, j。则yt和xt为相互独立的两个I(1)过程。 建立如下回归模型: yt = b0 + b1xt + wt (3) 当对上式进行最小二乘估计时,会产生虚假回归问题。用随机误差wt的最小二乘估计值 构造DW统计量, (4) 因为当T ® µ 时, 必然接近于零,上式中分子为Op(1),而分母T -1sw2也是Op(1),所以DW统计量是Op(T -1)的。当T ® µ 时,有 DW Þ 即当用两个I(1)变量进行如模型(3)形式的回归时,DW统计量的极限分布为零。 3.小样本DW分布的蒙特卡罗模拟及其结果分析 当样本为有限样本,特别是小样本时,DW统计量的分布与其极限分布有着很大不同。由于上述条件下的DW统计量的分布无法用解析的方法求解,本文用蒙特卡罗模拟方法对DW统计量的小样本分布特征进行了研究。 以模型(3)为基础,除了以yt,xt ~ I(1)为条件对DW分布(记为DW(1,1))进行模拟外,还分别以yt ~ I(1),xt ~ I(0) 和yt,xt ~ I(0)为条件进行了模拟(分别记为DW(1,0) 和DW(0,0))。 由于DW(0,0)就是通常意义的DW统计量,所以只模拟样本容量T = 10, 40两种情形。对于DW(1,1)和DW(1,0),分别取T = 10, 20, 30, 40和50进行了模拟。在每个样本容量条件下各模拟1000次。所得结果见表一。 首先见表一的第三部分,先分析DW(0,0) 的分布特征。由于DW(0,0) 就是通常意义的DW统计量,所以模拟结果表明,一 DW(0,0)分布的均值为2,不受样本容量大小的影响;二分布是对称的,相应JB值(表中最后一列)说明小样本DW(0,0)统计量的分布与正态分布相当近似。三 随着样本容量的增大,分布的标准差逐步减小。 见表一的第一、二部分。小样本DW(1,1)和DW(1,0)统计量有着相似的分布特征。一 分布均为右偏态,分布左侧有端点,端点为零;二 随着样本容量的增大,DW(1,1)和DW(1,0)分布的右偏倚程度越来越大,分布均值逐步相左移动,90、95、99百分位数也逐步向左移动,同时分布的标准差逐步减小,分布的峰值越来越大,DW取值向零集中;三 在样本容量相同的条件下,DW(1,0)分布总是位于DW(1,1)分布的左侧,即DW(1,0)分布的均值、百分位数以及方差都比DW(1,1)分布的相应量小。T = 50模拟1000次的DW(1,1)和DW(1,0)分布的结果分别见图一和图二。 表一 DW分布的蒙特卡罗模拟结果 类 型 样本容量 百 分 位 数 均 值 标准差 偏 度 JB统计量 1 90 95 99 10 22 18 45 81 28 62 50 74 DW(1,1) 20 11 28 49 80 75 39 68 61 30 09 90 04 39 51 29 07 73 40 06 77 88 16 41 25 06 10 50 05 59 71 98 33 20 16 31 10 18 73 02 38 98 53 73 59 20 09 02 21 59 56 34 22 61 DW(1,0) 30 06 70 83 18 38 24 27 43 40 04 54 66 91 30 19 25 68 50 04 45 54 71 24 15 12 84 DW(0,0) 10 31 75 97 24 02 57 00 17 40 72 41 53 70 00 31 03 06 注: DW(1,1)表示由两个I(1)变量进行回归,计算得到的DW值 DW(1,0)表示由一个I(1)变量和一个I(0)变量进行回归,计算得到的DW值。 DW(0,0)表示由两个I(0)变量进行回归,计算得到的DW值。 在每个样本容量条件下各模拟1000次。 图一 T = 50模拟1000次的DW(1,1)分布直方图 图二 T = 50模拟1000次的DW(1,0)分布直方图 在相同样本容量条件下,DW(1,0)分布之所以位于DW(1,1)分布左侧,可作如下解释。随着T ® µ,DW(1,0)和DW(1,1)的分布都趋近于零。由于DW(1,0)来自于一个I(1) 变量和一个I(0)变量之间的回归,所以残差序列wt ~ I(1)。由于DW(1,1)来自于两个I(1)变量之间的回归,一般来说残差序列wt&nb 1、统计范围 GDDS将国民经济活动划分为五大经济部门:实际部门、财政部门、金融部门、对外部门和社会人口部门。对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据类别。系统提出了五大部门综合框架和相关的数据类别以及指标编制和公布的目标,鼓励以适当的、反映成员国需要和能力的频率和及时性来开发和公布指标。选定的数据类别和指标分为规定的和受鼓励的两类。 规定的数据类别包括:(1)来自综合框架中的核心部分,如实际部门的国民帐户总量、财政部门的中央政府预算总量、金融部门的广义货币和信贷总量、对外部门的国际收支总量;(2)追踪分析统计类目,如实际部门的各种生产指数、财政部门的中央政府财政收支和债务统计、金融部门的中央银行分析帐户、对外部门的国际储备和商品贸易统计;(3)与该部门相关的统计指标,如实际部门的劳动市场和价格指数统计;(4)社会人口数据,包括人口、保健、教育、卫生等方面统计。 除规定的数据类别以外,GDDS鼓励成员国发布更多的统计信息,以增强成员国经济实绩和政策的透明度。如实际部门列出储蓄、国民总收入指标,财政部门列出利息支付和偿债预计数据等。 GDDS认为,系统所包括的大多数数据类别都是由各国官方机构编制的。将私人部门编制的数据包括进去将更有助于观察经济的全貌,并使各国数据的范围更加一致。但是,将一些由私人机构编制的数据包括在系统内会增加工作的复杂性,比如由官方转发这些数据隐含着对这些数据质量的认可,官方必须对在公众获得、数据完整性和数据质量方面的责任做出调整。 2、公布频率 公布频率是指统计数据编制发布的时间间隔。某项统计数据的公布频率需要根据调查、编制的工作难度和使用者的需要来决定。系统鼓励改进数据的公布频率。GDDS对列出的数据类别的公布频率作了统一规定。例如, GDDS要求国民帐户、国际收支平衡表按年公布,广义货币概览按月公布,汇率则每日公布。 3、公布及时性 公布及时性是指统计数据公布的速度。统计数据公布的及时性受多种因素制约,如资料整理和计算手续的繁简、数据公布的形式等。GDDS规定了间隔的最长时限,如按季度统计的GDP数据规定在下一季度内发布,按月度统计的生产指数规定在6周至3个月内公布。 GDDS将选定的数据类别分为规定性和鼓励性两类,目的是给予参加国公布统计数据一定的灵活性。鼓励性一类是要成员国争取发布的,条件不具备的可以暂不发布。有些数据类别下构成要素后面注明“视具体情况”,即成员国认为该项统计不符合本国实际的,可以不编制发布。GDDS规定的发布周期和发布及时性也列出一些灵活处理和变通的办法。 GDDS有关数据方面的内容及要求如下: GDDS的数据规范 A、综合框架 核心框架 范围、分类和分析框架 受鼓励的扩展 频率 及时性 国民帐户 编制和公布全套的名义和实际国民帐户总量和平衡项目,得出国内生产总值、国民总收入、可支配总收入、消费、储蓄、资本形成、净贷款、净借款。编制和公布有关的部门帐户以及国家和部门的资产负债表 年度 10-14个月 中央政府操作 编制和公布交易和债务的综合数据,需强调:1)包括所有的中央政府单位;2)使用适当的分析框架;3)建立一整套详细的分类标准(税收和非税收收入、经常性和资本性支出、国内及国外融资),并适当细分(根据债务持有人、债务工具和币种)。 广义政府或公共部门操作数据,在那些地方政府或公共企业操作具有重要分析或政策意义的国家尤其鼓励。 年度 6-9个月 广义货币概览 编制和公布综合的数据,需强调:1)包括所有的存款公司(银行机构);2)使用适当的分析框架;3)建立对外资产和负债、按部门分类的国内信贷以及货币(流动性)和非货币债务构成的分类标准。 月度 2-3个月 国际收支 编制和公布综合的国际收支主要总量数据和平衡项目,包括:货物和服务的进口和出口、贸易差额、收入和转移、经常项目差额、储备和其他金融交易、总余额,并适当进行细分。 国际投资头寸和总体经济外债数据(如果这些数据具有重要的分析和政策意义) 年度 6-9个月 GDDS的数据规范 B、数据类别和指标 数据类别 核心指标 受鼓励的总量及构成 频率 及时性 实际部门 国民帐户总量 国内生产总值(名义和实际) 国民总收入、资本形成、储蓄 年度(鼓励季度) 6-9个月 生产指数 制造业或工业 初级产品、农业或其他指标 视具体情况 月度 视具体情况 所有指标都为6周-3个月 价格指数 消费者价格指数 生产者价格指数 月度 1-2个月 劳动力市场指标 就业、失业,工资/收入,视具体情况 年度 6-9个月 财政部门 核心指标 受鼓励的指标 频率 及时性 中央政府预算总量 收入、支出、差额和融资,视具体情况进行细分(根据债务持有人、债务工具和币种) 利息支付 季度 1个季度 中央政府债务 内债和外债,视具体情况适当细分(按币种、期限、债务持有人和债务工具) 政府担保债务 年度(鼓励季度) 1-2个季度 金融部门 核心指标 受鼓励的指标 频率 及时性 广义货币和信贷总量 净对外头寸、国内信贷、广义或狭义货币 月度 1-3个月 中央银行总量 储备货币 月度 1-2个月 利率 短期和长期政府债券利率,政策可变利率 货币或银行间市场利率及一套存贷款利率 月度 高频率(如月度) 股票市场 股票价格指数,视具体情况 月度 对外部门 核心指标 受鼓励的指标 频率 及时性 国际收支总量 货物和服务的进口和出口、经常帐户差额、储备、总差额 总体经济的外债和偿债数据,视具体情况 年度(十分鼓励季度) 6个月 国际储备 以美元标价的官方储备总额 与储备有关的负债 月度 1-4周 商品贸易 总进口和总出口 较长时间的主要商品的分类 月度 8周-3个月 汇率 即期汇率 每日 高频率(如月度) 社会-人口数据 核心指标 频率 人口 人口;人口增长率;城市人口;农业人口;人口性别;人口的年龄构成 各国公布频率会各不相同;及时性 保健 每个医生照顾人口数;预期寿命;婴儿/儿童/产妇死亡率 也不尽相同 教育 成年人文盲率、学生-教师比率、小学/中学入学率 贫困状况 获得洁净水的情况、卫生;每个房间居住的人数;收入分配;最低收入标准以下的家庭数 二、公布数据的质量 GDDS从两个方面的内容来评估公布的统计数据质量,即:提供统计数据的文字说明和提供统计数据的交叉检验。 统计数据质量是个难以界定、因而不易评估的概念。为了便于检查,GDDS选定两条规则作为评估统计数据质量的标准。一是参加国提供数据编制方法和数据来源方面的资料。资料可以采取多种形式,包括公布数据时所附的概括性说明、单独出版物和可从编制者得到的有关说明。同时也鼓励成员国准备并公布重要的关于数据质量特征的说明(例如,数据可能存在的误差类型、不同时期数据之所以不可比的原因、数据调查的范围或调查数据的样本误差等)。二是提供统计类目核心指标的细项内容、及与其相关的统计数据的核对方法,以及支持数据交叉复核并保证合理性的统计框架。为了支持和鼓励使用者对数据进行核对和检验,规定在统计框架内公布有关总量数据的分项,公布有关数据的比较和核对。统计框架包括核算等式和统计关系。比较核对主要针对那些跨越不同框架的数据,例如,作为国民帐户一部分的进出口和作为国际收支一部分的进出口的交叉核对。 与数据质量密不可分的是制定和公布改进数据的计划。所准备和公布的改进计划应包含所有数据不全的部门。统计当局应表明下述立场中的一个:(1)针对已发现不全的改进计划;(2)最近实施的改进措施;或(3)国家认定不 四、公众获取 GDDS规定要提前公布数据发布日期,并向各方同时发送。 官方统计数据的公布是统计数据作为一项公共产品的基本特征之一,及时和机会均等地获得统计数据是公众的基本要求。GDDS对此制定了两项规划:一是参加国要预先公布各项统计的发布日历表。预先公布统计发布日程表既可方便使用者安排利用数据,又可显示统计工作管理完善和表明数据编制的透明度。GDDS规定对于以年度为频率公布的综合框架和指标,时间表表明不迟于某个既定时间;对于公布频率更高的数据,则可确定一个日期范围,如3-5天。鼓励成员国向公众公布发布最新信息的机构或个人的名称或地址。二是统计发布必须同时发送所有有关各方。由于数据是有价值的商品,因此GDDS规定应向所有有关方同时发布统计数据,以体现公平的原则。发布时可先提供概括性数据,然后再提供详细的数据,当局应至少提供一个公众知道并可以进入的地方,数据一经发布,公众就可以公平地获得。 
本人系福州大学统计学专业的一名学生,于2005年6月27日——7月8日到福建省统计局科研所认识实习,在两周的时间里,我所做的每一项工作都是以前从来没有做过的,在领导和同事的耐心帮助下,我学习到了很多实用的、有价值的东西,在积累了一些实际工作经验的同时也更深刻的理解到了统计理论知识体系,为今后的学习奠定了坚实基础。在认识实习期里,我所做的工作内容比较具体、感受和体会也比较多。下面,我仅把实习期里的主要情况做一下汇报。如有不妥之处,欢迎给予批评和指正。一、 福建省统计局科研所介绍科研所是统计局内部的一个重要职能部门,而统计科研涉及的领域也十分广阔,包括统计基础理论研究、统计应用研究和统计信息技术研究。同时在政府统计工作中,对政府和社会关心的有关经济、社会、科技、资源与环境等重大问题,都需要从统计的角度进行分析研究,得出结论,提出建议。“十五”期间,国家统计科技研究的重点是统计观念的创新、统计方法的创新、统计手段的创新以及统计体制的创新。要积极组织、指导重大课题研究,统计科研所每年要完成一项以上具有重要影响的课题。统计杂志是展示优秀科技成果的重要窗口,是科技成果转化为生产力的重要媒介。要加强对统计杂志的领导和支持,不断提高杂志的质量,增加发行量,扩大影响力,努力创办一流杂志。科研所的主要职能有五点,具体包括:拟订全省统计科研计划和科研制度,并组织实施;组织协调本局及全省各地区、各部门的统计科研工作;承担统计科研课题,负责向国家统计局和省直有关部门进行统计科研课题的申报立项及管理工作;承担全省统计科研成果的评审、选优、奖励工作,并推荐优秀成果参加国家和省级评奖;拟订省统计学会章程,负责省统计学会日常工作,履行省统计学会秘书处的职责。根据国务院有关文件精神,国家和各地统计科研所作为非营利性社会公益类科研机构,只能加强,不能削弱。统计科研所担负着从事统计科学研究、进行科研管理(组织统计科技交流、发布课题指南、课题立项、成果评奖等)、编辑出版统计杂志等重要职能。统计局要为科研人员配备先进的计算机设备、统计分析软件、通讯工具以及其他办公设备;要建设内容丰富的统计科研网站等。二、 科研所认识实习的具体内容第一天到科研所报到时,一进门,就看到书柜上排列着诸多奖章,象年度科研先进单位、统计学会先进单位等等,都是国家统计局给予福建省统计局科研所的表彰,也是对他们工作的肯定,我为自己能有幸到这里认识实习而感到骄傲。俞明所长和所内同事对我们的到来也表示了欢迎。俞所长对我们今后几天实习的具体工作做了安排,具体包括《福建统计》杂志的出版,统计科研网站的建设,如《国际经济信息摘编》,统计论文出版的校对及统计学会的一些工作。在次,我也就这几个工作做汇报。首先,是关于论文集的校对工作,也是此次实习中的重点工作,由于这本论文集的重要性,更要求我们校对工作的严格,在次之前,科研所的同事已经对该论文集校对过三遍,但为了确保论文集的正确无误,我们又进行了第四次校对工作。我也不得不为科研所里同事们认真负责的工作态度感到钦佩。首先我们学习了校对工作的基本常识,要求我们对哪怕是一个标点符号的错误也不能放过。校对了《区域R&D投入对经济发展影响的研究》、《从资金流量和流向的变化看福建经济运行》九篇学术论文。在校对过程中,印象较深的是关于统计报表的校对,统计报表就严格的编制规则,如规定表号采用一位英文字母或罗马字母和三位数码表示。英文字母或罗马字母表示全局统计报表制度的排列顺序,三位数码分为两段,第一位数码为第一段表示统计报表的报告期别,或报表的性质,即是年报还是定报,是综合表还是基层表;是经常性调查还是一次性调查或是普查、试行表。第二、三位数码为第二段表示统计报表的顺序。还学习了统计报表的性质代码:1、基层年报;2、基层定报;3、综合年报;4、综合定报;5、一次性调查;6、普查。从中不仅学习了如何查找错误遗漏还懂得了如何制表。其次,是关于科研所网站的建设,也是本次实习过程中工作时间较长的工作。我的主要工作是学会网站建设的一些基本知识,并单独处理网站的文章录入,信息搜集等任务。我负责的主要是“国际经济信息摘编”的编制工作,这个项目主要包括观点聚焦、经济综述]经济比较、热点追踪、市场动态、行业发展动向、统计数据等七个主要项目。搜集了当今国际上经济发展的最新动态的50余篇文章,并录入入网,以供统计相关部门采编并出版成书。再次,在实习期间,利用科研所书籍多的优点,阅读了大量关于统计方面的书,如《中国统计》、《福建统计》以及诸多统计专业论文,充实了自己的理论知识,收益非浅,还了解统计学会工作的大致流程。三、 认识实习的收获与感想在此之先,我想向所有为我的实习提供帮助和指导的老师和科研所的领导和同事致谢,感谢你们为我的顺利实习所作的努力和帮助。 通过实习,我在统计学方面获得了一些实际的工作经验,巩固并检验了自己三年来本科学习的知识水平。实习期间,我了解并参与了统计论文集的校对工作,并且对统计科研的网站寻找了资料,提出了自己的一些想法。在此期间,我进一步学习了统计学的理论知识体系,对统计有了更深的理解,将理论与实践有机结合起来。我的工作得到了实习单位充分的肯定和较好的评价。本次认识实习是我大学生活中不可或缺的重要经历,其收获和意义可见一斑。首先,我可以将自己所学的知识应用于实际的工作中,理论和实际是不可分的,在实践中我的知识得到了巩固,解决问题的能力也受到了锻炼;其次,本次实习开阔了我的视野,使我对统计在现实中的运作有所了解,也对统计也有了进一步的掌握;此外,我还学习了统计科研网站的制作及为网站建设搜集材,可以和同事在一起相互交流,相互促进。在实习过程中还有些其它方面也让我学到了很多东西。在两个星期的实习时间里,我基本上掌握了统计科研工作的一些具体操作细节,知道统计科技工作是一项具有创造性的活动,要出一流成果,就必须要有专业的统计人才和认真严肃的工作态度。在实践的校对工作中,知道一丝不苟的真正内涵。 认识实习期间,我利用此次难得的机会,努力工作,严格要求自己,虚心向领导和同事求教,每天按时报到,严格遵守各种规章制度。认真学习统计专业知识,阅读了大量统计方面的各种杂志,论文集,书籍等,进一步掌握了统计技能,从而进一步巩固自己所学到的知识,为以后真正走上工作岗位打下基础。但在短暂的实习过程中,我也深深的感觉到自己所学知识的肤浅和在实际运用中的专业知识的匮乏,刚开始的一段时间里,对一些工作感到无从下手,茫然不知所措,这让我感到非常的难过。在学校总以为自己学的不错,一旦接触到实际,才发现自己知道的是多么少,因此在以后的学习中应更加努力,让自己掌握好更多的专业知识,更好的运用统计这门科学。 最后,我想借此机会,再一次向为我的实习提供帮助和指导的老师和科研所的领导和同事以及在实习过程中帮助我的朋友、我的同学致以衷心的感谢!