[转帖] CPI真的被低估了7%吗?

徐奇渊 原创自 搜狐博客 | 2010-11-16 22:25 | 收藏 | 投票

按:以下是网友thunders在经济学教育科研网论坛发的一个帖子,对我的《统计数据和主观感受:CPI是风动还是帆动?》一文,在技术上进行了批判性分析。她模拟的一个例子,让我认识到:使用常数的回归方法,来拟合一个变系数的情况,会产生误导性的结果。这是我看到最靠谱,也是唯一靠谱的公开性批评。我无言以对,只好拿来放到这里,以正视听。(原来也有朋友善意的提醒:使用常系数对事实上变系数的情况作回归,可能会导致偏差;不过,我确实没想到,像这么微小的权重调整,也能导致如此大的偏差。看来模拟确实是有用的。)总之,我接受thunders的批评。

但是,另一方面,她的分析(具体分析见后面所附)提供了一个新的矛盾:

(1)统计数据本身有问题。

(2)CPI的权重,不是每年一调,而是经常在调(每年多调)。

具体分析过程如下:

现在我们有两条信息如下(第一条是没问题的可以相信;第二条有待验证,不过为了验证它,暂且接受它作为条件):

1.“由此可以判断,在权数固定不变的情况下,计量模型的检验是科学的”(thunders也同意的)

2. 根据国家统计局统计制度CPI“每五年调整一次商品篮子,每年则根据城乡居民12万户消费调查资料及相关资料调整一次权数”(庞晓林原话,我很庆幸庞说的这么准确“每年”调整“一次”,否则下面就没办法分析了)


既然权重“一年才调整一次权重”,而且在权重为常数的情况下,计量模型是科学的。那我们在样本期间找12个月为长度的数据,总会有一个拟合效果特别好,即“计量模型的检验是科学的”状态。

那我们就做一下好了,结果却发现:不管是选择“2006年1月-2006年12月”,“2007年1月-2007年12月”,“2008年1月-2008年12月”,……,或者说选择2006年2月-2007年1月,2006年3月-2007年2月……以12个月为长度滚动回归,找不到像是“计量模型是科学的状态”。

回归结果都是非常混乱的,极不理想。因此,

12个月长度的回归,显示出这样糟糕的结果(这和小样本无关),那就有两种情况:

(1)统计数据本身有问题。

(2)CPI的权重,不仅仅是每年一调,而是经常地在调。


 

 

转贴thunders原文如下:

 

CPI真的被低估了7%吗? 中国社会科学院世界经济与政治研究所徐奇渊发表的研究报告《统计数据和主观感受:CPI是风动还是帆动?》(以下简称《帆动》),从CPI基期、CPI结构以及居民阶层三个方面很好地解释了主观感受和统计数据不一致的原因,但媒体更为热炒的却是“CPI大约被系统的低估了7%”的推断。7%的低估,好比你原来花100块钱过生活,现在维持同样水平的生活却要花110块钱,而统计局却告诉你物价上涨了3%而不是10%。事实果真如此吗?


1.应该如何解释估计结果?


《帆动》一文所用的估计方程为:CPI=a+b1PI1+ b2PI2+ b3PI3+ b4PI4+ b5PI5+ b6PI6+ b7PI7+ b8PI8 ,对得到的常数项估计值-7.53,该文中做了如下解释:“有一部分变化值(-7.53)是无法用8个分项指数及其权重解释的……因此,-7.53 可以被视为人为调整的痕迹”。但仔细观察回归结果,可以发现系数估计值加起来,其和等于108%而不是加权平均意义上的100%。显然“b1PI1+ b2PI2+ b3PI3+ b4PI4+ b5PI5+ b6PI6+ b7PI7+ b8PI8”因权数估计问题,从而大于CPI,必然就有一个负的常数项与差额进行抵消。所以,这个常数项并非通常计量模型中“没有被包含在解释变量中的其他因素”,更不能被说成是“人为调整”,而是由于所用样本数据和估计模型产生了一个与CPI设计原理相违背的结果,至于为什么产生这种结果,下面将会进一步进行论证。


此外还要提一下,在《帆动》一文之前,很多学者都曾利用这种回归方法估计过CPI权重,但在估计中会设定回归系数之和等于1,如2008年贺力平、樊纲等曾在《经济研究》上发表的文章。用此方法,常数项会降到一个接近于0的水平,但这种做法并不好,相当于首先肯定了数据是正确的、会得到一组合理的权重。


2.回归系数异常的原因分析


按照CPI常规的编制程序,回归结果应该是和分类指数及权重相一致的。下面我们就来看看,回归系数之和超过100%,到底是模型还是数据的责任?为保持和《帆动》一致,我们同样用2006年1月-2010年5月的数据进行测试。


第一步:模型的可靠性测试


假设权数是不变,我们就可以利用实际公布的8大分类指数,根据2001年基期的CPI分类权重,可以计算出一个固定权数的CPI(这个CPI和实际公布的CPI并不相等),将固定权数CPI做为被解释变量进行回归,估计出的系数和实际赋予的权重会完全一致,常数项为0。


由此可以判断,在权数固定不变的情况下,计量模型的检验是科学的。之所以出现估计系数之和偏离100%这种违背原理的现象,有两种可能:(1)数据本身有问题;(2)CPI权数是变动的(权数的每年调整是制度规定的,如果确实是严格按照城乡居民消费支出资料计算的,就不能被视为带有贬义的人为调整;但这个权数的调整是不是这样呢,我们无法论证)。对于(1),我们无法从宏观层面检验真伪,只能依靠统计局内部的数据质量控制和评估体系;但对于(2),则完全可以通过模拟测算得到一个确定的答案。


第二步:逐年改变CPI分类权重,对回归系数影响的测试


根据国家统计局统计制度CPI“每五年调整一次商品篮子,每年则根据城乡居民12万户消费调查资料及相关资料调整一次权数。”基于此,笔者假设2006年权重和2001年权重相同,其后每年进行微调(表2),再利用这些不固定的权重和分类指数计算各月的CPI。注意:得到的非固定权重的CPI是严格按照加权平均计算出来。


不出意外。这次的回归结果(表1)和《帆动》的回归结果具有极强的相似性,即回归系数之和超过100%(106%),并出现了显著的负值(-6.9),显然,将负值解释为“人为调整”的做法是站不住脚的,负值的产生,是由于用不变系数的模型去估计变系数的事实所导致的。因此,我们只能说,《帆动》一文的计量模型估计并不适用于CPI变动权数的估计,对CPI权数进行这样的估计从一开始就是违背计量模型原理的,因此,《帆动》一文中CPI被人为低估7%的结论当然也就是错误的。


当然,我们也无法证明统计局的CPI数据完全是客观真实没有经过任何调整的。我们只能说,在目前分类权数每年调整且不公布分类权数的情况下,CPI权重是不可能依据计量模型进行估测的,更不能依据计量模型做出低估多少的判断。


 

个人简介
经济学博士,供职于中国社科院世界经济与政治研究所国际金融研究中心。
每日关注 更多
赞助商广告