Feed on Posts or Comments 09 September 2010

情报评论 admin on 28 Jun 2009 01:28 pm

再谈数据问题

本人从业以来所做的工作基本属于“软科学、软技术”研究,七八十年代过来的人应该都知道,这里说的“软”是相对于自然科学技术之讲数据,讲定律和讲实验等的“硬”而言的。我查过大概虽然欧洲日本在七十年代有过类似的说法,但从来没有成为主流。开放以后人们发现这些在国际上都是属于社会科学范畴的,我留学的专业叫“科技政策”,在国内一定是属于理工科范围的,但是那里颁发的是经济学学位,道理很简单,有限资源最优分配就是经济学的本质。其实明眼人也都清楚,国内之所以这样饶弯子是为了靠到科技领域里,少点干扰,因为一到哲学社会科学,当时很可能因为涉及意识形态,或某领导随便讲了句什么话,就不知道一加一应该等于几了。现在情况当然不同了,社会科学的地位正在恢复,至少部分社会科学已经能够招到最好的中学毕业生了,理工科毕业的读个什么经济金融研究生早就非常时髦,特别是政治局委员开始出现法学经济学学位的,而清华、石油学院等工科生一统天下的局面已经不复存在。

但是从我工作经历来看,社会科学的素养仍然是是被忽略的问题之一。现在很重视领导干部的专业知识培训,干部培训教材一发就是一大摞(不免又会让我这等小人产生联想),什么信息化、知识产权,但是我始终没有发现一些基本的统计和数据的知识培训,而按照我的体会,对于当领导的人而言,那些是比信息化、知识产权更加有用得多的知识。

在提出GDP翻两番(4倍)口号的时候,我亲眼看到过印在红头文件上的“战略”说成前一半年份实现2 .2倍,后一半年份达到1.8倍,加起来就变成4倍了,也听到过学者出身的领导把部门甲的和部门乙的平均收入加起来除以2就得到的两个部门总合平均数,这些属于数学问题,容易解决,近来是越来越少了。就统计和数据而言还有一类问题,就比较深刻了,不是一两句话就能够说明白的。

社会科学有些东西,看上去好像人人都懂,都能评论几句,其实往往不那么简单,例如最近正在讨论的国家统计数据不一的问题,一度有传说将来国家要统一数据发布,不一致的不许发布(不过统计法草稿里这句没有),还有就是前一阶段“大学排行榜”,主流的专家一致要求由“国家权威部门”发布,这些认识其实反映了对社会经济统计的了解太浅薄。对此问题比较赞同以下短评的观点,在此不多说了。“数据的公信力应从何而来”《东方早报》2009年6月28日10版http://www.dfdaily.com/node2/node24/node224/userobject1ai175966.shtml

我在读研究生后期参加了国内最早开展的社会、经济和科技统计指标的课题,我也没有系统学过社会经济统计(不过国内80年代前流行苏联编的教科书不学也罢),与别人不一样的是还有些书呆子气,设法找了些正经的学术研究来看,知道了些“指标(Indicator) ”的起源和原理,其中到现在还管用的认识就是,人类所做的各类社会经济统计,实际上都是,也永远只能是客观的近似,指标就是概念的代理(Proxy),而且随着观察者的视角不同,可以得到不同的代理,要接近真相不是去找个足够的权威,而是一要搞明白代理与概念的关系,二是要通过各种“代理”途径来观察,我说过无数瞎子一起摸象,加个地理信息系统就能够无限逼近大象的真面目。大学排行榜谁能做到精确?不要说教育部,政治局常委也不能,但是如果方法合理公开透明,有一定的理论支持,各种排行榜都会有点用。

这里还有一个实践经验的问题。眼下从题海战里胜出(还不说那些靠关系)进入管理部门的高才生们永远也不会明白为什么连一个点算人头的人口统计也那么难做(其实古代已有同类问题,知道韩信大点兵的趣味数学题吧)。而GDP比人口的统计难度在理论上要大得多。

我在英国有个体验现在还颇为得意。那是在课堂里听老师讲投入产出模型,我举手提出一个质疑和一个问题,使得老师对亚洲学生的感觉可能大为改观,质疑是提出那个对角线不应该都为零(本部门也对自己投入);问题是老师举了个实际例子,最后说明全部投入等于全部产出,理论上当然是这样,可以说无暇可击,但是我问怎么会那么巧,是不是有其它原因?老师想了想说你是对的,应该是数据调整的结果。这些质疑和提问在学问方面没有什么了不起,都来自我的实际经验,因为我都遇到过这样的问题。

回到政策研究这些“软”到许多科技行业专家不屑的课题,对领导者不敢说什么,对研究者来说,我觉得一是应当有些社会科学相关知识的扎实基础,而不是挂羊头卖狗肉的那些知识,自然科学技术领域学问很大的不一定这些问题上搞得明白;二是要实践,尽可能多了解现实社会的实际情况,大体知道这些统计和数据是如何得来的。如果没有这两方面的基本造诣,在这些数据上面搞的花里胡俏的模型分析会离开现实越来越远。

One Response to “再谈数据问题”

  1. on 30 Jun 2009 at 12:15 1.admin said …

    文中有句“全部投入等于全部产出”,有人问产出中包括增值应该大于投入,怎么说理论上等同呢?做个说明,列昂惕夫(Leontief)投入产出表中所有的产出都会有个出处(没有卖掉的不算产出),就叫做投入,所以理论上一定是等于的。

Trackback This Post | Subscribe to the comments through RSS Feed

Leave a Reply