日报标题:大家坐一块选出最穷的给发低保,这合适吗?
这是非常有意义的问题。简单来说,如果我们想评价群众评议,有两个问题需要回答:一是这个制度目的是什么,二是目的实现程度如何。单个回答不可能完整,只是希望通过分享近年来一些高水平的研究,为我们进一步思考提供启发。期待简单精辟答案的知友,可能要失望了。社科很多问题不是一两句话,或者一两篇文章能说清楚的。对抗贫困,尤为繁杂多绪。很多困难,不是亲身接触很难理解,或根本无法想象。只能抛砖引玉,期待更好答案。
低保主要目的之一是帮扶穷人。这里马上引出三个问题:什么叫穷?怎么识别贫穷?如果贫穷需要治理,何种措施最优?以发放低保为例,我们首先需要说明低保标准是什么,以及制定这个标准的理由。有了标准,我们需要准确识别哪些人符合标准。 @神农后裔指出一点难题:识别准确度和成本成正比,这要求我们根据总体目标做取舍。最后,即使我们确定最好扶贫方法就是低保,我们也要制定很多措施来确保低保能实现目的,让政策落到实处。
Banerjee 和 Olken 等五位学者在 2012 年用随机对照实验比较了不同的识别贫困方法。实验前一段时间,他们首先请独立调查公司在印度尼西亚 640 个村庄中 5756 户人家作基准调查。调查不仅记录人数、职业、教育、职务、与村领导关系等基本情况,还详尽询问家庭日均消费数额和相关细节。作者从 640 个村庄全体居民名单中抽出 8 户家庭,然后请受访者对这 8 户生活状况排序。最后,调查还请受访者为自家贫困程度打分,1 分最低,6 分最高。
实验同样在这 640 个村庄进行,前述调查没有提到任何有关实验之事。印尼执行世界通行贫困线:每天消费额小于等于 2 美元。政府据此定指标,穷人可得每月 10 美元补贴。作者以此为背景比较不同识别贫困方法。所有村庄随机分三组:一组叫代理平均(Proxy Mean Test,以下简称 PMT),一组叫社区识别(Community Targeting,类似群众评议,以下简称评议),一组叫混合法(Hybrid Method),结合利用前二者。然后比较识别结果和基准调查结果。
这里详细解释一下分组。因为补贴按指标发,每个村都有数目,所以就得筛选。PMT 法是政府派人入户调查,看类似房屋、电视、手机、摩托等商品保有量和种类,然后用公式估计收入。社区识别是村民开会给大家收入排序。作者进一步分组:一是按全体大会和精英小会分,后者只有村长、宗教领袖、教师等少数参加,不多于 7 人;二是按白天晚上开会分,白天男人要种田,所以白天开会,女人来得多,晚上开会,男人来得多。混合法对两种方法加权,再定结果。
实验还有许多细节,难以叙述详尽,请参考原文及在线附录。其中重要一点是实验之后结果收集,作者综合采用多种办法。一是再作调查,让大家填写对识别满意程度,指出有哪些贫困家庭遗漏,或有哪些本不应有资格的家庭混入。二是在显眼地点放置箱子,旁边放置格式表格,供村民反映前几点问题,一段时间后清点。所有村庄中识别结果都在村里各显眼地点公示。
理论来说,PMT 和评议各有优劣。PMT 由政府调查人员执行,相对公正一些。调查对象都是显眼财产,较难隐瞒。缺点是无法对应消费额。如果一家人之前光景不错,突然遭难,PMT 可能就反映不出来。社区评议优点在可用信息丰富。都是近邻,伪装穷人很难隐匿。不需调查员一家一户大动干戈,整体成本相对较低。当然,能不能发现是一回事,会不会说出来又是一回事。村里领导可能徇私,影响或者直接干预结果。混合法折衷,优缺点兼而有之。
如果所有问题都只有优劣两极,问题会比现实简单很多,可惜现实并非如此。第一大问题就是政府和村里人对贫穷定义可能根本不一样。政府看数字,日消费 2 美元以下就是穷,1 美元以下就是非常穷;村里人看能力,看日后光景。家境破落,但有壮劳力,和家庭尚可,但只有寡妇当家,村里人评价就未必和政府一致。不同人分析能力和比较能力可能不同,男人排,女人排,结果可能不一样。最后,评议有先后,会不会评到后来大家累了,就瞎评呢?
考虑基准调查结果,比较 PMT、评议和混合法结果,PMT 最准。上图左部是吃上补助家庭日均消费概率分布,右图是没吃上补助家庭消费概率分布,横轴单位是美元。三种方法里,该领补助的没领上,这种错误机率都差不多,但评议法和混合法里都混进了消费额较高,按政府标准本来不该吃补助的人,体现在上图左部就是分布右端更肥。两种错误概率一加,PMT 准确性比其它两种高大概 10 个百分点。但需要指出一点,对非常穷(消费少于 1 美元家庭),评议效果最好。
注意,这不能说明三种方法本身有差距,原因主要有三:一是城市化,这可能导致社区凝聚力下降,导致评议效果不好;二是不平等。如果不平等比较严重,一是穷人富人分化大,能让评议更准,二是富人可能势力大,能操纵或者压制;三是亲属关系。村里越亲,越盘根错节,大家彼此了解越清楚,利益纠葛也越多。作者控制这三点,发现评议方法影响依旧显著。换用 probit 等多种方法作稳健性检验,结果基本一致。看来,差距确实存在。
PMT 对消费反映更准,和政府指标更吻合,看起来是理想选择。问题来了。前面我们提过,做完实验,出了结果,作者还留了很多后手来收集村民反馈。大家最满意变成了社区评议。如果算全体村民,比起 PMT,评议满意度平均高 2.68%,投诉少 1.09%;混合法满意度平均高 2.01%。,投诉少 0.55%。只看精英,觉得评议合适比例高 38%,觉得混合法合适比例高 17%。
为何如此?主要原因前面都提过,这里重复一遍,可能有三。一是精英把持村务,让自己人吃补助;二是村民评议时不够尽心尽力,可能评到一半就累了。即使村庄只有几十户人家,评议有政府派来调查员牵头,要得出排列也要比上几百次;三是大家看法不一样。可能是村子里的人理解“穷”,和扶贫里的“穷”压根不同,也可能是村里不同群体,偏好就不一样。男人还是女人来开会,结果可能不一样;老人还是年轻人来开会,结果可能也不一样。
作者逐个考察。首先,第一点在印尼不严重。第一个证据是全体开会组和精英开会组排出来结果基本没啥区别。当然这不够充分,说不定即使全体开会,精英也能压服大家。作者为此控制了许多基本变量,发现精英,以及和精英有亲戚关系的人吃到补助概率比平均要低,而且系数很显著。比起 PMT,如果用混合,这些人领补助概率低 7.8%;如果用评议,概率低 6.7%。原因可能是即使遭遇不幸,精英也有更多朋友,而精英的朋友也可以向精英求助。
之前提到“累了”这点,上图显示评议顺序和错误率关系。无论是评议还是混合法中评议部分,偏离基准调查结果程度一开始都很低,比 PMT 还低,后来逐渐升高。说明大家可能真的会烦。至于标准不一致,先介绍群体不同这部分结果。前面提到作者把评议进一步分组,有些白天开有些晚上开。男人白天干农活,白天开会妇女来得多,晚上男人来得多,性别比平均差 10%。两组评议差别结果不大。控制其它一些个人特征、换回归方法,结果都稳健。
有些问题没有优劣之分,最是棘手,结果确实显示村民眼里的“穷”和政府标准有出入。虽然 PMT 和日均消费相关较强,但也仅此而已。无论是给别的家庭排序,还是给村干部发问卷问村里情况,还是让家庭自评贫困程度,和前面答案相关都不高,内部相关倒是很高。村里人更看赚钱能力,而非当下消费。同等条件,家庭大,不穷;孩子多,穷;教育程度高,不穷;寡妇当家,穷;抽烟喝酒,没关系。如果村里人确实知根知底,该用哪个标准?
也许这个问题还有最后解决办法:说不定村里人其实也看不准收入,用 PMT 就可以测得很准了呢?从农村生活常识出发就很难相信这一点。以基准结果调查为例,作者发现:家庭收入每上升一个百分位点(比如说从 67 分位点到 68 分位点,这说明家庭收入在村里从排前 33% 进步到了前 32%),在评议中排位平均升高 0.132 个分位点,而 PMT 结果只会升高 0.088 个分位点。当然,也有部分反直观结论:控制基本变量,少数民族评上补助概率要更高一些。
前面简单讨论了几种识别贫困方法效果,相信知友会有自己的评价。作者在上图中展示了面对三种贫困标准,不同识别法可以实现的脱贫效果。三种标准分别是:贫困率,用贫困人口数除以总人口;平均贫困距离,用贫困人口日均消费到贫困线差额衡量;均方贫困距离,用上一变量平方和,着重于非常贫困人群脱贫效果。只看贫困率,都差不多;平均距离,PMT 最好;均方距离,评议最好。评议成本大概是其它两种方法一半,但考虑进来基本不影响这个排序。
问题到此处已足够复杂,再加一把火。除了 PMT、评议和混合,还有一类方法叫自识别。知乎上有过对“没有厕所的廉租房”和“和珅在粥里掺沙子”讨论,道理和这个一致:把申领补助或其它福利弄得很麻烦,比如不能代办、费时间或者结果不确定,把对福利看得没有那么重的人群筛出去。Banerjee 和 Olken 等六位作者在印度尼西亚做对照实验:比起默认自动申领方式(6 年,每年 130 美元,每年申请后审查),需要自己跑去续期的设定可以筛掉很多富一点的人。
这方法看起来好,但没有做对比,结果未必会更好。最后一点,要让穷人领到补助,首先要让他们知道有补助可领,接下来还要宣传怎么申请、查询申请结果,还要督促地方官把东西发到手上。如果这片地区教育程度不错,广泛张贴公告或者用大喇叭都有效果;如果不是,那又要“以吏为师”。但这涉及到钱,地方官员完全有激励不去宣传,或者干脆领到补助不发。印尼政府为贫民每月提供 15 公斤廉价大米,但真要吃米,实际买米价平均比政府规定价高 42%。
还是 Banerjee 和 Olken 等五位作者,这次实验是往老百姓家里寄卡片,和他们说每个月有 15 公斤低价大米可以买,价格是多少多少。效果明显:以前大米总发不够,价钱还莫名其妙更高。现在,尽管只有 30% 家庭收到卡片,贫穷家庭整体吃到大米数量上升,价格下降,享受到政府补贴总额升高 26%。可能解释很多:地方领导只给真穷人发米;民众抗争;卡片暗示官员他们受监督,等等。第一种解释最合理,拿到卡片地区,民众为吃米而抗议数量明显上升了。
关于扶贫还有许许多多可写,还是就此打住。很不完全地总结一下:比起 PMT,评议能更好地识别很穷的人,也比较符合村民观念和喜好,成本更低。但 PMT 能更好地识别穷人。具体何种方法最优与政策目标有关。自识别方法有潜力,但需更详细验证。最后,识别和扶贫都要讲政治,要真正对接到穷人。以上是印尼经验,但对中国可能也有借鉴意义。最后,不能指望识别完全精准。在社会网络中识别隐藏变量在有些条件下也许天生就不可能。这也是自己在探索的内容。
参考文献:
Alatas V, Purnamasari R, Wai-Poi M, et al. Self-targeting: Evidence from a field experiment in Indonesia[J]. Journal of Political Economy, 2016, 124(2): 371-427.
Alatas V, Banerjee A, Hanna R, et al. Targeting the poor: Evidence from a field experiment in Indonesia[J]. The American Economic Review, 2012, 102(4): 1206-1240.
Banerjee A, Hanna R, Kyle J, et al. Tangible information and citizen empowerment: Identification cards and food subsidy programs in Indonesia[J]. Journal of Political Economy, forthcoming.