为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 家教-孩子被人欺负怎么办

家教-孩子被人欺负怎么办

2018-08-29 3页 doc 12KB 16阅读

用户头像

is_196623

暂无简介

举报
家教-孩子被人欺负怎么办 《比较》总第48辑 | 2010年第3期 1 灰色收入与国民收入分配 王小鲁 前言 2005~2006年,我们在全国各地几十个 不同规模城市进行了城镇居民收入与消费调 查。在此基础上,2007年作者发表了题为《我 国的灰色收入与居民收入差距》的研究报 告1。在这个报告中,作者推算我国在 2005 年的城镇居民可支配收入中,有 4.8万亿元 没有反映在居民收入统计数据中的隐性收 入,主要发生在高收入阶层。作者认为这些 隐性收入的大部分属于“灰色收入”。作者 通过对城镇居民分组收入数据进行校正,发 现在包括了隐...
家教-孩子被人欺负怎么办
《比较》总第48辑 | 2010年第3期 1 灰色收入与国民收入分配 王小鲁 前言 2005~2006年,我们在全国各地几十个 不同规模城市进行了城镇居民收入与消费调 查。在此基础上,2007年作者发表了为《我 国的灰色收入与居民收入差距》的研究报 告1。在这个报告中,作者推算我国在 2005 年的城镇居民可支配收入中,有 4.8万亿元 没有反映在居民收入统计数据中的隐性收 入,主要发生在高收入阶层。作者认为这些 隐性收入的大部分属于“灰色收入”。作者 通过对城镇居民分组收入数据进行校正,发 现在包括了隐性收入后,城镇最高收入和最 低收入各 10%家庭之间的收入差距从 9倍 扩大到了 31倍;全国居民最高收入和最低 收入各 10%家庭之间的收入差距从 21倍扩 大到了 55倍。这意味着我国国民收入的分 配失衡比过去所普遍了解的情况更加严重。 该报告还根据家用汽车拥有量、商品 住宅销售量、私人出境旅游的人次数、以 及银行存款的分布数据,从不同角度对居 民收入(主要是高收入居民的收入)进行 了估计,从而对上述推算结果进行了交叉 验证。同时也对灰色收入的来源进行了一 些初步,认为这主要是由于体制上的 缺陷造成的,因此迫切需要推进体制改革 来解决国民收入分配失衡问题。 上述推算的方法和结果是否可信?经 过几年之后,国民收入分配状况发生了哪 些变化?为了回答这些问题,我们于 2009 年再次组织进行了城镇居民家庭收支调查 (采集的数据为 2008年全年数据),并在调 查数据的基础上进行了新的研究分析。本 报告就这次调查的范围、调查和分析方法、 以及研究结果进行陈述,并在此基础上进 一步分析国民收入分配失衡的现象和所需 要的应对措施。 本报告的第一部分报告我们的城镇居 民收入调查方法和样本分布情况。第二部 分讲述分析方法,报告技术分析的结果。 第三部分在调查数据和技术分析的基础上, 推算我国城镇居民可支配收入的真实水平 和真实的收入差距。第四部分是对灰色收 入来源的进一步分析。第五部分分析灰色 收入对国民收入分配格局的影响。第六部 分是本报告的结论。 * 本文是中国经济体制改革研究会灰色收入课题研究报告,课题顾问:宋晓梧、石小敏。本课题在实地调查 和研究过程中,得到了许多机构和个人的帮助;在报告讨论过程中,也有许多专家提出了意见和建议,有益于报 告的修改完善;在此一并致谢。但报告中的错误由作者个人负责。 1 王小鲁,《比较》第 31辑,2007年 7月出版,中信出版社。这个课题是由中国经济体制改革研究会和中 国改革基金会国民经济研究所资助,历时两年,于 2007年完成。 CITIC Comparative Studies 48 | June 20102 一、城镇居民收入调查方法和样 本分布 1.如何获得真实的调查数据 作者认为,目前关于居民收入的统计 调查数据存在重大失真。特别是关于城镇 高收入居民的可支配收入,失真非常严重。 这并不是指统计调查方法或计算的错误。 目前的城镇和农村居民住户调查样本,是 根据统计学的随机抽样方法确定的。这一 方法本身并不存在系统性的错误。但必须 注意到以下情况: 1.现行的住户调查抽样是基于自愿原 则确定的,但高收入居民中有相当大比例 不愿意接受调查,导致在抽样过程中被迫 更换样本,因此在样本更换过程中发生了 对高收入居民的遗漏。 2.包括在调查样本中的高收入居民中, 有许多人不愿意提供他们的真实收入信息。 在他们报告的收入中,工资性收入的真实 程度较高,而其他收入可能偏低;特别是 其中一些人有大量不愿暴露、来源不明的 “灰色收入”。这部分收入基本上不可能反 映在收入调查数据中。 以上原因使统计调查发生系统性偏差, 无法真实地反映居民收入分配状况。这一 问题,很难在现有的住户统计样本和现有 的调查方法范围内得到彻底解决,需要探 索另外的途径。基于这一原因,我们研究 的首要目的是取得关于居民收入的真实数 据。在 2005~2006年调查中,我们借鉴了 社会学调查方法,由各地的专业调查人员 对他们熟悉的亲属、朋友、同事、邻里的 家庭收支状况进行了调查。我们还采取了 若干辅助措施保证调查数据的真实性。事 实证明这一方法是可行的,调查取得的数 据具有比较高的可信度。 在 2009年调查中,我们使用了同样的 调查方法,但采取了更严格的质量控制措 施,并扩大了调查样本。必须说明,由于 这一调查方法不同于随机抽样方法,因此 我们无法直接用这个调查样本的数据来推 算我国城镇居民收入的总体分布状况,而 必须借助于其他方法进行推算。关于推算 方法,将在本报告第二部分中详细介绍。 本部分的主要目的是对调查方法和样本分 布状况进行说明。 在调查之前,我们对各地调查人员进 行了问卷和调查方法培训。为了消除受访 者可能的疑虑,调查问卷采取无记名方式, 在调查开始前向受访者提供了调查结果只 用于研究的承诺和样本数据保密承诺。在 调查方法上,也采取了若干降低调查敏感 度和有利于获得真实数据的措施。例如, 关于调查目的,主要强调研究消费结构而 不是强调研究收入水平;在问卷上, 先问消费问题后问收入问题,先问具体分 项后问消费和收入总额。在收入来源方面, 问卷只要求回答简单的收入分类(包括工 资性收入、兼职和劳务收入、实体经营收 入、金融投资收入、财产性收入、知识产 权收入、各类转移收入、和未包括在以上 各项的其他收入),不要求回答具体收入来 源。在访问结束后,要求调查员填写他们 与受访者的关系,以及他们对问卷调查结 果可信程度(包括可能的偏差方向和偏差 程度)的个人估计,作为问卷的参考信息。 调查完成后,我们对问卷进行了全面 的质量检查。除了对信息完整性和调查地 点正确性进行核对外,我们设计了一套检 查程序,对各问题之间的逻辑关系,以及 各项收入和消费数据之间的数量关系,进 行合理性检查,对质量不符合要求的问卷 (包括信息遗漏、涂改、数据反常、不同信 《比较》总第48辑 | 2010年第3期 3 息之间存在逻辑错误而又无法鉴别正确信 息等等问题的数量超过标准,以及调查对 象不属于城镇居民)和信息真实性值得怀 疑的问卷做了剔除。 2.调查样本的分布状况 本次调查在全国 19个省份(包括直辖 市)的 64个不同规模城市,以及 14个县 的县城和建制镇进行, 省份(括直辖市)包括北京、上海、 山东、江苏、浙江、广东、山西、河南、 湖北、安徽、江西、辽宁、黑龙江、四川、 重庆、云南、陕西、甘肃、青海。这保证 了东部、中部、西部和东北地区都有一定 数量的样本分布,并照顾了南北方的分布。 城市包括北京、上海、济南、南京、 杭州、广州、太原、郑州、武汉、合肥、 南昌、沈阳、哈尔滨、成都、重庆、昆明、 西安、兰州、西宁、深圳、青岛、苏州、 大同、鞍山、抚顺、齐齐哈尔、大庆、徐 州、扬州、阜阳、芜湖、六安、日照、襄 樊、宜昌、东莞、中山、绵阳、忻州、开封、 三门峡、驻马店、孝感、宜都、邳州、富 阳、金华、绍兴、韶关、巢湖、滁州、赣州、 吉安、景德镇、九江、丹东、铁岭、牡丹江、 西昌、咸阳、白银、嘉峪关、天水、玉溪。 其中直辖市、省会城市和“副省级”城市 有 21个,规模较小的地级和县级城市有 43 个,在不同规模城市之间保证了较为均衡 的分布。 县城和建制镇所在的县份包括山西省 繁峙县、江苏省沛县、浙江省象山县、山 东省平原县、齐河县、河南省滑县、湖北 省大悟县、重庆市垫江县、开县、忠县、 陕西省咸阳市礼泉县、甘肃省皋兰县、泾 川县、青海省民和县。这些县份的地理分 布也是较为均衡的。 这次调查选取的城市数量较多,而样 本在各城市的分布比较分散,这是基于两 个考虑:首先,一个城市样本数量过多, 就无法保证调查样本家庭都是专业调查人 员所熟悉的家庭,与本次调查的初衷 相悖。其次,样本中包括较多的城市,也 保证了样本具有更好的代表性。 我们的调查方法也存在缺点。一个主 要问题是,该调查是一次性进行的,关于受 访者家庭收入和消费的数据都是由受访者 根据记忆提供(但在选取受访者的过程中, 已经排除了对家庭收入和消费状况不够了 解的家庭成员)。与记账式的抽样调查相比, 这会产生较大的数据误差。但记账式调查 不仅比一次性调查成本高、耗时长、难度 大,而且由于调查内容具有敏感性,更容 易导致系统性偏差。而一次性调查因记忆 不准确造成的数据误差,一般而言是随机 分布的,而不是系统性的。在样本平均的 意义上,随机性误差会因正负互相抵消而 大大减少,而系统性偏差是无法自动抵消 的。因此基于本课题的研究目和研究条件, 都必须采取一次性调查的方式。 本次调查总共包括样本家庭 4 909个, 经过严格的质量检验,剔除问卷质量不符 合要求的 689个样本,另有 25个负收入样 本未包括在分析中(因为分析表明,他们 大部分在正常情况下不属于低收入家庭, 负收入主要是临时性经营亏损造成的),实 际分析采用有效样本 4 195个。 表 1列出了全部调查样本和有效样本 的地区分布、按城市规模的分布、受访者 年龄和户籍状况分布、样本家庭最高收入 者的文化程度分布、受访家庭的人均可支 配收入分布等情况。可以看到,样本在全 国不同区域之间、不同规模的城市之间、 以及受访者的年龄、文化程度的分布是比 CITIC Comparative Studies 48 | June 20104 表 1 按各种分组的样本分布状况 1. 按地区分布 样本总数 样本总数分布 有效样本数 有效样本分布 东部地区 1 863 37.95% 4 563 37.26% 中部和东北地区 1 848 37.65% 1 605 38.26% 西部地区 1 198 24.40% 1 027 24.48% 合计 4 909 100.00% 4 195 100.00% 2. 按城市规模分布 样本总数 样本总数分布 有效样本数 有效样本分布 200万人以上城市 2 495 50.83% 2 083 49.65% 100~200万人城市 915 18.64% 789 18.81% 100万人以下城市 995 20.27% 889 21.19% 县城、建制镇 504 10.27% 434 10.35% 合计 4 909 100.00% 4 195 100.00% 3. 受访者年龄分布 样本总数 样本总数分布 有效样本数 有效样本分布 20~29 1 647 33.55% 1 411 33.64% 30~39 1 383 28.17% 1 196 28.51% 40~49 1 236 25.18% 1 062 25.32% 50~59 520 10.59% 425 10.13% 60及以上 123 2.51% 101 2.41% 合计 4 909 100.00% 4 195 100.00% 4. 受访者户籍分布 样本总数 样本总数分布 有效样本数 有效样本分布 本市城镇 4 457 90.79% 3 808 90.77% 外地城镇 276 5.62% 234 5.58% 外地农村 156 3.18% 138 3.29% 漏答 20 0.41% 15 0.36% 合计 4 909 100.00% 4 195 100.00% 5. 家庭最高收入者文化程度 样本总数 样本总数分布 有效样本数 有效样本分布 或以下 165 3.36% 136 3.24% 初中 970 19.76% 832 19.83% 高中(包括同等学历) 1 833 37.34% 1 565 37.31% 大专、大学本科 1 822 37.12% 1 569 37.40% 硕士、博士 82 1.67% 74 1.76% 漏答或无法确定 37 0.75% 19 0.45% 合计 4 909 100.00% 4 195 100.00% 6. 家庭最高收入者职业 样本总数 样本总数分布 有效样本数 有效样本分布 一般专业技术人员 396 8.07% 353 8.41% 中高级专业技术人员 262 5.34% 227 5.41% 其他专业人员(科教文卫等) 339 6.91% 302 7.20% 党政军机关一般干部 193 3.93% 165 3.93% 党政军机关中高级干部 52 1.06% 47 1.12% 企事业单位、社团职员 561 11.43% 483 11.51% 企事业中层以上管理者 327 6.66% 268 6.39% 服务人员 317 6.46% 277 6.60% 工人 659 13.42% 562 13.40% 个体工商户、自由职业者 1 008 20.53% 853 20.33% 私企所有者、合伙人、股东 317 6.46% 277 6.60% 其他职业 73 1.49% 66 1.57% 学生、研究生 20 0.41% 17 0.41% 无职业(括退休退职人员) 349 7.11% 278 6.63% 漏答或无法确定 36 0.73% 20 0.48% 合计 4 909 100.00% 4 195 100.00% 注:城市规模按市区常住人口计算。 《比较》总第48辑 | 2010年第3期 5 较均衡的;但居住在较大规模城市、具有 较高学历以及从事经营性活动和白领职业 的人群所占比重,高于这些人群在全国城 镇人口中的相应比重。这是因为根据作者 2007年研究报告的结果,城镇居民收入水 平的统计偏差主要发生在高收入居民。为 了保证有足够数量的高收入居民样本以进 行分析,在调查中有意识地增加了这部分 人群的样本数量。我们使用的分析方法, 将保证这种分布的差异不会影响到对全国 城镇居民人均收入分布的推算结果。 二、分析方法和技术分析结果 1.本报告使用的基本推算方法——恩 格尔系数法 根据调查样本数据推算城镇居民可支 配收入的方法可以概述如下: 首先,我们进行城镇居民收入调查的 目的,并不是为了从调查样本直接推断城 镇居民的总体收入分布状况,而是在真实 可信的数据基础上,推算收入水平与若干 消费特征参数之间的关系。其中一个关键 的消费特征参数就是恩格尔系数(即居民 家庭的食品消费支出占家庭消费支出总额 的比例)。恩格尔系数是一个与收入水平相 关的参数,其下降趋势能够反映收入水平 的上升;这在经济学界是一个公认的事实。 这是因为在满足了基本的温饱需求之后, 居民会逐渐转向追求其他需求的满足,例 如对出行和通信联络的需求、对奢侈品的 需求、以及教育、文化娱乐等较高层次的 需求。因此随着收入水平提高,居民用于 食品的支出增量会递减,而用于某些较高 层次消费的支出增量会递增,使它们在消 费总量中的比例发生改变。 基于这个原理,我们可以基于一个比 较可信、比较有代表性的调查样本,来计 算居民家庭的恩格尔系数和人均可支配收 入水平,并使用统计学或计量经济学方法, 找出两者间的统计关系。依据得到的这些 关系,我们可以对任意一组居民收入统计 数据进行检验。也就是说,只要我们能够 得到某一组统计样本的相对可靠的恩格尔 系数,就可以依据该系数近似推算出该组 居民的真实人均收入水平。因此,我们可 以根据国家统计局的分组城镇住户的恩格 尔系数,推算这些组别的平均收入水平, 并将这些推算结果与公布的该组居民收入 水平统计数据进行比较,以发现统计数据 是否存在系统性的误差,以及这一误差有 多大。我们称这一分析方法为“恩格尔系 数法”。 当然,这样做的前提,是要求分组统 计样本的恩格尔系数真实可信。一个自然会 遇到的问题是,如果某一组居民的收入水 平统计数据存在系统性偏差,他们的恩格 尔系数数据会不会同样有系统性偏差呢? 事实上,如果收入数据存在偏差(例如, 被低估),那么消费和商品消费支出数据很 可能也存在一定的偏差。但首先,只要消 费支出和食品消费支出的偏差是同方向的, 并在统计意义上大体上保持同比例,那么 分组平均的恩格尔系数仍然是基本可信的。 在这种情况下,我们仍然可以使用恩格尔系 数来推算真实收入水平。其次,即使消费 支出和食品消费支出的偏差不保持同比例, 在计算恩格尔系数时,同方向的偏差仍然 可以在很大程度上互相抵消,使恩格尔系 数的偏差远远小于收入水平的偏差。因此 仍然可以用来推算收入水平,只是推算结 果的准确程度较低。 根据作者 2007年的研究,发现在居民 CITIC Comparative Studies 48 | June 20106 收支统计数据中,高收入居民的收入水平 数据偏差最大,明显低于他们的真实收入。 他们的消费支出和食品消费支出也都存在 一定程度的低估,但在程度上远远小于收 入的偏差。其中食品支出的偏差比消费支 出总额的偏差更小些。这也就是说,据此 计算的恩格尔系数可能轻微偏高,因而根 据这些恩格尔系数推算的收入水平有可能 轻微偏低;但仍然可以在很大程度上校正 原来的收入数据偏差。不过,我们也需要 知道,我们所得到的收入水平校正结果, 相比于真实收入,可能或多或少仍在一定 程度上偏低。 还要注意到,使用这一方法对居民收 入统计数据进行检验,并不能在数量上确 定统计样本对高收入居民遗漏的情况,只 能对现有统计样本收入数据的系统性偏差 进行校正。因此校正之后的结果,仍然可 能在一定程度上低估高收入居民的收入水 平(由于样本遗漏的原因)。 以下,作者采取两种具体方法建立恩 格尔系数与收入水平之间的关系,并对居 民收入统计数据进行检验。这两种方法都 属于恩格尔系数法,但分析手段和过程不 同。在下面的叙述中,为简化起见,作者 将“人均可支配收入”称为“人均收入”; 将国家统计局的城镇居民住户调查样本称 为“统计样本”,而将我们这次调查的样本 称为“调查样本”;来自统计样本的人均收 入将称为“统计收入”,而根据调查样本提 供的参数及其与统计数据的比较结果推算 的人均收入称为“推算收入”;以示区别。 2.分组比较法 第一种具体推算方法可以称为分组比 较法。在 2007年研究报告中,作者采用的 就是这个方法。其步骤如下: 第一步,分别计算全部调查样本的人 均收入和恩格尔系数。 第二步,计算统计样本的分组恩格尔 系数。国家统计局每年公布的城镇居民分 组收入数据,是按人均收入,将全国城镇 居民家庭分为七组。其中最低收入、(次) 低收入、最高收入、(次)高收入这四组分 别是按十等份划分的,即每组各占 10%的 城镇家庭。中间三组(中低收入、中等收 入、中高收入组)是按五等份划分的,每 组占 20%的城镇家庭。这七组的平均恩格 尔系数都是可计算的。根据本文前面的解 释,我们假定统计样本的恩格尔系数是可 信的2。 第三步,将全部有效调查样本按人均 收入排序,从低到高进行分组。分组方法 是,从最低收入开始,将样本逐个累加, 直到该组的平均恩格尔系数与“统计样本 最低收入组”的平均恩格尔系数相等为 止。我们称这一组样本为“调查样本最低 收入组”。这个分组过程不考虑样本数量。 然后开始对“调查样本低收入组”进行分 组,方法相同,也是使其平均恩格尔系数 与“统计样本低收入组”(即第二个 10% 的城镇住户)相同。其余各组的分组方法 类推。 第四步,分别计算调查样本各组的人 均收入平均水平。根据前面解释的理由, 我们假定一组居民的恩格尔系数与他们的 收入水平具有唯一的对应关系。也就是说, 给定某组居民一个恩格尔系数,则该组的 人均收入就应当是我们计算得到的、对应 于这个恩格尔系数的人均收入。 第五步,将各组调查样本与对应的统 计样本人均收入进行对比,其差异就反映 2  国家统计局城镇住户样本的平均和分组数据见 历年国家统计局:《中国统计年鉴》“人民生活”部分。 《比较》总第48辑 | 2010年第3期 7 出统计样本的数据遗漏。表 2是调查样本 和统计样本的分组分布情况。可以看到在 取了同样的恩格尔系数之后,调查样本的各 组分布比例是不一样的。还可以看到,根 据恩格尔系数分为七组之后,还有一部分 人均收入更高的调查样本被留在了这七组 之外(因为其恩格尔系数更低)。这一组的 人均可支配年收入都超过 40万元,最高为 176万元。表 3是调查样本和统计样本恩格 尔系数和人均收入的对比结果。 从表 3可以看到,在对应各组恩格尔 系数一一相等的情况下,调查样本每一组 的人均收入都高于对应的统计样本,但差 额和差率都非常有规律地逐级扩大,特别 是最高收入组的差额和差率最大,统计样 本最高收入组的人均收入只有 4.3万元,而 调查样本最高收入组为 16.4万元,是前者 的近 3.8倍。其差额占了全部样本差额的 2/3。这种情况和作者在 2007年研究报告 中发现的情况基本一样,所不同的只是中、 低收入各组的差额和差率在一定程度上大 于 2007年报告的推算。这样,也就基本上 验证了 2007年报告研究结果的可信性。但 对于这一推算的可信度,我们还要在下一 节中通过另一种推算方法来验证。 此外还需要说明,在作者 2007年研究 报告发表后,有少数读者误认为这一研究 方法仍然等同于用调查样本来推算城镇居 民总体收入分布状况,因而对研究结果的 可信性提出质疑。因为无论本项研究的调 查方法(非随机抽样)还是样本规模(规模 偏小),都不适合用于直接推算城镇居民总 表 2 调查样本的分组分布及与统计样本分布的比较 调查样本 统计样本 分组 区间 有效样本数 分布比例 分布比例 最低收入 1~7 000元 365 8.7% 10% 低收入 7 001~10 000元 622 14.8% 10% 中低收入 10 001~17 000元 927 22.1% 20% 中等收入 17 001~26 500元 650 15.5% 20% 中高收入 26 501~34 000元 355 8.5% 20% 高收入 34 001~75 000元 635 15.1% 10% 最高收入 75 001~400 000元 565 13.5% 10% 剩余样本 >400 000元 76 1.8% 0% 合计 4 195 100.0% 100.0% 注:统计样本总共包括城镇居民约 6.5万户。 表 3 调查样本与统计样本的比较 推算收入 统计收入 两样本比较 分组 恩格尔系数 人均收入(元) 恩格尔系数 人均收入(元)收入差额(元)收入差率(%) 最低收入 0.4816 5 685 0.4814 4 754 931 19.6% 低收入 0.4595 8 646 0.4594 7 363 1 283 17.4% 中低收入 0.4297 13 392 0.4289 10 196 3 196 31.3% 中等收入 0.4065 20 941 0.4042 13 984 6 957 49.7% 中高收入 0.3790 29 910 0.3787 19 254 10 656 55.3% 高收入 0.3437 47 772 0.3403 26 250 21 500 82.0% 最高收入 0.2908 164 034 0.2918 43 614 120 420 276.1% 剩余样本 0.2241 658 811 注 1:调查样本和统计样本对应各组恩格尔系数之间有很小的尾数误差,不影响分析,我们视同相等。 注 2:“收入差额”指调查收入高于统计收入的部分,“收入差率”是指收入差额相当于统计收入的百分比。 CITIC Comparative Studies 48 | June 20108 体收入分布。这种误解是由于对这项研究 使用的恩格尔系数法,尤其是对分组比较 的分析方法缺乏了解。实际上,即使不理 解我们使用的分组分析法与从调查样本推 算总体的方法有何实质区别,只要将两种 方法得到的结果进行对比就清楚了。在表 4 中,作者使用本次调查的数据,把用分组 分析法的结果与直接推算总体分布的结果 进行比较。显然,两种方法不仅每组得到 的恩格尔系数有差异,而且每组人均收入 的差别更为显著。其中关于最高收入组的 人均收入,分组分析法得到的结果是 16.4 万元,而推算总体的方法得到的是 29.4万 元。两者的区别是显而易见的。 3.模型分析法 以分组比较法对收入水平进行推算, 也存在缺点,即这种方法假定恩格尔系数 只与收入水平相关。但实际上,恩格尔系 数还可能受到其他因素的影响,例如消费 品价格、不同地方居民的饮食习惯差异等 等。因此某一个恩格尔系数是否真的只对 应一个确定的收入水平?是可以怀疑的。 因此在这里,作者采用第二种具体推 算方法,这可以称为模型分析法。这种方法 以计量模型分析为基础,并能够把除收入 水平以外还有可能影响恩格尔系数的其他 变量作为控制变量包括在模型中进行检验, 并在计算恩格尔系数与收入水平的关系时 把这些额外的影响因素排除在外。这种方 法能够避免分组分析法的不足之处,具有 明显的优点。其基本步骤可以概述如下: 第一步,确定控制变量。我们需要对 调查样本的恩格尔系数和人均收入用计量 经济学方法进行回归,找出人均收入对恩 格尔系数的影响系数;而在进行这一步工 作的同时,我们必须找到可能影响恩格尔 系数的其他因素,作为控制变量包括在模 型中,对其影响进行估计,才可能得到正 确的收入影响系数。 首先,不同规模的城市,各类消费品 的价格水平有很大差异。这可能会影响不 同规模城市的恩格尔系数。例如,大城市 由于远离农产品产地,农产品运输成本和 损耗都较大,中间环节也较多,因此食品 价格可能会显著高于中小城市,高出的幅 度有可能大于其他消费品价格高于中小城 市的幅度(这是因为蔬菜、肉类等农产品不 耐保存,储藏成本和中间损耗较大)。因此 在其他条件相同的情况下,大城市居民的 恩格尔系数可能高于中小城市居民。因为 无法得到物价绝对水平的数据,作者在模 型中设定了一个表示城市规模的变量 city, 其中对县镇、100万人以下城市(在这里作 者称其为中小城市)、100~200万人之间的 城市(这里称之为大城市)和 200万人以 表 4 基于 2008 年调查样本的比较:分组分析法和推算总体方法 分组分析法 推算总体的方法 分组 恩格尔系数 人均收入(元)样本分布比例 恩格尔系数 人均收入(元)样本分布比例 最低收入 0.4816 5 685 8.7% 0.4794 5 884 10% 低收入 0.4595 8 646 14.8% 0.4654 8 362 10% 中低收入 0.4297 13 392 22.1% 0.4323 12 038 20% 中等收入 0.4065 20 941 15.5% 0.4146 19 285 20% 中高收入 0.3790 29 910 8.5% 0.3656 35 606 20% 高收入 0.3437 47 772 15.1% 0.3187 76 097 10% 最高收入 0.2908 164 034 13.5% 0.2645 293 769 10% 平均 /合计 35 462 98.2% 51 771 100% 《比较》总第48辑 | 2010年第3期 9 上城市(这里称之为特大城市)分别赋值 为 1、2、3、4。 其次,不同地区居民的消费习惯有差 异。有些地区居民比其他地区居民有更高 的美食偏好,因此可能在食品消费方面支 出多于其他地区。通过对调查样本数据的 分析,作者发现在其他条件相同的情况下, 上海、江西、四川的恩格尔系数显著高于 各省份平均水平。这三个省份用虚拟变量 H1表示。北京、山东、湖北、广东、重庆、 河南的恩格尔系数在一定程度上高于平均 水平,这些省份用虚拟变量 H2表示。而辽 宁、山西的恩格尔系数低于平均水平,两 者用 L1表示。据此,在模型中包括了这几 个虚拟变量。未包括在内的其他省份(有 江苏、浙江、安徽、黑龙江、云南、陕西、 甘肃、青海)的样本作为本底样本。 第三,家庭人口数对恩格尔系数可能 有影响,因为人口较多的家庭在食品支出 方面可能具有规模效应,能够节约食品支 出。因此设定了一个代表家庭人口数的变 量 famliy。 第四,家庭成员的平均文化程度有可 能对恩格尔系数有影响,因为文化程度较高 的居民可能偏向于较多的精神需求,例如 通信联络、教育、文化娱乐等,而教育程 度较低的居民则可能在这些方面需求较少, 而在食品烟酒等消费方面支出较多。因此 设定了一个代表成年家庭成员平均教育水 平的变量 edu18,由 18岁及以上家庭成员 的平均受教育年份表示。 第五,恩格尔系数还可能与家庭成员 的就业面(就业的家庭成员占全部家庭成 员的比例)有关。其原因比较复杂;一方 面,家庭就业率较高,可能节约食品支出, 因为从业者有可能在单位就餐,在某种程 度上享受工作单位的食品补助。另一方面, 较高的就业率又有可能导致较多的外出就 餐(因为在家里做饭更花费时间),因此导 致较高的食品支出。究竟哪种因素占上风, 还需要通过检验来证明。模型中设定了家 庭就业面的变量 emp。 第二步,设定模型的函数形式。从数 据上我们可以直观地判断,恩格尔系数与 人均收入之间的关系是非线性关系。因此 作者分别选择了半对数函数、半对数二次 函数、二次函数和三次函数模型进行估计。 各函数均以恩格尔系数为被解释变量(以 eng表示),半对数函数以对数人均收入 lnY、以及控制变量 city、family、edu18、 emp、H1、H2、和 L1为解释变量,称为 函数(1)。半对数二次函数在函数(1)的 基础上增加了 lnY的平方项,见函数(2)。 二次函数以人均收入及其二次项、以及各 控制变量及其二次项作为解释变量,见函 数(3)。三次函数在二次函数的基础上增 加了各解释变量的三次项。函数(2)、(3) 如下,函数(1)、函数(4)省略。 eng = C1+a1lnY+a1city+a3family+a4edu18 +a5emp+a6H2+a7H1+a8L1+a9(lnY) 2 (2) eng = C2+b1Y+b2city+b3family+b4edu18 +b5emp+b6H2+b7H1+b8L1+b9Y 2+b10city 2+ b11family 2+b12edu18 2+b13empl 2+b14H2 2+b15H1 2 +b16L1 2 (3) 第三步是对上述四个模型的估计。估 计结果见表 5。在初步回归分析中发现, 其中二次和三次函数模型的某些变量二次 项或三次项没有统计显著性,且 t值很低。 因此在表 5的回归中已将这些项从模型中 剔除。 从表 5的回归结果看,尽管四个模型 的调整 R2不够高,但它们的绝大部分变量 都有高的统计显著性,不仅证明恩格尔系 数与人均收入水平之间存在十分显著的负 CITIC Comparative Studies 48 | June 201010 相关关系,同时也证明恩格尔系数还受家 庭成员文化程度、家庭人口数、家庭成员 就业面、城市规模、以及地域特征的影响。 其中模型(2)的调整 R2最高。计算表明, 模型(1)和模型(2)的结果非常接近,而 且在中、低收入区间的模拟结果与统计数 据比较接近,而模型(3)和模型(4)的 模拟结果在各个收入区间都与统计数据有 较大差异,而且在收入水平很高的情况下 不再保持恩格尔系数单调下降,这与事实 相左。因此在下面的分析中将采用模型(2) 的结果。 图 1是用函数(1)~函数(3)模拟出 的收入水平与恩格尔系数之间的关系曲线, 显示了函数(1)和函数(2)之间很好的 相似性。图中的纵轴表示恩格尔系数,横 轴表示人均收入水平(元)。 第四步,为了最后实现使用回归得到 的各变量影响系数,求解与不同的恩格尔 系数相对应的全国城镇居民收入水平,还 需要确定各影响变量在全国平均意义上的 赋值。 根据 2007年统计数据,城镇居民在特 大城市、大城市、中小城市、县城和建制镇 (在模型中分别取值为 1、2、3、4)的分布 比例,大致为 21%、25%、33%、21%。加 权平均取值为 2.5。但我们知道不同收入组 别的人群在不同城市的分布是有区别的, 高收入居民较多集中在特大城市和大城市, 而低收入居民则更多集中在中小城市和小 城镇。因此根据数据分析,作者把按人均 收入从低到高排序的居民组合的城市规模 取值,确定在 3.3~1.3之间平滑变动。 关于城镇居民的人均文化程度(18周 岁及以上),模型中分别用从 1到 5的赋值 来表示小学及以下、初中、高中和中专中 职、大学专科和本科、硕士和博士学历。估 算全国城镇平均取值在 3左右。但文化程 度在不同收入人群中的分布也是有差异的, 作者把从最低收入到最高收入居民组合的 表 5 模型估计结果 (1)半对数函数 (2)半对数二次函数 (3)二次函数 (4)三次函数 变量 系数 t 值 系数 t 值 系数 t 值 系数 t 值 lnY -0.05739 -28.66** -0.12004 -4.63** lnY2 0.00295 2.42* Y -7.67E-07 -20.8** -1.24E-06 -19.31** Y2 5.44E-13 13.88** 1.93E-12 12.15** Y3 -7.49E-19 -8.99** city -0.00664 -3.50** -0.00677 -3.57** -0.00385 -1.97* -0.12508 -2.21* city2 0.05612 2.22* city3 -0.00774 -2.28* edu18 -0.01116 -4.35** -0.01066 -4.15** -0.03194 -6.80** -0.02741 -5.83** edu182 0.00117 2.84** 0.00098 2.39* family -0.01427 -6.41** -0.01423 -6.40** -0.01559 -6.78** -0.01498 -6.54** emp -0.01585 -1.95* -0.01350 -1.65’ -0.03781 -4.53** -0.03164 -3.82** H1 0.07106 11.47** 0.07078 11.43** 0.07601 11.89** 0.07543 11.89** H2 0.02557 5.66** 0.02544 5.62** 0.02615 5.58** 0.02858 6.12** L1 -0.03938 -6.06** -0.03979 -6.13** -0.03298 -4.93** -0.03149 -4.74** C 1.06077 49.76** 1.38627 10.19** 0.5790 37.80** 0.64580 16.57** Adj.R2 0.2463 0.2472 0.1973 0.2130 Obser. 4195 4195 4195 注:t值标有 ’号表示在 10%水平显著,*号表示在 5%水平显著,**表示在 1%水平显著。 《比较》总第48辑 | 2010年第3期 11 平均文化程度取值确定在 2.6~3.8之间平滑 变动。 关于城镇居民家庭成员的就业面,根 据统计数据 ,全国平均大致为 0.5,但也存 在不同收入分组的差异,从低到高取值在 0.38~0.62之间变动。 关于城镇居民家庭人口数,统计显示 全国平均为 2.9人,但低收入居民家庭的平 均规模相对较大,高收入家庭较小,变动 范围在 3.3~2.6之间。 最后,关于不同地区之间城镇居民的 饮食习惯差异,模型中按在相同条件下恩 格尔系数最高、较高、普通、较低的省份 分为四组,它们的虚拟变量系数在正 0.071 到负 0.039之间。全国平均按 0.01取值。 在完成上述这些控制变量的赋值过程 后,就可以根据模型回归得到的参数和各 影响因素的取值,即在考虑其他影响因素 对恩格尔系数影响的条件下,求解不同恩 格尔系数所对应的城镇居民收入水平。这 一结果在下部分报告。 三、求解城镇居民真实收入 1.城镇居民分组收入推算结果 把上文模型(2)中各参数的估计结果 (见表 5)、统计样本中的分组恩格尔系数、 以及各控制变量的全国平均赋值,带入模 型(2),就可以倒推出对应于不同恩格尔 系数的人均收入水平。表 6将这些根据模 型分析推算出的结果,与分组统计数据、 以及使用分组分析法得到的结果同时列出, 以进行对比。 从表 6的数据看,用分组比较恩格尔 系数和通过模型分析取得恩格尔系数与收 入水平的关系这两种方法,得到的结果总 体上是比较接近的。它们对最低收入、低 收入和中低收入这三组收入水平的推算,虽 然都不同程度上高于统计收入,但总体上 差异不太大(其中模型分析法的结果更为 接近)。从中等收入组往上,推算收入与统 计收入的差距明显扩大。差距最大的是最 高收入组,其中分组比较法的结果是 16.4 0.600 0.500 0.400 0.300 0.200 0.100 0 100 000 200 000 300 000 400 000 500 000 (1)半对数函数 (3)二次函数(2)半对数二次函数 图 1 函数(1)~ 函数(3)的模拟曲线 CITIC Comparative Studies 48 | June 201012 万元,模型分析法的结果是 13.9万元,分 别是统计收入的 3.76倍和 3.19倍。这两个 结果所反映的收入分布基本格局是一致的, 而且与 2007年报告的结果(2005年数据) 相比,尽管数据来源不同,但具有较高的 相似性。 表 6显示,主要由于高收入和最高收 入组的收入差异,按模型分析法推算得到的 全国城镇人均收入平均值为 32 154元,而 不是按统计局的分组数据加权平均的 16 885 元,或统计局公布的 15 781元。推算数与 统计数几乎相差了一倍。 在表 7中,我们也提供了 2005年和 2008年两次研究的推算收入(2008年采用 模型分析法的结果)与统计收入之比。我 们发现,2008年(次于最高收入组的)高 收入组推算收入相对于统计收入差异明显 变大,但总体而言差异最大的还是最高收 入组。我们把这些没有包括在统计数据中 的居民收入称为隐性收入,在表中最后一 列计算了各组的隐性收入占隐性收入总量 的比重。很明显,隐性收入主要集中在最 高收入家庭。 以上两种推算结果中,分组比较法可 能误差会大一些,这是由两个原因导致的。 第一,分组分析法只能通过计算各组的平 均恩格尔系数和平均收入水平,得到与某 一特定的恩格尔系数对应的人均收入。但 无法排除收入以外的因素对恩格尔系数的 影响。但这些因素对调查样本的影响和对 统计样本的影响有可能是不同的,因此推 算出的人均收入水平有可能不够准确。而 模型分析法则控制了收入以外因素对恩格 尔系数的影响,并计算了这些因素的全国 平均影响程度。所得到的结果,是在这些 影响之下,对应于某个恩格尔系数的人均 收入水平,因此也应该更真实、更准确。 第二,分组分析法通过根据恩格尔系 数重新分组的方法,在总体上避免了调查 样本分布与统计样本分布不一致而对总体 的收入分布产生错误影响。但这一方法对 各组平均收入的计算,仍与组内的样本分 布有关。而调查样本的组内分布有可能与 统计样本的组内分布有所不同。尽管这对 总体分布的影响不会很大,但不能排除产 生一定误差的可能性。举例说,全国城镇 居民最高收入组和最低收入组的组内收入 水平很可能不是均等分布的,而是分别向 低端和高端倾斜。但调查样本的组内分布, 不一定符合这个特点。而模型分析法则是 表 6 基于恩格尔系数法求解的城镇分组人均收入(元) 分组 恩格尔系数 统计收入 推算收入:(1)分组比较法 推算收入: (2)模型分析法 最低收入 0.481 4 754 5 685 5 350 低收入 0.459 7 363 8 646 7 430 中低收入 0.429 10 196 13 392 11 970 中等收入 0.404 13 984 20 941 17 900 中高收入 0.379 19 254 29 910 27 560 高收入 0.340 26 250 47 772 54 900 最高收入 0.292 43 614 164 034 139 000 全部城镇居民 0.379 16 885 35 462 32 154 剩余样本 0.224 658 811 625 000 注 1: 全部城镇居民的平均统计收入 16 885元是按各组统计收入加权平均计算的,而统计局公布的平均数是 15 781元。 注 2:推算的全部城镇居民收入没有将剩余样本包括在内。 《比较》总第48辑 | 2010年第3期 13 根据收入和其他因素对恩格尔系数的影响 系数,直接从恩格尔系数推算出对应的收 入水平,准确程度应该高于分组比较法。 基于以上两点考虑,在以下的计算中, 我们将根据模型分析法(模型 2)的估计结 果进行。 图 2更直观地给出了两种方法得到的 推算收入与统计收入的比较。可以看到,两 种方法具有一致性,但也有些差异。其中 按模型分析法得到的高收入组人均收入明 显高于按分组比较法得到的人均收入,而 模型分析法得到的最高收入组人均收入则 低于按分组比较法得到的收入。 此外,为了进行对比,我们把 2007年 研究报告提供的 2005年推算数据与统计数 据比较图(见图 3,依据分组比较法)也放 在图 2后面。这两张图很相似,显示了两 次调查和研究结论的基本一致性。 还需要指出,在 2007 年报告中,作 者判断根据调查样本推算的分组收入水平 可能存在一定正方向误差,因此对推算结 果做了一定程度的下调。从表 6可见,下 调后的 2005年推算数与未进行调整处理 的 2008年推算数与统计数的比例比较一 致,只有(次)高收入组例外。这看来说 明,当时的下调是合理的,而且当时的误 差可能主要来自分组比较法自身,因此这 次使用模型分析法进行推算,就消除了这 一误差。 但要再次强调的是,这里的推算只解 决了统计收入低报的问题,并没有解决统 计数据遗漏高收入样本的问题,因此实际 上这里对最高收入居民人均收入的推算仍 然可能在一定程度上偏低。 这种情况也反映在我们的调查样本中。 按分组比较法对调查样本分组之后,有少 数高收入样本没有能够列入这 7个收入组。 这是因为这些样本家庭的恩格尔系数更低; 加入这些样本后,最高收入组的平均恩格 尔系数就会低于统计数据中最高收入组的 恩格尔系数。在这次的有效样本中,有 76 个高收入样本被排除在外,他们的人均可 支配收入都在 40万元以上,平均收入为 66 万元。他们的平均恩格尔系数只有 0.224, 而国家统计局城镇住户样本中最高收入组 的平均恩格尔系数为 0.292。这似乎说明, 在统计部门的城镇住户样本中,可能很少 包括人均收入 40万元以上的住户。因此严 格地说,这里的最高收入组并不是收入最 高的居民组,因为还有一些更高收入的居 民没有包括在内。 但我们无法用这些调查样本来反映高 收入居民的统计遗漏的情况,这是因为我 们无法知道被遗漏的高收入人群在全部城 表 7 2005 和 2008 年推算收入与统计收入之比 分组 推算收入 / 统计收入2005 推算收入 / 统计收入 2008 隐性收入的分布 2008 最低收入 99.1% 112.5% 0.4% 低收入 101.8% 100.9% 0.0% 中低收入 106.9% 117.4% 2.3% 中等收入 114.0% 128.0% 5.1% 中高收入 130.6% 143.1% 10.9% 高收入 138.7% 209.1% 18.8% 最高收入 337.6% 318.7% 62.5% 全部城镇居民 177.7% 194.4% 100.0% 注:推算收入与统计收入之比以各组的统计收入为 100%,隐性收入分布以 2008年隐性收入总量为 100%。 CITIC Comparative Studies 48 | June 201014 镇居民家庭中占有多大比重,也不能用调 查数据中这些没有包括在内的高收入样本 的分布来代表全国被遗漏的高收入样本分 布,因为调查样本的分布状况与全国更高 收入居民的分布状况未必一致。而且,在 我们的调查样本中也仍然存在遗漏。在这 次调查样本中,收入最高家庭的人均可支 配收入为 176万元,比这一收入更高的样 本还是没有包括在内。 这也从一个侧面说明,在统计调查中, 更高收入的居民被遗漏了。而我们在这里 所采取的两种恩格尔系数推算方法,都只 能纠正已有的统计样本中对收入的低报, 而无法纠正因遗漏高收入样本而导致的收 入统计数据偏低问题。因此在某种程度上, 我们对“最高收入组”人均收入的推算仍 然是偏低的,不过其可靠程度还是远远高 于目前的统计数据。 180 000 160 000 140 000 120 000 100 000 80 000 60 000 40 000 20 000 0 最低收入 低收入 最高收入中低收入 中等收入 中高收入 高收入 统计数据 估算数据-分组比较法 估算数据-模型分析法 图 2 2008 城镇居民分组人均收入:推算数据与统计数据比较 120 000 100 000 80 000 60 000 40 000 20 000 0 最低收入 低收入 最高收入中低收入 中等收入 中高收入 高收入 统计数据 估算数据-分组比较法 图 3 2005 城镇居民分组人均收入:推算数据与统计数据比较 《比较》总第48辑 | 2010年第3期 15 2.隐性收入和居民收入差距有多大? 从表 6 和表 7 可以看到,2008 年占 10%的城镇居民最高收入家庭,人均可支 配收入应为 13.9万元,而不是统计显示的 4.4万元。两者相差 3.2倍。最高收入家庭 这些没有包括在统计数据中的隐性收入占 城镇居民隐性收入总量的 63%。再加上高 收入组,城镇 20%高收入居民的隐性收入, 占全部城镇居民隐性收入总量的 80%以上。 据此推算城镇居民收入分配差距,按 城镇居民家庭 10%分组,2008年城镇最高 收入家庭与最低收入家庭的实际人均收入 分别是 5 350元和 13.9万元,差距是 26倍 (上一份报告推算的 2005年差距是 31倍), 而按统计数据计算只有 9倍。(这次推算的 收入差距小于上次的推算
/
本文档为【家教-孩子被人欺负怎么办】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索