为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > EXCEL下基尼系数的计算研究

EXCEL下基尼系数的计算研究

2013-01-05 3页 pdf 1MB 30阅读

用户头像

is_044688

暂无简介

举报
EXCEL下基尼系数的计算研究 ● 实务探讨 E X C E L 下基尼系数的计算研究 高 技 基 尼 系 数是 20世 纪 初意 大利 经 济 学 家基 尼 根据 洛 伦茨 曲 线提 出的定量 测定 收入 差异程度 的指标 , 也是 国 际 上 通 常用 来 衡量 收入 差异程 度 的 一 个重 要 统计 分析指标 。 一 直 以来 , 尽 管 很多人 都知道 基 尼 系数的大致含 义和 主 要 用途 , 但 由于 基 尼 系 数计算 比较复杂 , 而 且 在相 关教材和 资料中难 以找到 非常有效 的计算 方法 , 使得很 多人 在计算基尼 系数...
EXCEL下基尼系数的计算研究
● 实务探讨 E X C E L 下基尼系数的计算研究 高 技 基 尼 系 数是 20世 纪 初意 大利 经 济 学 家基 尼 根据 洛 伦茨 曲 线提 出的定量 测定 收入 差异程度 的指标 , 也是 国 际 上 通 常用 来 衡量 收入 差异程 度 的 一 个重 要 统计 分析指标 。 一 直 以来 , 尽 管 很多人 都知道 基 尼 系数的大致含 义和 主 要 用途 , 但 由于 基 尼 系 数计算 比较复杂 , 而 且 在相 关教材和 中难 以找到 非常有效 的计算 方法 , 使得很 多人 在计算基尼 系数方面 存在 一 些 技术障 碍 和 困难 , 大大地 影 响 了基 尼 系数在实际工 作 中的应 用 。 为 了彻 底破 除人 们 在计 算基 尼 系 数 方面 的技术 障碍 和 困 难 , 本文将对基 尼 系数 的计算进行 一 番 探索 , 在指 出常用基 尼 系数计算公 式 不 足 的 同 时 , 直 接根据 基 尼 系数 的有关定 义 , 对 两 种情况 下 的基 尼 系数计算 , 进行严 格 的数学推 导证 明 , 取 得 两 条新 的基 尼 系数实用计算公 式 ; 然后 再 根据 这 两 条实用计算 公 式 , 充分利用 E X C E L 中单 元格 的计 算功能 , 建立 起全 新 、 科 学 、 简 易 的基 尼 系数计算方法 , 可 使 一 般人 不 用专 门计算程序 也能轻轻松松地计算出基 尼 系数 。 一 、 基尼 系数 的概念 与 常用 计 算 瓤 式 昀 不 足 由于 基 尼 系数与洛伦茨 曲线关 系密切 , 因 此 , 在介绍基 尼 系 数之 前 , 我们还 得先讲 一 下 洛伦茨 曲线 。 洛伦茨 曲线是 统计学家洛伦茨在研 究社会收入 分布情况 时 首 先提 出 的 , 其 大 致 意 思 是 : 先将研 究 的全 部 人 口 对 象 (如 N个人 )按 其 收入 从 低 到高排列 (设 其 收入 为Q 。 ) , 从 收入 最 低 的对 象开 始 , 累计任 意百 分 比 的人 口 (如i/N ) , 计算 出他 们收入 合计 占全部人 口 收入 合计 的百 分 比 (设V . ) , 然后 , 以 人 口 累计 的百 分 比 为X轴 , 以收 入 累计 的百 分 比 为Y 轴 , 将所 有 这 些 人 口 累 计 百 分 比 和 收入 累计 百 分 比 的对 应 关 系 (如 点 B , )描绘 在 图 上 , 这 样 绘 出的 曲线就 叫洛 伦茨 曲线 (见 图 1 中 向下 弯 曲的曲线 )。 0 ) 累计 百 分 比 上 图 中B i点 的坐 标 (X , Y )为 x : 0嘣j : 土 ’ N Y : A iB i = K = 明 白 了洛伦兹 曲线后 , 基 尼 系数就很好理 解 了 。 基尼 系数 实 际 上 就 是 图 1 中S ,除 以 (S ,+ S : ) , 其 中 , S ,是 直 线段 O B 与 洛伦兹 曲线围成 的区 域 面 积 , S ,是 直 线段 O A 、 A B 和 洛伦兹 曲 线围 成 的区 域面 积 。 目前有关 资料和 教材 中比较 常用 的基尼 系数 (G )计算公 式有 以下 两 条 : 1 N 卜 - 1 G = — 毒 ∑∑(Q 『一 g)Jv% 舞 智 ⋯ ⋯ 。 G = ∑置z+ 2∑一 (1 一 )¨一 1 (2) i= 1 i= I 公 式 1是 在 已知所 有N个人 收入 的情况 下 使用 的 。 公 式 1 中 W .为这 N个人 的收入 之 和 , Q .为这 N个人 按 收入 从 低到高排列 后 的第i个人 的收入 。 公 式 1 的具 体展 开 就是 : 1 G 。 赢 ‘(幺 一 Q 1) + (珐 一 蜴)+ (包 ~ 奶) + (Q 4 一 Q 1)+ (Q 4 一 Q 2)+ (Q 4 一 Q ) + ⋯ ⋯ + (鳊一 ,一 Q )+ (级一 。一 Q2)+ (绋一 .一 Q])+ ⋯ . + (绋一 ,一 玑一 :) + (aN — Q1)+ (绋 一 Q2)+ (QⅣ一 Qj)+ ⋯ . + (G — QN一 :)+ (级 一 玑一 。)】 尽 管这 个计算公 式 中各 项都 很 有规律 , 但 在 E X C E L 下 要 对 给 定 的 一 组 收入 数据 (Q )实现 以上 计算还 是 比较麻烦 的 。 像这样 的计算 , 为 了有效利用 E X C E L 的 “ 拖 拉复制 ” 功 能 , 减 少手 工 输入 公 式 , 一 般 要 在E X C E L表 中开辟 一 个与 以上 展 开 式 形状相似 的三 角形计算 区域 , 在这三 角形计算区域 中 , 虽 然每 列 只 需 对 一 个单 元输入 计 算公 式 , 其他单 元 的公 式可 通 过拖拉 复制得到 , 但 由于 这样 的列数共 有N 一 1个 , 当N很大时 , 要输 入 全部 的计算公 式还 是 显 得 非常麻烦 的 。 公 式2是 针 对 研 究 对 象 已 按 个人 收 入 多 少 分 成 n个组 , 并 且 已知每组 的对 象个数 (P . )和 总 收入 (Q )的情况 , 而 建 立 的基 尼 系数计 算公 式 。 这 条公 式 C x。、 Y .、 V .分别为 : 4 1 维普资讯 http://www.cqvip.com ● 买 务 探 讨 X t: 丢 ∑e r: 善 ∑g 』= I K = ∑l “= 1,2,..⋯ , n) 如 果 在 E X C E L - F 要 对 给 定 的 对 象 个 数 ( P . )和 总 收 入 (Q . )两 列数据 , 用 公 式2计算基 尼 系 数 一 般也 需开 设 4 、 5列 的计算 区 域 , 其计 算也 比较麻 烦 。 而 且 , 公 式2中各项 的具 体 意义 也 不是 很直 观 , 不便于 记 忆 , 计算时容易弄错 。 二 、 洛伦茨 曲线 的 补充 说明 和基尼 系 数 实 用 计算愈式的 推导 对于 上 面 洛伦茨 曲线的 一 般描述 , 本人 认 为还 需要 补充说 明 的是 : 严 格来讲 , 按上 面 定 义 中的 方法将所 有对应 关 系都描 在 图上 , 实际 上 是 不 能构成 一 条连续 的 曲线 。 这是 因 为 , 人 口 数 N是 一 个 自然 数 , 当 N确 定 后 , 在X 轴 的 【O , 1 】区 间上 只 有 i/N (i= 0 , 1 , 2 , ⋯ ⋯ , N )处 , 人 口 累计 的百 分 比才有 实际 意义 。 虽 然 对 象越 多 , 这 些 有意义 的点 就 越 紧密 , 但 无 论 多 密 , 相 邻 的点 总 是还 有 1/N的间隔 。 这 时将人 口 累计百 分 比和 收入 累计百 分 比的对应 关 系描绘在图上 , 还 只 是 一 串貌似 曲线 的 N点 集合 。 关 于 这 个 问题 , 许 多资料都没 有提及 。 但 本人 认 为 , 根据 洛伦茨 曲线的精神 , 在这种情况 下 , 依 次将上 面 N点 用 直 线 段 进 行 连 接 , 所 得 到 的 一 条从 坐 标 (0 , 0 )到 (1 , 1 )的折 线就 是 洛 伦茨 曲线 , 这 时 不 存在用 直 线近 似 代替 曲线 一 说 , 因 为上 面 N点 的间隔 处原 先就没有什么 曲线 。 清楚 了 以上 有关概 念和补充说 明后 , 现在让 我们 分两 种不 同情况重 新推导 一 下 基 尼 系数 的计算公 式 。 第 一 种情况 : 已知 N个人的收入 , 计算其基尼 系数 G 。 设这 N 个人 收入 从 'fk~N 高排列后 , 得 到的收入 为Q (i= 1 , 2 , ⋯ ⋯ , N )。 且 记 vo = 0 .上 形 = ≥。 Q , (江 1,2, ⋯ ,Ⅳ ) " : 关 (f_ 1⋯2 ⋯ ,Ⅳ )‘ % 。 ~ 。 。 则 有 : G : 』 L : 玉 : 堕 生 : l一 2S . S l + S 2 0. 5 0. 5 ‘ : 1 — 2兰兰型 2: l一 土兰(% + )¨: l一 吉(2∑ N 2N N ¨一 ‰) 鲁 鲁 ~ L 。 N 、 台 ? ” ‘ 斗 专c2喜景叫 斗 击c2善 N 彬 圳 ④ 上 面 推导 中需要 说 明 的是 : 根据前面 有关概 念和说 明我们 知 道 , 图 1 中直 角 三 角 形 0 A B 的 两 个 直 角 边 长 都 是 1 , 于 是 S ,+ S :等 于 0 . 5 。 S :实 际 上 就 是 N 个 直 角 梯 形 (第 一 个 为 三 角 形 )面 积 之 和 , 其 中第i个梯形 的 “ 上 底 ” 就 是 V .. . , “ 下 底 ” 4 2 就 是 V ., “ 高 ” 就 是 1 / N , 面 积 就 是 (V ...+ V . ) /2N 。 另 外 , 值得 一 提 的是 , 可 以证 明 公 式3和 公 式 1 的计 算结 果 是 完 全 一 样 的 。 第二 种情况 : 已知按个人收入 多少进行分组 。 而且 知 道每 组 的人数和收入 。 计算其基 尼 系数 G 。 设 共 被 分成 n个组 , 按 组 人 均 收入 由小 到 大进行 排列后 , 各组 的人 数和 收入 分 别 为 P . (._ 1 , 2 , ⋯ ⋯ , n )和 Q (__ 1 , 2 , ⋯ ⋯ , n ) , 且 记 uo = 0 % = 0 wo = 0 f M = ∑e (f= 1,2, . . ⋯ , ,z) ,= I U : 盟i N n 彬 = ∑Q ,= I 矿 : 堕 。 睨 j (江 1,2, . .⋯ . , 月) “= 1, 2⋯ ⋯ . , n) 则 有 : G : 土 : 旦 : —0. 5 - — S 2 : l- 2S 2 S + S 2 0. 5 0. 5 小 2喜盟 巡 小 击缸 - 堋 x fl2fl ,,台 N n 台 一 。 。 小 击喜警 晔 卜 袁喜c% 堋 × 只 ㈤M 智 % ‘ M 睨 智 一 ’ ” ‘ 一 这 里 需要 说 明 的是 : 1 . 在这种情况 下 , 由于 不知道每个研 究对 象的具体 收入 情 况 , 所 以 , 不 可 能像第 一 种情况 一 样能准确画 出洛伦茨 曲线 。 但 如 果 我们 用 直 线段依 次将 (U . , V ) (i= 0 , 1 , 2 , ⋯ ⋯ , n )这 些 点连 接起来 , 并将所 得折线记 为 K 线 , 就 会发现 K 线与 洛伦 茨 曲线还 是 比较 近 似 的 。 这 是 因 为 , 根据 洛伦 茨 曲线定 义 , 可 以知 道 (U . , V ) (i= 0 , 1 , 2 , ⋯ ⋯ , n )这 些 点 肯定 都 落在 洛伦 茨 曲线上 , 换句话 说 , K 线与 洛伦 茨 曲线在 (U . , V ) (i= 0 , 1 , 2 , ⋯ ⋯ , n )这些 点 上 是 完全 重 合 的 , 只 不 过 在 这 些 点 的间隔 处 K 线是 一 条直 线段 , 而 洛伦茨 曲线 不 一 定是 一 条直线段 , 很可 能是 一 条单调 上 升 的 “ 折 线段 ” 。 在这 种没 办 法具 体确定 这 些 “ 折线段 ” 的 条件 下 , 我们 用 K 线 的直 线段 代 替 未知 的 “ 折线段 ” , 应该 说 是 比较 合 理 的 。 上 面 公 式 4 就 是 用 K 线近 似 代 替 洛伦茨 曲线后 推导 出来 的 。 我们 前面 介绍 过 的 公 式2在推 导 中可 能 也 有 这 样 一 个近 似 代 替 的过 程 , 因 为我 们 可 以验证 2和公 式4 的计算结果是 完全 一 样 的 。 2 . 用 K 线 近 似 代 替 洛 伦 茨 曲 线 后 , S ,就 是 n个 直 角 梯 形 (第 一 个 为 三 角形 )面 积 之 和 , 其 中第i个梯 形 的 “ 上 底 ” 就 是V ..., “ 下 底 ” 就是 V ., “ 高 ” 就 是 P . / N 。 , 面 积就 是 (V ,’ V )P , /2N 。 。 3 . 我 们 应 当 明 白用 公 式2和 公 式 4 得 到 的 G 只 是 一 个 近 似 值 , 当我们 可 以用 公 式 1和 公 式3计 算时 , 最 好 不 要 用 公 式 2和 公 式4 。 事实上 , 公 式4 计算 出来 的 G 往往要 比 实际 上 的基尼 系 数小 一 些 。 这是 因 为 , 根据洛伦茨 曲线定 义 可 以知道 , 实际 上 的洛 伦茨 曲线在 (U . , V . ) (i= 0 , 1 , 2 , ⋯ ⋯ , n )这 些点 间 维普资讯 http://www.cqvip.com 隔 处 的 “ 折 线 段 ” 一 般 都 在 K 线 的 下 方 , 不 可 能 在 K 线 的 上 方 , 这 就 使得 公 式 4 中的 S ,往往 要 比 实际 上 的 S ,小 , 结 果 公 式 4 计算 出 的 G 也 就 往往要 比 实 际 上 的基 尼 系 数 小 一 些 。 这 点 也 说 明 了 , 用 分组 方法计算基 尼 系数往往会 出现低估 的情况 , 分 组越粗 , 得到 的基 尼 系数就越 小 。 这个 问题 , 在我们 的实际 工 作 中也遇 到过 。 如 同样 的住户调 查 数据 , 由于 在计算时采 用 不 同 的 分组 方法 , 如十 分法 或五 分 法 , 则 得到 的基 尼 系 数往往是 不 一 样 的 , 结果 给 关于 基尼 系数 的统计 分析带来 了 困 惑 。 人 们 之 所 以 比较 多地采用 十分 法和 五 分 法计算基 尼 系数 , 我 想其 中 一 个主 要 原 因就是 想简化基尼 系数的计算 , 避开 对成 百 上 千住 户调查 数据进行直 接计算的麻烦 。 现 在好 了 , 我们 没有必 要 回 避 对住户调 查 数据 的直 接计算 , 因 为 , 有 了 公 式3和 下 面 将要 介绍 的方法 , 我们 可 以不 费吹灰 之 力就 能将它们搞定 , 还 能还 基 尼 系数 以本来面 目 。 三 、 E X C E L 下 基尼 系 数计 算的劫 方 法 有 了 上 面 的 公 式35B 公 式 4 , 现 在 我 们 可 以讨 论 E X C E L 下 基尼 系数计算的新 方法 。 为 了更加具体 、 直 观地介绍 E X C E L 下 基 尼 系数计算的新 方法 , 下 面将采 用 实例的形 式 , 并分两 种情 况进行 。 1 . 已 知 E X C E L 表 中有 一 列个人收入 数据 , 求其基 尼 系数 。 为 了 节省 本 文篇幅 , 这 里 只 举 一 个 18人 的例 子 , 人 数 很 多操作步骤 也 完 全 一 样 。 设 在 E X C E L 表 的 A 3 到 A 20单 元 中有 18个人 的收入 数据 , 它们 已按 从 小到 大排列 , 具体见 表 1 。 表 1 个人II扒 【QI) * 。 【兀 J 8568 8568 14 560 23128 18039 4 1167 20693 61860 23893 85753 26397 112150 29252 1 4 14 02 32025 1734 27 34 590 I 208017 37600 24 5617 4 0992 286609 4 74 13 334022 55692 389714 62952 4 52666 72152 524 818 85902 I 610720 99910 ; 71 0630 j69 . 626 ? 112Z鲢 . 基尼系数 I 盔超z£l 这 时我们 的具体计算操作步骤就 是 : 第 一 步 : 在 B 3 单 元 中输入 公 式 “ = B 2+ A 3 ” (要 求 B 2单 元 为空或零 ) , 并点住 B 3单元 右下 角拖拉至 B 20单元 , 这 时便 会得到表 1 中的 B 3 到 B 20的数据 , 这 些数据 实际上 就是 公 式3 中 的W . (I一1 , 2 , ⋯ ⋯ , 侣 ) , 这 些单元 中的计算公 式 分别 为 : B 3 : “ : B 2 + A 3 ” B 4 : “ = B 3 + A 4 ” B 20 : “ = B 19 + A 20 ” 第二 步 : 在 B 21单 元 中 , 根据 公 式3 并结合 本例 实际 , 输 入 相应 的计算公 式 “ = 1 一 (2’ S U M (B 3 :B 20)一 B 20)/(18” B 20)” , 便可 以得到基尼 系数的计算结果0. 3878。 2 . 已 知 E X C E L 表 中有 分 组 的 人 数 (或 家 庭 数 )和 总 收 入 ● 实务探讨 ● 这 两 列 数据 , 求其 基尼 系数 。 对 于 这 种 情 况 的基 尼 系 数 计 算 , 我 们 也举 一 个 18个 组 的 例 子 。 设 在 EX C E L 表 的 B 3 到 B 20位 置 有 1 8个 组 的 家 庭 数 , C 3 ~fJ C 20位 置 有 侣 个组 的 收入 数据 , 它们 已按 户均 收入 从 小 到 大排列 , 具体见 表2。 对 于 这 个例子 , 有个 问题 需要 先说 明 一 下 , 即公 式 4 中原 来要 求知 道 分组 的人 数和 收入 , 而 现在 实 际 上 只 知 道 分 组 的 家庭数和 收入 , 公 式 4 中能用 家庭数代 替人 数 吗 ? 对 于 这 样 类似 的 问题 , 许 多教材 和 资 料 一 般都 是 默许 的 。 这 主 要 原 因 是 , 在不 知 道人 口 分布的情况 下 , 用 家庭分布 大 致 反 映人 口 分 布也 是 一 个 比 较合 理 的办 法 。 另 外 , 从 公 式 4 来 看 , 如 果被调 查 的每 户 家庭 人 口 数都 一 样 , 公 式 4 中的 分 组人 口 数用 分组 家庭数代替后 , 其计算结果是 不 变的 , 所 以 , 当被调 查 的家庭人 口 数大致相 同 时 , 这种替代 的合理 性是 有依 据 的 。 尽 管这 种替代是 被允许的 , 但我们 也 要 明 白 它也是 一 个 近 似 的过程 , 对计算结果也 是 有影 响的 。 表2 %譬躲 专爷’总氅拶 I 吼 饥 ^ )PI(日兀 ) (个) (万元) ‘ ’ 一 、 。 。 393 。 103752 1063 、 4 3534 4 2羽 5 . 14 32364 4 003 34 1 14 08 6365 6583680 9367 11216916 1271 1 1560914 6 16299 19900860 20137 24 4 4 8556 23950 270694 18 27598 ’ 27939016 31557 324 75095 35001 29618310 4 1 770 6164 71 13 4 6590 4 5063600 554 98 82078752 60856 4 584 34 76 69370. j22I§§§盆- l 盈iQllI 关于 本例基 尼 系数计算 , 我们 的具体操作步骤 就 是 : 第 一 步 : 在 D 3单 元 中输入 公 式 “ = D 2+ C 3 ” (要 求 D 2单 元 为空 或零 ) , 并点住该单 元 右下 角拖拉至 D 20单 元 , 这 时便 会得到表2中的 D 3 到 D 20的数据 , 这 些数据 实际上 就是公 式4 中 的W . (i= 1 , 2 , ⋯ ⋯ , 18 ) , 这些 单元 中的计算公式分别为 : D 3 : “ = D 2+ C 3 ” D 4 : “ = D 3 + C 4 ” D 20 : “ = D 19 + C 20 ” 第 二 步 : 在 E 3单 元 中输入 公 式 “ : (D 2+ D 3 )’ B 3 ” (要 求 D 2单元 为空或零 ) , 并点住该单 元 右下 角拖拉至 E 20单元 , 这 时便会 得到 表2中的E 3 到 E 20的数据 , 这 些 数据 实际 上 就是 公 式 4 中 的 (W ...+ W . )P . (._ 1 , 2 , ⋯ ⋯ , 侣 ) , 这 些 单 元 中的计算公 式 分别 为 : E 3 : “ = (D 2 + D 3 ) * B 3 ” E 4 : “ = (D 3 + D 4 )。 B 4 ” E 20 : “ = (D 19 + D 20 )。 B 20 ” 第三 步 : 在 E 21单元 中 , 根据 公 式4 并结合本例实际 , 输入 相 应 的计算公 式 “ : 1 一 S U M (E 3 :E 20)/(S U M (B 3 :B 20)* D 20)” , 便可 以得到基尼 系数 的计算结果o. 301 1 。 司《》 (作 者单位 : 温 州 市统 计局 ? 邮编 : 325009 ) 4 3 3 O 2 8 2 2 哇 8 8 曼 8 9 生 9 O 8 8 4嚣 滁 孺 嚣 嚣蓍曩鬻嚣 嚣 纵啪黜泓哪m研瞄叭Ⅲ眦刚!莹螂啪姒湖粥 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 口 9 £ & 9 , 9 4 9 4 9 4 9 : 4 g 9 ; ÷ hI 端 器 慧 嚣嚣篙 嚣慧稆融 0 O 0 0 0 0 堡 O 0 0 0 0 9 0 9 0 0 加 已 端 器船麓 麓嚣 器器嬲瓢 如 ∞ 筋 靼 舅蚰够卯 !;}∞ 诣 伯 强 ∞ 娜⋯晒姗勘 维普资讯 http://www.cqvip.com
/
本文档为【EXCEL下基尼系数的计算研究】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索