一种简易的
基尼系数
计算方法
□文/施卫国
统计学家洛伦茨 ( M . Lo renz) 在研究居民收入分配
均衡程度时, 发现将居民人数累计百分比和居民收入累
计百分比联系在一起,可以揭示收入分配的公平程度。后
来, 人们将这种揭示社会分配均衡程度的曲线称为洛伦
茨曲线 (见图 1)。这条曲线利用两组变量值的累计百分
数之间的关系构成正方形。联接正方形的对角线,为收入
分配绝对公平线, 其直观的理解为: 占人口总数 10%的
家庭获得社会总收入的 10%比例; 占人口总数 20%的家
庭获得社会总收入的 20%的比例; ⋯⋯余此类推, 说明
社会收入的分布绝对的均衡配置。而在公平线的对角周
围有一个不均衡分配区, 它说明占人口总数的绝大比重
人口仅获得占收入比重较少的收入, 反映收入配置的不
公平。洛伦茨曲线是反映收入及其资源配置均衡程度重
要量度的一种工具。它是对税收政策、财政政策、价格杠
杆等一系列调节收入政策的效应测度及分析的有效工
具, 是社会经济统计分析中的常用方法。
意大利统计学家基尼 ( G ini) 根据洛伦茨曲线提出计
算收入分配公平程度的系数,又称基尼系数。作为测度居
民收入分配的非均衡性的方法以及被作为联合国规定的
社会经济发展指标之一, 基尼系数是被人们普遍接受的
并行之有效的方法。
第四, 计算经济集约度指数。由前述公式和表二
数据, 可求出江苏省 1985- 1995年各年的经济集约
度指数 (见表三)。
表三
年份 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995
Ei ( % ) 77. 1 70. 8 70. 2 74. 8 68. 7 68. 3 71. 7 77. 7 80. 6 81. 0 83. 7
从表三列示的数据可以看出, 江苏经济集约化
的总体趋势是上升的, 1986- 1995年集约度指数共
上升 7. 6个百分点, 显示出近年来江苏粗放型经济
增长方式有所改观, 集约因素对经济增长的作用正
逐步增大。但从变动趋势分析, “七五”时期江苏经
济集约化程度较低, 1990 年集约度指数比 1985年下
降 8. 8 个百分点, 其间除 1988年集约度指数有所好
转外, 其余 4 年均呈逐年下降之势; 而 “八五”时期,
江苏经济集约化水平逐年上升 , 1995年与 1990年相
比, 集约度指数共上升 15 个百分点, 表明“八五”时
期江苏经济集约化水平提高较快。
进一步对系统内各影响因素的变动情况观察,
促成江苏经济集约化水平提高的指标有人均 GDP、
能源产出率、贷款利用效益和每万人拥有技术人员
数等四个指标, 1985- 1995 年分别年递增 12%、10.
7%、0. 6%和 6. 9% , “八五”时期该四个指标值的
增长速度明显快于 “七五”时期。制约经济集约化水
平提高的指标则是中间投入率、投资效果系数、更改
投资比重和资金利税率, 1985 年到 1995年, 全省中
间投入率由 60. 3%上升到 71. 9% , 投资效果系数
年递减 5. 1% , 每百元资金实现的利税年递减 11.
6% , 更改投资比重一直徘徊在 12- 14%左右。这说
明, 江苏经济要全面提高整体素质和效益, 必须积极
推进经济增长方式由粗放型向集约型转变, 调整和
优化产业结构, 全面提高科技进步对经济增长的贡
献份额, 进一步提高固定资产的投资效率, 强化企业
管理, 使全省经济真正步入良性循环的轨道。
(责任编辑: 薛金龙)
—16—
应用研究 《江苏统计》1997. 2
目前, 计算基尼系数的方法多种多样, 大致可分
为三类, 第一类为三角形面积法, 将曲边三角形的面
积近似为直角三角形面积 , 通过求几何面积的方法
求解; 第二类将洛伦茨曲线拟合为各种近似的函数
曲线, 利用定积分方法求该函数曲线下的面积, 最后
求得基尼系数数值; 第三类是将 SA的面积近似为弓
形面积, 利用求弓形面积的方法, 求得基尼系数数
值。上述三类方法都是近似计算法, 求解上难易程度
各不相同。实用中尤以第二类方法的曲线最佳拟合
形式难度较大, 实用效果不好。第三类方法则因计算
结果精度不够, 在应用中受到限制。第一类方法因为
计算公式复杂难记, 在应用中受到推广和普遍使用
的局限性, 为此 , 笔者经反复推算, 根据第一类方法
原理, 提出一种简便易记易用的最简捷计算基尼系
数的计算公式, 便于一般统计工作者掌握和使用。
图 2 三角形面积示意图
由图 1、2 可知, 基尼系数的一般计算公式为:
G=
SA
SA+ SB
, 0≤G≤1 ( 1)⋯⋯⋯⋯⋯⋯⋯⋯
由( 1)式可知, 当SA = 0时 , 洛伦茨曲线与绝对平均
线重合, G= 0, 表示收入分配绝对平均; 当 SA= 12 ,
洛伦茨曲线与绝对不平均线重合时, G= 1, 表示收入
分配绝对不平均。
当横、纵坐标均以 1 为单位时, OC �对角线以下
的 SA 和SB 之和为 12 , 即 SA+ SB=
1
2
, 故 G 值亦为:
G= 2SA ( 2)⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
求基尼系数的本质转化为求面积 SA 或 SB ( SB=
1
2
- SA ) 的问题。三角形面积法的计算思路如图2 中
的阴影三角形的面积为 1
2
( x i- Xi- 1) · ( yi- yi- 1) ,
所有这些三角形面积之和:
S△= ∑n
i = 1
1
2
( x i- x i- 1) · ( yi- yi- 1)
令 Pi= ( x i- xi- 1) , I i= ( y i- yi- 1)
则: S△= ∑n
i = 1
1
2
PiIi=
1
2
∑n
i = 1
PiIi
然后, 计算上述三角形以上部分的矩形面积:
S � = ∑n
i = 1
( x i- x i- 1) · ( 1- Y i) = ∑n- 1
i = 1
Pi ( 1-
Yi)。
最后, 从 S△和 S � 之和的面积中减去对角线以上的三
角形面积, 即 1/ 2, 则 SA的面积为:
SA= S△+ S � - 12
=
1
2
∑n
i = 1
P iI i+ ∑n- 1
i = 1
P i ( 1- yi) -
1
2
( 3)⋯⋯⋯
由 ( 3) 式可得基尼系数值为:
G= 2SA= ∑n
i = 1
PiIi+ 2∑n- 1
i = 1
Pi ( 1- y i) - 1 ( 4)⋯
以 ( 4) 式计算 G 值较为复杂且难以记忆, 实用中存
在局限性, 笔者对 ( 4) 式作简化推导得:
G= ∑n- 1
i = 1
( x iyi+ 1- x i+ 1y i) ( 5)⋯⋯⋯⋯⋯⋯⋯
以 ( 5) 式计算基尼数数值, 是最为简便实用且易于
记忆的计算方法。
例如, 某地居民收入分配以收入多少分组后形
成如下累积相对次数见下表:
年收入分组
(元) 1800以下 18003000 30005000 5000010000 1000020000 2000030000 3000050000 50000以上
( x i) 累积人口百分比
( % )
6 15 33 60 76 87 95 100
(y i) 累积收入百分比
( % )
1 4 15 35 60 75 98 100
—17—
应用研究
简捷式与
式回归系数的数量关系
□文/唐建荣
(一)
最小二乘法或称最小平方法, 是理论界倍受推
崇的统计估计方法。一般认为, 由最小二乘法拟合的
曲线是最理想的趋势线。该趋势线满足以下二条件:
( 1) 原数列与趋势线的离差平方和最小, 即:
∑ ( Y�t- Y t) 2= min;
( 2) 原数列与趋势线的离差和为零, 即:
∑ ( Y�t- Y t) = 0。
据此性质我们可以实现不同趋势模型参数的有
效估计。
以直线趋势模型 Y t= a+ bx 为例, 根据最小二
乘法性质和微分极值原理易估计到参数 a、b 的值为:
b
� = [ n∑XY - ∑X∑Y ] / [ n∑X2 -
∑2X] ( 1)⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
a�= y�- bx�
公式 ( 1) 即是回归系数 b 标准估计式。对于等
距时序的动态数列, 应用其等距性, 可作以下变换:
x′= k [ x- 1
2
( x1+ x n) ]
式中 n 为奇数时, k= 1; n 为偶数时, k= 2; 则
参数估计简捷式为:
b
�′= ∑X′Y/∑X′2 ( 2)⋯⋯⋯⋯⋯⋯⋯⋯⋯
a�′= y
显然, 简捷式计算的实质,即是 y 轴的向右平移,
其结果一方面使 a、b 参数的估计过程尽可能地得以
简化; 另方面亦保证了平移前后估计值 y�t 的一致性。
(二)
简捷式的有效性是不容置疑的, 其实践的广泛
性即是明证。简捷式具有以下性质:
( 1) ∑X′= 0;
( 2) 模型的趋势性不变;
( 3) b
�′= b� (当 n= 2m+ 1 时) 或 b�′= 12 b� (当 n
= 2m 时)。
( 1)、( 2) 性质已为统计工作者熟知, 一般统计学书
藉上亦作了说明。性质 ( 3) 则长期为人们所忽略。笔
者在长期的统计教学实践中发现, 性质 ( 3) 的认识
不仅有助于简捷法的理解, 而且亦有助于对最小二
乘法的把握。
应用第 ( 5) 式计算:
G = ∑n- 1
i = 1
( x iyi+ 1- x i+ 1yi ) = ∑n- 1
i = 1
x iyi+ 1- ∑n- 1
i = 1
x i+ 1
yi
= ( 0. 06×0. 04+ 0. 15×0. 15+ 0. 33×0. 35+
0. 6×0. 6+ 0. 76×0. 75+ 0. 87×0. 98+ 0. 95×
1) - ( 0. 15×0. 01+ 0. 33×0. 04+ 0. 6×0.
15) + 0. 76×0. 35+ 0. 87×0. 6+ 0. 95×0. 75+
1×0. 98)
= 2. 873- 2. 5852= 0. 2878
从上例计算可以了解基尼系数的数值计算可以
归结为两组相对累积次数变量值 ( x i和 yi) 的对角斜
乘积和之差, 这种计算方法简便宜记, 便于推广, 是
实用中较便利的一种计算方法。只要我们正确掌握
收入分组的方法, 就可运用家计调查资料直接求得,
简捷便利、方法灵活。
(责任编辑: 薛金龙)
—18—
应用研究 《江苏统计》1997. 2