泰尔指数及分解的计算方法与MATLAB实现

最近查一点泰尔指数的资料,发现无论是公式还是软件实现,都说的特别乱,看不出所以然。

特整理了该内容,并用Matlab软件给出了实现的代码。

一.泰尔指数

泰尔指数(Theil index)或者泰尔熵标准(Theil’s entropy measure)泰是由泰尔(Theil,1967)利用信息理论中的熵概念来计算收入不平等而得名。

熵在信息论中被称为平均信息量。在信息理论中,假定某事件E将以某概率p发生,而后收到一条确定消息证实该事件E的发生,则此消息所包含的信息量用公式可以表示为:

将信息理论中的熵指数概念用于收入差距的测度时,可将收入差距的测度解释为将人口份额转化为收入份额(类似于洛伦兹曲线中将人口累计百分比信息转化为收入累计百分比)的消息所包含的信息量。而泰尔指数只是熵指数中的一个应用最广泛的特例。泰尔指数的表达式为:

运行结果:

二. 泰尔指数分解法

另外,值得注意的是组内差距项分别由各组的组内差距之和构成,各组的组内差距的计算公式与样本总体的计算公式并无二致,只是将样本容量控制在第k组的个体数目。

例2 还是例1的数据,计算组间差距与组内差距,验证泰尔指数

运行结果:

Tw= -3.7007e-17

z= 1.0e-15 *

0 0 -0.1110 0 0

Dw= 1.0e-15 *

0 0 -0.4680 0 0

说明:由于该例中,每个分组内各个个体的收入是相同的,故每个分组的组内差距为0,总的组内差距Tw也为0,结果中的-3.7007e-17是由于Matlab中的双精度误差造成的,相当于是0.

例3 修改例1中的数据,让各分组的个体收入不相等,继续测试上述算法。

原第1组:10、10,改为9.5、10.5

原第2组:8、8、8、8,改为7、9、7.5、8.5

原第3组:6、6、6、6、6、6改为5、7、5.5、6.5、6、6

原第4组:4、4、4、4改为3、5、3.5、4.5

原第5组:1.5、2.5

主程序:

运行结果:

z= 0.0013 0.0049 0.0058 0.0197 0.0316

Dw= 0.0027 0.0167 0.0223 0.0336 0.0135

来源:知乎

扫描关注一下,拜托拜托啦~