从偏态Pearson VII分布生成的新的多元偏
态t分布
应用概率统计第二十五卷
第五期2009年10月
ChineseJournalofAppliedProbability andStatisticsV01.25NO.5Oct.2009 从偏态PearsonVI1分布生成的新的多元偏态t分布木
温阳俊
(南京农业大学
系,南京,210095)
朱道元
(东南大学数学系,南京,210096)
摘要
一
般而言,偏态的椭球等高分布是,类分布族,有相当一部分的分布都是积分形式,且此类积分
不易求出,而偏态的正态,偏态的正态尺度混合,偏态的PVII型,偏态的PII型的分布却有着很好的结
构,偏态t分布属于偏态PVII型分布,因此,本文在偏态PVII型分布的基础上着重研究新的偏态t分布,
给出它的背景,定义,两种随机表示及其等价性.
关键词:椭球等高分布,偏态PearsonVI1分布,偏态t分布,密度生成函数. 学科分类号:O212.4.
?1.引言
我们知道,随机向量的t分布属于椭球等高分布族,然而,它是对称分布.在许多诸如经
济学,生理学,社会学等领域中,有时回归模型中的随机误差不再满足对称性,通常表现出
高度的偏态性(skewness).为了保留一些重要的对称性质,一个很自然的想法就是将一些分
布分解成用来说明对称性质的部分和用来说明偏态性质的线性约束部分.于是就有了偏态
椭球等高分布族.
AzzaliniSHDallaVal1e于1996年首次提出了多元偏态正态分布(【1】),记为随机向量l
—
SNk(Ok1,fl,Q),其分布密度为:
2(;Q)(),?,(1.1)
其中,Ck(z;Q)为均值为0,方差为Q的k维正态分布Nk(0,Q)的密度函数,(?)是一元标准正
态分布N(0,1)的累积分布函数,a?称为形状参数或偏态系数,当Ol=0N,便得到我们
通常所说的正态分布密度.
随后,各种各样的此类分布得到进一步推广,直到偏态椭球等高分布,特别是Dey和Liu
72005年(『21)将各种偏态形式归结于两种简洁形式,使偏态椭球等高分布得到进一步完
善.许多研究者根据不同的实际数据提出了不同类型的偏态正态分布,偏态t分布,偏
态Chauchy分布,偏态Logistic分布,偏态Stable分布等【(3]),特别是对它们实际数据的处
理(【4]『51)取得了一定的进展.然而,大部分偏态椭球等高分布族都是不易求出的积分形式,
南京农业大学青年科技创新基~(KJ07024)资助.
本文2006年9月l5日收到,2008年4月28日收到修改稿
应用概率统计第二十五卷
只有正态,正态的尺度混合,PVII型,PII型的偏态分布具有良好的结构形式,这对实
际问
题的研究提供了有利依据.t分布属~PVII型分布,因此,在偏态P?I型分布的基础
上研究
偏态t分布,可以使许多问题得到简化.
?2.预备知识
设p维随机向量1服从参数为l,Qpp>0的椭球等高分布,记为—ECp(,fl;
9(p)),它的分布密度函数(pdf)为:
f(~lu,Q;9(p)):}Qi一/29(p)((z—)Q一(—)),?,(2.1) 其中,Ig)()是一个+到+的非增函数,且满足
g(p(u):—__L.9(),
>0
7rP/2./rp/g(r;p)dr',0 全?夕(;p).
夕(u;p)表示R+到R+,且使得积分
夕(u;p)为p维随机向量1的密度生成
(2.6.17)式).
(2.2)
(2.3)
oo
/rV/-1夕(r;p)打存在的非增函数,通常我们称t,O 函数(densitygenerator)(【6]P.77,(2.5.16)式,P.92, 例1(多元正态分布)令9(u;p)=exp(-u/2),则
9(p():(2不)一p/2expf一),
,(zl,Q;9(p)=(27r)一p/IQI一/.exp(一言(一)一(z一)),?. 注记1密度生成函数9(u;p)中,>0表示P维随机向量l生成的二次型,即=
(一)Q_1(z—),这里,只是一个中间变量.
下面我们给出椭球等高分布有关性质的重要引理. 引理2.1设1ECp(,Q;9(p)),Bkp为行满秩的常数矩阵,则B—ECk(B#,
BQ;)).特别,当p可逆时,BXECv(,Bi2B;9(p).这里)未必等于夕(.
引理2.2设×l+Y,xl=dR14(P)(p)),AA=>0,则的所有 的边缘分布都有密度.特别,西)=(X1,,…,)(1<p)的边缘分布密度为 ,((惫)I(),Q();)
=
IQ()l一1/..r(p一)/2—1g(p)(r+((一()-1,x(一())d(2.4) 第五期温阳俊朱道元:从偏态Pea璐onvI1分布生成的崭的多元偏态t分布 其中,~()()表示为
)=~~ro'-k)/2-1go')(
,u>..(2.5)
这里,表示同分布,.口)表维单位球面上的均匀分布,.5))表示具有分布密度夕(p)
的p维球对称分布,且P(:0p1)=0,()=(1,2,…,),Q()表示Q第一个阶主子 式.
设1一ECp(#,Q;9(p)),将,,Q分块为
=
'
()一Ecp((),Q=();9cp),
其中,X1:pl×1,:P2×1,P=Pl+P2.
引理2.3条件同引理2.1,设1一E(,Q;夕(p)),Bkp为行满秩的常数矩阵, 则Bx—ECk(B#,BQ;').特别,当B=(0)时,X2一Ecp2(2,Q22;~(p2));当 B=(0)时,X1一ECp(1,Ql1;-)),这里)同(2.5)式,)未必等于. 引理2.4设1一ECp(,Q;9?),分块同上.则条件分布
这里,
I:2ECp(肌2,Q11.2;
1.2:1+n12n21(x2一2),
Ql1.
2=nil—Q12QQ2l,
q(x2)=(X2一2)Q(z2一2),
)('
夕(?;P1)~JPl维密度生成函数((2.2)式).
?3.从偏~PearsonVI1分布生成的新的多元偏态t分布 (2.6)
(2.7)
本节我们将在多元偏态PearsonVII型分布的基础上给出新的多元偏态t分布的定
义及
随机表示.
488应用概率统计第二十五卷
3.1多元偏态PVI1分布的定义
([6】P.93,例2.6.2),记为—PVIIp(%×1,Q, 设随机向量1服从PearsonVII型分布
M,),M>p/2,>0,Qp×p>0,它的密度生成函数为 夕(;p)=(+)一M,>0,(3.1)
=
lrv)p/2F(M.(3.2).p一(一
p/2)'一
将分块为=(zl,),其中,X1:PlX1,x2:P2×1,P=Pl+P2,且1满足下面的线 性约束条件:
xl>Opl~1.(3.3)
我们记p.表示约束条件(3.3)式的概率,即
P=P(X1>0).(3.4)
Q分块为全黔本文以下部…一Q12Q21.
定义3.i若随机向量xl有如下分布密度:
(z2)I2xl,~22;101Mp2/2VM一2,)F(0p×Ip1×,;一,)\,/ l?
F(dx2(+Q2)一1/}×,;M,1)?,(z10p.×1,Q22;M一,u),(3.5) Q2=Qx2;
F(2(+Q2)一/Iop1,;M,1)~PVIIv(0,l;M,1)分布在2+Q2)一/.处的 值;F(Op1t0p×1,;M-m/2,v)~,PVIIp.(0,,M-p~/2,)分布在Op1×1处的值,等 于2一p;f(x:lOp2×1,22;M—pl/2,)表~PVIIp2(0p2×1,Q22,M—pl/2,)的分布密度.
我
们称z服从多;G/~PVIIp(?)分布,~NSPVIIp.(0,Q,M,V,Q),称为偏态系数. 注记2定义3.1及后面的定义3.2都是按着Ql1=的特殊情况给出的. 下面的定理给出了如何构造SPVII的分布密度.
定理3.1设1一PVIIp(O,Q,M,),M>;/2,>0,p×p>0,分块同上.在线 性约束(3.3)式条件下,Z=(x2l1>0)有(3.5)式的分布密度. 证明:在线性约束(3.3)式条件下,(i,x)的密度为
=,
(3.6)
2
=三
Q
c::
娩
Q
=
里
这
第五期温阳俊朱道元:从偏态PearsonVI1分布生成的新的多元偏态t分布 其中,夕(p)=CIp?9(;p),同(3.2)式,9(;p)同(3.1)式.
对(3.6)式关于1积分,得到的密度:
(x2)麦>.,(z,210pxt,Q;9(p)) 2IQ22;)
>.
,Q2;(3-7)
其中,)同(2.5)式,)同(2.7)式.
再对(3.7)式进行化简,即得(3.5)式,具体计算过程见附录.口 若M:(+p)/2,我们称PVIIv~自由度为V的多元t分布(【6】P.93,例2.6.2),记为tp(,
Q;),其中
9(p,()=(1+)一+,>..
所以,我们有如下定义:
定义3.2若随机向量z~2~1有如下的分布密度:
z):堂.,(,
Q2
=29l?F(x2(v-t-Q2)一/(+p2)/Iop1×1,1;v+p2)?f(x210~×1,Q22;),(3.8) 这里,
Q=Q21Q/2;Q2:f2--12,~…一…-_…
F(x2(v+Q2)一/2(+p2)/2lopl×1,1;+)表示自由度为+p2的tp1(Ovl×1,1;V-{-P2) 分布在Qx2(v-4-Q2)一/2(V"I-p2)/处的值;F(Opl~11oplx1,l;)表示自由度为口的tp1(Op1×1,
1;)分布在OplX1处的值,等于2一P;f(x2tOv2xl,Q22;)表示自由度为的tp2(×1,Q22;)
的分布密度.我们称z服从多元偏态tpu(?)分布,记为Stp2(0,Q,V,),O/称为偏态系数. 同理,下面的推论给出了如何构造st的分布密度.
推论3.1设1^一tp(0,Q;),>0,Qp×p>0,分块同上.在线性约束(3.3)式条 件下,Z=(IXi>0)有(3.8)式的分布密度.
证明:见附录.口
图1给出TPl=P2=1,V:3,=0,0.5,1时的St分布密度,注意:当=0时,即为 ,,l0.70.2,
t分布的密度.图2,图3分别给出TPl=1,P2=2,=1.2,Q=l0.710.4I的二 20.4l
维St分布密度及密度等高线.
应用概率统计第二十五卷
图1:0,0.5,l的St分布密度图
图2二维St分布密度图3二维St分布密度等高线
3.2关于多元SPVI1分布定义的几点说明
本节我们将证明定义3.1,定义3.2确实是一个分布密度.
定理3.2(类似结果见[4]P.374)设连续型随机向量1具有累积分布函数G(?), 连续型随机向量×l具有分布密度,(?),且与独立.令Wl(y),…,()为一函数列,满
三():?一,i=1,…,P1.记w(y)=(1(),???,wp()).贝0 p2G(叫()),()(3.9)
是一个分布密度.其中,P.=P(训(y))=P(X1Wl(Y),…,(y)). 证明:见附录.口
定理3.3设×1,PVIIp却2(Op×1,Q,M,),X分块同上.则 1×l=一Q11-1
.2
/(1一1_2)(+Q2)一/
=一
Ql(1一Ql2Q2)(+x2)一/2
一
PVlIp(Oplx1,;M,1),(3.10) 第五期温阳俊朱道元:从偏态PearsonVI1分布生成的新的多元偏态t分布491
且与独立.
证明:见附录.口
推论3.2设×1一tp.+p2(0p×1,Q;),x分块同上.则 l×1=一Q_11;2(1一//'1.2)(v+Q2)一1/2+)/2 =一
l.(1一12Q)(JU+Q)一/(+)/2
tp(1×l,;+P2),(3.11)
且与独立.
证明:见附录.口
定理3.4(3.5)式是一个分布密度.
证明:由定理3.2和定理3.3,我们令
z×1=X2,若×1<(),
其中yp×1同(3.10)式,且与独立.
(3.12)
()=Q5Q12Q+Q)一/全a'X2(v+)一1/2,(3.13) 则(3.12)式等价于z=(X21X1>1).所以(3.5)式化为 ?
F((2)I×1,;M,1)?,(210p2x,Q22;M一,),(3.14)
其中
=
P(X1>0)=F(0p.×110p×l,;M一/)2,)=P(Y<()).(3.15)
考虑(3.14)式,Y—PVIIp.(0pl×1,1;M,1),X2PVIIm(×l,Q22;M—pl/2,),且y与 独立,Wi(X2):-_+R,i=1,…,Pl,Vx2?Rp2,所以由定理3.2得(3.14)式,即(3.5)式 是一个分布密度.口:
推论3.3(3.8)式是一个分布密度.
证明:见附录.口
3.3两种随机表示方法
在?3.1中,我们已经给出TSPVIIp2(O,Q,M,,)的一种随机表示方法,即线性约束的 条件方法来求解Z=(X21X~>0)的分布密度.接下来,我们将介绍另一种随机表示方法,
即变换的方法,并证明两者表示的等价性:参数(×p,)与(p,)等价. 应用概率统计第二十五卷
()…删,p=(0p)>.,
M>p/2,>0,其中:Pl×1,:P2×1,P=Pl+P2,=(Vl,…,up1), ZJ(Il+…+1I)+(1一鳄)/2vj,一1<<1,J=P1+1,…,p,(3.16) 则全(.十1,…,zp)有(3.5)式的分布密度.这里,
九=fii(1一舒)一,i=Pl+1,…,P,(3.17)
)j?p×pz=diag{(1++1)一,…,(1+),/},(3.18)
Qpxp===
(?Ipl??),c3.9,:
?一(+)一[一(+AA)一_'/2.
证明:令"全(]VlJ,…,jl,+l,…,)全(叼,,则
一
,
lJ一/9(p)("一U),
其中,Pc=P(,×1):2-p,,9(p)=G.9(乱;),c~J(3.2)式,
Eh(3.17)式,(3.18)式知
令Z=(1I,?.
B全
?
=
?=diag{(1一霹+1)/2,…,(1一霹)/). ,lupl,1+1,…,)全(,,
1
;..
(3.20)
(3.21)
夕(;p)同(3.1)式.
U…10
1+l…+1(1一霹1+1)/
1+2…1+20(1,1+2)/
jj..
…
00…(1一)/2
\
.×p1?'
(3.22)
(3.23)
第五期温阳俊朱道元:从偏态PearsonVI1分布生成的新的多元偏态t分布493
则fl~(3.21)式,Z=BU,J(U一一+Z):IBI,,Fh~IN2.1@Z的分布密度为
z一lr/2J(U-.+z)9(p)((B一)一B一) =plal一/2夕)(Q一),(3.24) 其中,P.:P(0)=P(z0), …帅:
).)0?)-(3
由(3.22)式,(3.23)式知,=?,所以(3.25)式即为(3.19)式.由(3.24)式z…I.边'缘分布的
密度为:
Zp-[IQf/2/9(z)I,0p1×1
p2引×11Q22;p2).,
,
札2,Ql1_2;))d1,(3.26)J0>?.
(3.26)式等同于(3.7)式.I:h(3.19)式及:AQQ2l11--1.2 /2得(3.20)式.
所以SPVIIp.(0,Q,M,V,),有分布密度(3.5)式,Q同(3.19)式,Q同(3.20)式. 口
这样我们便证明了两种随机表示的等价性.
例2设()P?I2(.?,(三),,),贝u
maxc,一sPV一(.,(三p1),,,Q),c3.27 其中,Q=【(1一p)/(1+p)】/.
证明:注意到maX(y1,y2)=I—Y~ll2-t-(y1+Y~)/2,具体证明见附录. 上面的例子早在1966年RDberts在[7】中已有类似的结果:设 )?-2(.,(三)),
口
其中p是相关系数,~1]min(X,y)服从偏态正态分布.当时,偏态分布并没有作为一套
系统的
理论提出来,可见,min(X,Y)~:max(X,y)分布是偏态分布的雏形. 应用概率统计第二十五卷
附录
对定理3.1的补充证明.
证明:对(3.7)式进行化简:
(i)首先求2的边缘密度.由(2.5),(3.1),(3.2)式得
因为
.'()7厂..r—p:)/2—1g(p)(r+)dr
r(一w)/2)Jo'.一
丽/F(pl/2~v)p/2r(MJo..(1十)一dr)(一p/2),,,,
r(pl/2rv)p/2r(M(1+兰V))(一p/2),/
?
..
1+).....\…r/~pl/2-1d().
dt=/oJo1t)M?f+,.一tPl/2一l(1+t)(M—vi/2)+pl/2 =
BM—Pl
,
)=—r(M1-pd2)r(p~/2),
这里,口(?)表示beta函数.所以
)=F(M-pl/2)(1+p1,>..(A.1) 由(A.1)式,(2.1)式,引理2.3知,边缘分布服从P?Ip2(0p.l,Q22,M—pl/2,),它 的分布密度为:
f(X2[.)=2I-1/2(1+导)m'(A.2)
这里,Q2=x2g~x2.
(ii)其次求.类似(i)的证明过程得
p1()=r(M-p:
-=/2)(1+)一M—p2,>..(A.3)
m(A.3)式,(2.1)式,引理2.3知,边缘分布1服从PVIIp(Op1,,M—p2/2,),它 的分布密度为:
f(XlIop1×1;=F(M-p2/2)(1+),(A.4) 第五期温阳俊朱道元:从偏态PearsonVI1分布生成的新的多元偏态t分布495
这里,QI=i1.
又因为1的分布关于原点对称,所以
=
P(1>0)=P(X1<0)=/f(xllOp1×1,1;p1))dxlJz1<0
=
F(Op1×1lOp1×1,1;p)=2(A.5)
其中F(.1I.1,;?))表示参数为op.1,.,密度为(p?)的累计分布函数在
Ovl×1的值.
再求条件分布I=X2.由引理2.4知,Q2=q(x2)=z2t3'2-212,
o./rpl/2一g(Q2+r;p1)dr',0 c~
rPl/2-1(1+0.2+r1...} =
()p1(1+)..(1+V+Q2 =
(/2(+)/o..
)-M(~Q2.)pl/2-ld( =
(/2(1+).....—r(M-p:/2)r(p—l/2). 所以,m(2.7)式得
=
F(pl/2)—
F(MV1/2)r(丽pl/2(1/27rp 1/2—1'
?
(1+).(1+)
V+Q2
(A.6)
=丽((+).....,>0.(A.7)
m(A.7)式得X:lX2=X2的分布密度为: f(~ll2,1_2'Q11.g…(Pl:
)
))
=
IQ.I—l/.(+Q2)一p1(1+一
Q
…
3)一M,(A.8)
其中,Q3=(Xl—1.2)Q2(Xl—l_2),1.2=Q12Qz2. 496应用概率统计第二十五卷
所以
.>.
,
Q2;)))d?
=
I‰I((+),-(A.9)
4>yp1=A—Q_115(1一/~1.2)(+Q2)一1/2,(1一)=(一17lQl1.211/2(+Q2)p1/2,
代入(A.9)式,得
>.
IX2,~1.2,Q谁)))dz
:—
厂(1-)-y'y)一Md.(A.10)r(M—pl/2)rP/2<Q.2(计Q2)一1/2 由(A.1O)式可以看出×1P?Ip(0p1,.;M,1),所以 >.
,?‰;
=
F(Q《Q12Q2v+Q2)一/2Io,;M,1) 全F(x2(v+Q2)一/2Io,;M,1),
其中,=QQ21Qf..
(A.11)
由(i)(ii)(iii)我们即得到(3.5)式.口
推论3.1的证明.
证明:计算边缘分布时只需令定理3.1ee的M=fV+p)/2ffP可.计算条件分布X1IX2
=2时,由(A.10)式,令1×1=1×l(+p2)一/2,J(Y--+t)=(V+p2)一P/2,则(A.10)式得
JXl>O,(肌,Q2;9))d
r(【(+P2)+p1]/2)
r((+p2)/2)rpl/2(+)p1/ '
川.
(1+titV+P2
由(A.12)式可以看出1tpl(op1,;+).口 )dt_(A.12)
定理3.2的证明.
证明:因为与y独立,所以必有
()的联合分布,所以Pccy存在.由
pc=P((y))=Ey{P[Xw(Y)IY=引}
=
Ey{P[X叫()]}=/G(w(y))f(y)dy,.,Rp2
(A.13)
第五期温阳俊朱道元:从偏态PearsonVI1分布生成的新的多元偏态t分布497
即得(3.9)式.口
定理3.3的证明.
证明:由(A.10)式即得(3.10)式.因为在=2下,y的条件分布与无关,所以y
与2独立.口
推论3.2的证明.
证明:由(A.10),(A.12)式即得(3.11)式.因为在=x2T,的条件分布与无关,
所以与独立.口
推论3.3的证明.
证明:只需令
.×1=X2,若×1<训(),
其中×1H(3.11)式,且与2独立,
w(X2)
?
(A.14)
Q《.Q12Q2(+Qx2)一/(+p2)/ a'X2(v+Q2)一/(+p2)/(A.15) 即可.口
例2的证明.
i~fl"[~#Jmax(Y1,):I—Y21/2+(y1+Y~)/2,所以 (羔)全(1)()一P?z(.z×,(2_02p22p),,).A.6
N-令
()全(2一一2+一.)(X1)PVII2(0z×,( 所以,定理3.5中:=
(),=1,
所以,
到.
=max(Y1,v2)=2+X2 =
()VII+()=lI+(1—.
),M,,),EO6=—p2,可通过c3.2.式得 ,l,7
,
l
,叫/
M
,?/
01
1p
/\
0
/,??I,
\
1
Tl
t工V
P
S
,口
应用概率统计第二十五卷
参考文献
【1】
Azzalini,A.andDallaV_alle,A.,Themultivariateskewnormaldistribution,Biometrika,83(1996),
715-726.
[2】
Dey,D.K.andLiu,J.,Anewconstructionforskewmultivariatedistributions,J.Multivar.Ana1.,
95(2005),323,344.
【3】
Branco,M.D.andDey,D.K.,Ageneralclassofmultivariateskew?ellipticaldistribution,Multivar.
Ana1.,79(2001),99-113.
[4】
Azzalini,A.andCapitanio,A.,Distributiongeneratedbyperturbationofsymmetrywithemphasis
onamultivariateskewt-distribution,R.Statist.Soc.,B65(Part2)(2003),367-389. 【5]Jones,M.C.andFaddy,MJAskewextensionofthet-distribution,withapplications,J.R.Statist.
Soc.,B65(Patti)(2003),159—174.
【6】方开泰,张尧庭,广义多元分析,科学出版社,1993.
【7]Roberts,C.,Acorrelationmodelusefulinthestudyoftwins,J.Amer.Statist.Assoc.,61(1966),
】】84-1】90.
NewMultivariateSkewtDistributionsGenerated
fromSkewPearsonVIIDistributions
WENNGJUN
(DepartmentofMathematics,NanjingAgriculturalUniversity,Nanjing,210095) ZHUDAOYUAN
(DepartmentofMathematics,SoutheastUniversity,Nanjing,210096)
Ingeneral,therearealargenumberofskewellipticallycontoureddistributionswithhardcalculated
integralforms,whileskewnormal,skewnormalscalemixtures,skewPearsontypeVIIandskewPearson
typeIIdistributionspossessgoodstructures.SkewtdistributionsbelongtoskewPearsontypeVIIdistri-
butions,therefore,thispaperproposesnewmultivariateskewtdistributionsbasedonmultivariateskew
PearsontypeVIIdistributions.Backgroundsanddefinitionsaregiven,twostochasticrepresentationsand
theirequivalencearederived.
Keywords:Ellipticallycontoureddistributions,skewPearsontypeVIIdistributions,skewtdis-
tributions,densitygenerator.
AMSSubjectClassification:62H10.60E05.