正在进行安全检测...
时间:2023-11-11 20:25:12 下载该word文档
维普资讯http://www.cqvip.com2002血 青海师范大学学报(自然科学版) Journal of Qinghai Normal University(Natural Science) 2002 第3期 No.3 指数分布下基于失效次数估计参数的方法 周 莉 (烟台师范学院数学与计算机科学系,山东烟台264025) 摘要:本文给出指数分布下基于失效次数进行参数估计的几种不同方法的比较。 关键词:指数分布;参数估计;生存函数;置信区间 中圈分类号:0213 文献标识码:A 文章编号:1001—7542(2oo2)O3—0015一o4 设有 个样品组成的随机样本,它们的寿命时间分别是T。,T ,… ,对每个样品都附有 一个固定的截尾时间L >Oo我们仅在 ≤Li时,能观察到 ,因此数据是由以下数对组成 (t , ),i=1,2,… 其中 ti=优 ( ,Li), =【。l ̄ ti,,看在指数模型为 厂(t;0)=0 e ,t≥0的场合下,上述I型截尾数据的似然函数为 L( )= 1 ) Ll“’ : I exp(一 i =1 ti ) (1)其中r=∑ 是能观察到的寿命时间的个数。记T=∑£ :∑ +∑L 是 个样品的总观察时间,其中D和C分别表示观察到寿命时间的样品集合和被截尾的样品集合。这里 统计量(r,T)是0的最小充分统计量,在r>0的假设下最大化(1>式可得0的极大似然估计为 T=, (2) 则枢轴量2 近似于 (2r+1)分布。 对于上述来自指数分布的I型截尾数据,在某些情况下,推断可根据r方便地进行,由于忽略了真 实的失效时间,不可避免地会损失某些信息。假设所有的样品采用固定的截尾时间L,在此情形下,,.服 从参数为7"/和P=1一exp(一LIo)的二项分布即r~B(7/",P),以下对基于失效次数进行参数估计的 几种方法进行讨论。 1 在大样本下将只使用r估计0的精度与同时使用r与∑t 给出的0的估计精度进行比较,并同 时给出什么情况下只使用r引起的信息量损失达到最小。 1.1 只使用r对参数0进行估计 由于r~B(7/",P),P=1一exp(一LIo) 欲求0的置信区间,只需求P的置信区间。若以G(r,P)表示r的分布函数,则有 ‘ 1一G(r, )= =c: (1一P) 一 =B(P;r+1, 一r) , ) F( ‘ 其中fl=2(r+1), =2(7"/一r)。易知,1一G(r,P)是P的连续增函数,从而G(r,P)是P的连续 收稿日期:2002—03—05 作者简介:周莉(1966一),女(汉族)。山东人,硕士。
维普资讯http://www.cqvip.com16 青海师范大学学报(自然科学版) 2002年 减函数,故P的1一a的置信区间的上限为方程G(r,P)=a/2的解,即 可’r . =FH(2(r+1),2(,】一号 十 , z—r))一 (3)j 而下限则为方程 G(r一1,P)=1一a/2的解,即 ——— ■一.‘丁_ 二二一 = :P一*/2(2r,r, ,2(,z—r+1))z—r十上 (4)q 由(3)(4)两式可解得P的置信区间,而后利用P与 之间的单调关系,即:P=1一exp(一z.1O),可得 参数 的1一Ot置信区间。 1.2 利用r和∑t 估计参数 两 由 2rOlO~ (2r+1) (5) 其中, 由(2)式给出,利用(5)式对 的置信区间进行估计,不仅利用了r中所含样品信息,同时利 用了T=∑t 中所含有的样品信息。 1.3 通过实例,对以上两种估计方法进行比较 例 在一个试验中,有20个样品投入检测,检测150小时后中止,有15个样品失效,时间分别为3, 19,23,26,27,37,38,41,45,58,84,90,99,109,138.用以上两种方法求 的双边0.90置信区间, 解 在只考虑r的情形下,,z=20,r=15, Fo.95(32,lo):2.692, Fo 05(30,12)=1/Fo 95(12,30)=0,477 由 ・r =2,692 得p =0,896;由 ・ =0.477得pL=0.544 从而, 的1一a置信区间为(66.284,191.083). 若同时考虑r与∑t ,由于2 ~ (2r+1),其中r=15, :丁/r=105.8 T=∑Ti+∑L =837+750=1587 故0,9=P( 。5(31)< < 2.95(31)) 从而70.58< <164.52 显然,用第二种方法得到的估计效果优于第一种方法,区间长度稍短。原因在于第一种方法忽略了 样品真实的失效时间,当共同的截尾时间L<t 或L较小时,信息量的损失才能达到最小。 2 假定我们希望估计生存函数s(t。),0<t。<L,以下将上述两种方法的结果与基于m的分布的非 参数方法进行比较,其中,m是小于等于t。的观测值的个数。 2.1 基于m的非参数方法 与上述只用r估计 的方法类似,为估计S(t。),我们只须估计F(t。),将(3)、(4)两式中的r换成 m,L换成t0即可。假设t0=100. 以1.3中例题为例,此时, ,z=20,t。=100,m=13,P=1一S(100)=1一exp(一lOO/O), 则P的1一a上限为方程 可’I ・ =F 一号(2(m+1),2(,1一号 z 十l ,zL 一 z— )) 的解。下限为方程 ——— ——一’. : a/2(2m,2(,2 z,z z—m+1))一十l
维普资讯http://www.cqvip.com第3期 的解。由 周 莉:指数分布下基于失效次数估计参数的方法 17 。 .. :Fo 95(28 14),可得 P :0.823823 14),可得“=0・ . ,由 8・ =Fo.o5(26,16),可得pL=0.442 从而,S(100)的0.90置信区间为(0.177,0.558) 2.2 利用1.1与1.2中的方法的参数估计 1.1与1.2中的方法均是利用(0,L)时间段上的信息估计参数 ,然后利用S(t。)与 的单调关系, 即S(t。)=exp(-to/o),来求得S(t。)的置信区间。 以1.3中例题为例,由66.284< <191.083,可得S(100)的0.90置信区间为0.221<S(100) <0.592,由70.58< <164.52,可得0.242<S(100)<0.545. 2.3 三种估计方法的比较 由比较可知,仍是1.2中的估计方法精度较高,非参数方法估计的精度稍差。但由以上计算过程可 知,基于m的分布的非参数方法的优点在于,它把S(t。)整体作为参数来进行估计,计算方法简单,且 误差只产生一次,而1.1与1.2中的两种方法在求参数 时,产生一次误差,然后,求其幂时,又使误差进 一步扩大。 3 1.2中可用来替换近似式2 /0~ (2r+1)的另外两种方法。 3.1 大样本下的近似式 在I型截尾场合,由于r是随机的,于是,精确的小样本检验和区间估计方法不容易获得,以下为 基于极大似然估计的大样本性质的方法。 由<1)式可得对数似然函数的一阶和二阶导数 盥dO一 +吾骞z。 dO= 一(、 6) (7) 吾 为得到期望信息量,需求E(一d logL/dO ) 由于 P,( c=0)=exp(一L /o)=1一P,( i=1) 故 E(t I =0)=L ≤L ) e~.e—z 1 E(t I =1)=E( I J。 ‘ = 一 故 E(t )=E(t I :0)・P ( =0)+E(t I =1)P ( =1) =L 一“ +( 一} )(1一e—LI ) =(1一e一 f/ ) 由于 E(r)=∑E( )=∑(1一e-Ule) 故样本的期望信息量为 砌)-E( )= 耋(1 )
维普资讯http://www.cqvip.com18 青海师范大学学报(自然科学版) 2002生 利用极大似然估计的渐近正态性 ~J( )-1/2 N(0,1)’上 (8) 作为(8)式的替换式,有 lr 1一 12 ~N(0,1)’ , (9)J0 其中J。=(一d logL/dO ) :a是可观测到的信息量。 近似式(8)、(9)是在大样本场合下适用的,在中、小样本场合近似效果较差 。 3.2 中小样本场合下的近似式 (1)Sprott(1973)和另外一些作者指出,在小样本场合, = 的分布要比 的分布更近似正态 分布, 的分布近似于均值为 =0 和方差为(dk/dO) ASvar(0)= 19Q的正态分布,其中 Asvar(O)=0z/Q,Q=E(r)=∑(1一P—Ll ),类似于(8)式,有 ( /9Q )