放射性数据的概率分布类型

如题所述

放射性数据处理中,研究变量的概率分布具有重要意义。例如,某地区正常花岗岩的γ射线照射量率的概率分布为正态分布,实践表明,若出现单峰正偏斜分布时,其偏斜部分是由矿化引起的,而且偏度系数越大,矿化越好。因此利用偏度系数的大小可以指示铀矿化的存在与富集程度。概括起来,研究变量的概率分布有如下意义:

1)变量的分布函数是研究地质体的最重要的数学手段之一,它具有重要的鉴别和研究地质体及其成因的意义:

2)根据所研究问题的性质和观测对象的特点,选择恰当的概率分布模型可进行各种必要的概率估计;

3)查明分布规律是进一步统计分析工作的基础,如选择恰当的统计分析方法,确定原始数据是否需要进行变换及其数值的取舍,评价统计分析的效果和放射性测量的质量等;

4)评价和发现影响观测值的因素,提供新的找矿线索和改进工作方式。

放射性数据变量的概率分布主要有正态分布、对数正态分布、泊松分布、二项分布、指数分布以及各种混合分布。

(一)一元正态分布

一元正态分布的密度函数是

放射性勘探方法

记作x~N(a,σ2)。式中a为连续型随机变量的数学期望;σ为均方差。

参数a及σ的直观意义如下:

从f(x)的表达式可知:参数a和σ确定之后,则f(x)的具体形式即确定。如果σ不变,a改变,f(x)的曲线只改变位置,不改变形状。例如某三种岩石的γ射线照射量率的均方差相同,平均数不同的频率分布曲线如图6-4所示。如果a相等,σ改变,f(x)的位置不变,但f(x)的曲线形状发生了改变。例如三种岩石的γ射线照射量率的平均数相同,它们的差别仅表现在均方差σ这个参数上,如图6-5所示。所以应用这两个参数不仅可以进行必要的概率估计,而且能够鉴别不同的地质体。

图6-4 a的直观意义

图6-5 σ的直观意义

平均数为0、方差为1的正态分布称为标准正态分布。记为N~(0,1),其表达式为服从这种分布的随机变量称标准正态随机变量。

(二)多元正态分布

多元正态分布的密度函数式为

放射性勘探方法

式中:X=[x1,x2,…,xm]'为多元正态变量;μ=[a1,a2,…,am]为X的均值向量;∑=[cij]m×n,(i,j=1,2,…,m)为X的协方差矩阵;|∑-1|为∑的逆矩阵行列式;m为变量个数。

把X的上述分布记作X~N(μ,∑)。两个独立的正态变量的联合分布如图6-6所示。

图6-6 两个(独)变量的联合概率分布(X、Y为正态变量)

多元正态分布有如下一些重要性质(不作证明):

(1)多元正态变量X的任意线性交换仍然是正态变量,即若X=[x1,x2,…,xm]'服从正态分布N(μ,∑),则任意线性变换仍服从正态分布N(Cμ+D,C∑C')。

这里:

放射性勘探方法

(2)多元正态变量各分量的线性组合服从一元正态分布,即X~

;i=1,2,…,m,C=[c1,c2,…,cm]为任一常向量,则线性组合CX=c1x1+c2x2+…+cmxm服从一元正态分布

放射性勘探方法

由此性质推出如下推论:①多元正态变量的每一个分量服从正态分布;②多元正态变量的任何部分分量之和服从正态分布;③多元正态变量X的任何一个分量子集的分布(称为边缘分布)仍服从正态分布;④多元正态变量X的一阶原点矩μ和二阶中心∑都是存在的。

(3)若X=[x1,x2,…,xm]'和Y=[y1,y2,…,ym]'有联合正态分布:

放射性勘探方法

则X与Y各自独立的主要条件是X中的任一分量和Y中的任一分量的协方差为0,即c12=c21=0。

在地质领域里有许多变量服从正态分布,例如同种正常岩石中γ射线照射量率、某些常量元素的含量、地磁场强度、重力值、地层厚度、矿体厚度以及某些比值数据(如铀镭平衡系数)都服从或接近正态分布。那么正态分布产生的原因是什么呢?用概率论中的中心极限定理可以回答这个问题。中心极限定理给出:只要某个随机变量x是由大量的相互独立的随机因素的总和所构成(x=α+β+…+ε…),而且每一个因素对总和x的影响都是均匀的、微小的(即没有一个是突出的,显著起作用的),那么就可以断定X是服从正态分布的。如果有一个因素或几个因素起显著作用就有可能服从对数正态分布或其他分布。

(三)一元对数正态分布

若随机变量x经过对数变换后lnx服从正态分布,则称x服从一元对数正态分布。如果用f(x)表示x的分布密度函数,则随机变量x的对数正态分布的密度函数为

放射性勘探方法

曲线f(lnx)具有正态分布曲线的全部性质。它在lnx=aL处达到极大值,并以aL的纵轴为对称轴。

曲线f(x)具有单峰不对称特征,即对数正态变量x的概率密度的极大值所对应的x小于x的平均数。x的平均数为

,而f(x)的极大值在

处,因

是大于零的数,故在x轴上极大值在平均数的左侧(图6-7)。

对数正态分布的两个基本参数,即总体对数值的平均数aL和均方差σL

放射性勘探方法

实际应用中,除了用变量x的对数值的平均数aL和均方差σL之外,还经常需要知道x的数学期望E(x)和方差D(x)或均方差

图6-7 对数正态密度函数曲线

为了得到E(x)和D(x)的有效无偏估计量,应首先估计aL及σL再估计E(x)和D(x)。上式计算较复杂,而且如果观测值不精确地符合对数正态分布,用上述方法估计也可能是有偏的。芬尼(1941)证明,只要变异系数小于1.2,相应x的对数方差

,用通常的平均数

作E(x)的估计量是有效的。

经验证明,岩层中的射气浓度、α径迹密度、铀矿化等引起的γ偏高场 (大于均值加一倍均方差的值)内的γ射线照射量率,岩石中铀、钍、钾 (40K)、水中铀含量以及岩石、矿物中的许多其他微量元素含量,其概率分布都可能服从对数正态分布。一般来说,当某种地球化学元素主要集中于某些矿物中或受某些地质因素的控制时,该元素的含量就可能遵循对数正态分布。如氡射气常受构造裂隙的控制,裂隙的分布又常常不均匀,因此氡射气浓度、α径迹密度、210Po 的观测值常呈现对数正态分布或重对数正态分布 (即对变量x作二次对数变换的分布)。

目前对一些地质变量服从对数正态分布的原因提出了一些看法,这些看法认为,对数正态分布可能代表一种混合体。换言之,对数正态总体不一定是一次地质作用过程中形成的,而是多次叠加的结果。

(四)二项分布

一般用于计数型数据,是一种常见的离散型分布。当试验结果统计独立且每次试验中成功的概率相同时,在固定试验次数的条件下,成功次数的分布就服从二项分布。即

放射性勘探方法

式中:pn(k)是在n次试验中事件A出现k次的概率;p是一次试验中事件A出现的概率;q是在一次试验中事件A不出现的概率,

为二项式系数。

(五)泊松分布

它是另一种离散型分布。大家知道,任何一种事物无论是有形的实体还是抽象的事件,在一组对象中出现的次数总是可以计数的。这些对象可以是单元面积、单位体积或相同时间间隔。例如在相同时间间隔内放射性物质衰变产生的并被计数器记录的α粒子数;单元面积内的异常个数或矿床个数等,都是服从泊松分布的离散型随机变量。相反,一旦发现它们不服从泊松分布(例如单元面积内的异常分布),则说明它们不单是随机因素造成的,可能是地理空间上有一个或几个因素控制了异常的分布(例如区域构造因素控制的异常分布)。其概率密度函数为

放射性勘探方法

泊松分布中只有一个参数λ,它既是平均数又是方差。当λ值较小时其概率分布曲线是正偏斜的,当λ≥10时泊松分布就近似于正态分布了。因此泊松分布常用来研究“稀有事件”的概率。不同λ值的泊松分布如图(6-8)所示。

图6-8 对于不同λ值的泊松分布多角形图

对于随机事件,只要具有下列三个条件就可以认为它服从泊松分布。现以单元面积为例说明如下:①事件A(例如异常的出现)在某一单元内出现k个的概率,只与单元面积大小有关而与单元的序次无关;②对于相互间不重叠的单元,A出现的个数相互独立;③当单元面积很小时,A出现的个数≥2(即多于2个)的情况几乎没有。

这时,事件A就服从泊松分布。由于概率P(x=k)的计算工作量大,为了使用方便,有专门的泊松分布表供查阅,也可用下列递推公式计算:

放射性勘探方法

只要知道了p(k=0)的值,则p(1),p(2),…,p(k)就可递推出来。

泊松分布是二项分布的特例,当这p很小且n很大时,用泊松分布可以很好地近似二项分布。一般情况下,当p≤0.1,n≥20时,泊松分布可以用来近似描述二项分布,而且不至于引起显著误差。例如,有n=1023个放射性原子核,在时间间隔t内,一个原子核衰变的概率p=10-23,如果用二项分布计算在时间间隔t中,n个原子核衰变个数为k的概率,由式(6-47)得

放射性勘探方法

显然,按上式计算是很费事的,这时若取均值λ为np=10,则用泊松分布计算就非常简便了。即

放射性勘探方法

(六)指数分布

自然界中,有色、稀有及贵金属矿床的品位、厚度以及某些铀矿床的品位、壤中氡浓度、α径迹密度等变化性很大的随机变量都可能遵循指数分布。它的概率密度函数

放射性勘探方法

指数分布的均值

,方差

图6-9 是指数分布的概率密度函数f(x)的图形。

随机分布的平稳泊松质点流中,质点间隔长度L是服从指数分布的。图6-10反映了某铀矿床地表氡射气浓度近似服从指数分布。图6-11反映了某铀矿床,地表α径迹密度也近似服从指数分布。这说明氡射气浓度及α径迹密度在这两个铀矿床的地表分布是平稳泊松质点流的一种表现。

图6-9 指数分布密度曲线

图6-10 某铀矿床地表氡浓度频率曲线

图6-11 325某铀矿床地表径迹变密度频度曲线

以上列举了数据处理中常见的几种概率分布及应用,值得注意的是,研究方法的不同可能会改变数据分布的特征。例如统计时分组间隔的长度和单个样品体积大小的变化等,都会影响分布的特征。但是当组距适当和样品体积足够大,且某种观测值的频率分布仍不呈现正态分布时,则可断言,在空间上必然存在着非均质的总体,即混合总体。这一点在实践中是有重要意义的。

(七)混合分布

实际中由单一总体构成的分布不多,多数是混合分布,即由多个统计总体构成的分布。从地质成因分析,混合分布产生的原因是二次或多次地质作用的叠加,或多个地质体混合形成的,因此对混合分布的解释有重要的地质意义。

混合分布类型有多峰型和单峰型分布。在单峰型分布中有正偏斜和负偏斜分布。常见有下列三种情况的混合分布:①两个或两个以上正态总体的混合分布;②两个或两个以上对数正态总体的混合分布;③正态总体和对数正态总体的混合分布。

应当指出,单峰型的对数正态分布在一定条件下可能是多个正态总体形成的。从地质成因上分析,它可能是多阶段地质作用发展演化的结果。因此,在这种情况下对数据进行变换(对数变换或其他变换)是不妥当的,应进行分解。下面以3110铀矿床钻孔内伽马射线照射量率的频率分布为例,说明混合分布的特点和研究意义。

图6-12是寒武系中三个含铀矿体层位的γ射线照射量率概率分布曲线。经比较和实际验证:曲线A和A同属于

层,并分别呈指数分布和多峰负偏斜分布,

层是该铀矿床最好的含矿层位;曲线B和B同属于

层。B呈多峰正偏斜分布,反映大型铀矿体,B接近于对数正态分布,反映无矿体存在;曲线C和C同属于

层。C呈单峰强正偏斜分布,有较大型铀矿体;C接近简单正态分布,无矿体存在。

图6-12 某铀矿床Ⅰ、Ⅱ区段三个矿层伽马射线照射量率分布曲线

A—接近b<0的指数分布;B—多峰正偏斜分布;C—单峰正偏斜分布;A—多峰负偏斜分布;B—接近对数正态分布;C—接近对称分布;Ⅰ、Ⅱ—为勘探区中段号;Δ=2.58×10-10(C/kg·h)

从上述例子可以看出,图6-12中频率曲线A、B、C、A具有混合分布的特点,它反映了在长期多次成矿作用下,含矿层位中铀元素在空间上分布的不均匀性。由于这种作用,使原始状态的简单对数正态或正态分布的总体(B、C)变成了混合总体(如B、C),因而使得不含矿层位

在第Ⅰ区段变成了蕴藏大矿体的层位。

工作中,如果需要求得组成混合分布的各单个总体分布的均值和方差,必须对它进行分解。

分离混合分布曲线的方法主要有三种:解析法、图解法及数学法。这里只介绍图解法。

众所周知,在正态概率纸上,一元正态分布表现为一条确定的直线(一元对数正态分布为一条凹面向上的曲线)。在对数概率纸上,一元对数正态分布表现为一条直线(一元正态分布是一条凹面向下的曲线),而且不同的直线斜率是不同正态或对数正态总体的表现。利用这些特征可以进行混合总体的分离,并检验它所服从的分布规律。正确估计各总体的平均数和均方差。

通常,在概率纸上,若频率分布出现两个或两个以上直线段,表明为混合总体。每一个直线段对应一个正态总体(在对数概率纸上对应的是对数正态总体)。

为了对混合总体分解,首先根据频率分布曲线判断概率分布可能所属的分布类型,以便决定分组方式和是否进行变量转换等。

下面举一个混合总体分解的实例。

用滑动窗口法计算某地区γ详测数据的偏度系数,得到频率分布曲线,示于图6-13。从图上曲线可以看出,它显然是两个正态总体的混合分布。实践表明,B峰对应细粒黑云母花岗岩,不含铀矿床。A峰对应中黑云母花岗岩,含大型铀矿床。分解这两个正态总体的方法如下:首先找出拐点,即图6-14中*处,拐点纵坐标为26%,这说明A、B总体各占混合总体的74%和26%。

图6-13 某地区实测γ详测滑动窗口内偏度系数的频率分布曲线和频数分布直方图

从图6-14中知,1号点占混合总体的10.1%,即占B总体的10.1/26=38.8%。同理,2号点占89.3%,点出并连接(0.50,38.3%)和(1.50,89.3%)两点,其连接线即是B总体的展直线T1,由此求出均值为0.69,均方差为0.78。3号点占混合总体的38.7%,故对于A总体来说.从-∞积分到3.0的累积频率为(38.7-26)÷74%=17.2%。同理:4、5、6号点分别求得相应于A总体的累积频率为54.1%、80.95%、90%。在概率纸上点出(2.75,17.2%)、(3.75,54.1%)、(4.75,80.95%)、(5.25,90%)即3'、4'、5'、6'点。连接这四点即得A总体的展直线T2。由此求出偏度系数的均值为3.8,均方差为1.48。

对数正态混合总体的分解,可采用:①在正态概率纸上用对数值作图;②在对数概率纸上用原始值作图。

上面讨论了两个正态总体形成的混合分布的图解分离方法,实际工作中并不那么简单,一般要想有效地分离混合总体,必须具备下列条件中的一个或几个:①知道总体分布的函数关系式,最好是知道它们的参数表达式;②补充测定其他标志,例如岩性或地理位置;③各总体的分布参数差异明显;④形成混合分布的总体不太多。

混合分布分解后要估计出各总体的参数值,考查不同总体的地理分布,以便圈定各种图件,例如相对等值图(数值不同但级别相同的点连接成圆滑线所构成的图)。

图6-14 两个正态总体的混合总体分布的分解图

温馨提示:答案为网友推荐,仅供参考

相关了解……

你可能感兴趣的内容

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 非常风气网