您的当前位置:首页概率论与数理统计公式全

概率论与数理统计公式全

2023-04-29 来源:爱问旅游网
第1章 随机事件及其概率

(1)排列组合公式 nCmnPmm! 从m个人中挑出n个人进行排列的可能数。 (mn)!m! 从m个人中挑出n个人进行组合的可能数。 n!(mn)!加法原理(两种方法均能完成此事):m+n 某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完(2)加成。 法和乘乘法原理(两个步骤分别不能完成这件事):m×n 法原理 某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m×n 种方法来完成。 (3)一重复排列和非重复排列(有序) 些常见对立事件(至少有一个) 排列 顺序问题 (4)随如果一个试验在相同条件下可以重复进行,而每次试验的可能机试验结果不止一个,但在进行一次试验之前却不能断言它出现哪个和随机结果,则称这种试验为随机试验。 事件 试验的可能结果称为随机事件。 (5)基在一个试验下,不管事件有多少个,总可以从其中找出这样一本事件、组事件,它具有如下性质: 样本空①每进行一次试验,必须发生且只能发生这一组中的一个事间和事件; 件 ②任何事件,都是由这一组中的部分事件组成的。 这样一组事件中的每一个事件称为基本事件,用来表示。 基本事件的全体,称为试验的样本空间,用表示。 一个事件就是由中的部分点(基本事件)组成的集合。通常用大写字母A,B,C,…表示事件,它们是的子集。 为必然事件,为不可能事件。 不可能事件()的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。 ①关系: 如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):AB 如果同时有AB,BA,则称事件A与事件B等价,或称A等于B:A=B。 (6)事件的关系与运算 A、B中至少有一个发生的事件:AB,或者A+B。 属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者AB,它表示A发生而B不发生的事件。 A、B同时发生:AB,或者AB。AB=,则表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。基本事件是互不相容的。 -A称为事件A的逆事件,或称A的对立事件,记为A。它表示A不发生的事件。互斥未必对立。 ②运算: 结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B)∪C 分配率:(AB)∪C=(A∪C)∩(B∪C) (A∪B)∩C=(AC)∪(BC) 德摩根率: AAii1i1i ABAB,ABAB 设为样本空间,A为事件,对每一个事件A都有一个实(7)概数P(A),若满足下列三个条件: 1° 0≤P(A)≤1, 率的公2° P(Ω) =1 3° 对于两两互不相容的事件A1,A2,…有 理化定常称为可列(完全)可加性。 义 则称P(A)为事件A的概率。 1° 1,2n, (8)古典概型 1。 n设任一事件A,它是由1,2m组成的,则有 2° P(1)P(2)P(n)P(A)=(1)(2)(m) =P(1)P(2)P(m) 若随机试验的结果为无限不可数并且每个结果出现的可能性(9)几何概型 均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件A, P(A)L(A)。其中L为几何度量(长度、面积、体积)。 L()(10)加P(A+B)=P(A)+P(B)-P(AB) 法公式 当P(AB)=0时,P(A+B)=P(A)+P(B) P(A-B)=P(A)-P(AB) (11)减当BA时,P(A-B)=P(A)-P(B) 法公式 当A=Ω时,P(B)=1- P(B) P(AB)为事件A发P(A)(12)条生条件下,事件B发生的条件概率,记为P(B/A)P(AB)。 P(A)定义 设A、B是两个事件,且P(A)>0,则称件概率 条件概率是概率的一种,所有概率的性质都适合于条件概率。 例如P(Ω/B)=1P(B/A)=1-P(B/A) 乘法公式:P(AB)P(A)P(B/A) (13)乘更一般地,对事件A1,A2,…An,若P(A1A2…An-1)>0,则有 法公式 P(A1A2…An)P(A1)P(A2|A1)P(A3|A1A2)……P(An|A1A2…An1)。 ①两个事件的独立性 设事件A、B满足P(AB)P(A)P(B),则称事件A、B是相互独立的。 若事件A、B相互独立,且P(A)0,则有 若事件A、B相互独立,则可得到A与B、A与B、A与B也都相互独立。 必然事件和不可能事件与任何事件都相互独立。 与任何事件都互斥。 ②多个事件的独立性 立性 设ABC是三个事件,如果满足两两独立的条件, P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足P(ABC)=P(A)P(B)P(C) 那么A、B、C相互独立。 对于n个事件类似。 设事件B1,B2,,Bn满足 (15)全概公式 1°B1,B2,,Bn两两互不相容,P(Bi)0(i1,2,,n), 2°则有 ABii1n(14)独, P(A)P(B1)P(A|B1)P(B2)P(A|B2)P(Bn)P(A|Bn)。 设事件B1,B2,…,Bn及A满足 (16)贝1° B1,B2,…,Bn两两互不相容,P(Bi)>0,i1,2,…,n, 叶斯公式 2° 则 ABii1n,P(A)0, ,i=1,2,…n。 jP(Bi/A)P(Bi)P(A/Bi)P(B)P(A/B)jj1n此公式即为贝叶斯公式。 P(Bi),(i1,2,…,n),通常叫先验概率。P(Bi/A),(i1,2,…,n),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。 我们作了n次试验,且满足 每次试验只有两种可能结果,A发生或A不发生; n次试验是重复进行的,即A发生的概率每次均一样; 每次试验是独立的,即每次试验A发生与否与其他次试(17)伯验A发生与否是互不影响的。 n努利概这种试验称为伯努利概型,或称为重伯努利试验。 型 用p表示每次试验A发生的概率,则A发生的概率为1pq,用Pn(k)表示n重伯努利试验中A出现k(0kn)次的概率, Pn(k)Cnpkqnk,k0,1,2,,n。 k第二章 随机变量及其分布

(1)离散型随机变量的分布律 设离散型随机变量X的可能取值为Xk(k=1,2,…)且取P(X=xk)=pk,k=1,2,…, 则称上式为离散型随机变量X的概率分布或分布律。Xx1,x2,,xk,|P(Xxk)p1,p2,,pk,。 显然分布律应满足下列条件: (1)pk0,k1,2,, (2)k1xpk1。 F(x)是随机变量X的分布函数,若存在非负函数f(x),设(2)连续型随机变量的分布密度 , 则称X为连续型随机变量。f(x)称为X的概率密度函数或密度函数具有下面4个性质: F(x)f(x)dx1° f(x)0。 2° f(x)dx1。 (3)离散与连续型随机变积分元f(x)dx在连续型随机变量理论中所起的作用与P(X量的关系 (4)分布函数 设X为随机变量,x是任意实数,则函数 称为随机变量X的分布函数,本质上是一个累积函数。 P(aXb)F(b)F(a) 可以得到X落入区间(a,b率。 分布函数具有如下性质: 1° 0F(x)1, x; 2° F(x)是单调不减的函数,即x1x2时,有 F(x1)xx3° F()limF(x)0, F()limF(x)1; 4° F(x0)F(x),即F(x)是右连续的; 5° P(Xx)F(x)F(x0)。 对于离散型随机变量,F(x)对于连续型随机变量,F(x)(5)八大分布 0-1P(X=1)=p, P(X=0)=q 分布 二项分xkxxpk; f(x)dx 。 在n重贝努里试验中,设事件A发生的概率为p。事kP(Xk)Pn(k)Cnpkqnk, 其中q1p,0p1则称随机变量X服从参数为n,p的二项分布。记为布 当n1时,P(Xk)pkq1k,k0.1,这就是(0-1泊松分布 设随机变量X的分布律为 P(Xk)kk!e,0,k0,1,2, 则称随机变量X服从参数为的泊松分布,记为X~泊松分布为二项分布的极限分布(np=λ,n→∞)。超几何分布 几何分布 均匀分P(Xk)qk1p,k1,2,3,,其中p≥0,q=1-p。 随机变量X服从参数为n,N,M的超几何分布,记为随机变量X服从参数为p的几何分布,记为G(p)。设随机变量X的值只落在[a,b]内,其密度函数f(1,a≤x≤b f(x)ba 其他, 0,布 则称随机变量X在[a,b]上服从均匀分布,记为X~分布函数为 0, xb。 当a≤x1(1)离散型 联合分布 如果二维随机向量(X,Y)的所有可能取值为至设=(X,Y)的所有可能取值为(xi,yj)(i,j1,2,为=(X,Y)的分布律或称为X和Y的联合分布律。 Y y1 X x1 x2 y2 … yj … p11 p21 p12 p22 … … … p1j p2j … … xi pi1 … 这里pij具有下面两个性质: (1)pij≥0(i,j=1,2,…); (2)pij1. ij连续型 对于二维随机向量(X,Y),如果存在非负函数f(x轴的矩形区域D,即D={(X,Y)|ax1时,有F(x2,y)≥F(x1,y);当y2>y1时,有F(x,y2) ≥F(x,y1); (3)F(x,y)分别对x和y是右连续的,即 (4)F(,)F(,y)F(x,)0,F(,)1. (5)对于x1x2,y1y2, F(x2,y2)F(x2,y1)F(x1,y2)F(x1,y1)0. (4) 离散型与连续型的关系 (5)离散型 边缘分布 X的边缘分布为 Pi•P(Xxi)pij(i,j1,2,); jY的边缘分布为 P•jP(Yyj)pij(i,j1,2,)。 i连续型 X的边缘分布密度为 Y的边缘分布密度为 (6)离散型 条件分布 连续型 在已知X=xi的条件下,Y取值的条件分布为 在已知Y=yj的条件下,X取值的条件分布为 在已知Y=y的条件下,X的条件分布密度为 f(x|y)f(x,y); fY(y)在已知X=x的条件下,Y的条件分布密度为 (7)一般型 独立离散型 性 连续型 F(X,Y)=FX(x)FY(y) 有零不独立 f(x,y)=fX(x)fY(y) 直接判断,充要条件: ①可分离变量 ②正概率密度区间为矩形 二维正态分布 随机变量的函数 =0 若X1,X2,…Xm,Xm+1,…Xn相互独立, h,g为连续函数,h(X1,X2,…Xm)和g(Xm+1,…Xn)相互独立。 特例:若X与Y独立,则:h(X)和g(Y)独立。 例如:若X与Y独立,则:3X+1和5Y-2独立。 (8)设随机向量(X,Y)的分布密度函数为 二维其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)~均匀例如图、图和图。 分布 y 1 D1 O 1 图 x y 1 O 2 图 1 D 2 x y d c O a b x 图 D3 (9)设随机向量(X,Y)的分布密度函数为 二维其中1,2,10,20,||1是5个参数,则称(X,Y)服从二维正态分布, 22正态记为(X,Y)~N(1,2,1,2,). 分布 由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布2即X~N(1,12),Y~N(2,2). 2但是若X~N(1,12),Y~N(2,2),(X,Y)未必是二维正态分布。 (10Z=X+Y )函数分布 根据定义计算:FZ(z)P(Zz)P(XYz) 对于连续型,fZ(z)=f(x,zx)dx 两个独立的正态分布的和仍为正态分布(12,12n个相互独立的正态分布的线性组合,仍服从正态分Cii, 2Ci2i2 iiZ=max,min(X1,X2,…Xn) 2分布 若X1,X2Xn相互独立,其分布函数分别为Fx(x),F1设n个随机变量X1,X2,,Xn相互独立,且服从标准的分布密度为 我们称随机变量W服从自由度为n的2分布,记为所谓自由度是指独立正态随机变量的个数,它是2分布满足可加性:设 则 t分布 设X,Y是两个相互独立的随机变量,且 可以证明函数 的概率密度为 我们称随机变量T服从自由度为n的t分布,记为TF分布 设X~2(n1),Y~2(n2),且X与Y独立,可以证明F我们称随机变量F服从第一个自由度为n1,第二个自第四章 随机变量的数字特征

(1) 一维期望 随机期望就是平均值 变量的数字特函数的期望 征 方差 D(X)=E[X-E(X)]2, 标准差 离散型 连续型 设X是离散型随机变量,设X是连续型随机变量,其分布律为P(Xxk)=(要求绝对收敛) pk,k=1,2,…,n, (要求绝对收敛) Y=g(X) Y=g(X) (X)D(X), 矩 ①对于正整数k,称随机①对于正整数k,称随机k变量X的k次幂的数学期νk=E(X)=xkf(x)dx, 望为X的k阶原点矩,记 k=1,2, …. 为vk,即 νk=E(Xk)= xikpi, i②对于正整数k,称随机变即 =(xE(X))kf(x)dx, k=1,2, …. ②对于正整数k,称随机k=1,2, …. 变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为k,即 =(xiiE(X))kpi, k=1,2, …. 切比雪夫不等式 设随机变量X具有数学期望E(X)=μ,方差D(X)切比雪夫不等式给出了在未知X的分布的情况下,对的一种估计,它在理论上有重要意义。 (2)期望的性质 (4) E(XY)=E(X) E(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 (1) E(C)=C (2) E(CX)=CE(X) (3) E(X+Y)=E(X)+E(Y),E(CiXi)CiE(Xi) i1i1nn(3)方差的性质 (1) D(C)=0;E(C)=C (2) D(aX)=aD(X); E(aX)=aE(X) (3) D(aX+b)= aD(X); E(aX+b)=aE(X)+b (4) D(X)=E(X)-E(X) (5) D(X±Y)=D(X)+D(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 D(X±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))],无条件成立。 而E(X+Y)=E(X)+E(Y),无条件成立。 2222(4) 常见分布的期望和方差 0-1分布B(1,p) 二项分布B(n,p) 泊松分布P() 几何分布G(p) 期望 p np 超几何分布H(n,M,N) 均匀分布U(a,b) 指数分布e() 正态分布N(,2) t分布 n 0 E[G(X,Y)]= (5)期望 二维函数的期望 随机方差 E[G(X,Y)]= 变量协方差 的数字特相关系数 征 对于随机变量X与Y,称它们的二阶混合中心矩11为与记号XY相对应,X与Y的方差D(X)与D(Y)也对于随机变量X与Y,如果D(X)>0, D(Y)>0,则称为X与Y的相关系数,记作XY(有时可简记为)。 ||≤1,当||=1时,称X与Y完全相关:P(完全相关而当0时,称X与Y不相关。 以下五个命题是等价的: ①XY0; ②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y). 协方差矩阵 混合矩 对于随机变量X与Y,如果有E(XkYl)存在,则称之(6)(i) cov (X, Y)=cov (Y, X); 协方(ii) cov(aX,bY)=ab cov(X,Y); 差的(iii) cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y); 性质 (iv) cov(X,Y)=E(XY)-E(X)E(Y). (7)(i) 若随机变量X与Y相互独立,则XY0;反之不真。 2,), 独立(ii) 若(X,Y)~N(1,2,12,2和不相关 则X与Y相互独立的充要条件是X和Y不相关。 第五章 大数定律和中心极限定理

(1)大切数定律 比雪夫大数定律 伯努利大数定律 设μ是n次独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意的正数ε,有 伯努利大数定律说明,当试验次数n很大时,事件A设随机变量X1,X2,…相互独立,均具有有限方差,且被同一常数C所界:D(Xi)(1)总数理体 统计的基个本概体 在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。 总体中的每一个单元称为样品(或个体)。 念 样本 我们把从总体中抽取的部分样品x1,x2,,xn称为样本。样本中所含的样品数称为样本容量,一般用n表示。在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,x1,x2,,xn表示n个随机变量(样本);在具体的一次抽取之后,x1,x2,,xn表示n个具体的数值(样本值)。我们称之为样本的两重性。 样本函数和统计量 设x1,x2,,xn为总体的一个样本,称  (x1,x2,,xn) 为样本函数,其中为一个连续函数。如果中不包含任何未知参数,则称(x1,x2,,xn)为一个统计量。 常见统计量样本均值 1nxxi. ni1样本方差 1n2S(xx). in1i12样本标准差 1n2S(xx). in1i1样本k阶原点矩 及样本k阶中心矩 其性质 E(X),D(X) 2n, n12, nE(S2)2,E(S*2)21n其中S*(XiX)2,为二阶中心矩。 ni1(2)正正态态总体分下的布 设x1,x2,,xn为来自正态总体N(,2)的一个样本,则样本函数 四大t分设x1,x2,,xn为来自正态总体N(,2)的一个样本,则样本分布 布 函数 其中t(n-1)表示自由度为n-1的t分布。 设x1,x2,,xn为来自正态总体N(,2)的一个样本,则样本函数 其中2(n1)表示自由度为n-1的2分布。 2F分设x1,x2,,xn为来自正态总体N(,1)的一个样本,而布 2)的一个样本,y1,y2,,yn为来自正态总体N(,2则样本函数 其中 F(n11,n21)表示第一自由度为n11,第二自由度为n21的F分布。 (3)正态总体下分布的性质 X与S2独立。 第七章 参数估计

(1)矩点估估计 计 设总体X的分布中包含有未知数1,2,,m,则其分布函数可以表成F(x;1,2,,m).它的k阶原点矩vkE(Xk)(k1,2,,m)中也包含了未知参数1,2,,m,即vkvk(1,2,,m)。又设x1,x2,,xn为总体X的n个样本值,其样本的k阶原点矩为 这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有 由上面的m个方程中,解出的m个未知参数(1,2,,m)即为参数(1,2,,m)的矩估计量。 若为的矩估计,g(x)为连续函数,则g(ˆ)为g()的矩估计。 极大似然估计 当总体X为连续型随机变量时,设其分布密度为f(x;1,2,,m),其中1,2,,m为未知参数。又设x1,x2,,xn为总体的一个样本,称 为样本的似然函数,简记为Ln. 当总体X为离型随机变量时,设其分布律为P{Xx}p(x;1,2,,m),则称 为样本的似然函数。 若似然函数L(x1,x,,xn;1,,,m)在1,,,m处取222到最大值,则称1,,,m分别为1,,,m的最大似然估22计值,相应的统计量称为最大似然估计量。 若为的极大似然估计,g(x)为单调函数,则g(ˆ)为g()的极大似然估计。 (2)无估计偏设(x1,x2,,xn)为未知参数的估计量。若E ()=,则称 为的无偏估计量。 量的性 E(X)=E(X), E(S2)=D(X) 评选有标准 效性 设11(x1,x,2,,xn)和22(x1,x,2,,xn)是未知参数的两个无偏估计量。若D(1)D(2),则称1比2有效。 一致设n是的一串估计量,如果对于任意的正数,都有 则称n为的一致估计量(或相合估计量)。 性 若为的无偏估计,且D(ˆ)0(n),则为的一致估计。 只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。 (3)置区间信估计 区间和置信度 单正态总体的设x1,x,2,,xn为总体X~N(,2)的一个样本,在置信度为1下,我们来确定和2的置信区间[1,2]。具体步骤如设总体X含有一个待估的未知参数。如果我们从样本x1,x,2,,xn出发,找出两个统计量11(x1,x,2,,xn)与22(x1,x,2,,xn)(12),使得区间[1,2]以1(01)的概率包含这个待估参数,即 那么称区间[1,2]为的置信区间,1为该区间的置信度(或置信水平)。 下: (i)选择样本函数; (ii)由置信度1,查表找分位数; (iii)导出置信区间[1,2]。 期望和方差的区间估计 已知方差,估计均值 (i)选择样本函数 (ii) 查表找分位数 (iii)导出置信区间 未知方差,估计均值 (i)选择样本函数 (ii)查表找分位数 (iii)导出置信区间 方差的区间估计 (i)选择样本函数 (ii)查表找分位数 (iii)导出的置信区间 第八章 假设检验

基假设检验的统计思想是,概率很小的事件在一次试验中可以认为本基本上是不会发生的,即小概率原理。 思 为了检验一个假设H0是否成立。我们先假定H0是成立的。如果根想 据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的。与H0相对的假设称为备择假设,用H1表示。 这里所说的小概率事件就是事件{KR},其概率就是检验水平α,通常我们取α=,有时也取或。 基假设检验的基本步骤如下: 本步骤 (i) 提出零假设H0; (ii) 选择统计量K; (iii) 对于检验水平α查表找分位数λ; (iv) 由样本值x1,x2,,xn计算统计量之值K; 将K与进行比较,作出判断:当|K|(或K)时否定H0,否则认为H0相容。 两第一类当H0为真时,而样本值却落入了否定域,按照我们规定的检类错误 错误 验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记为犯此类错误的概率,即 P{否定H0|H0为真}=; 此处的α恰好为检验水平。 第二类当H1为真时,而样本值却落入了相容域,按照我们规定的检错误 验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记为犯此类错误的概率,即 P{接受H0|H1为真}=。 两类错人们当然希望犯两类错误的概率同时都很小。但是,当误的关容量n一定时,变小,则变大;相反地,变小,则变系 大。取定要想使变小,则必须增加样本容量。 在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显着性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如,甚至。反之,则应把α取得大些。 单正态总体均值和方差的假设检验

条零假设 件 已 知 2 对应样本 统计量 函数分布 N(0,1) 未 知 2 未 知 2

因篇幅问题不能全部显示,请点此查看更多更全内容