概率论与数理统计知识整理(2)--二维随机变量的分布

前面讲到的随机变量都是一维的,但是某些试验中随机变量可能有多个,这里主要讨论二维的随机变量。

联合分布函数

假设 \(X\)\(Y\) 都是随机变量,那么我们定义其分布函数如下:

\[ F(x,y) = P ((X \le x)\cap(Y \le y)) = P (X \le x, Y \le y )\]

上面的 \(F(x,y)\) 称作随机变量(X,Y)的分布函数,也叫作联合分布函数

离散型随机变量联合分布

如果上面的 \(X\)\(Y\) 都是离散随机变量,那么对于 \((X,Y)\) 的所有取值可记为

\[P(X=x_i, Y=y_i) = p_{ij},i,j=1,2,....\]

上面的所有P的取值为二维离散随机变量的分布律,也叫联合分布律。直观用表格表示如下所示

连续型随机变量联合分布

类似地,如果上面的X和Y都是连续随机变量,那么分布函数可定义为

\[ F(x,y) = \int_{-\infty}^y\int_{-\infty}^xf(u,v)dudv \]

其中 \(f(x,y)\) 被称为概率密度函数,也叫联合概率密度函数

其性质与一维随机变量的概率密度函数非常相似

  1. \[f(x,y) \ge 0\]

  2. \[\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f(x,y)dxdy = F(\infty,\infty)\]

3.设 \(G\)\(xOy\) 平面上的区域,点 \((X,Y)\) 落在G内的概率为

\[P((X,Y)\in G) = \int\int f(x,y)dxdy\]

4.若 \(f(x,y)\) 在点 \((x, y)\) 连续,则

\[\frac{\partial^2F(X,Y)}{\partial x \partial y} = f(x, y)\]

边缘分布函数

二维随机变量 \((X,Y)\) 作为一个整体的时候,其分布函数为联合分布函数,但是 \(X\)\(Y\) 是随机变量,各自也有分布函数,将其分别记为 \(F_X(x),F_Y(y)\),称为随机变量 \((X,Y)\) 关于 \(X\) 和关于 \(Y\)边缘分布函数

边缘分布函数可通过联合分布函数确定,关系如下

\[F_X(x) = P(X \le x) = P(X \le x,Y \lt \infty) = F(x, \infty)\]

\[F_X(x) = F(x,\infty)\]

也就是说在联合分布函数 \(F(x,y)\) 中令 \(y \rightarrow \infty\) 即可得到边缘分布 \(F_X(x)\), 同理\[F_Y(y) = F(\infty, y)\]

下面分别以离散型随机变量和连续性随机基量为例说明

离散型随机变量边缘分布

假如 \(X\)\(Y\) 是离散型随机变量,那么随机变量 \((X,Y)\) 关于 \(X\) 和关于 \(Y\) 的边缘分布定义下

\[p_{i.} = \sum_{j=1}^{\infty} p_{ij} = P(X = x_i), i=1,2,3.....n\]

\[p_{.j} = \sum_{i=1}^{\infty} p_{ij} = P(Y = y_j), j=1,2,3.....n\]

上面的式子分别称为随机变量 \((X,Y)\) 关于 \(X\) 和关于 \(Y\)边缘分布率

连续型随机变量边缘分布

假如 \(X\)\(Y\) 分别是连续性随机变量,那么随机变量 \((X,Y)\) 关于 \(X\)边缘分布函数定义为

\[F_X(x) = F(x,\infty) = \int_{-\infty}^{x}(\int_{-\infty}^{\infty}f(x,y)dy)dx\]

\[ f_X(x) = \int_{-\infty}^{\infty}f(x,y)dy\]

则被称为随机变量 \((X,Y)\) 关于 \(Y\)边缘概率密度函数

条件分布

由条件概率可以比较容易推导出条件分布的含义,其定义如下:

离散型随机变量的条件分布

对于离散型随机变量,条件分布的定义如下:

\((X,Y)\) 是二维离散型随机变量,对于固定的 \(j\),若 \(P(Y=y_j) \gt 0\), 则称 \[P(X = x_i|Y= y_j) = \frac{P(X = x_i, Y=y_j)}{P(Y=y_j)} = \frac{p_{ij}}{p_{.j}}, i = 1,2,3\] 为在 \(Y=y_j\) 条件下随机变量X的条件分布律。同理,交换 \(X\)\(Y\) 的位置得到的是在 \(X=x_i\) 条件下随机变量 \(Y\) 的条件分布律。

连续型随机变量的条件分布

对于连续型的随机变量,条件分布的定义如下:

设二维随机变量 \((X,Y)\) 的概率密度函数为 \(f(x,y),(X,Y)\) 关于 \(Y\) 的边缘概率密度为 \(f_Y(y)\) .若对于固定的 \(y,f_Y(y) >0\) ,则称 \(\frac{f(x,y)}{f_Y(y)}\) 为在 \(Y=y\) 的条件下 \(X\) 的条件概率密度。记为 \[f_{X|Y}(x|y) = \frac{f(x,y)}{f_Y(y)}\]

有了条件概率密度(就是条件概率密度函数),我们也可以定义出条件分布函数如下

\[\int_{-\infty}^x f_{X|Y}(x|y)dx = \int_{-\infty}^x \frac{f(x,y)}{f_Y(y)}dx\]

上面的函数为在 \(Y=y\) 的条件下 \(X\) 的条件分布函数,记为

\(F_{X|Y}(x|y) = P(X \le x| Y=y)\)

相互独立的随机变量

两个随机变量 \(X,Y\) 相互独立的充要条件如下:

\(F(x,y) = F_X(x)F_Y(y)\)

上面的 \(F(x,y),F_X(x),F_Y(y)\) 分别是二维随机变量的联合分布函数及关于 \(X\)\(Y\) 的边缘分布函数。

除了通过分布函数,对于具体的连续型随机变量或离散型随机变量,还可通过概率密度函数和分布律来定义相互独立的条件。

对于连续型随机变量,上面的式子等价于

\(f(x,y) = f_X(x)f_Y(y)\)

式子中的 \(f(x,y),f_X(x),f_Y(y)\) 分别为 随机变量 \((X,Y)\) 的条件概率密度函数和边缘概率密度函数。

对于离散型随机变量则有:

\(P(X = x_i, Y = y_j) = P(X=x_i)P(Y=y_j)\)

二维随机变量的函数的分布

在讨论一维随机变量的分布函数的时候,也讨论了一维随机变量的函数的分布函数,同样对于二维随机变量,我们也可以讨论其函数的分布函数。下面主要讨论 \(Z=X+Y\)\(Z=XY\)\(Z=Y/X\)\(M=max(X,Y)\)\(N=min(X,Y)\) 这几个函数的分布函数(\(X,Y\) 为相互独立的随机变量),这里主要给出具体的公式,证明省略。

\(Z = X + Y\) 的分布

\((X,Y)\) 是二维连续型随机变量,其概率密度函数为 \(f(x,y)\)\(Z = X+Y\)仍然为连续性随机变量,其概率密度函数为

\[f_{X+Y}(z) = \int_{-\infty}^{\infty} f(z-y,y)dy\]\[f_{X+Y}(z) = \int_{-\infty}^{\infty} f(x,z-x)dx\]

\(X,Y\) 相互独立时,其边缘概率密度函数具有以下性质

\(f(x,y) = f_X(x)f_Y(y)\)

因此上面的式子也可以化成下面的形式

\[f_{X+Y}(z) = \int_{-\infty}^{\infty} f_X(z-y)f_Y(y)dy\]

\[f_{X+Y}(z) = \int_{-\infty}^{\infty} f_X(x)f_Y(z-x)dx\]

\(Z=XY\)\(Z=Y/X\) 的分布

\((X,Y)\) 是二维连续型随机变量,其概率密度函数为 \(f(x,y)\)\(Z = \frac{Y}{X},Z = XY\)仍然为连续性随机变量,其概率密度函数为

\[f_{Y/X}(z) = \int_{-\infty}^{\infty} |x|f(x,xz)dx\]

\[f_{XY}(z) = \int_{-\infty}^{\infty} \frac{1}{|x|}f(x,z/x)dx\]

\(X,Y\) 相互独立时,同样有下面的性质

\[f_{Y/X}(z) = \int_{-\infty}^{\infty} |x|f_X(x)f_Y(xz)dx\]

\[f_{XY}(z) = \int_{-\infty}^{\infty} \frac{1}{|x|}f_X(x)f_Y(z/x)dx\]

\(M = max(X,Y)\)\(N = min(X,Y)\) 的分布

讨论 \(max(X,Y)\)\(min(X,Y)\) 的分布的时候, 一般假设 \(X, Y\) 相互独立,因为这样才有下面的性质。

对于 \(M = max(X,Y)\) 的分布有

\(F_{max}(z) = P(M \le z) = P(X \le z, Y \le z) = P(X \le z)P(Y \le z)\)

由于 \(X\)\(Y\) 相互独立,因此有

\(F_{max}(z) = F_X(z)F_Y(z)\)

同样对 \(N = min(X,Y)\)

\(F_{min}(z) = P(N \le z) = 1 - P(N \gt z) = 1 - P(X > z)P(Y>z)\)

\(F_{min}(z) = 1 - (1 - F_X(z))(1 - F_Y(z))\)

推广到 \(n\) 个相互独立的随机变量有下面的性质

\(M = max \lbrace X_1,X_2...,X_n \rbrace\)\(N = min\lbrace X_1,X_2...,X_n \rbrace\) 的分布函数分别为

\[F_{max}(z) = F_{X_1}(z)F_{X_2}(z)...F_{X_n}(z)\]

\[F_{min}(z) = 1 - (1 - F_{X_1}(z))(1 - F_{X_2}(z))...(1 - F_{X_n}(z))\]

而当 $ X_1,X_2...,X_n $ 独立同分布的时候,上式变为如下所示

\[F_{max}(z) = [F(z)]^n\]

\[F_{min}(z) = 1 - (1 - F(z))^n\]