前面讲到的随机变量都是一维的,但是某些试验中随机变量可能有多个,这里主要讨论二维的随机变量。
联合分布函数
假设 $X$ 和 $Y$ 都是随机变量,那么我们定义其分布函数如下:
$$ F(x,y) = P ((X \le x)\cap(Y \le y)) = P (X \le x, Y \le y )$$
上面的 $F(x,y)$ 称作随机变量(X,Y)的分布函数,也叫作联合分布函数。
离散型随机变量联合分布
如果上面的 $X$ 和 $Y$ 都是离散随机变量,那么对于 $(X,Y)$ 的所有取值可记为
$$P(X=x_i, Y=y_i) = p_{ij},i,j=1,2,….$$
上面的所有P的取值为二维离散随机变量的分布律,也叫联合分布律。直观用表格表示如下所示
连续型随机变量联合分布
类似地,如果上面的X和Y都是连续随机变量,那么分布函数可定义为
$$ F(x,y) = \int_{-\infty}^y\int_{-\infty}^xf(u,v)dudv $$
其中 $f(x,y)$ 被称为概率密度函数,也叫联合概率密度函数。
其性质与一维随机变量的概率密度函数非常相似
$$f(x,y) \ge 0$$
$$\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f(x,y)dxdy = F(\infty,\infty)$$
3.设 $G$ 是 $xOy$ 平面上的区域,点 $(X,Y)$ 落在G内的概率为
$$P((X,Y)\in G) = \int\int f(x,y)dxdy$$
4.若 $f(x,y)$ 在点 $(x, y)$ 连续,则
$$\frac{\partial^2F(X,Y)}{\partial x \partial y} = f(x, y)$$
边缘分布函数
二维随机变量 $(X,Y)$ 作为一个整体的时候,其分布函数为联合分布函数,但是 $X$ 和 $Y$ 是随机变量,各自也有分布函数,将其分别记为 $F_X(x),F_Y(y)$,称为随机变量 $(X,Y)$ 关于 $X$ 和关于 $Y$ 的边缘分布函数。
边缘分布函数可通过联合分布函数确定,关系如下
$$F_X(x) = P(X \le x) = P(X \le x,Y \lt \infty) = F(x, \infty)$$
即
$$F_X(x) = F(x,\infty)$$
也就是说在联合分布函数 $F(x,y)$ 中令 $y \rightarrow \infty$ 即可得到边缘分布 $F_X(x)$, 同理$$F_Y(y) = F(\infty, y)$$
下面分别以离散型随机变量和连续性随机基量为例说明
离散型随机变量边缘分布
假如 $X$ 和 $Y$ 是离散型随机变量,那么随机变量 $(X,Y)$ 关于 $X$ 和关于 $Y$ 的边缘分布定义下
$$p_{i.} = \sum_{j=1}^{\infty} p_{ij} = P(X = x_i), i=1,2,3…..n$$
$$p_{.j} = \sum_{i=1}^{\infty} p_{ij} = P(Y = y_j), j=1,2,3…..n$$
上面的式子分别称为随机变量 $(X,Y)$ 关于 $X$ 和关于 $Y$ 的边缘分布率。
连续型随机变量边缘分布
假如 $X$ 和 $Y$ 分别是连续性随机变量,那么随机变量 $(X,Y)$ 关于 $X$ 的边缘分布函数定义为
$$F_X(x) = F(x,\infty) = \int_{-\infty}^{x}(\int_{-\infty}^{\infty}f(x,y)dy)dx$$
而
$$ f_X(x) = \int_{-\infty}^{\infty}f(x,y)dy$$
则被称为随机变量 $(X,Y)$ 关于 $Y$ 的 边缘概率密度函数
条件分布
由条件概率可以比较容易推导出条件分布的含义,其定义如下:
离散型随机变量的条件分布
对于离散型随机变量,条件分布的定义如下:
设 $(X,Y)$ 是二维离散型随机变量,对于固定的 $j$,若 $P(Y=y_j) \gt 0$, 则称
$$P(X = x_i|Y= y_j) = \frac{P(X = x_i, Y=y_j)}{P(Y=y_j)} = \frac{p_{ij}}{p_{.j}}, i = 1,2,3$$
为在 $Y=y_j$ 条件下随机变量X的条件分布律。同理,交换 $X$ 和 $Y$ 的位置得到的是在 $X=x_i$ 条件下随机变量 $Y$ 的条件分布律。
连续型随机变量的条件分布
对于连续型的随机变量,条件分布的定义如下:
设二维随机变量 $(X,Y)$ 的概率密度函数为 $f(x,y),(X,Y)$ 关于 $Y$ 的边缘概率密度为 $f_Y(y)$ .若对于固定的 $y,f_Y(y) >0$ ,则称 $\frac{f(x,y)}{f_Y(y)}$ 为在 $Y=y$ 的条件下 $X$ 的条件概率密度。记为
$$f_{X|Y}(x|y) = \frac{f(x,y)}{f_Y(y)}$$
有了条件概率密度(就是条件概率密度函数),我们也可以定义出条件分布函数如下
$$\int_{-\infty}^x f_{X|Y}(x|y)dx = \int_{-\infty}^x \frac{f(x,y)}{f_Y(y)}dx$$
上面的函数为在 $Y=y$ 的条件下 $X$ 的条件分布函数,记为
$F_{X|Y}(x|y) = P(X \le x| Y=y)$
相互独立的随机变量
两个随机变量 $X,Y$ 相互独立的充要条件如下:
$F(x,y) = F_X(x)F_Y(y)$
上面的 $F(x,y),F_X(x),F_Y(y)$ 分别是二维随机变量的联合分布函数及关于 $X$ 和 $Y$ 的边缘分布函数。
除了通过分布函数,对于具体的连续型随机变量或离散型随机变量,还可通过概率密度函数和分布律来定义相互独立的条件。
对于连续型随机变量,上面的式子等价于
$f(x,y) = f_X(x)f_Y(y)$
式子中的 $f(x,y),f_X(x),f_Y(y)$ 分别为 随机变量 $(X,Y)$ 的条件概率密度函数和边缘概率密度函数。
对于离散型随机变量则有:
$P(X = x_i, Y = y_j) = P(X=x_i)P(Y=y_j)$
二维随机变量的函数的分布
在讨论一维随机变量的分布函数的时候,也讨论了一维随机变量的函数的分布函数,同样对于二维随机变量,我们也可以讨论其函数的分布函数。下面主要讨论 $Z=X+Y$,$Z=XY$,$Z=Y/X$,$M=max(X,Y)$,$N=min(X,Y)$ 这几个函数的分布函数($X,Y$ 为相互独立的随机变量),这里主要给出具体的公式,证明省略。
$Z = X + Y$ 的分布
设 $(X,Y)$ 是二维连续型随机变量,其概率密度函数为 $f(x,y)$, $Z = X+Y$仍然为连续性随机变量,其概率密度函数为
$$f_{X+Y}(z) = \int_{-\infty}^{\infty} f(z-y,y)dy$$
或
$$f_{X+Y}(z) = \int_{-\infty}^{\infty} f(x,z-x)dx$$
当 $X,Y$ 相互独立时,其边缘概率密度函数具有以下性质
$f(x,y) = f_X(x)f_Y(y)$
因此上面的式子也可以化成下面的形式
$$f_{X+Y}(z) = \int_{-\infty}^{\infty} f_X(z-y)f_Y(y)dy$$
$$f_{X+Y}(z) = \int_{-\infty}^{\infty} f_X(x)f_Y(z-x)dx$$
$Z=XY$ 和 $Z=Y/X$ 的分布
设 $(X,Y)$ 是二维连续型随机变量,其概率密度函数为 $f(x,y)$, $Z = \frac{Y}{X},Z = XY$仍然为连续性随机变量,其概率密度函数为
$$f_{Y/X}(z) = \int_{-\infty}^{\infty} |x|f(x,xz)dx$$
$$f_{XY}(z) = \int_{-\infty}^{\infty} \frac{1}{|x|}f(x,z/x)dx$$
当 $X,Y$ 相互独立时,同样有下面的性质
$$f_{Y/X}(z) = \int_{-\infty}^{\infty} |x|f_X(x)f_Y(xz)dx$$
$$f_{XY}(z) = \int_{-\infty}^{\infty} \frac{1}{|x|}f_X(x)f_Y(z/x)dx$$
$M = max(X,Y)$ 和 $N = min(X,Y)$ 的分布
讨论 $max(X,Y)$ 和 $min(X,Y)$ 的分布的时候, 一般假设 $X, Y$ 相互独立,因为这样才有下面的性质。
对于 $M = max(X,Y)$ 的分布有
$F_{max}(z) = P(M \le z) = P(X \le z, Y \le z) = P(X \le z)P(Y \le z)$
由于 $X$ 和 $Y$ 相互独立,因此有
$F_{max}(z) = F_X(z)F_Y(z)$
同样对 $N = min(X,Y)$ 有
$F_{min}(z) = P(N \le z) = 1 - P(N \gt z) = 1 - P(X > z)P(Y>z)$
即
$F_{min}(z) = 1 - (1 - F_X(z))(1 - F_Y(z))$
推广到 $n$ 个相互独立的随机变量有下面的性质
$M = max \lbrace X_1,X_2…,X_n \rbrace$ 及 $N = min\lbrace X_1,X_2…,X_n \rbrace$ 的分布函数分别为
$$F_{max}(z) = F_{X_1}(z)F_{X_2}(z)…F_{X_n}(z)$$
$$F_{min}(z) = 1 - (1 - F_{X_1}(z))(1 - F_{X_2}(z))…(1 - F_{X_n}(z))$$
而当 $ X_1,X_2…,X_n $ 独立同分布的时候,上式变为如下所示
$$F_{max}(z) = [F(z)]^n$$
$$F_{min}(z) = 1 - (1 - F(z))^n$$