$$ \def\*#1{\mathbf{#1}} \def\+#1{\mathcal{#1}} \def\-#1{\mathrm{#1}} \def\!#1{\mathsf{#1}} \def\@#1{\mathscr{#1}} \newcommand{\mr}[1]{\mbox{\color{RedViolet}$\triangleright\;$#1}\quad\quad} $$

第十三讲:乘积概率空间,富比尼-托内利定理

乘积测度空间

在我们上一周的作业里,我们让大家举反例说明如下命题是不对的:如果每一个 \(X_i\) 均可积,那么 \[ \E{\sum_{i=1}^\infty X_i} = \sum_{i=1}^\infty\E{X_i}. \] 我们知道,无论是期望还是求和,都可以看成在某个测度下的勒贝格积分。因此,我们今天想来回答,在什么条件下,积分是可以交换的,即 \[ \int_{A}\tp{\int_B f\d P}\d Q = \int_{B}\tp{\int_A f\d Q}\d P \] 成立。我们首先来定义乘积测度空间。

假设我们有两个概率空间 \((X,\@X,\mu)\)\((Y,\@Y,\nu)\)。我们可以想象

  • 第一个概率空间是掷一个骰子得到 \(\omega_1\in X\),第二个概率空间是掷另一个骰子,得到 \(\omega_2\in Y\);或者
  • 第一个概率空间是在 \([0,1]\) 上均匀取一个数 \(a\),第二个概率空间是在 \([0,2]\) 上均匀取一个数 \(b\)

我们现在可以考虑一个概率空间,称为乘积概率空间,他的样本集是 \(X\times Y\),用来表示独立的做两次实验。在我们上面的两个例子里,分别对应了:

  • 同时投两枚骰子,得到 \((\omega_1,\omega_2)\)
  • \([0,1]\times [0,2]\) 上均匀取一个点 \((a,b)\)

所以一个自然的问题是,这个乘积概率空间里,事件集和测度应该是什么。离散概率空间比较平凡,我们考虑上面第二个例子。这个时候 \(\@X=\@B([0,1])\)\(\@Y = \@B([0,2])\)。集合 \(\@X\times \@Y = \set{A\times B\cmid A\in \@X, B\in \@Y}\)\([0,1]\times [0,2]\) 上所有“矩形”的集合。它显然不是一个 \(\sigma\)-代数,因此,我们可以取乘积概率空间的事件集为 \(\sigma(\@X\times \@Y)\),并把它记做 \(\@X\otimes \@Y\)

更一般的,对于两个测度空间 \((X,\@X,\mu)\)\((Y,\@Y,\nu)\),我们定义它的乘积空间为 \((X\times Y,\@X\otimes \@Y)\),其中 \(\@X\otimes\@Y \defeq \sigma(\@X\times \@Y)\)。我们接下来定义 \(\@X\otimes\@Y\) 上的测度。看起来有两种比较自然的定义方式。

给定一个集合 \(E\in \@X\otimes\@Y\),我们定义两个函数 \(E^1\colon x\in X\mapsto E^1(x)\subseteq Y\)\(E^2\colon y\in Y\mapsto E^2(y)\subseteq X\),分别表示集合 \(E\)\(X=x\)\(Y=y\) 上的投影,如下图所示。 \[ \begin{align*} E^1(x)&\defeq \set{y\in Y\cmid (x,y)\in E}\\ E^2(y)&\defeq \set{x\in X\cmid (x,y)\in E}. \end{align*} \]

Figure 1

我们需要说明,如果 \(E\)\(\@X\otimes\@Y\) 可测的,那么对于任意 \(x\)\(y\)\(E^1(x)\)\(E^2(y)\) 分别是 \(\@Y\)\(\@X\) 可测的。

Proposition 1 如果 \(E\)\(\@X\otimes\@Y\) 可测的,那么对于任意 \(x\)\(y\)\(E^1(x)\)\(E^2(y)\) 分别是 \(\@Y\)\(\@X\) 可测的。

我们把命题的证明放到本次讲义的最后,先来继续我们的讨论。

于是,我们可以定义 \[ \begin{align*} \pi^1(E) &\defeq \int_X \nu(E^1(x))\mu(\dd x);\\ \pi^2(E) &\defeq \int_Y \mu(E^2(y))\nu(\dd y). \end{align*} \] 换句话说,\(\pi^1(E)\)\(\pi^2(E)\) 分别对应着在计算 \(E\) 的面积的时候“横着积”和“竖着积”。设 \[ \@G =\set{E\in \@X\otimes\@Y\cmid \pi^1(E) = \pi^2(E)} \] 为所有 \(\pi^1(E)\)\(\pi^2(E)\) 相等的可测集的集合。对于矩形 \(E=A\times B\in\@X\times \@Y\),我们显然有 \[ \pi^1(E) = \pi^2(E) = \mu(A)\times \mu(B), \]\(\@X\times \@Y\subseteq \@G\)。如果 \(\mu\)\(\nu\) 均是 \(\sigma\)-有限的,我们可以使用单调类定理说明 \(\@X\otimes\@Y\subseteq \@G\) (留作练习)。所以,我们可以定义测度 \[ \forall E\in\@X\otimes\@Y,\;\tp{\mu\otimes\nu}(E)\defeq \pi^1(E)=\pi^2(E). \] 于是,\((X\times Y,\@X\otimes\@Y,\mu\otimes\nu)\) 便是我们构造出来的乘积空间。

我们考虑一个特殊的例子。设 \(X=Y=\bb R\)\(\@X=\@Y = \@B(\bb R)\)\(\mu=\nu=\lambda\)。那么 \((X,\@X,\mu)\)\((Y,\@Y,\nu)\) 均为一维的 \(\bb R\) 上的勒贝格测度空间。按照我们的定义,它的乘积空间是 \((\bb R^2,\@B(\bb R)^{\otimes 2},\lambda^{\otimes 2})\)。同样根据定义,我们知道 \(\@B(\bb R)^{\otimes 2}\) 就是 \(\@B(\bb R^2)\),并且根据 Carathéodory 定理,\(\lambda^{\otimes 2}\) 就是 \(\bb R^2\) 上的勒贝格测度。

我们的定义可以推广到任意有限个概率空间的乘积。对于无穷多个概率空间的乘积,情况比较复杂,超出了这门课的范畴,可以参见 Kolmogorov extension theorem

富比尼-托内利定理(Fubini-Tonelli’s Theorem

富比尼-托内利定理说的是,如果一个定义在乘积空间 \((X\times Y,\@X\otimes \@Y,\mu\otimes \nu)\) 上的可测函数 \(f\) 非负,或者可积,那么有等式 \[ \int_{X\times Y} f(x,y)\mu\otimes\nu(\dd x\dd y) = \int_X\tp{\int_Yf(x,y)\nu(\dd y)}\mu(\dd x) = \int_Y\tp{\int_X f(x,y) \mu(\dd x)}\nu(\dd y) \] 成立。也就是说,积分的顺序可以任意交换。当然,这个等式成立需要先保证对于任意 \(x\),函数 \(f(x,\cdot)\colon y\in Y\mapsto f(x,y)\in \bb R\) 是可测的 (对函数 \(f(\cdot,y)\) 同理)。这是上一节关于 \(E^1\)\(E^2\) 函数可测的更一般版本。我们将在最后一节证明。

值得强调的是,关于 \(f\) 的可积性要求是 \(f\)\(\mu\otimes\nu\) 这个乘积测度上是可积的,如果仅仅是对于任何 \(x\in X\), \(f(x,\cdot)\)\(\nu\) 上可积,或者对于任何 \(y\in Y\)\(f(\cdot,y)\)\(\mu\) 上可积,是不够的。我们本次课一开始提到的的那个反例就说明了这一点。

我们简单叙述一下定理的证明,类似的套路大家现在应该很熟悉了,具体的细节请大家自己完成。我们只讨论 \(f\ge 0\) 的情况,\(f\) 可积的情形可以转化为分别考虑 \(f^+\)\(f^-\) 两个非负函数。

  • 首先,如果 \(f = \bb I_E\) ,其中 \(E\) 是某个可测集。那么此时,我们想要证明的等式即我们上一节验证过的“横着积”等于“竖着积”的测度等式。
  • 然后,我们考虑 \(f\) 的下近似 \(\ul f_n\)。对于每一个 \(n\),它都可以写成 \(\sum_i c_i\cdot \bb I_{E_i}\) 的形式,其中 \(E_i\) 是可测集。于是,使用期望的线性性,我们可以证明此时的等式。
  • 使用 MCT,我们可以对 \(\ul f_n\) 的积分求极限,得到对 \(f\) 的积分。

在具体使用 Fubini-Tonelli 的时候,我们往往是这样做的。

  • 如果 \(f\) 非负,那么可以随意的交换积分顺序进行计算。
  • 如果 \(f\) 可正可负,我们先对 \(\abs{f}\) 计算某一个累次积分,比如 \(\int_X \tp{\int_Y \abs{f}\d\nu}\d\mu\)。如果其 \(<\infty\),那么就说明它满足我们定理的条件。

\(f(x,\cdot)\)\(f(\cdot,y)\) 可测的证明

我们接下来证明在乘积测度空间 \((X\times Y,\@X\otimes \@Y,\mu\otimes\nu)\) 上的可测函数 \(f\colon (x,y)\in X\times Y\mapsto \bb R\) 的限制 \(f(x,\cdot)\colon y\in Y\mapsto f(x,y)\)\(f(\cdot,y)\colon x\in X\mapsto f(x,y)\) 分别是在 \(\@Y\)\(\@X\) 上可测的。

我们证明 \(f(x,\cdot)\) 的情况。考虑一个固定的 \(x\in X\) 以及一个函数 \[ T_x\colon y\in Y\mapsto (x,y)\in X\times Y. \] 显然,\(f(x,\cdot) = f\circ T_x\)。我们只需要验证 \(T_x\) 是从 \((X,\@X)\)\((X\times Y,\@X\otimes\@Y)\) 的可测函数即可。因为容易验证,两个可测函数的复合函数还是一个可测函数。

为了验证 \(T_x\) 是一个可测函数,我们只需要验证,对于每一个 \(X\times Y\) 里的矩形 \(A\times B\)\(T_x^{-1}(A\times B)\in \@X\) 即可(我们以前证明过这件事情,还记得吗)。但 \[ T_x^{-1}(A\times B) = \begin{cases} B, & \mbox{ if $x\in A$;}\\ \emptyset, & \mbox{if $x\not\in A$.} \end{cases} \] 因此 \(T_x\) 是可测的。