跳转至

高斯积分\#

不愧是高斯大神研究的问题,这个问题一探究下去把数学的各块都打通了

一维二维三维漫步问题、雅可比矩阵、gamma函数...

先积出来吧\#

gaussian_function

高斯积分(Gaussian integral)也叫欧拉——柏松积分(Euler-Poisson integral)

\[ \int_{-\infty}^{\infty}e^{-x^2}\mathrm{d}x = \sqrt \pi \]

虽然这个积分不存在原函数,也就是说不存在初等的不定积分,但是可以通过多元微积分的方法求解数值,柏松给出了两种计算的方法,大致的思路都是利用这个函数在三维空间下的对称性:

$$ (\int_{-\infty}{\infty}e{-x2}\mathrm{d}x)2 = \int_{-\infty}{\infty}e{-x2}\mathrm{d}x\int_{-\infty}e{-y2}\mathrm{d}y = \int_{-\infty}{\infty}\int_{-\infty}e{-(x2+y^2)}\mathrm{d}x\mathrm{d}y $$ 这是一个二重积分

现在,我们就把这个积分的问题从二维变成了三维

笛卡尔坐标系\#

在笛卡尔坐标系下,这个三维的钟形曲面

\[ f(x,y) = e^{-(x^2+y^2) = e^{-r^2}} \]

这是一个具有圆周对称性的曲面,因此我们可以尝试切片来看一看,你可以发现,横截面就是半径不同的圆,因此对于横截面,其面积:

\[ Area = 2\pi r·e^{-r^2} \]

那么对于极小的\(\mathrm{d}r\)可以视为半径不变,则圆柱体体积:

\[ Volume = 2\pi r·e^{-r^2}\mathrm{d}r \]

对于这些积累起来的圆柱体的体积,总和就是这个钟形曲面覆盖的体积,即积分值:

\[ \int_0^\infty 2\pi r·e^{-r^2}\mathrm{d}r = \pi \int_0^\infty 2r·e^{-r^2}\mathrm{d}r \]

对于这个积分,我们可以很容易地求出原函数:

\[ \pi [-e^{-r^2}]_0^\infty = \pi \]

于是我们就得到了高斯积分的值\(\sqrt \pi\)

极坐标系\#

延续上面的思路,我们可以采用极坐标变换,用三角函数来解决

\[ \begin{align} \iint_{\mathbb{R^2}}e^{-(x^2+y^2)}\mathrm{d}x\mathrm{d}y &= \int_0^{2\pi}\int_0^\infty e^{-r^2}r\mathrm{d}r\mathrm{d}\theta \\ &= 2\pi \int_0^\infty re^{-r^2}\mathrm{d}r\mathrm{d}\theta \\ &= 2\pi \int_{-\infty}^0 \frac{1}{2}e^s\mathrm{d}s \qquad\longrightarrow s = -r^2 \\ &= \pi \int_{-\infty}^0e^s \mathrm{d}s\\ &= \lim_{x\to -\infty}\pi (e^0 - e^x)\\ &= \pi \end{align} \]

这样我们也能得到正确的结果,需要注意这里的坐标变换:

\[ \mathrm{d}x\mathrm{d}y = r\mathrm{d}r\mathrm{d}\theta \]

这是一个老生常谈的问题了,但是在这里我还是想把这里讲透,因为我发现好像几乎没有人会强调这里,而学习时比较较真的我当年在这里被卡了好久,一直都没有想明白

在笛卡尔坐标系中,对于一块面积元的计算你可以当作一个长方形来看,而在极坐标系中,面积的计算方式改变了


dxdy image-20240415211157411

对于左边:

\[ S = \mathrm{d}x\mathrm{d}y \]

对于右边:

image-20240418131852737

我们发现极坐标系下的单位元,像这样一个圆形(扇形)的区域面积是非常容易表达的,比笛卡尔坐标系简洁的多,因为在这里,圆形才相当于笛卡尔坐标系中的长方形,因此我们得学着将极坐标用笛卡尔坐标的角度思考(此前我们一直都是将极坐标带入笛卡尔坐标来思考的),这样的话我们就可以对扇形使用长方形面积的计算方法了 $$ S = r\mathrm{d}r\mathrm{d}\theta $$ 在两个坐标系下,同一个图形的面积也应该相同,因此我们就可以得到上面的变换。更一般地,可以参考雅可比行列式

雅可比矩阵\#

雅可比矩阵描述的是从一个n维的欧式空间到m维的欧式空间的变换,因此如果要计算行列式的值,只有雅可比矩阵为方阵时才行,也就是从n维到n维的变换

雅可比行列式\#

上面我们已经发现,使用笛卡尔坐标系,无穷小的面积元素可以计算为\(\mathrm{d}A = \mathrm{d}x\mathrm{d}y\),多重积分的替换规则规定,当使用其他坐标时,必须考虑坐标转换公式的雅可比行列式:

$$ J = \det \frac{\partial(x,y)}{\partial(r, \theta)} = \begin{vmatrix} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta}\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{vmatrix} = \begin{vmatrix} \cos\theta & -r\sin \theta \ \sin \theta & r\cos \theta \end{vmatrix} = r $$ 因此,极坐标中的面积元素可以写为

\[ \mathrm{d} A = \boldsymbol{J}\mathrm{d}r\mathrm{d}\theta = r\mathrm{d}r\mathrm{d}\theta \]

对于上面的内容,同济版高等数学讲积分的时候已经提到过,我们可以用雅可比行列式(Jacobian determinant)来作坐标系变换。不过很可惜,教科书上对这一块内容只是一笔掠过,我们也只需要将这个行列式记住,带入计算即可。可这不是我所期望的数学,所以,在这里我会尽可能地将雅可比矩阵的含义,以及我们在这里为什么需要这个东西讲清楚

雅可比行列式解读\#

首先我们知道雅可比行列式是一个方阵的行列式,这个方阵是由一组函数相对于另一组变量的偏导数构成的,假设我们有向量函数\(\mathrm{\boldsymbol{F}} = (f_1,f_2,\cdots, f_n)\),其中每个\(f_i\)都是由变量\(x_1, x_2,\cdots,x_n\)构成的函数,那么雅可比矩阵\(\boldsymbol{J}\)可定义为

\[ \boldsymbol{J} = \begin{bmatrix} \frac{\partial f_1}{\partial x_1}&\frac{\partial f_1}{\partial x_2}&{\cdots}&\frac{\partial f_1}{\partial x_n}\\ \frac{\partial f_2}{\partial x_1}&\frac{\partial f_2}{\partial x_2}&{\cdots}&\frac{\partial f_2}{\partial x_n}\\ {\vdots}&{\vdots}&{\ddots}&{\vdots}\\ \frac{\partial f_n}{\partial x_1}&\frac{\partial f_n}{\partial x_2}&{\cdots}&\frac{\partial f_n}{\partial x_n}\\ \end{bmatrix} \]

雅可比行列式则表示当一个坐标系统变换到另一个坐标系统时单位体积的伸缩因子。我们如何理解这个伸缩呢?我们需要使用雅可比行列式来调整积分的测度,或者更通俗地说密度,雅可比矩阵在这里能够补偿坐标系变换引起的“面积”或更高维度中“体积”的变形

正如我们前面推导的一样,我们将扇形的增长单位面积使用长方形的面积算法来计算,尽管对于扇形来说内外侧的长度显然不同。不过我们得清楚一点,从笛卡尔坐标系变换到极坐标系并不是线性变换,这个二维空间在不同位置会有着不同的增长速度,或者说密度、权重不同

对于上面的函数\(f\),我们考虑简单的二维情况,当我们在某点\(a\)考察函数\(f\)的时候,则变化的\(\Delta x\)导致的函数值变化\(\Delta f\)有:

\[ \Delta f \approx \boldsymbol{J}(a) \Delta x \]

怎么理解呢?根据我们对线性代数本质的理解,在笛卡尔坐标系对极坐标的变换下,这个雅可比矩阵的两组向量\(\begin{pmatrix} \frac{\partial x}{\partial r} \\\frac{\partial y}{\partial r} \end{pmatrix}\)\(\begin{pmatrix} \frac{\partial x}{\partial \theta} \\\frac{\partial y}{\partial\theta} \end{pmatrix}\)表示对两组基\(\begin{pmatrix} 1 \\0 \end{pmatrix}\)\(\begin{pmatrix} 0 \\1 \end{pmatrix}\)的变换,对于原本的这两组基,我们知道它的行列式

\[ \begin{vmatrix} 1&0 \\ 0&1 \end{vmatrix} = 1 \]

对于前面我们已经求得的

\[ \begin{vmatrix} \cos\theta & -r\sin \theta \\ \sin \theta & r\cos \theta \end{vmatrix} = r \]

二者的比值\(r\)就是这个点附近区域的拉伸倍数

因此雅可比行列式可以认为是对这个点及其附近的区域的一种“展开”,注意这里我所说的展开并不是只有拉伸空间的含义,反向拉伸(收缩)也算拉伸。由于这个区域非常小,我们可以认为它是均匀不变的(尽管笛卡尔坐标系在我们看来是均匀的,而极坐标却没有那么均匀,这里我们需要使用一下逆向思考),因此偏导数在这里可以视为是确定的数,因此对于一个确定的点,我们就可以用雅可比行列式对其进行“均匀的展开”了

这个雅可比行列式的值往往是一个变量,这表明在不同的点上,拉伸的倍数往往不同,因此对不同点有着不同的作用,不过好在这已经是一个足够定量的描述了,我们只需在变量中乘上这样一个系数就可以正常得到转换后的坐标系了

有关更多\#

高斯积分貌似比如何积出这个积分本身更让人感兴趣…

维基百科上对Gaussian integral解释得比较清晰,而且还介绍了与\(\Gamma\)函数的关系

此外,还给出了更严谨、本质的笛卡尔坐标系和极坐标系之间切换的原理:Calculus/Polar Integration

高斯积分对正态分布函数的推导有着非常重要的作用,而这个积分在三维形态所表达的意义非常的丰富,在二维空间中,蚂蚁的随机漫步问题即可归为高斯积分的分布问题,由此我们可以得出蚂蚁在二维空间下运动有限次一定能回到原点的结论,从另一个角度思考,对于一只蚂蚁,它的每一步移动的选择,都可以展开像高尔顿板那样,因此我们也可以从二项分布的角度来分析,至此我们就串起了高斯积分和二项分布的关系

对于上面所说的随机漫步问题,我们还可以变换它的维度:在一维下,运动被束缚在一条数轴上,此时我们得到了赌徒必输问题;在三维下,我们发现,蚂蚁永远也回不到原点了。这些都是非常有意思的问题

References\#

  1. 【官方双语】为什么正态分布里会有一个π?(不止是积分技巧)
  2. 谷神星的神谕,高斯积分
  3. 随机漫步,高斯手中的蚂蚁
  4. Gaussian integral
  5. Calculus/Polar Integration
  6. What is Jacobian? | The right way of thinking derivatives and integrals
  7. Random walks in 2D and 3D are fundamentally different (Markov chains approach)