My Opera is closing 3rd of March

Tutoriale o wszystkim

Wydarzenia

Centralne twierdzenie graniczne

Przykładowy rozkład prawdopodobieństwa pewnej zmiennej

Rozkład prawdopodobieństwa średniej dwóch takich niezależnych zmiennych

Rozkład prawdopodobieństwa średniej trzech takich niezależnych zmiennych

Rozkład prawdopodobieństwa średniej czterech takich niezależnych zmiennych. Jest już bardzo zbliżony do rozkładu normalnego.

Centralne twierdzenie graniczne – jedno z najważniejszych twierdzeń rachunku prawdopodobieństwa, uzasadniające powszechne występowanie w przyrodzie rozkładów zbliżonych do rozkładu normalnego.

Teza

Sformułowanie szczególne

Centralne twierdzenie graniczne to twierdzenie matematyczne mówiące, że jeśli Xi są niezależnymi zmiennymi losowymi o jednakowym rozkładzie, takiej samej wartości oczekiwanej \mu i skończonej wariancji \sigma^2, to zmienna losowa o postaci

\frac\sum_i=1^n X_i - n\mu\sigma\sqrtn

zbiega według rozkładu do standardowego rozkładu normalnego gdy n rośnie do nieskończoności.

Sformułowanie ogólne

Centralne twierdzenie graniczne znane też pod nazwą Twierdzenie Lindeberga-Lévy'ego orzeka:

Niech (X_n,k) będzie schematem serii, w którym EX_n,k = 0 dla k \leqslant n i dla każdego n mamy \sum_k=1^n D^2 X_n,k = 1. Jeśli spełniony jest warunek Lindeberga, tj. dla każdego "\epsilon 0" src="//upload.wikimedia.org/math/e/7/7/e778429d8769714354b1994984a23fe5.png"/> zachodzi \lim_n \to \infty \sum_k=1^n EX_n,k^2 \mathbf 1_\X_n,k = 0, wtedy \sum_k=1^n X_n,k \xrightarrowD N(0,1).

Dowód

Dowodów Centralnego Twierdzenia Granicznego w wersji ogólnej jest kilka. Wszystkie są dość skomplikowane i wymagają korzystania z wielu zaawansowanych narzędzi matematycznych. Poniżej znajduje się jeden z prostszych dowodów, nie dający jednak oszacowania wartości błędu.

Pierwszym krokiem dowodu jest sformułowanie i udowodnienie użytecznych lematów.

Lemat 1

Niech f: \mathbf R \to \mathbf R będzie funkcją trzykrotnie różniczkowalną taką, że \forall x \in \mathbf R zachodzi |f'''(x)| \leqslant A oraz |f''(x)| \leqslant B. Wówczas: \forall x,y \in \mathbf R

  • a) |f(x+y) - f(x) - f'(x)y - \fracf''(x)y^22!| \leqslant \frac^33!

  • b) |f(x+y) - f(x) - f'(y)| \leqslant \fracBy^22!.
  • Dowód

    Oznaczmy \varphi_x(y) = f(x+y) - f(x) - f'(x)y - \fracf''(x)y^22!. Wówczas \varphi_x(0) = 0, \varphi_x'(0) = 0, \varphi_x''(0) = 0.

    Ustalmy dowolne "y 0" src="//upload.wikimedia.org/math/3/4/b/34b506d4a8cb0a7bc03701bec2c7691c.png"/>. Wówczas zgodnie z twierdzeniem Lagrange'a istnieją takie "z, 0" src="//upload.wikimedia.org/math/3/7/6/376e139a8e4a02df669b9fff98aa1c62.png"/>, że:

    \Bigg|\frac\varphi_x(y)y^3\Bigg| = \Bigg|\frac\varphi_x(y) - \varphi_x(0)y^3 - 0\Bigg| = \Bigg|\frac\varphi_x'(z)3z^2\Bigg| = \Bigg|\frac\varphi_x'(z) - \varphi_x'(0)3z^2 - 3\cdot0^2\Bigg| = \Bigg|\frac\varphi_x''(t)6t\Bigg| = \Bigg|\frac\varphi_x''(t) - \varphi_x''(0)6t - 6\cdot0\Bigg| = \Bigg|\frac\varphi_x'''(w)6\Bigg| \leqslant \fracA6

    Na tej samej zasadzie:

    \Bigg|\frac\varphi_x(y)y^2\Bigg| = \Bigg|\frac\varphi_x''(t)2\Bigg| \leqslant \fracB2. \Box

    Lemat 2

    Jeżeli X \sim N(0,1), to

    E|X|^3 = \int\limits_R |x|^3 \frac1\sqrt2\pie^ -\fracx^22dx = \frac4\sqrt2\pi

    Dowód

    E|X|^3 = \int\limits_R |x|^3 \frac1\sqrt2\pie^ -\fracx^22dx = \frac2\sqrt2\pi\int\limits_0^+\inftyx^3e^ -\fracx^22dx

    Dokonujemy podstawienia x^2 = t \Rightarrow dx = \fracdt2x:

    E|X|^3 = \frac2\sqrt2\pi\int\limits_0^+\inftytxe^ -\fract2\fracdt2x = \frac1\sqrt2\pi\int\limits_0^+\inftyte^ -\fract2dt

    Teraz całkujemy przez części:

    E|X|^3 = -\frac2t\sqrt2\pie^ -\fract2\Bigg|_0^+\infty + \frac2\sqrt2\pi\int\limits_0^+\inftye^ -\fract2dt = -\frac4\sqrt2\pie^ -\fract2\Bigg|_0^+\infty = \frac4\sqrt2\pi. \Box

    Drugi krok polega na oszacowaniu pewnej wartości:

    Niech f : \mathbf R \to \mathbf R, f \in \mathbb C^3(R) będzie funkcją trzykrotnie różniczkowalną taką, że |f'''(x)| \leqslant A \; \forall x\in \mathbf R oraz |f''(x)| \leqslant B \; \forall x\in \mathbf R.

    Rozważamy niezależne zmienne (G_n,k) o rozkładzie normalnym takie, że \forall n,k \; EG_n,k = 0 oraz D^2G_n,k = D^2X_n,k.

    Wówczas :

    \forall x \in \mathbf R \; |Ef(x + X_n,k) - Ef(x + G_n,k)| = |Ef(x + X_n,k) - f(x) - f'(x)\cdot EX_n,k - \fracf''(x)2!EX^2_n,k - Ef(x + G_n,k) + f(x) + f'(x)\cdot EG_n,k + \fracf''(x)2!EG^2_n,k| =

    |E%5Bf(x + X_n,k) - f(x) - f'(x)\cdot X_n,k - \fracf''(x)2!X^2_n,k - E[f(x + G_n,k) - f(x) - f'(x)\cdot G_n,k - \fracf''(x)2!G^2_n,k">| \leqslant" src="//upload.wikimedia.org/math/3/a/2/3a27326452ff94b9f6276243fa31c298.png"/>

    E|f(x + X_n,k) - f(x) - f'(x)\cdot X_n,k - \fracf''(x)2!X^2_n,k| + E|f(x + G_n,k) - f(x) - f'(x)\cdot G_n,k - \fracf''(x)2!G^2_n,k|.

    Przy czym ostatnia nierówność to nierówność trójkąta.

    Drugi ze składników daje się na podstawie Lematu 1 oszacować w sposób następujący:

    E|f(x + G_n,k) - f(x) - f'(x)\cdot G_n,k - \fracf''(x)2!G^2_n,k| \leqslant \fracA6E|G_n,k|^3.

    Tymczasem G_n,k = \sqrtD^2X_n,k \cdot G, gdzie G \sim N(0,1). W związku z tym (korzystając z Lematu 2):

    E|G_n,k|^3 = (D^2X_n,k)^3/2\cdot E|G|^3 \leqslant 12\cdot (D^2X_n,k)^3/2.

    Wobec tego

    \fracA6E|G_n,k|^3 \leqslant 2A \cdot (D^2X_n,k)^3/2 \leqslant 2A\cdot D^2X_n,k \cdot \bigg(\max_1 \leqslant k \leqslant n \sqrtD^2X_n,k\bigg).

    Pierwszy ze składników można natomiast oszacować w sposób następujący:

    E|f(x + X_n,k) - f(x) - f'(x)\cdot X_n,k - \fracf''(x)2!X^2_n,k| =E|f(x + X_n,k) - f(x) - f'(x)\cdot X_n,k - \fracf''(x)2!X^2_n,k|\cdot \mathbf 1_\ + E|f(x + X_n,k) - f(x) - f'(x)\cdot X_n,k "- \epsilon \" src="//upload.wikimedia.org/math/5/a/5/5a5fbf76cc1401c07452ffd4f5d52375.png"/>.

    Z kolei szacujemy:

    E|f(x + X_n,k) - f(x) - f'(x)\cdot X_n,k - \fracf''(x)2!X^2_n,k|\cdot \mathbf 1_\X_n,k \leqslant \fracA6E|X_n,k|^3 \cdot \mathbf 1_\\leqslant \epsilon \ \leqslant \fracA6D^2X_n,k \cdot \epsilon

    oraz

    E|f(x + X_n,k) - f(x) - f'(x)\cdot X_n,k - \fracf''(x)2!X^2_n,k|\cdot \mathbf 1_\X_n,k \leqslant E|f(x + X_n,k) - f(x) - f'(x)\cdot X_n,k|\cdot \mathbf 1_\ + E|\fracf''(x)2!X^2_n,k|\cdot \mathbf 1_\X_n,k \leqslant B\cdot D^2X_n,k\cdot \mathbf 1_\X_n,k.

    Ostatnia nierówność wynika z Lematu 1.

    Zatem \forall x \in \mathbf R mamy następujące oszacowanie:

    |Ef(x + X_n,k) - Ef(x + G_n,k)| "\leqslant \epsilon \" src="//upload.wikimedia.org/math/7/b/f/7bf12e18e225fc1479ed681694c64485.png"/>.

    Trzeci krok polega na wielokrotnym zastosowaniu oszacowania uzyskanego powyżej.

    |Ef(X_n,1 + X_n,2 + \dots + X_n,n) - Ef(G_n,1 + G_n,2 + \dots + G_n,n)| \leqslant |Ef(X_n,1 + \dots + X_n,n) - Ef(X_n,1 + \dots + X_n,n-1 + G_n,n)| + |Ef(X_n,1 + \dots + X_n,n-1 + G_n,n) - Ef(X_n,1 + \dots + X_n,n-2 + G_n,n-1 + G_n,n)| + \dots + |Ef(X_n,1 + G_n,2 + \dots + G_n,n) - Ef(G_n,1 + G_n,2 + \dots + G_n,n)|.

    Rozpatrzmy k-ty z powyższych wyrazów.

    Podstawiamy

    Y:= X_n,1 + \dots + X_n,k-1 + G_n,k+1 + \dots + G_n,n.

    Zmienna Y jest niezależna od X_n,k i G_n,k. Wobec tego:

    |Ef(X_n,1 + \dots + X_n,k + G_n,k+1 + \dots + G_n,n) - Ef(X_n,1 + \dots + X_n,k-1 + G_n,k + \dots + G_n,n)| =|Ef(Y + X_n,k) - Ef(Y + G_n,k)| =\bigg|\int\limits_R Ef(y+X_n,k)d\mu_Y (y) - \int\limits_R Ef(y+G_n,k)d\mu_Y(y)\bigg| \leqslant\int\limits_R |Ef(y+X_n,k) - Ef(y+G_n,k)|d\mu_Y(y) \leqslant 2A\cdot D^2X_n,k \cdot \bigg(\max_1 \leqslant k \leqslant n \sqrtD^2X_n,k\bigg) + \fracA6D^2X_n,k \cdot \epsilon + B\cdot D^2X_n,k\cdot \mathbf 1_\X_n,k.

    Zatem:

    |Ef(X_n,1 + X_n,2 + \dots + X_n,n) - Ef(G_n,1 + G_n,2 + \dots + G_n,n)| \leqslant

    2A\cdot \bigg(\sum_k=1^n D^2X_n,k\bigg) \cdot \bigg(\max_1 \leqslant k \leqslant n \sqrtD^2X_n,k\bigg) + \fracA6\bigg(\sum_k=1^n D^2X_n,k\bigg) \cdot \epsilon "+ \epsilon \\bigg) \leqslant" src="//upload.wikimedia.org/math/8/1/6/8162b4e011fc82c9c9226c86d58bbb00.png"/>2A \cdot \bigg(\max_1 \leqslant k \leqslant n \sqrtD^2X_n,k\bigg) +\fracA6\epsilon + B\cdot L_n(\epsilon). Pierwszy i ostatni składnik z warunku Lindeberga zbiegają do zera, gdy n dąży do nieskończoności. W związku z tym:

    "\forall 0 \; \limsup_n \to \infty |Ef(X_n,1 + \dots + X_n,n) - Ef(G_n,1 + \dots + G_n,n)| \leqslant A\cdot \epsilon" src="//upload.wikimedia.org/math/b/a/3/ba3d9f5fdf5997b29996f4b793bc64ee.png"/>.

    Oznacza to, że:

    Ef(X_n,1 + \dots + X_n,k) \xrightarrow%5Bn \to \inftyEf(G_n,1+\dots + G_n,n) = Ef(G)" src="//upload.wikimedia.org/math/9/9/2/992bef8da2af9d14c418b69fb9e1f14f.png"/>, gdzie G \sim N(0,1).

    Czwarty krok polega na wyliczenie dystrybuanty granicznej na podstawie powyższych oszacowań.

    Weźmy funkcję f : \mathbf R \to \mathbf R, f \in \mathbb C^3(R) spełniającą warunek \forall x \in \mathbf R \; \mathbf 1_(t+\delta,+\infty)(x) \leqslant f(x) \leqslant \mathbf 1_(t,+\infty)(x) dla pewnych "t 0" src="//upload.wikimedia.org/math/a/4/7/a479ec386291c5b17b32f044469e677e.png"/>.

    Wówczas:

    P(X_n,1 + \dots + X_n,n \geqslant t) \geqslant Ef(X_n,1 + \dots + X_n,n) \geqslant P(X_n,1 + \dots + X_n,n \geqslant t+\delta).

    Ale:

    Ef(X_n,1 + \dots + X_n,n) \xrightarrow%5Bn \to \infty Ef(G)" src="//upload.wikimedia.org/math/f/8/d/f8daa491409c53d929ee2804f55dcf1b.png"/>

    oraz

    P(G \geqslant t) \geqslant Ef(G) \geqslant P(G\geqslant t+ \delta).

    W związku z tym:

    \liminf_n\to \infty P(X_n,1 + \dots + X_n,n \geqslant t) \geqslant P(G\geqslant t+\delta) \xrightarrow%5B\delta \to 0^+ P(G\geqslant t)" src="//upload.wikimedia.org/math/d/1/d/d1d66edca3adb916f4b46fece7db46f4.png"/>

    oraz podobnie

    \limsup_n\to \infty P(X_n,1 + \dots + X_n,n \geqslant t) \leqslant P(G\geqslant t -\delta) \xrightarrow%5B\delta \to 0^+ P(G\geqslant t)" src="//upload.wikimedia.org/math/4/3/7/437e3ed519b13830ce90cbcefe895b45.png"/>.

    Otrzymujemy więc

    P(X_n,1 + \dots + X_n,n \geqslant t) \xrightarrow%5Bn\to \infty " src="//upload.wikimedia.org/math/8/1/0/810ce8e6b810e39387ec00e96a677c5c.png"/>P(G \geqslant t) \Rightarrow P(X_n,1 + \dots + X_n,n < t) \xrightarrow%5Bn\to \infty P(G < t)" src="//upload.wikimedia.org/math/4/b/4/4b417b10ed8abcd01c77d9962b4ed352.png"/>.

    Ale z ciągłości dystrybuanty rozkładu normalnego wnioskujemy, że

    P(X_n,1 + \dots + X_n,n \leqslant t) \xrightarrow%5Bn\to \infty P(G \leqslant t)" src="//upload.wikimedia.org/math/b/4/b/b4b059404c4e910e0e3d2922570bbd42.png"/>.

    Ponieważ punktowa zbieżność dystrybuant w punktach ciągłości dystrybuanty granicznej jest równoważna zbieżności według rozkładu, więc ostatecznie:

    \sum_k=1^n X_n,k \xrightarrow%5Bn\to \inftyD N(0,1)" src="//upload.wikimedia.org/math/c/8/6/c867549da634280de308a1f5c5dae398.png"/>.

    \Box

    Częste nieporozumienia

    • Centralne twierdzenie graniczne nie sprawi, by przy dostatecznie dużej próbie rozkład stał się normalny. Jedynie rozkład średniej z tej próby upodabnia się do normalnego.

  • Centralne twierdzenie graniczne jest prawdziwe tylko dla rozkładów o skończonej wariancji. Zobacz stabilność struktury.
  • Zobacz też

    • prawo wielkich liczb

  • Twierdzenie Berry-Essena
  • Informacje powiązane z http://www.smile-dent.pl/. Zapraszam!

    Kwaterniony

    Write a comment

    New comments have been disabled for this post.