Normální zákon rozdělení náhodných veličin. Normální rozdělení spojité náhodné veličiny Normální rozdělení je popsáno pomocí

Definice 1

Náhodná veličina $X$ má normální rozdělení (Gaussovo rozdělení), pokud je hustota jejího rozdělení určena vzorcem:

\[\varphi \left(x\right)=\frac(1)(\sqrt(2\pi )\sigma )e^(\frac(-((x-a))^2)(2(\sigma )^ 2))\]

Zde $aϵR$ je matematické očekávání a $\sigma >0$ je standardní odchylka.

Hustota normálního rozdělení.

Ukažme, že tato funkce je skutečně distribuční hustotou. Chcete-li to provést, zkontrolujte následující podmínku:

Uvažujme nesprávný integrál $\int\limits^(+\infty )_(-\infty )(\frac(1)(\sqrt(2\pi )\sigma )e^(\frac(-((x-a)) ^ 2)(2(\sigma )^2))dx)$.

Provedeme substituci: $\frac(x-a)(\sigma )=t,\ x=\sigma t+a,\ dx=\sigma dt$.

Protože $f\left(t\right)=e^(\frac(-t^2)(2))$ je sudá funkce, pak

Rovnost platí, takže funkce $\varphi \left(x\right)=\frac(1)(\sqrt(2\pi )\sigma )e^(\frac(-((x-a))^2)( 2 (\sigma )^2))$ je skutečně distribuční hustota některých náhodná proměnná.

Zvažte některé z nejjednodušších vlastností funkce hustoty pravděpodobnosti normálního rozdělení $\varphi \left(x\right)$:

  1. Graf funkce hustoty pravděpodobnosti normálního rozdělení je symetrický vzhledem k přímce $x=a$.
  2. Funkce $\varphi \left(x\right)$ dosahuje svého maxima při $x=a$, zatímco $\varphi \left(a\right)=\frac(1)(\sqrt(2\pi )\sigma ) e^(\frac(-((a-a))^2)(2(\sigma )^2))=\frac(1)(\sqrt(2\pi )\sigma )$
  3. Funkce $\varphi \left(x\right)$ klesá jako $x>a$ a zvyšuje se jako $x
  4. Funkce $\varphi \left(x\right)$ má inflexní body v $x=a+\sigma $ a $x=a-\sigma $.
  5. Funkce $\varphi \left(x\right)$ se asymptoticky přibližuje k ose $Ox$ jako $x\to \pm \infty $.
  6. Schematický graf vypadá takto (obr. 1).

Obrázek 1 1. Graf hustoty normální distribuce

Všimněte si, že pokud $a=0$, pak je graf funkce symetrický vzhledem k ose $Oy$. Funkce $\varphi \left(x\right)$ je tedy sudá.

Funkce normálního rozdělení pravděpodobnosti.

Abychom našli funkci rozdělení pravděpodobnosti pro normální rozdělení, použijeme následující vzorec:

Proto,

Definice 2

Funkce $F(x)$ se nazývá standardní normální rozdělení, pokud $a=0,\ \sigma =1$, tedy:

Zde $Ф\left(x\right)=\frac(1)(\sqrt(2\pi ))\int\limits^x_0(e^(\frac(-t^2)(2))dt)$ je Laplaceova funkce.

Definice 3

Funkce $Ф\left(x\right)=\frac(1)(\sqrt(2\pi ))\int\limits^x_0(e^(\frac(-t^2)(2))dt)$ se nazývá pravděpodobnostní integrál.

Numerické charakteristiky normálního rozdělení.

Matematické očekávání: $M\left(X\right)=a$.

Rozptyl : $D\left(X\right)=(\sigma )^2$.

Střední čtvercové rozdělení: $\sigma \left(X\right)=\sigma $.

Příklad 1

Příklad řešení úlohy na konceptu normálního rozdělení.

Úkol 1: Délka cesty $X$ je náhodná spojitá hodnota. $X$ se rozděluje podle zákona o normální distribuci, jehož průměrná hodnota je $4$ kilometrů a standardní odchylka je $100$ metrů.

  1. Najděte funkci hustoty rozdělení $X$.
  2. Sestrojte schematický graf hustoty distribuce.
  3. Najděte distribuční funkci náhodné veličiny $X$.
  4. Najděte rozptyl.
  1. Pro začátek si představme všechny veličiny v jednom rozměru: 100m = 0,1km

Z definice 1 dostáváme:

\[\varphi \left(x\right)=\frac(1)(0,1\sqrt(2\pi))e^(\frac(-((x-4))^2)(0,02 ))\]

(protože $a=4\ km,\ \sigma =0,1\ km)$

  1. Pomocí vlastností funkce hustoty rozdělení máme, že graf funkce $\varphi \left(x\right)$ je symetrický vzhledem k přímce $x=4$.

Funkce dosáhne svého maxima v bodě $\left(a,\frac(1)(\sqrt(2\pi )\sigma )\right)=(4,\ \frac(1)(0,1\sqrt( 2\pi )))$

Schematický graf vypadá takto:

Obrázek 2

  1. Podle definice distribuční funkce $F\left(x\right)=\frac(1)(\sqrt(2\pi )\sigma )\int\limits^x_(-\infty )(e^(\frac( -((t-a))^2)(2(\sigma )^2))dt)$, máme:
\
  1. $D\left(X\right)=(\sigma )^2=0,01$.

Normální zákon rozdělení pravděpodobnosti

Bez nadsázky jej lze nazvat filozofickým zákonem. Při pozorování různých objektů a procesů světa kolem nás se často setkáváme s tím, že něco nestačí a že existuje norma:


Zde je základní pohled funkce hustoty normální rozdělení pravděpodobnosti a vítám vás u této nejzajímavější lekce.

Jaké příklady lze uvést? Jsou jen temnotou. To je například výška, váha lidí (a nejen), jejich fyzická síla, duševní schopnosti atd. Existuje "masa" (Tak či onak) a existují odchylky v obou směrech.

Jde o různé vlastnosti neživých předmětů (stejné rozměry, hmotnost). Jedná se o náhodné trvání procesů, například čas závodu na sto metrů nebo přeměnu pryskyřice na jantar. Z fyziky přišly na mysl molekuly vzduchu: mezi nimi jsou pomalé, jsou rychlé, ale většina z nich se pohybuje „standardními“ rychlostmi.

Pak se od středu odkloníme ještě o jeden standardní odchylka a vypočítat výšku:

Označení bodů na výkresu (zelená barva) a vidíme, že je toho docela dost.

V závěrečné fázi pečlivě nakreslíme graf a obzvlášť opatrně odrážet to konvexnost / konkávnost! Pravděpodobně jste si již dávno uvědomili, že úsečka je horizontální asymptota, a je absolutně nemožné na to „vylézt“!

Díky elektronickému návrhu řešení lze graf snadno sestavit v Excelu a nečekaně pro sebe jsem na toto téma natočil i krátké video. Nejprve si ale řekněme, jak se mění tvar normální křivky v závislosti na hodnotách a .

Při zvýšení nebo snížení "a" (s nezměněným "sigma") graf si zachovává svůj tvar a pohybuje doprava/doleva respektive. Tedy například když má funkce tvar a náš graf se "posune" o 3 jednotky doleva - přesně k počátku:


Normálně rozložená veličina s nulovým matematickým očekáváním dostala zcela přirozený název - vycentrovaný; jeho hustotní funkce je dokonce a graf je symetrický podle osy y.

V případě změny "sigma" (s konstantním "a"), graf "zůstává na místě", ale mění tvar. Když se zvětší, stane se nižší a prodloužený, jako chobotnice protahující svá chapadla. A naopak při snižování grafu stává se užším a vyšším- ukáže se "překvapená chobotnice." Ano, v pokles"sigma" dvakrát: předchozí graf se dvakrát zužuje a natahuje nahoru:

Vše je plně v souladu s geometrické transformace grafů.

Normální rozdělení s jednotkovou hodnotou se nazývá "sigma". normalizované a pokud je také vycentrovaný(náš případ), pak se takové rozdělení nazývá Standard. Má ještě víc jednoduchá funkce hustota, se kterou jsme se již setkali v místní Laplaceova věta: . Standardní distribuce našla široké uplatnění v praxi a velmi brzy konečně pochopíme její účel.

Nyní se podíváme na film:

Ano, zcela správně – jaksi nezaslouženě jsme zůstali ve stínu funkce rozdělení pravděpodobnosti. Vzpomínáme na ni definice:
- pravděpodobnost, že náhodná proměnná bude mít hodnotu MENŠÍ než proměnná , která „běží“ všechny reálné hodnoty do „plus“ nekonečna.

Uvnitř integrálu se obvykle používá jiné písmeno, aby nedocházelo k „překryvům“ se zápisem, protože zde je každá hodnota přiřazena nevlastní integrál, který se rovná některým číslo z intervalu.

Téměř všechny hodnoty nelze přesně vypočítat, ale jak jsme právě viděli, s moderním výpočetním výkonem to není obtížné. Takže pro standardní distribuční funkci obsahuje odpovídající funkce Excel obecně jeden argument:

=NORMSDIST(z)

Raz, dva – a máte hotovo:

Výkres jasně ukazuje realizaci všech vlastnosti distribuční funkce, a z technických nuancí byste měli věnovat pozornost horizontální asymptoty a inflexní bod.

Nyní si připomeňme jeden z klíčových úkolů tématu, totiž zjistit, jak zjistit – pravděpodobnost, že normální náhodná veličina převezme hodnotu z intervalu. Geometricky je tato pravděpodobnost rovna plocha mezi normální křivkou a osou x v odpovídající sekci:

ale pokaždé vybrousit přibližnou hodnotu je nerozumné, a proto je racionálnější používat "snadný" vzorec:
.

! také vzpomíná , Co

Zde můžete znovu použít Excel, ale existuje několik významných „ale“: za prvé, není to vždy po ruce, a za druhé „hotové“ hodnoty s největší pravděpodobností vyvolají otázky učitele. Proč?

Již jsem o tom opakovaně mluvil: kdysi (a ne tak dávno) byla obyčejná kalkulačka luxusem a „ruční“ způsob řešení uvažovaného problému je stále zachován ve vzdělávací literatuře. Jeho podstatou je k standardizovat hodnoty „alfa“ a „beta“, to znamená, že redukují řešení na standardní distribuci:

Poznámka : funkci lze snadno získat z obecného případupomocí lineárního substitucí. Pak a:

a z nahrazení jen vyplývá vzorec pro přechod z hodnot libovolného rozdělení na odpovídající hodnoty standardního rozdělení.

Proč je to potřeba? Faktem je, že hodnoty byly pečlivě vypočítány našimi předky a shrnuty do speciální tabulky, která je v mnoha knihách o terveru. Ještě běžnější je ale tabulka hodnot, kterou jsme se již zabývali Laplaceova integrální věta:

Pokud máme k dispozici tabulku hodnot Laplaceovy funkce , pak to vyřešíme:

Zlomkové hodnoty se tradičně zaokrouhlují na 4 desetinná místa, jak je tomu ve standardní tabulce. A pro kontrolu Položka 5 rozložení.

Připomínám vám to, a aby nedošlo k záměně mít vždy pod kontrolou, tabulka JAKÉ funkce před vašima očima.

Odpovědět je vyžadováno, aby bylo uvedeno v procentech, takže vypočítanou pravděpodobnost je třeba vynásobit 100 a výsledek opatřit smysluplným komentářem:

- při letu od 5 do 70 m spadne přibližně 15,87 % granátů

Cvičíme sami:

Příklad 3

Průměr ložisek vyrobených v továrně je náhodná veličina normálně rozdělená s očekáváním 1,5 cm a směrodatnou odchylkou 0,04 cm Najděte pravděpodobnost, že velikost náhodně vybraného ložiska se pohybuje od 1,4 do 1,6 cm.

V ukázkovém řešení a níže použiji funkci Laplace jako nejčastější možnost. Mimochodem, všimněte si, že podle znění zde můžete zahrnout konce intervalu do úvahy. To však není kritické.

A již v tomto příkladu jsme se setkali se speciálním případem - kdy je interval symetrický vzhledem k matematické očekávání. V takové situaci jej lze zapsat ve tvaru a pomocí zvláštnosti Laplaceovy funkce zjednodušit pracovní vzorec:


Volá se parametr delta odchylka z matematického očekávání a dvojitou nerovnost lze „zabalit“ pomocí modul:

je pravděpodobnost, že se hodnota náhodné proměnné odchyluje od matematického očekávání o méně než .

No, řešení, které se hodí do jedné řady :)
je pravděpodobnost, že se průměr náhodně vybraného ložiska liší od 1,5 cm maximálně o 0,1 cm.

Výsledek tohoto úkolu se ukázal být blízký jednotě, ale chtěl bych ještě větší spolehlivost - konkrétně zjistit hranice, ve kterých je průměr Téměř všichni ložiska. Existuje pro to nějaké kritérium? Existuje! Na otázku odpovídá tzv

pravidlo tři sigma

Jeho podstatou je to prakticky spolehlivý je skutečnost, že normálně distribuovaná náhodná proměnná bude mít hodnotu z intervalu .

Pravděpodobnost odchylky od očekávání je skutečně menší než:
nebo 99,73 %

Co se týče "ložisek" - jedná se o 9973 kusů o průměru 1,38 až 1,62 cm a pouze 27 "nestandardních" exemplářů.

V praktickém výzkumu se pravidlo „tři sigma“ obvykle uplatňuje v opačném směru: pokud statisticky zjistili, že téměř všechny hodnoty studovaná náhodná proměnná vejde do intervalu 6 směrodatných odchylek, pak existují dobré důvody domnívat se, že tato hodnota je rozdělena podle normálního zákona. Ověření se provádí pomocí teorie statistické hypotézy.

Pokračujeme v řešení tvrdých sovětských úkolů:

Příklad 4

Náhodná hodnota chyby vážení je rozdělena podle normálního zákona s nulovým matematickým očekáváním a směrodatnou odchylkou 3 gramy. Najděte pravděpodobnost, že příští vážení bude provedeno s chybou nepřesahující 5 gramů v absolutní hodnotě.

Řešení velmi jednoduché. Podle stavu a okamžitě si to všimneme při příštím vážení (něco nebo někdo) téměř 100% získáme výsledek s přesností na 9 gramů. Ale v problému je užší odchylka a podle vzorce:

- pravděpodobnost, že příští vážení bude provedeno s chybou nepřesahující 5 gramů.

Odpovědět:

Řešený problém se zásadně liší od zdánlivě podobného. Příklad 3 lekce o rovnoměrné rozložení. byla tam chyba zaokrouhlování výsledky měření, zde hovoříme o náhodné chybě samotných měření. Takové chyby vznikají kvůli technickým vlastnostem samotného zařízení. (rozsah přípustných chyb je zpravidla uveden v jeho pasu), a také vinou experimentátora - když například "od oka" odečítáme ze šipky stejných měřítek.

Mimo jiné existují i ​​tzv systematický chyby měření. Už je nenáhodný chyby, ke kterým dochází v důsledku nesprávného nastavení nebo provozu zařízení. Takže například neupravené podlahové váhy mohou důsledně „přidávat“ kilogram a prodávající systematicky podvážejí kupující. Nebo ne systematicky, protože můžete zkratovat. V žádném případě však taková chyba nebude náhodná a její očekávání se liší od nuly.

…urychleně připravuji prodejní školení =)

Pojďme si problém vyřešit sami:

Příklad 5

Průměr válečku je náhodná normálně rozdělená náhodná veličina, její směrodatná odchylka je mm. Najděte délku intervalu, symetrickou vzhledem k matematickému očekávání, ve kterém bude s pravděpodobností klesat délka průměru korálku.

Položka 5* designové rozvržení pomoci. Upozorňujeme, že matematické očekávání zde není známo, ale to ani v nejmenším nezasahuje do řešení problému.

A zkouškový úkol, který vřele doporučuji pro upevnění látky:

Příklad 6

Normálně rozdělená náhodná veličina je dána svými parametry (matematické očekávání) a (směrodatná odchylka). Požadované:

a) zapište hustotu pravděpodobnosti a schematicky znázorněte její graf;
b) najděte pravděpodobnost, že bude mít hodnotu z intervalu ;
c) najít pravděpodobnost, že se modulo odchyluje od ne více než ;
d) pomocí pravidla „tři sigma“ najděte hodnoty náhodné proměnné.

Takové problémy se nabízí všude a za léta praxe jsem jich dokázal vyřešit stovky a stovky. Určitě si procvičte ruční kreslení a používání papírových tabulek ;)

Budu analyzovat příklad zvýšené složitosti:

Příklad 7

Hustota rozdělení pravděpodobnosti náhodné veličiny má tvar . Find , matematické očekávání , rozptyl , distribuční funkce , hustota grafu a distribuční funkce, find .

Řešení: v první řadě si dejme pozor, že podmínka nevypovídá nic o povaze náhodné veličiny. Přítomnost vystavovatele sama o sobě nic neznamená: může to být např. demonstrativní nebo obecně libovolné kontinuální distribuce. A proto je ještě třeba doložit „normálnost“ distribuce:

Od funkce určeno při žádný skutečná hodnota , a to může být sníženo na formu , pak je náhodná veličina distribuována podle normálního zákona.

Prezentujeme. Pro tohle vyberte celý čtverec a organizovat třípatrový zlomek:


Nezapomeňte provést kontrolu a vraťte indikátor do původní podoby:

což jsme chtěli vidět.

Tím pádem:
- Podle mocenské pravidlo„odštípnutí“. A zde si můžete okamžitě zapsat zřejmé číselné charakteristiky:

Nyní zjistíme hodnotu parametru. Protože multiplikátor normálního rozdělení má tvar a, pak:
, ze kterého vyjadřujeme a dosazujeme do naší funkce:
, načež ještě jednou projedeme záznam očima a ujistíme se, že výsledná funkce má podobu .

Nakreslíme hustotu:

a graf distribuční funkce :

Pokud není po ruce žádný Excel a dokonce i běžná kalkulačka, pak se poslední graf snadno sestaví ručně! V tuto chvíli distribuční funkce nabývá hodnoty a tady je

Náhodné proměnné jsou spojeny s náhodnými událostmi. O náhodných událostech se mluví tehdy, když nelze jednoznačně předpovědět výsledek, kterého lze za určitých podmínek dosáhnout.

Předpokládejme, že si hodíme obyčejnou mincí. Obvykle není výsledek tohoto postupu jednoznačně jistý. S jistotou lze říci pouze to, že se stane jedna ze dvou věcí: buď vypadnou hlavy, nebo ocasy. Každá z těchto událostí bude náhodná. Můžete zadat proměnnou, která bude popisovat výsledek této náhodné události. Je zřejmé, že tato proměnná bude mít dvě diskrétní hodnoty: hlavy a ocasy. Protože nemůžeme předem přesně předpovědět, kterou ze dvou možných hodnot tato proměnná nabude, lze tvrdit, že v tomto případě máme co do činění s náhodnými proměnnými.

Předpokládejme nyní, že v experimentu hodnotíme reakční dobu subjektu při předložení nějakého podnětu. Zpravidla se ukazuje, že i když experimentátor učiní všechna opatření ke standardizaci experimentálních podmínek, minimalizuje nebo dokonce eliminuje možné odchylky v prezentaci podnětu, naměřené hodnoty reakční doby subjektu se budou stále lišit. V tomto případě říkají, že reakční doba subjektu je popsána náhodnou veličinou. Protože v zásadě můžeme v experimentu získat libovolnou hodnotu reakční doby - množina možných hodnot reakční doby, kterou lze získat jako výsledek měření, se ukazuje jako nekonečná - říkají o kontinuita tuto náhodnou veličinu.

Nabízí se otázka: existují nějaké zákonitosti v chování náhodných veličin? Odpověď na tuto otázku se ukazuje jako kladná.

Pokud tedy utrácíte neomezeně velké číslo když hodíte stejnou mincí, zjistíte, že počet výskytů na každé ze dvou stran mince bude přibližně stejný, pokud ovšem mince není falešná a není ohnutá. Pro zdůraznění tohoto vzorce je zaveden koncept pravděpodobnosti náhodné události. Je jasné, že v případě hodu mincí jistě dojde k jedné ze dvou možných událostí. To je způsobeno tím, že celková pravděpodobnost těchto dvou událostí, jinak nazývaná celková pravděpodobnost, je 100 %. Pokud předpokládáme, že obě dvě události spojené s testováním mince nastanou se stejnou pravděpodobností, pak se pravděpodobnost každého výsledku zvlášť zjevně ukáže jako 50%. Teoretické úvahy nám tedy umožňují popsat chování dané náhodné veličiny. Takový popis v matematické statistiky označený pojmem "distribuce náhodné proměnné".

Složitější situace je u náhodné veličiny, která nemá přesně definovaný soubor hodnot, tzn. se ukazuje jako kontinuální. Ale i v tomto případě lze zaznamenat některé důležité zákonitosti jeho chování. Takže při provádění experimentu s měřením reakční doby subjektu lze poznamenat, že různé intervaly trvání reakce subjektu jsou hodnoceny s různé míry pravděpodobnosti. Je pravděpodobné, že subjekt bude reagovat příliš rychle. Například v úlohách sémantického rozhodování subjekty prakticky nedokážou více či méně přesně reagovat při rychlosti menší než 500 ms (1/2 s). Podobně je nepravděpodobné, že subjekt, který věrně dodržuje pokyny experimentátora, značně zpozdí jeho reakci. V problémech sémantického rozhodování jsou například odpovědi odhadované na více než 5 s obvykle považovány za nespolehlivé. Přesto lze se 100% jistotou předpokládat, že reakční doba subjektu se bude pohybovat v rozmezí od 0 do + co. Ale tato pravděpodobnost je součtem pravděpodobností každé jednotlivé hodnoty náhodné veličiny. Proto lze rozdělení spojité náhodné veličiny popsat jako kontinuální funkce y = f (X ).

Pokud máme co do činění s diskrétní náhodnou veličinou, kdy jsou předem známy všechny její možné hodnoty, jako v příkladu s mincí, není obvykle příliš obtížné sestavit model pro její rozdělení. Stačí uvést jen některé rozumné předpoklady, jak jsme to udělali v uvažovaném příkladu. Složitější je situace s rozložením spojitých veličin, které nabývají předem neznámého počtu hodnot. Samozřejmě, že pokud bychom například vyvinuli teoretický model, který popisuje chování testovaného v experimentu s měřením reakční doby při řešení úlohy sémantického řešení, mohli bychom se pokusit na základě tohoto modelu popsat teoretický rozdělení konkrétních hodnot reakční doby stejného subjektu při prezentaci jednoho a téhož podnětu. To však není vždy možné. Proto může být experimentátor nucen předpokládat, že rozdělení náhodné veličiny, která ho zajímá, je popsáno nějakým předem prostudovaným zákonem. Nejčastěji, i když to nemusí být vždy absolutně správné, se pro tyto účely používá tzv. normální rozdělení, které funguje jako standard pro rozdělení libovolné náhodné veličiny bez ohledu na její povahu. Toto rozdělení bylo poprvé popsáno matematicky v první polovině 18. století. de Moivre.

Normální distribuce nastává, když jev, který nás zajímá, podléhá vlivu nekonečného množství náhodných faktorů, které se navzájem vyvažují. Formálně lze normální rozdělení, jak ukázal de Moivre, popsat následujícím vztahem:

Kde X představuje pro nás zajímavou náhodnou veličinu, jejíž chování studujeme; R je hodnota pravděpodobnosti spojená s touto náhodnou proměnnou; π a e - dobře známé matematické konstanty popisující poměr obvodu k průměru a základny přirozeného logaritmu; μ a σ2 jsou parametry normálního rozdělení náhodné veličiny, respektive matematické očekávání a rozptyl náhodné veličiny X.

Pro popis normálního rozdělení se ukazuje jako nezbytné a postačující definovat pouze parametry μ a σ2.

Pokud tedy máme náhodnou veličinu, jejíž chování je popsáno rovnicí (1.1) s libovolnými hodnotami μ a σ2, můžeme ji označit jako Ν (μ, σ2), aniž bychom si pamatovali všechny podrobnosti této rovnice.

Rýže. 1.1.

Libovolné rozdělení lze znázornit vizuálně ve formě grafu. Graficky má normální rozdělení podobu zvonovité křivky, jejíž přesný tvar je určen parametry rozdělení, tzn. matematické očekávání a rozptyl. Parametry normálního rozdělení mohou nabývat téměř libovolných hodnot, které jsou omezeny pouze měřící stupnicí používanou experimentátorem. Teoreticky může být hodnotou matematického očekávání libovolné číslo z rozsahu čísel od -∞ do +∞ a rozptyl může být libovolné nezáporné číslo. Proto existuje nekonečné číslo různé druhy normální rozdělení a podle toho nekonečná množina křivek, které jej znázorňují (mají však podobný zvonovitý tvar). Je jasné, že je nemožné popsat všechny. Pokud jsou však známy parametry konkrétního normálního rozdělení, lze jej převést na tzv normální rozdělení jednotek, matematické očekávání se rovná nule a rozptyl je roven jedné. Toto normální rozdělení se také nazývá Standard nebo z-rozdělení. Graf jednotkového normálního rozdělení je znázorněn na Obr. 1.1, odkud je zřejmé, že vrchol zvonovité křivky normálního rozdělení charakterizuje hodnotu matematického očekávání. Další parametr normálního rozdělení - disperze - charakterizuje míru "rozproudění" zvonovité křivky vzhledem k horizontále (osa úsečky).

Náhodné, pokud v důsledku zkušeností může s určitou pravděpodobností nabývat skutečných hodnot. Nejúplnější, vyčerpávající charakteristika náhodné veličiny je zákon rozdělení. Distribuční zákon je funkce (tabulka, graf, vzorec), která umožňuje určit pravděpodobnost, že náhodná veličina X nabývá určité hodnoty xi nebo spadá do určitého intervalu. Pokud má náhodná veličina daný distribuční zákon, pak se říká, že je rozdělena podle tohoto zákona nebo se tomuto zákonu rozdělení řídí.

Každý distribuční zákon je funkce, která kompletně popisuje náhodnou veličinu z pravděpodobnostního hlediska. V praxi musí být rozdělení pravděpodobnosti náhodné veličiny X často posuzováno pouze podle výsledků testu.

Normální distribuce

Normální distribuce, nazývané také Gaussovo rozdělení, je rozdělení pravděpodobnosti, které hraje zásadní roli v mnoha oblastech poznání, zejména ve fyzice. Fyzické množství podléhá normálnímu rozdělení, když je ovlivněn velkým počtem náhodných zvuků. Je jasné, že tato situace je extrémně častá, takže můžeme říci, že ze všech distribucí se v přírodě nejčastěji vyskytuje normální distribuce – odtud pochází i jeden z jejích názvů.

Normální rozdělení závisí na dvou parametrech – posunutí a měřítku, čili z matematického hlediska nejde o jedno rozdělení, ale o celou jejich rodinu. Hodnoty parametrů odpovídají středním hodnotám (matematické očekávání) a spreadu (směrodatná odchylka).

Standardní normální rozdělení je normální rozdělení s průměrem 0 a směrodatnou odchylkou 1.

Koeficient asymetrie

Koeficient šikmosti je kladný, pokud je pravý konec rozdělení delší než levý, a v opačném případě záporný.

Pokud je rozdělení symetrické vzhledem k matematickému očekávání, pak je jeho koeficient šikmosti roven nule.

Koeficient šikmosti vzorku se používá k testování rozdělení na symetrii a také k hrubému předběžnému testu normality. Umožňuje odmítnout, ale neumožňuje přijmout hypotézu normality.

Kurtózní koeficient

Koeficient špičatosti (koeficient ostrosti) je mírou ostrosti vrcholu rozdělení náhodné veličiny.

"Minus tři" na konci vzorce je zavedeno tak, aby koeficient špičatosti normálního rozdělení byl roven nule. Je pozitivní, pokud je vrchol distribuce blízko očekávané hodnoty ostrý, a negativní, pokud je vrchol hladký.

Okamžiky náhodné veličiny

Okamžik náhodné veličiny je číselná charakteristika rozdělení dané náhodné veličiny.

Normální distribuce ( normální distribuce) - hraje důležitá role v analýze dat.

Někdy místo termínu normální rozdělení používat termín Gaussovo rozdělení na počest K. Gausse (starší termíny, dnes prakticky nepoužívané: Gaussův zákon, Gauss-Laplaceovo rozdělení).

Jednorozměrné normální rozdělení

Normální rozdělení má hustotu::

V tomto vzorci pevné parametry, - průměrný, - Standard odchylka.

Jsou uvedeny grafy hustoty pro různé parametry.

Charakteristická funkce normálního rozdělení má tvar:

Rozlišení charakteristické funkce a nastavení t = 0, získáváme okamžiky libovolného pořadí.

Křivka hustoty normální distribuce je symetrická vzhledem k a má v tomto bodě jediné maximum, rovné

Parametr standardní odchylky se pohybuje od 0 do ∞.

Průměrný se pohybuje od -∞ do +∞.

Jak se parametr zvyšuje, křivka se rozšiřuje podél osy X, tendence k 0 se kolem průměrné hodnoty smršťuje (parametr charakterizuje rozptyl, rozptyl).

Když se to změní křivka je posunuta podél osy X(viz grafy).

Změnou parametrů a získáme různé modely náhodných veličin, které vznikají v telefonii.

Typickou aplikací normálního zákona při analýze např. telekomunikačních dat je modelování signálu, popis šumu, rušení, chyb, provozu.

Grafy jednorozměrného normálního rozdělení

Obrázek 1. Graf hustoty normální distribuce: průměr je 0, směrodatná odchylka je 1

Obrázek 2. Graf hustoty standardní normální distribuce s oblastmi obsahujícími 68 % a 95 % všech pozorování

Obrázek 3. Grafy hustoty normálních rozdělení s nulovým průměrem a různými odchylkami (=0,5, =1, =2)

Obrázek 4 Grafy dvou normálních rozdělení N(-2,2) a N(3,2).

Všimněte si, že střed distribuce se při změně parametru posunul.

Komentář

V programu STATISTIKA označení N(3,2) je chápáno jako normální nebo Gaussův zákon s parametry: průměr = 3 a směrodatná odchylka =2.

V literatuře je někdy druhý parametr interpretován jako disperze, tj. náměstí standardní odchylka.

Výpočty procentuálního bodu normálního rozdělení pomocí kalkulátoru pravděpodobnosti STATISTIKA

Použití pravděpodobnostního kalkulátoru STATISTIKA je možné vypočítat různé charakteristiky rozdělení, aniž byste se museli uchylovat k těžkopádným tabulkám používaným ve starých knihách.

Krok 1. Spouštíme Analýza / Kalkulačka pravděpodobnosti / Distribuce.

V části distribuce vyberte normální.

Obrázek 5. Spuštění kalkulátoru rozdělení pravděpodobnosti

Krok 2 Uveďte parametry, které nás zajímají.

Například chceme vypočítat 95% kvantil normálního rozdělení s průměrem 0 a směrodatnou odchylkou 1.

Tyto parametry zadejte do polí kalkulačky (viz pole střední hodnoty a směrodatné odchylky kalkulačky).

Zaveďme parametr p=0,95.

Zaškrtávací políčko "Reverse f.r.". se zobrazí automaticky. Zaškrtněte políčko "Graf".

Klikněte na tlačítko "Vypočítat" v pravém horním rohu.

Obrázek 6. Nastavení parametrů

Krok 3 V poli Z získáme výsledek: hodnota kvantilu je 1,64 (viz další okno).

Obrázek 7. Zobrazení výsledku kalkulačky

Obrázek 8. Grafy hustoty a distribučních funkcí. Rovné x=1,644485

Obrázek 9. Grafy funkce normálního rozdělení. Svislé tečkované čáry - x=-1,5, x=-1, x=-0,5, x=0

Obrázek 10. Grafy funkce normálního rozdělení. Svislé tečkované čáry - x=0,5, x=1, x=1,5, x=2

Odhad parametrů normálního rozdělení

Hodnoty normálního rozdělení lze vypočítat pomocí interaktivní kalkulačka.

Dvourozměrné normální rozdělení

Jednorozměrné normální rozdělení přirozeně zobecňuje na dvourozměrný normální distribuce.

Pokud například uvažujete signál pouze v jednom bodě, pak vám stačí jednorozměrné rozložení, ve dvou bodech - dvourozměrné rozložení, ve třech bodech - trojrozměrné rozložení a tak dále.

Obecný vzorec pro bivariační normální rozdělení je:

Kde je párová korelace mezi x1 A x2;

x1 respektive;

Střední a směrodatná odchylka proměnné x2 respektive.

Pokud náhodné proměnné X 1 A X 2 jsou nezávislé, pak je korelace 0, = 0, prostřední člen v exponentu zmizí a máme:

f(x 1 ,x 2) = f(x 1)*f(x 2)

U nezávislých veličin se dvourozměrná hustota rozkládá na součin dvou jednorozměrných hustot.

Dvourozměrné grafy normální hustoty

Obrázek 11. Graf hustoty bivariačního normálního rozdělení (nulový střední vektor, jednotková kovarianční matice)

Obrázek 12. Řez grafu hustoty dvourozměrného normálního rozdělení rovinou z=0,05

Obrázek 13. Graf hustoty bivariačního normálního rozdělení (nulový vektor očekávání, kovarianční matice s 1 na hlavní diagonále a 0,5 na boční diagonále)

Obrázek 14. Průřez 2D grafem normální hustoty (očekávací vektor nula, kovarianční matice s 1 na hlavní diagonále a 0,5 na boční diagonále) rovinou z= 0,05

Obrázek 15. Graf hustoty bivariačního normálního rozdělení (nulový vektor očekávání, kovarianční matice s 1 na hlavní diagonále a -0,5 na boční diagonále)

Obrázek 16. Průřez grafem hustoty dvourozměrného normálního rozdělení (vektor nulového očekávání, kovarianční matice s 1 na hlavní diagonále a -0,5 na boční diagonále) rovinou z=0,05

Obrázek 17. Průřezy grafů 2D hustot normálního rozdělení rovinou z=0,05

Pro lepší pochopení bivariačního normálního rozdělení vyzkoušejte následující problém.

Úkol. Podívejte se na graf dvourozměrného normálního rozdělení. Přemýšlejte o tom, lze to znázornit jako rotaci grafu jednorozměrného normálního rozdělení? Kdy je potřeba použít deformační techniku?