Jak vypočítat interval spolehlivosti. Otázky k samovyšetření žáků

Konstantin Krawchik jasně vysvětluje, co je interval spolehlivosti v lékařském výzkumu a jak jej používat

„Katren-Style“ pokračuje ve vydávání cyklu Konstantina Kravchika o lékařských statistikách. Ve dvou předchozích článcích se autor dotkl vysvětlení takových pojmů jako a.

Konstantin Kravchik

Matematik-analytik. Specialista v oboru statistické studie v lékařství a humanitních věd

Moskva město

Velmi často se v článcích o klinických studiích můžete setkat se záhadnou frází: „interval spolehlivosti“ (95% CI nebo 95% CI - interval spolehlivosti). V článku může být například uvedeno: "K posouzení významnosti rozdílů byl použit studentský t-test s vypočítaným 95% intervalem spolehlivosti."

Jaká je hodnota „95% intervalu spolehlivosti“ a proč jej počítat?

Co je interval spolehlivosti? - Toto je rozsah, ve kterém spadají skutečné průměrné hodnoty v populaci. A co, existují "nepravdivé" průměry? V jistém smyslu ano, dělají. Vysvětlili jsme, že je nemožné měřit sledovaný parametr v celé populaci, takže se výzkumníci spokojili s omezeným vzorkem. V tomto vzorku (například podle tělesné hmotnosti) je jedna průměrná hodnota (určitá hmotnost), podle které posuzujeme průměrnou hodnotu v celé běžné populaci. Je však nepravděpodobné, že by se průměrná hmotnost ve vzorku (zejména malém) shodovala s průměrnou hmotností v obecné populaci. Proto je správnější vypočítat a použít rozsah průměrných hodnot běžné populace.

Předpokládejme například, že 95% interval spolehlivosti (95% CI) pro hemoglobin je mezi 110 a 122 g/l. To znamená, že s 95 % pravděpodobností bude skutečná střední hodnota hemoglobinu v běžné populaci v rozmezí od 110 do 122 g/l. Jinými slovy, neznáme průměrný hemoglobin v běžné populaci, ale můžeme s 95% pravděpodobností uvést rozsah hodnot pro tuto vlastnost.

Intervaly spolehlivosti jsou zvláště důležité pro rozdíl v průměrech mezi skupinami nebo to, co se nazývá velikost účinku.

Předpokládejme, že jsme porovnali účinnost dvou přípravků železa: jednoho, který je na trhu již dlouho, a jednoho, který byl právě registrován. Po ukončení terapie byla stanovena koncentrace hemoglobinu ve studovaných skupinách pacientů a statistický program vypočítali jsme, že rozdíl mezi středními hodnotami obou skupin s pravděpodobností 95 % je v rozmezí od 1,72 do 14,36 g/l (tabulka 1).

Tab. 1. Kritérium pro nezávislé vzorky
(skupiny se porovnávají podle hladiny hemoglobinu)

To je třeba interpretovat následovně: u části pacientů v běžné populaci, kteří užívají nový lék, bude hemoglobin vyšší v průměru o 1,72–14,36 g/l než u těch, kteří užívali již známý lék.

Jinými slovy, v obecné populaci je rozdíl v průměrných hodnotách hemoglobinu ve skupinách s 95% pravděpodobností v těchto mezích. Bude na výzkumníkovi, aby posoudil, zda je to hodně nebo málo. Smyslem toho všeho je, že nepracujeme s jednou průměrnou hodnotou, ale s rozsahem hodnot, proto spolehlivěji odhadneme rozdíl v parametru mezi skupinami.

Ve statistických balíčcích lze podle uvážení výzkumníka nezávisle zúžit nebo rozšířit hranice intervalu spolehlivosti. Snížením pravděpodobností intervalu spolehlivosti zúžíme rozsah průměrů. Například při 90% CI bude rozsah průměrů (nebo průměrných rozdílů) užší než při 95% CI.

Naopak zvýšení pravděpodobnosti na 99 % rozšiřuje rozsah hodnot. Při porovnávání skupin může spodní hranice CI překročit nulovou značku. Pokud jsme například rozšířili hranice intervalu spolehlivosti na 99 %, pak se hranice intervalu pohybovaly od –1 do 16 g/L. To znamená, že v obecné populaci existují skupiny, u nichž je rozdíl mezi průměry, mezi nimiž pro studovaný znak, 0 (M=0).

Intervaly spolehlivosti lze použít k testování statistických hypotéz. Pokud interval spolehlivosti překročí nulovou hodnotu, pak platí nulová hypotéza, která předpokládá, že se skupiny ve studovaném parametru neliší. Výše je popsán příklad, kdy jsme rozšířili hranice na 99 %. Někde v běžné populaci jsme našli skupiny, které se nijak nelišily.

95% interval spolehlivosti rozdílu v hemoglobinu, (g/l)


Obrázek ukazuje 95% interval spolehlivosti průměrného rozdílu hemoglobinu mezi těmito dvěma skupinami jako čáru. Čára prochází nulovou značkou, proto je rozdíl mezi průměry roven nule, což potvrzuje nulovou hypotézu, že se skupiny neliší. Rozdíl mezi skupinami se pohybuje od -2 do 5 g/l, což znamená, že hemoglobin se může buď snížit o 2 g/l, nebo zvýšit o 5 g/l.

Interval spolehlivosti je velmi důležitým ukazatelem. Díky ní můžete vidět, zda rozdíly ve skupinách byly skutečně způsobeny rozdílem v průměrech nebo díky velkému vzorku, protože u velkého vzorku je šance na nalezení rozdílů větší než u malého.

V praxi to může vypadat takto. Odebrali jsme vzorek 1000 lidí, změřili hladinu hemoglobinu a zjistili, že interval spolehlivosti pro rozdíl v průměrech leží od 1,2 do 1,5 g/l. Hladina statistické významnosti v tomto případě p

Vidíme, že koncentrace hemoglobinu se zvýšila, ale téměř neznatelně, statistická významnost se proto objevila právě kvůli velikosti vzorku.

Intervaly spolehlivosti lze vypočítat nejen pro průměry, ale také pro podíly (a rizikové poměry). Zajímá nás například interval spolehlivosti podílů pacientů, kteří dosáhli remise při užívání vyvinutého léku. Předpokládejme, že 95% CI pro podíly, tj. pro podíl takových pacientů, je v rozmezí 0,60–0,80. Můžeme tedy říci, že naše medicína má terapeutický účinek v 60 až 80 % případů.

Jedna z metod řešení statistické úlohy je výpočet intervalu spolehlivosti. Používá se jako preferovaná alternativa k bodovému odhadu, když je velikost vzorku malá. Je třeba poznamenat, že proces výpočtu intervalu spolehlivosti je poměrně komplikovaný. Nástroje programu Excel vám to ale umožňují poněkud zjednodušit. Pojďme zjistit, jak se to dělá v praxi.

Tato metoda se používá při intervalovém odhadu různých statistických veličin. Hlavním úkolem tohoto výpočtu je zbavit se nejistot bodového odhadu.

V aplikaci Excel existují dvě hlavní možnosti výpočtu pomocí této metody: když je rozptyl známý, a když je neznámý. V prvním případě se funkce používá pro výpočty SEBEVĚDOMÁ NORMA a ve druhém DŮVĚŘOVAT.STUDENT.

Metoda 1: Funkce CONFIDENCE NORM

Operátor SEBEVĚDOMÁ NORMA, který odkazuje na statistickou skupinu funkcí, se poprvé objevil v Excelu 2010. Dřívější verze tohoto programu používají jeho protějšek DŮVĚRA. Úkolem tohoto operátoru je vypočítat interval spolehlivosti s normálním rozdělením pro průměr populace.

Jeho syntaxe je následující:

CONFIDENCE NORM(alfa; standardní_vývoj; velikost)

"alfa" je argument udávající hladinu významnosti, která se používá k výpočtu hladiny spolehlivosti. Úroveň spolehlivosti se rovná následujícímu výrazu:

(1-"Alfa")*100

"Standardní odchylka" je argument, jehož podstata je zřejmá již z názvu. Tento standardní odchylka navrhovaný vzorek.

"Velikost" je argument, který určuje velikost vzorku.

Všechny argumenty pro tento operátor jsou povinné.

Funkce DŮVĚRA má úplně stejné argumenty a možnosti jako předchozí. Jeho syntaxe je:

TRUST(alfa; standardní_vývoj; velikost)

Jak vidíte, rozdíly jsou pouze ve jménu operátora. Tato funkce byla zachována v Excelu 2010 a novějších verzích ve speciální kategorii z důvodů kompatibility. "Kompatibilita". Ve verzích Excelu 2007 a starších je přítomen v hlavní skupině statistických operátorů.

Hranice intervalu spolehlivosti se určí pomocí vzorce v následujícím tvaru:

X+(-)SEVĚDOMÍ NORM

Kde X je průměr vzorku, který se nachází uprostřed zvoleného rozsahu.

Nyní se podívejme, jak vypočítat interval spolehlivosti pro konkrétní příklad. Bylo provedeno 12 testů, jejichž výsledkem byly různé výsledky, které jsou uvedeny v tabulce. Tohle je naše totalita. Standardní odchylka je 8. Potřebujeme vypočítat interval spolehlivosti na hladině spolehlivosti 97 %.

  1. Vyberte buňku, kde se zobrazí výsledek zpracování dat. Kliknutím na tlačítko "Vložit funkci".
  2. Objeví se Průvodce funkcí. Přejít do kategorie "Statistický" a zvýrazněte jméno "CONFIDENCE.NORM". Poté klikněte na tlačítko OK.
  3. Otevře se okno s argumenty. Jeho pole přirozeně odpovídají názvům argumentů.
    Nastavte kurzor na první pole - "alfa". Zde bychom měli specifikovat hladinu významnosti. Jak si pamatujeme, naše úroveň důvěry je 97 %. Zároveň jsme řekli, že se to počítá takto:

    (1-úroveň důvěryhodnosti)/100

    To znamená, že dosazením hodnoty získáme:

    Jednoduchými výpočty zjistíme, že argument "alfa" rovná se 0,03 . Zadejte tuto hodnotu do pole.

    Jak víte, směrodatná odchylka je rovna 8 . Proto v terénu "Standardní odchylka" stačí napsat to číslo.

    V terénu "Velikost" musíte zadat počet prvků provedených testů. Jak si pamatujeme, oni 12 . Ale abychom vzorec zautomatizovali a nemuseli jej upravovat pokaždé, když je spuštěn nový test, nastavme tuto hodnotu na společné číslo a pomocí operátora ŠEK. Nastavíme tedy kurzor do pole "Velikost" a poté klikněte na trojúhelník, který se nachází vlevo od řádku vzorců.

    Zobrazí se seznam naposledy použitých funkcí. Pokud operátor ŠEK kterou jste nedávno použili, měla by být na tomto seznamu. V tomto případě stačí kliknout na jeho název. V opačném případě, pokud to nenajdete, přejděte k věci "Další funkce...".

  4. Zdá se nám to již povědomé Průvodce funkcí. Přesun zpět do skupiny "Statistický". Tam vybereme jméno "ŠEK". Klikněte na tlačítko OK.
  5. Zobrazí se okno argumentů pro výše uvedený operátor. Tato funkce je určena k výpočtu počtu buněk v zadaném rozsahu, které obsahují číselné hodnoty. Jeho syntaxe je následující:

    POČET(hodnota1; hodnota2;…)

    Skupina argumentů "hodnoty" je odkaz na rozsah, ve kterém chcete vypočítat počet buněk vyplněných číselnými údaji. Celkem může být takových argumentů až 255, ale v našem případě potřebujeme pouze jeden.

    Nastavte kurzor do pole "Hodnota 1" a podržením levého tlačítka myši vyberte rozsah na listu, který obsahuje naši populaci. Poté se v poli zobrazí jeho adresa. Klikněte na tlačítko OK.

  6. Poté aplikace provede výpočet a výsledek zobrazí v buňce, kde je sama. V našem konkrétním případě vzorec dopadl takto:

    CONFIDENCE NORM(0,03;8;POČET(B2:B13))

    Celkový výsledek výpočtů byl 5,011609 .

  7. Ale to není vše. Jak si pamatujeme, hranice intervalu spolehlivosti se vypočítává přičtením a odečtením průměrné hodnoty vzorku výsledku výpočtu SEBEVĚDOMÁ NORMA. Tímto způsobem se vypočítá pravá a levá hranice intervalu spolehlivosti. Samotný výběrový průměr lze vypočítat pomocí operátoru PRŮMĚRNÝ.

    Tento operátor je určen k výpočtu aritmetického průměru zvoleného rozsahu čísel. Má následující poměrně jednoduchou syntaxi:

    AVERAGE(číslo1; číslo2;…)

    Argument "Číslo" může být buď jedna číselná hodnota nebo odkaz na buňky nebo dokonce celé rozsahy, které je obsahují.

    Vyberte tedy buňku, ve které se zobrazí výpočet průměrné hodnoty, a klikněte na tlačítko "Vložit funkci".

  8. otevře Průvodce funkcí. Zpět do kategorie "Statistický" a vyberte jméno ze seznamu "PRŮMĚRNÝ". Jako vždy klikněte na tlačítko OK.
  9. Otevře se okno s argumenty. Nastavte kurzor do pole "Číslo 1" a se stisknutým levým tlačítkem myši vyberte celý rozsah hodnot. Po zobrazení souřadnic v poli klikněte na tlačítko OK.
  10. Potom PRŮMĚRNÝ vypíše výsledek výpočtu na prvek listu.
  11. Vypočítáme pravou hranici intervalu spolehlivosti. Chcete-li to provést, vyberte samostatnou buňku a vložte znaménko «=» a přidejte obsah prvků listu, ve kterých jsou umístěny výsledky výpočtu funkcí PRŮMĚRNÝ A SEBEVĚDOMÁ NORMA. Chcete-li provést výpočet, stiskněte tlačítko Vstupte. V našem případě jsme dostali následující vzorec:

    Výsledek výpočtu: 6,953276

  12. Stejným způsobem vypočítáme levou hranici intervalu spolehlivosti, pouze tentokrát z výsledku výpočtu PRŮMĚRNÝ odečtěte výsledek výpočtu operátora SEBEVĚDOMÁ NORMA. Ukazuje se vzorec pro náš příklad následujícího typu:

    Výsledek výpočtu: -3,06994

  13. Snažili jsme se podrobně popsat všechny kroky pro výpočet intervalu spolehlivosti, proto jsme podrobně popsali každý vzorec. Všechny akce ale můžete spojit do jednoho vzorce. Výpočet pravé hranice intervalu spolehlivosti lze zapsat následovně:

    AVERAGE(B2:B13)+CONFIDENCE(0,03;8;COUNT(B2:B13))

  14. Podobný výpočet levého okraje by vypadal takto:

    AVERAGE(B2:B13)-CONFIDENCE.NORM(0.03;8;COUNT(B2:B13))

Metoda 2: Funkce TRUST.STUDENT

Kromě toho existuje v Excelu další funkce, která souvisí s výpočtem intervalu spolehlivosti - DŮVĚŘOVAT.STUDENT. Objevuje se teprve od Excelu 2010. Tento operátor provádí výpočet populačního intervalu spolehlivosti pomocí Studentova t-rozdělení. Je velmi vhodné jej použít v případě, kdy je neznámý rozptyl a tedy i směrodatná odchylka. Syntaxe operátoru je:

TRUST.STUDENT(alfa;standardní_vývoj;velikost)

Jak vidíte, jména operátorů v tomto případě zůstala nezměněna.

Podívejme se, jak vypočítat hranice intervalu spolehlivosti s neznámou směrodatnou odchylkou na příkladu stejné populace, kterou jsme uvažovali v předchozí metodě. Úroveň důvěry, stejně jako minule, vezmeme 97%.

  1. Vyberte buňku, ve které se provede výpočet. Klikněte na tlačítko "Vložit funkci".
  2. V otevřeném Průvodce funkcí přejděte do kategorie "Statistický". Vyberte jméno "DŮVĚRA.STUDENT". Klikněte na tlačítko OK.
  3. Spustí se okno argumentů pro zadaný operátor.

    V terénu "alfa", vzhledem k tomu, že hladina spolehlivosti je 97 %, zapíšeme si číslo 0,03 . Podruhé se nebudeme zdržovat principy výpočtu tohoto parametru.

    Poté nastavte kurzor do pole "Standardní odchylka". Tentokrát je nám tento ukazatel neznámý a je potřeba jej spočítat. To se provádí pomocí speciální funkce - STDEV.V. Okno tohoto operátoru vyvoláte kliknutím na trojúhelník vlevo od řádku vzorců. Pokud nenajdeme požadované jméno v seznamu, který se otevře, přejděte na položku "Další funkce...".

  4. běží Průvodce funkcí. Přesun do kategorie "Statistický" a označte jméno "STDEV.B". Poté klikněte na tlačítko OK.
  5. Otevře se okno s argumenty. úkol operátora STDEV.V je definice směrodatné odchylky ve vzorkování. Jeho syntaxe vypadá takto:

    STDEV.V(číslo1,číslo2,…)

    Je snadné uhodnout, že argument "Číslo" je adresa prvku výběru. Pokud je výběr umístěn v jediném poli, pak pomocí pouze jednoho argumentu můžete dát odkaz na tento rozsah.

    Nastavte kurzor do pole "Číslo 1" a jako vždy podržením levého tlačítka myši vyberte sadu. Jakmile jsou souřadnice v poli, nespěchejte se stisknutím tlačítka OK protože výsledek bude nesprávný. Nejprve se musíme vrátit do okna argumentů operátora DŮVĚŘOVAT.STUDENT učinit poslední argument. Chcete-li to provést, klikněte na příslušný název v řádku vzorců.

  6. Znovu se otevře okno argumentů již známé funkce. Nastavte kurzor do pole "Velikost". Opět klikněte na nám již známý trojúhelník a přejděte k volbě operátorů. Jak jste pochopili, potřebujeme jméno "ŠEK". Protože jsme tuto funkci použili ve výpočtech v předchozí metodě, je v tomto seznamu přítomna, takže na ni stačí kliknout. Pokud jej nenajdete, postupujte podle algoritmu popsaného v první metodě.
  7. Vstup do okna argumentů ŠEK, umístěte kurzor do pole "Číslo 1" a při stisknutém tlačítku myši vyberte kolekci. Poté klikněte na tlačítko OK.
  8. Poté program vypočítá a zobrazí hodnotu intervalu spolehlivosti.
  9. Pro určení hranic budeme opět muset vypočítat výběrový průměr. Ale vzhledem k tomu, že výpočetní algoritmus pomocí vzorce PRŮMĚRNÝ stejně jako u předchozího způsobu a ani výsledek se nezměnil, nebudeme se tím podruhé podrobně zabývat.
  10. Sečtení výsledků výpočtu PRŮMĚRNÝ A DŮVĚŘOVAT.STUDENT, získáme pravou hranici intervalu spolehlivosti.
  11. Odečtením od výsledků výpočtu operátora PRŮMĚRNÝ výsledek výpočtu DŮVĚŘOVAT.STUDENT, máme levou hranici intervalu spolehlivosti.
  12. Pokud je výpočet zapsán v jednom vzorci, bude výpočet pravé hranice v našem případě vypadat takto:

    PRŮMĚR (B2:B13)+SEVĚDOMÍ STUDENTŮ (0,03,STDV(B2:B13),POČET(B2:B13))

  13. Podle toho bude vzorec pro výpočet levého okraje vypadat takto:

    PRŮMĚRNÉ(B2:B13)-SEBVĚDOMÍ STUDENTŮ(0,03;STDV(B2:B13);POČET(B2:B13))

Jak je vidět, nástroje programu Excel umožňují výrazně usnadnit výpočet intervalu spolehlivosti a jeho hranic. Pro tyto účely se používají samostatné operátory pro vzorky, jejichž rozptyl je známý a neznámý.

Příkladem intervalového odhadu je interval spolehlivosti. Interval spolehlivosti je segment, jehož střed je bodovým odhadem číselné charakteristiky, včetně skutečné hodnoty této číselné charakteristiky s danou pravděpodobností. Tato pravděpodobnost se nazývá pravděpodobnost spolehlivosti. Interval spolehlivosti je tedy mírou přesnosti odhadu a pravděpodobnost spolehlivosti charakterizuje jeho spolehlivost. Velikost intervalu spolehlivosti závisí na tom, jakou hodnotu pravděpodobnosti spolehlivosti udává experimentátor. Čím vyšší je úroveň spolehlivosti, tím širší musí být interval, aby byla zahrnuta skutečná hodnota číselné charakteristiky s danou pravděpodobností. Často je zvolena hodnota spolehlivosti Pd = 0,95, takže se věří, že tato hodnota je dostatečně velká, aby bylo možné uvažovat, že interval spolehlivosti „téměř vždy“ pokrývá skutečnou hodnotu. Jen někdy se v případě odpovědného a velmi zodpovědného výzkumu předpokládá P d = 0,99, respektive 0,999.

Postup pro konstrukci intervalu spolehlivosti zahrnuje dva kroky:

Psaní pravděpodobnostního tvrzení o některých náhodná funkce, která zahrnuje rozdíl nebo poměr hodnocení a číselné charakteristiky. Taková funkce nese informaci o míře blízkosti zmíněných hodnot. Je nutné, aby byl znám distribuční zákon funkce;

Pravděpodobnostní tvrzení je transformováno do formy, ve které jsou hranice intervalu spolehlivosti numerické charakteristiky uvedeny v explicitní podobě.

Příklady funkcí se známým rozdělením, které splňují požadované požadavky, jsou následující:

mající normální rozdělení, pokud je hodnota X normálně rozdělena a hodnota s[X] je známá;

2) (3.25)

mající Studentovo rozdělení c m = N-1, pokud je hodnota X normálně rozdělena a hodnota s[X] není předem známa, ale její odhad lze získat z experimentálních dat pomocí vzorce (3.23);

3) (3.26)

mající Pearsonovo rozdělení s m = N-1, pokud je hodnota X normálně rozdělena.

Připomeňme, že distribuční parametry m jsou počty stupňů volnosti. Kromě toho se zde používají následující zápisy: - aritmetická střední hodnota, - střední odmocnina rovna druhé odmocnině rozptylu, [X] - odhad střední hodnoty rámce, definovaný jako druhá odmocnina nestranného odhadu rozptyl, N - velikost vzorku.

Funkce Z a t lze použít ke konstrukci intervalu spolehlivosti pro matematické očekávání, zatímco funkce c 2 se používá ke konstrukci intervalu spolehlivosti pro rozptyl.


Sestrojme interval spolehlivosti pro matematické očekávání za předpokladu, že máme k dispozici výsledky N pozorování normálně rozdělené veličiny X a střední kvadratická hodnota je předem známa z nezávislých pozorování. Protože funkce Z je normálně rozdělena, můžete pomocí příslušné tabulky určit hodnotu z a tak, že mimo - za a + z a zůstane část plochy pod distribuční křivkou v součtu rovném a, zatímco uvnitř [- z a ,+ z a ] leží část plochy rovna 1 - a . To, co bylo právě řečeno, odpovídá následujícímu pravděpodobnostnímu tvrzení:

Р(- z a £ £+z a )= 1-a. (3,27)

(Pravděpodobnost splnění nerovnosti ve složených závorkách je 1-a.). Převedeme výraz v závorkách:

Р(-z a ) = 1 - a

Hodnotu 1-a = Р d nazýváme pravděpodobnost spolehlivosti Р d. Podle (3.28) je při této pravděpodobnosti spolehlivosti interval spolehlivosti pro M[X] dán limity:

. (3.29)

Komentář: Bohužel tabulky normální distribuce v různých knihách jsou konstruovány odlišně. Někdy je dán pravděpodobnostní integrál

Ф(z) =

Předpokládejme, že máme velké množství položek s normálním rozložením některých vlastností (například plný sklad zeleniny stejného druhu, jejíž velikost a hmotnost se liší). Chcete znát průměrné vlastnosti celé šarže zboží, ale nemáte čas ani chuť každou zeleninu měřit a vážit. Chápete, že to není nutné. Kolik kusů byste ale potřebovali vzít k namátkové kontrole? Než uvedeme některé vzorce užitečné pro tuto situaci, připomeneme si nějaký zápis. Za prvé, pokud bychom změřili celý sklad zeleniny (tento soubor prvků se nazývá obecná populace), pak bychom s veškerou přesností, kterou máme k dispozici, zjistili průměrnou hodnotu hmotnosti celé dávky. Říkejme tomu průměr X průměrný gen. - obecný průměr. Již víme, co je zcela určeno, pokud je známa jeho střední hodnota a odchylka s. Pravda, zatím neznáme ani průměrný X gen, ani geny obecné populace. Můžeme odebrat pouze nějaký vzorek, změřit hodnoty, které potřebujeme a vypočítat pro tento vzorek jak průměrnou hodnotu X avg., tak i směrodatnou odchylku S vyb. Je známo, že pokud naše výběrová kontrola obsahuje velké množství prvků (obvykle n více než 30), a jsou odebírány opravdu náhodně, pak se s populace téměř nebudou lišit od vzorků S. Navíc pro případ např. normální rozdělení, můžeme použít následující vzorce:

S pravděpodobností 95%

S pravděpodobností 99%

.

V obecný pohled s pravděpodobností Р(t)

Vztah mezi hodnotou t a hodnotou pravděpodobnosti P(t), se kterou chceme znát interval spolehlivosti, lze převzít z následující tabulky:

P(t) 0,683 0,950 0,954 0,990 0,997
t 1,00 1,96 2,00 2,58 3,00

Zjistili jsme tedy, v jakém rozmezí je průměrná hodnota pro běžnou populaci (s danou pravděpodobností).

Pokud nemáme dostatečně velký vzorek, nemůžeme tvrdit, že populace má s = S vzorků. V tomto případě je navíc problematická blízkost vzorku k normálnímu rozdělení. V tomto případě také použijte S s místo s ve vzorci:

ale hodnota t pro pevnou pravděpodobnost P(t) bude záviset na počtu prvků ve vzorku n. Čím větší n, tím blíže bude výsledný interval spolehlivosti hodnotě dané vzorcem (1). Hodnoty t jsou v tomto případě převzaty z jiné tabulky (Studentův t-test), kterou uvádíme níže:

Hodnoty Studentova t-testu pro pravděpodobnost 0,95 a 0,99 

n P n P
0.95 0.99 0.95 0.99
2 12.71 63.66 18 2.11 2.90
3 4.30 9.93 19 2.10 2.88
4 3.18 5.84 20 2.093 2.861
5 2.78 4.60 25 2.064 2.797
6 2.57 4.03 30 2.045 2.756
7 2.45 3.71 35 2.032 2.720
8 2.37 3.50 40 2.022 2.708
9 2.31 3.36 45 2.016 2.692
10 2.26 3.25 50 2.009 2.679
11 2.23 3.17 60 2.001 2.662
12 2.20 3.11 70 1.996 2.649
13 2.18 3.06 80 1.991 2.640
14 2.16 3.01 90 1.987 2.633
15 2.15 2.98 100 1.984 2.627
16 2.13 2.95 120 1.980 2.617
17 2.12 2.92 >120 1.960 2.576

Příklad 3 Ze zaměstnanců firmy bylo náhodně vybráno 30 lidí. Podle vzorku se ukázalo, že průměrná mzda (za měsíc) je 10 tisíc rublů s průměrnou čtvercovou odchylkou 3 tisíce rublů. S pravděpodobností 0,99 určete průměrnou mzdu ve firmě. Řešení: Podle podmínky máme n = 30, X srov. = 10 000, S = 3 000, P = 0,99. Pro zjištění intervalu spolehlivosti použijeme vzorec odpovídající Studentovu kritériu. Podle tabulky pro n \u003d 30 a P \u003d 0,99 tedy najdeme t \u003d 2,756,

těch. požadovaný interval spolehlivosti 27484< Х ср.ген < 32516.

Takže s pravděpodobností 0,99 lze tvrdit, že interval (27484; 32516) obsahuje průměrnou mzdu ve firmě.
Doufáme, že tuto metodu využijete, aniž byste s sebou museli pokaždé mít tabulku. Výpočty lze provádět automaticky v Excelu. V souboru aplikace Excel klikněte na tlačítko fx v horní nabídce. Poté vyberte mezi funkcemi typ "statistické" a z navrženého seznamu v rámečku - STEUDRASP. Poté na výzvu umístěním kurzoru do pole "pravděpodobnost" zadejte hodnotu reciproční pravděpodobnosti (tj. v našem případě místo pravděpodobnosti 0,95 je třeba zadat pravděpodobnost 0,05). Zřejmě je tabulka navržena tak, aby výsledek odpovídal na otázku, s jakou pravděpodobností se můžeme mýlit. Podobně do pole "stupeň volnosti" zadejte hodnotu (n-1) pro váš vzorek.

Interval spolehlivosti pro matematické očekávání - to je takový interval vypočítaný z dat, který se známou pravděpodobností obsahuje matematické očekávání běžné populace. Přirozeným odhadem pro matematické očekávání je aritmetický průměr jeho pozorovaných hodnot. Proto dále v průběhu lekce budeme používat pojmy „průměr“, „průměrná hodnota“. V úlohách výpočtu intervalu spolehlivosti je nejčastěji vyžadována odpověď „Interval spolehlivosti průměrného čísla [hodnota v konkrétním problému] je od [nižší hodnota] do [vyšší hodnota]“. Pomocí intervalu spolehlivosti je možné hodnotit nejen průměrné hodnoty, ale i podíl toho či onoho znaku obecné populace. V lekci jsou rozebrány střední hodnoty, rozptyl, směrodatná odchylka a chyba, pomocí kterých se dostaneme k novým definicím a vzorcům Charakteristika vzorku a populace .

Bodové a intervalové odhady průměru

Pokud je průměrná hodnota obecné populace odhadnuta číslem (bodem), pak se jako odhad neznámého průměru obecné populace bere konkrétní průměr vypočítaný ze vzorku pozorování. V tomto případě je střední hodnota vzorku náhodná proměnná- neshoduje se s průměrnou hodnotou běžné populace. Při indikaci střední hodnoty vzorku je tedy nutné současně indikovat i výběrovou chybu. Standardní chyba se používá jako míra výběrové chyby, která je vyjádřena ve stejných jednotkách jako průměr. Proto se často používá následující zápis: .

Je-li požadováno, aby odhad střední hodnoty byl spojen s určitou pravděpodobností, pak parametr obecné zájmové populace musí být odhadnut nikoli jedním číslem, ale intervalem. Interval spolehlivosti je interval, ve kterém s určitou pravděpodobností P je zjištěna hodnota odhadovaného ukazatele obecné populace. Interval spolehlivosti, ve kterém s pravděpodobností P = 1 - α je náhodná proměnná , se vypočítá takto:

,

α = 1 - P, kterou najdete v příloze téměř každé knihy o statistice.

V praxi průměr a rozptyl populace nejsou známy, takže rozptyl populace je nahrazen rozptylem výběru a průměr populace průměrem vzorku. Interval spolehlivosti se tedy ve většině případů vypočítá takto:

.

Vzorec intervalu spolehlivosti lze použít k odhadu střední hodnoty populace, jestliže

  • je známa standardní odchylka obecné populace;
  • nebo není známa standardní odchylka základního souboru, ale velikost vzorku je větší než 30.

Výběrový průměr je nestranný odhad průměru populace. Na druhé straně, rozptyl vzorku není nestranný odhad rozptylu populace. Pro získání nezkresleného odhadu rozptylu populace ve vzorci pro rozptyl vzorku je velikost vzorku n by měl být nahrazen n-1.

Příklad 1 Ze 100 náhodně vybraných kaváren v určitém městě se shromažďuje informace, že průměrný počet zaměstnanců v nich je 10,5 se směrodatnou odchylkou 4,6. Určete interval spolehlivosti 95 % počtu zaměstnanců kavárny.

kde je kritická hodnota standardního normálního rozdělení pro hladinu významnosti α = 0,05 .

95% interval spolehlivosti pro průměrný počet zaměstnanců kavárny byl tedy mezi 9,6 a 11,4.

Příklad 2 Pro náhodný vzorek z obecné populace 64 pozorování byly vypočteny následující celkové hodnoty:

součet hodnot v pozorováních,

součet čtverců odchylek hodnot od průměru .

Vypočítejte 95% interval spolehlivosti pro očekávanou hodnotu.

vypočítat směrodatnou odchylku:

,

vypočítat průměrnou hodnotu:

.

Interval spolehlivosti nahraďte hodnotami ve výrazu:

kde je kritická hodnota standardního normálního rozdělení pro hladinu významnosti α = 0,05 .

Dostaneme:

95% interval spolehlivosti pro matematické očekávání tohoto vzorku se tedy pohyboval od 7,484 do 11,266.

Příklad 3 Pro náhodný vzorek z obecné populace 100 pozorování byla vypočtena střední hodnota 15,2 a směrodatná odchylka 3,2. Vypočítejte 95% interval spolehlivosti pro očekávanou hodnotu a poté 99% interval spolehlivosti. Pokud výkon vzorku a jeho variace zůstanou stejné, ale faktor spolehlivosti se zvýší, bude se interval spolehlivosti zužovat nebo rozšiřovat?

Tyto hodnoty dosadíme do výrazu pro interval spolehlivosti:

kde je kritická hodnota standardního normálního rozdělení pro hladinu významnosti α = 0,05 .

Dostaneme:

.

95% interval spolehlivosti pro průměr tohoto vzorku byl tedy od 14,57 do 15,82.

Opět dosadíme tyto hodnoty do výrazu pro interval spolehlivosti:

kde je kritická hodnota standardního normálního rozdělení pro hladinu významnosti α = 0,01 .

Dostaneme:

.

99% interval spolehlivosti pro průměr tohoto vzorku byl tedy od 14,37 do 16,02.

Jak vidíte, jak se faktor spolehlivosti zvyšuje, kritická hodnota standardního normálního rozdělení také roste, a proto jsou počáteční a koncové body intervalu umístěny dále od průměru, a tedy intervalu spolehlivosti pro matematické očekávání. zvyšuje.

Bodové a intervalové odhady měrné hmotnosti

Podíl některého znaku vzorku lze interpretovat jako bodový odhad podílu p stejný rys v běžné populaci. Pokud je třeba tuto hodnotu spojit s pravděpodobností, měl by se vypočítat interval spolehlivosti specifické hmotnosti p rys v obecné populaci s pravděpodobností P = 1 - α :

.

Příklad 4 V určitém městě jsou dva kandidáti A A B kandidovat na starostu. Náhodně bylo dotázáno 200 obyvatel města, z nichž 46 % odpovědělo, že by kandidáta volili A, 26 % - pro kandidáta B a 28 % neví, koho budou volit. Určete 95% interval spolehlivosti pro podíl obyvatel města, kteří kandidáta podporují A.