Kā aprēķināt ticamības intervālu. Jautājumi skolēnu pašpārbaudei

Konstantīns Krawčiks skaidri izskaidro, kas ir ticamības intervāls medicīniskajos pētījumos un kā to izmantot

"Katren-Style" turpina izdot Konstantīna Kravčika ciklu par medicīnas statistiku. Divos iepriekšējos rakstos autore pieskārās tādu jēdzienu kā un skaidrojumam.

Konstantīns Kravčiks

Matemātiķis-analītiķis. Jomas speciālists statistikas pētījumi medicīnā un humanitārās zinātnes

Maskavas pilsēta

Ļoti bieži rakstos par klīniskajiem pētījumiem var atrast noslēpumainu frāzi: "uzticamības intervāls" (95% TI vai 95% TI - ticamības intervāls). Piemēram, rakstā varētu būt teikts: "Studenta t-tests tika izmantots, lai novērtētu atšķirību nozīmīgumu, un tika aprēķināts 95% ticamības intervāls."

Kāda ir "95% ticamības intervāla" vērtība un kāpēc tā jāaprēķina?

Kas ir ticamības intervāls? - Šis ir diapazons, kurā ietilpst patiesās vidējās vērtības populācijā. Un ko, ir "nepatiesi" vidējie rādītāji? Savā ziņā jā, viņi to dara. Mēs paskaidrojām, ka nav iespējams izmērīt interesējošo parametru visā populācijā, tāpēc pētnieki ir apmierināti ar ierobežotu izlasi. Šajā izlasē (piemēram, pēc ķermeņa svara) ir viena vidējā vērtība (noteikts svars), pēc kuras mēs spriežam par vidējo vērtību visā vispārējā populācijā. Tomēr maz ticams, ka vidējais svars izlasē (īpaši mazā) sakritīs ar vidējo svaru vispārējā populācijā. Tāpēc pareizāk ir aprēķināt un izmantot vispārējās populācijas vidējo vērtību diapazonu.

Piemēram, pieņemsim, ka hemoglobīna 95% ticamības intervāls (95% TI) ir no 110 līdz 122 g/l. Tas nozīmē, ka ar 95 % varbūtību hemoglobīna patiesā vidējā vērtība vispārējā populācijā būs robežās no 110 līdz 122 g/l. Citiem vārdiem sakot, mēs nezinām vidējo hemoglobīna līmeni vispārējā populācijā, bet mēs varam norādīt šīs pazīmes vērtību diapazonu ar 95% varbūtību.

Uzticības intervāli īpaši attiecas uz atšķirību starp grupām jeb tā saukto efekta lielumu.

Pieņemsim, ka mēs salīdzinājām divu dzelzs preparātu efektivitāti: vienu, kas ir tirgū jau ilgu laiku, un vienu, kas ir tikko reģistrēts. Pēc terapijas kursa tika novērtēta hemoglobīna koncentrācija pētītajās pacientu grupās, un statistikas programma mēs aprēķinājām, ka starpība starp abu grupu vidējām vērtībām ar varbūtību 95% ir robežās no 1,72 līdz 14,36 g/l (1. tabula).

Tab. 1. Neatkarīgo paraugu kritērijs
(grupas tiek salīdzinātas pēc hemoglobīna līmeņa)

Tas jāinterpretē šādi: daļai pacientu no kopējās populācijas, kas lieto jaunas zāles, hemoglobīns būs vidēji par 1,72–14,36 g/l augstāks nekā tiem, kuri lietojuši jau zināmas zāles.

Citiem vārdiem sakot, vispārējā populācijā hemoglobīna vidējo vērtību atšķirība grupās ar 95% varbūtību ir šajās robežās. Tas, vai tas ir daudz vai maz, būs pētnieka ziņā. Tā visa būtība ir tāda, ka mēs strādājam nevis ar vienu vidējo vērtību, bet ar vērtību diapazonu, tāpēc mēs ticamāk novērtējam parametra atšķirību starp grupām.

Statistikas paketēs pēc pētnieka ieskatiem var patstāvīgi sašaurināt vai paplašināt ticamības intervāla robežas. Samazinot ticamības intervāla varbūtības, mēs sašaurinām vidējo diapazonu. Piemēram, pie 90% TI vidējo diapazons (vai vidējās atšķirības) būs šaurāks nekā pie 95% TI.

Un otrādi, palielinot varbūtību līdz 99%, vērtību diapazons tiek paplašināts. Salīdzinot grupas, CI apakšējā robeža var šķērsot nulles atzīmi. Piemēram, ja mēs pagarinājām ticamības intervāla robežas līdz 99 %, tad intervāla robežas bija no –1 līdz 16 g/L. Tas nozīmē, ka vispārējā populācijā ir grupas, kuru starpība starp vidējiem rādītājiem pētāmajai pazīmei ir 0 (M=0).

Statistisko hipotēžu pārbaudei var izmantot ticamības intervālus. Ja ticamības intervāls šķērso nulles vērtību, tad nulles hipotēze, kas pieņem, ka grupas neatšķiras pētītajā parametrā, ir patiesa. Piemērs ir aprakstīts iepriekš, kad mēs paplašinājām robežas līdz 99%. Kaut kur vispārējā populācijā mēs atradām grupas, kas nekādā veidā neatšķīrās.

95% hemoglobīna atšķirības ticamības intervāls (g/l)


Attēlā kā līnija parādīts vidējās hemoglobīna starpības 95% ticamības intervāls starp abām grupām. Līnija iet garām nulles atzīmei, tāpēc starp vidējiem, kas vienādi ar nulli, ir atšķirība, kas apstiprina nulles hipotēzi, ka grupas neatšķiras. Atšķirība starp grupām svārstās no -2 līdz 5 g/l, kas nozīmē, ka hemoglobīns var vai nu samazināties par 2 g/l, vai palielināties par 5 g/l.

Uzticamības intervāls ir ļoti svarīgs rādītājs. Pateicoties tam, var redzēt, vai atšķirības grupās tiešām radušās vidējo atšķirību vai lielas izlases dēļ, jo ar lielu izlasi iespēja atrast atšķirības ir lielāka nekā ar mazu.

Praksē tas varētu izskatīties šādi. Mēs paņēmām 1000 cilvēku paraugu, izmērījām hemoglobīna līmeni un konstatējām, ka ticamības intervāls vidējo atšķirību starpībai ir no 1,2 līdz 1,5 g/l. Statistiskās nozīmīguma līmenis šajā gadījumā p

Redzam, ka hemoglobīna koncentrācija pieauga, taču gandrīz nemanāmi, tāpēc statistiskā nozīme parādījās tieši izlases lieluma dēļ.

Uzticības intervālus var aprēķināt ne tikai vidējiem rādītājiem, bet arī proporcijām (un riska koeficientiem). Piemēram, mūs interesē to pacientu īpatsvara ticamības intervāls, kuri, lietojot izstrādātās zāles, sasniedza remisiju. Pieņemsim, ka 95% TI proporcijām, t.i., šādu pacientu īpatsvaram, ir robežās no 0,60 līdz 0,80. Tādējādi mēs varam teikt, ka mūsu zālēm ir ārstnieciska iedarbība 60 līdz 80% gadījumu.

Viena no risināšanas metodēm statistikas uzdevumi ir ticamības intervāla aprēķins. To izmanto kā vēlamo alternatīvu punktu novērtējumam, ja izlases lielums ir mazs. Jāatzīmē, ka ticamības intervāla aprēķināšanas process ir diezgan sarežģīts. Bet programmas Excel rīki ļauj to nedaudz vienkāršot. Noskaidrosim, kā tas tiek darīts praksē.

Šo metodi izmanto dažādu statistisko lielumu intervālu novērtēšanā. Šī aprēķina galvenais uzdevums ir atbrīvoties no punktu tāmes nenoteiktībām.

Programmā Excel ir divas galvenās iespējas aprēķināt, izmantojot šo metodi: kad dispersija ir zināma un kad tā nav zināma. Pirmajā gadījumā funkcija tiek izmantota aprēķiniem PĀRLIECĪBAS NORMA, un otrajā UZTICĪBAS.STUDENTS.

1. metode: funkcija CONFIDENCE NORM

Operators PĀRLIECĪBAS NORMA, kas attiecas uz statistisko funkciju grupu, pirmo reizi parādījās programmā Excel 2010. Šīs programmas iepriekšējās versijās tiek izmantots tās līdzinieks. UZTICĪBAS. Šī operatora uzdevums ir aprēķināt ticamības intervālu ar normālu sadalījumu populācijas vidējai vērtībai.

Tās sintakse ir šāda:

CONFIDENCE NORM(alfa, standarta_dev, izmērs)

"Alfa" ir arguments, kas norāda nozīmīguma līmeni, kas tiek izmantots ticamības līmeņa aprēķināšanai. Uzticamības līmenis ir vienāds ar šādu izteiksmi:

(1-"Alfa")*100

"Standarta novirze" ir arguments, kura būtība ir skaidra no nosaukuma. Šis standarta novirze piedāvātais paraugs.

"Izmērs" ir arguments, kas nosaka izlases lielumu.

Ir nepieciešami visi šī operatora argumenti.

Funkcija UZTICĪBAS ir tieši tādi paši argumenti un iespējas kā iepriekšējam. Tās sintakse ir:

TRUST(alfa, standarta_dev, izmērs)

Kā redzat, atšķirības ir tikai operatora nosaukumā. Šis līdzeklis ir saglabāts programmā Excel 2010 un jaunākās versijās īpašā kategorijā saderības apsvērumu dēļ. "Saderība". Programmas Excel 2007 un vecākās versijās tas ir iekļauts galvenajā statistikas operatoru grupā.

Uzticamības intervāla robežu nosaka, izmantojot šādas formas formulu:

X+(-)PĀRLIECĪBAS NORMA

Kur X ir izlases vidējais rādītājs, kas atrodas atlasītā diapazona vidū.

Tagad apskatīsim, kā aprēķināt ticamības intervālu konkrēts piemērs. Tika veikti 12 testi, kuru rezultātā iegūti dažādi rezultāti, kas norādīti tabulā. Tas ir mūsu kopums. Standarta novirze ir 8. Mums jāaprēķina ticamības intervāls 97% ticamības līmenī.

  1. Atlasiet šūnu, kurā tiks parādīts datu apstrādes rezultāts. Noklikšķinot uz pogas "Ievietot funkciju".
  2. Parādās Funkciju vednis. Dodieties uz kategoriju "Statistika" un iezīmējiet nosaukumu "CONFIDENCE.NORM". Pēc tam noklikšķiniet uz pogas labi.
  3. Tiek atvērts argumentu logs. Tās lauki dabiski atbilst argumentu nosaukumiem.
    Novietojiet kursoru uz pirmo lauku - "Alfa". Šeit mums vajadzētu norādīt nozīmīguma līmeni. Kā mēs atceramies, mūsu uzticības līmenis ir 97%. Tajā pašā laikā mēs teicām, ka tas tiek aprēķināts šādi:

    (1 uzticības līmenis)/100

    Tas ir, aizstājot vērtību, mēs iegūstam:

    Ar vienkāršiem aprēķiniem mēs uzzinām, ka arguments "Alfa" vienāds 0,03 . Ievadiet šo vērtību laukā.

    Kā jūs zināt, standarta novirze ir vienāda ar 8 . Tāpēc laukā "Standarta novirze" vienkārši pierakstiet šo numuru.

    Laukā "Izmērs" jāievada veikto testu elementu skaits. Kā mēs atceramies, viņi 12 . Taču, lai formula būtu automatizēta un tā nebūtu jārediģē katru reizi, kad tiek palaists jauns tests, iestatīsim šo vērtību uz kopīgs numurs, un izmantojot operatoru PĀRBAUDE. Tātad, mēs iestatām kursoru laukā "Izmērs" un pēc tam noklikšķiniet uz trīsstūra, kas atrodas pa kreisi no formulas joslas.

    Tiek parādīts nesen izmantoto funkciju saraksts. Ja operators PĀRBAUDE nesen izmantojāt, tam vajadzētu būt šajā sarakstā. Šajā gadījumā jums vienkārši jānoklikšķina uz tā nosaukuma. Citādi, ja neatrodi, tad ej pie lietas "Citas funkcijas...".

  4. Mums šķiet jau pazīstams Funkciju vednis. Pāriet atpakaļ uz grupu "Statistika". Mēs tur izvēlamies nosaukumu "PĀRBAUDĪT". Noklikšķiniet uz pogas labi.
  5. Parādās iepriekš minētā operatora argumentu logs. Šī funkcija ir paredzēta, lai aprēķinātu to šūnu skaitu norādītajā diapazonā, kurās ir skaitliskās vērtības. Tās sintakse ir šāda:

    SKAITS(vērtība1, vērtība2,…)

    Argumentu grupa "Vērtības" ir atsauce uz diapazonu, kurā vēlaties aprēķināt ar skaitliskiem datiem aizpildīto šūnu skaitu. Kopumā var būt līdz 255 tādiem argumentiem, bet mūsu gadījumā vajadzīgs tikai viens.

    Iestatiet kursoru laukā "Vērtība1" un, turot nospiestu peles kreiso pogu, atlasiet lapā diapazonu, kurā ir mūsu populācija. Pēc tam laukā tiks parādīta tā adrese. Noklikšķiniet uz pogas labi.

  6. Pēc tam lietojumprogramma veiks aprēķinu un parādīs rezultātu šūnā, kurā tā atrodas. Mūsu konkrētajā gadījumā formula izrādījās šāda:

    PĀRLIECĪBAS NORMA(0,03,8,SKAITS(B2:B13))

    Kopējais aprēķinu rezultāts bija 5,011609 .

  7. Bet tas vēl nav viss. Kā mēs atceramies, ticamības intervāla robežu aprēķina, saskaitot un atņemot no aprēķina rezultāta vidējās izlases vērtības PĀRLIECĪBAS NORMA. Tādā veidā tiek aprēķināta attiecīgi ticamības intervāla labā un kreisā robeža. Parauga vidējo vērtību var aprēķināt, izmantojot operatoru VIDĒJS.

    Šis operators ir paredzēts, lai aprēķinātu izvēlētā skaitļu diapazona vidējo aritmētisko. Tam ir šāda diezgan vienkārša sintakse:

    VIDĒJAIS(skaitlis1, skaitlis2,…)

    Arguments "Numurs" var būt vai nu viena skaitliska vērtība, vai atsauce uz šūnām vai pat veseliem diapazoniem, kuros tās ir.

    Tātad, atlasiet šūnu, kurā tiks parādīts vidējās vērtības aprēķins, un noklikšķiniet uz pogas "Ievietot funkciju".

  8. atveras Funkciju vednis. Atpakaļ uz kategoriju "Statistika" un sarakstā atlasiet vārdu "VIDĒJAIS". Kā vienmēr, noklikšķiniet uz pogas labi.
  9. Tiek atvērts argumentu logs. Iestatiet kursoru laukā "Numurs1" un, nospiežot kreiso peles pogu, atlasiet visu vērtību diapazonu. Kad laukā ir parādītas koordinātas, noklikšķiniet uz pogas labi.
  10. Pēc tam VIDĒJS izvada aprēķina rezultātu lapas elementā.
  11. Mēs aprēķinām ticamības intervāla labo robežu. Lai to izdarītu, atlasiet atsevišķu šūnu, ievietojiet zīmi «=» un pievieno to lapas elementu saturu, kuros atrodas funkciju aprēķina rezultāti VIDĒJS Un PĀRLIECĪBAS NORMA. Lai veiktu aprēķinu, nospiediet pogu Ievadiet. Mūsu gadījumā mēs saņēmām šādu formulu:

    Aprēķina rezultāts: 6,953276

  12. Tādā pašā veidā mēs aprēķinām ticamības intervāla kreiso robežu, tikai šoreiz no aprēķina rezultāta VIDĒJS atņem operatora aprēķina rezultātu PĀRLIECĪBAS NORMA. Mūsu piemēra formula ir šāda veida:

    Aprēķina rezultāts: -3,06994

  13. Mēs centāmies detalizēti aprakstīt visas ticamības intervāla aprēķināšanas darbības, tāpēc mēs detalizēti aprakstījām katru formulu. Bet jūs varat apvienot visas darbības vienā formulā. Ticamības intervāla labās robežas aprēķinu var uzrakstīt šādi:

    VIDĒJAIS(B2:B13)+PĀRLIECINĀJUMS(0,03,8,SKAITS(B2:B13))

  14. Līdzīgs kreisās apmales aprēķins izskatītos šādi:

    VIDĒJAIS(B2:B13)-PĀRLIECINĀJUMS.NORM.(0,03,8,SKAITS(B2:B13))

2. metode: funkcija TRUST.STUDENT

Turklāt programmā Excel ir vēl viena funkcija, kas ir saistīta ar ticamības intervāla aprēķināšanu - UZTICĪBAS.STUDENTS. Tas ir parādījies tikai kopš programmas Excel 2010. Šis operators veic populācijas ticamības intervāla aprēķinu, izmantojot Stjudenta t sadalījumu. Ļoti ērti to lietot gadījumā, ja dispersija un attiecīgi arī standartnovirze nav zināma. Operatora sintakse ir:

UZTICĪBAS.STUDENTS(alfa,standarta_dev,izmērs)

Kā redzat, operatoru nosaukumi šajā gadījumā palika nemainīgi.

Apskatīsim, kā aprēķināt ticamības intervāla robežas ar nezināmu standartnovirzi, izmantojot tās pašas populācijas piemēru, kuru aplūkojām iepriekšējā metodē. Pārliecības līmenis, tāpat kā pagājušajā reizē, ņemsim 97%.

  1. Atlasiet šūnu, kurā tiks veikts aprēķins. Noklikšķiniet uz pogas "Ievietot funkciju".
  2. Atvērtajā Funkciju vednis dodieties uz kategoriju "Statistika". Izvēlieties vārdu "UZTICĪBAS.STUDENTS". Noklikšķiniet uz pogas labi.
  3. Tiek palaists argumentu logs norādītajam operatoram.

    Laukā "Alfa", ņemot vērā, ka ticamības līmenis ir 97%, mēs pierakstām skaitli 0,03 . Otro reizi mēs nekavēsimies pie šī parametra aprēķināšanas principiem.

    Pēc tam iestatiet kursoru laukā "Standarta novirze". Šoreiz šis rādītājs mums nav zināms un tas ir jāaprēķina. Tas tiek darīts, izmantojot īpašu funkciju - STDEV.B. Lai izsauktu šī operatora logu, noklikšķiniet uz trīsstūra formulas joslas kreisajā pusē. Ja atvērtajā sarakstā neatrodam vajadzīgo nosaukumu, dodieties uz vienumu "Citas funkcijas...".

  4. skrien Funkciju vednis. Pāreja uz kategoriju "Statistika" un atzīmējiet vārdu "STDEV.B". Pēc tam noklikšķiniet uz pogas labi.
  5. Tiek atvērts argumentu logs. operatora uzdevums STDEV.B ir izlases standarta novirzes definīcija. Tās sintakse izskatās šādi:

    STDEV.V(skaitlis1,skaitlis2,…)

    Ir viegli uzminēt, ka arguments "Numurs" ir atlases elementa adrese. Ja atlase ir ievietota vienā masīvā, tad, izmantojot tikai vienu argumentu, varat norādīt saiti uz šo diapazonu.

    Iestatiet kursoru laukā "Numurs1" un, kā vienmēr, turot nospiestu peles kreiso pogu, atlasiet kopu. Kad koordinātas ir laukā, nesteidzieties nospiest pogu labi jo rezultāts būs nepareizs. Vispirms mums jāatgriežas operatora argumentu logā UZTICĪBAS.STUDENTS lai izteiktu pēdējo argumentu. Lai to izdarītu, formulas joslā noklikšķiniet uz atbilstošā nosaukuma.

  6. Atkal tiek atvērts jau pazīstamās funkcijas argumentu logs. Iestatiet kursoru laukā "Izmērs". Atkal noklikšķiniet uz mums jau pazīstamā trīsstūra, lai pārietu uz operatoru izvēli. Kā jūs saprotat, mums ir nepieciešams vārds "PĀRBAUDĪT". Tā kā mēs izmantojām šo funkciju iepriekšējās metodes aprēķinos, tā ir šajā sarakstā, tāpēc vienkārši noklikšķiniet uz tās. Ja jūs to neatrodat, izpildiet pirmajā metodē aprakstīto algoritmu.
  7. Iekļūšana argumentu logā PĀRBAUDE, novietojiet kursoru laukā "Numurs1" un, turot nospiestu peles pogu, atlasiet kolekciju. Pēc tam noklikšķiniet uz pogas labi.
  8. Pēc tam programma aprēķina un parāda ticamības intervāla vērtību.
  9. Lai noteiktu robežas, mums atkal būs jāaprēķina izlases vidējais lielums. Bet, ņemot vērā, ka aprēķinu algoritms, izmantojot formulu VIDĒJS tas pats, kas iepriekšējā metodē, un pat rezultāts nav mainījies, otrreiz mēs par to sīkāk nekavēsimies.
  10. Aprēķinu rezultātu saskaitīšana VIDĒJS Un UZTICĪBAS.STUDENTS, mēs iegūstam ticamības intervāla labo robežu.
  11. Atņemot no operatora aprēķinu rezultātiem VIDĒJS aprēķina rezultāts UZTICĪBAS.STUDENTS, mums ir ticamības intervāla kreisā robeža.
  12. Ja aprēķins ir uzrakstīts vienā formulā, tad labās robežas aprēķins mūsu gadījumā izskatīsies šādi:

    VIDĒJAIS(B2:B13)+STUDENTA PĀRLIECĪBAS (0,03,STDV(B2:B13),SKAITS(B2:B13))

  13. Attiecīgi kreisās robežas aprēķināšanas formula izskatīsies šādi:

    VIDĒJAIS(B2:B13)-STUDENTA PĀRLIECĪBA(0,03,STDV(B2:B13),SKAITS(B2:B13))

Kā redzat, programmas Excel rīki ļauj ievērojami atvieglot ticamības intervāla un tā robežu aprēķināšanu. Šiem nolūkiem tiek izmantoti atsevišķi operatori paraugiem, kuru dispersija ir zināma un nezināma.

Intervālu novērtēšanas piemērs ir ticamības intervāls. Ticamības intervāls ir segments, kura centrs ir skaitliskā raksturlieluma punktveida novērtējums, ieskaitot šī skaitliskā raksturlieluma patieso vērtību ar noteiktu varbūtību. Šo varbūtību sauc ticamības varbūtība. Tādējādi ticamības intervāls ir aplēses precizitātes mērs, un ticamības varbūtība raksturo tā ticamību. Uzticamības intervāla lielums ir atkarīgs no tā, kādu ticamības varbūtības vērtību ir norādījis eksperimentētājs. Jo augstāks ticamības līmenis, jo plašākam ir jābūt intervālam, lai ar noteiktu varbūtību iekļautu skaitliskā raksturlieluma patieso vērtību. Bieži tiek izvēlēta ticamības vērtība P d = 0,95, tādējādi uzskatot, ka šī vērtība ir pietiekami liela, lai uzskatītu, ka ticamības intervāls “gandrīz vienmēr” aptver patieso vērtību. Tikai dažkārt atbildīgu un ļoti atbildīgu pētījumu gadījumā tiek pieņemts attiecīgi P d = 0,99 un 0,999.

Uzticamības intervāla konstruēšanas procedūra ietver divus posmus:

Rakstot varbūtības paziņojumu par dažiem izlases funkcija, kas ietver novērtējuma un skaitliskā raksturlieluma starpību vai attiecību. Šāda funkcija nes informāciju par minēto vērtību tuvuma pakāpi. Ir nepieciešams, lai būtu zināms funkcijas sadalījuma likums;

Varbūtības apgalvojums tiek pārveidots formā, kurā skaitliskā raksturlieluma ticamības intervāla robežas tiek uzrādītas skaidri izteiktā formā.

Funkciju piemēri ar zināmu sadalījumu, kas atbilst nepieciešamajām prasībām, ir šādi:

ar normālu sadalījumu, ja X vērtība ir normāli sadalīta un ir zināma s[X] vērtība;

2) (3.25)

ar Stjudenta sadalījumu c m = N-1, ja X vērtība ir normāli sadalīta un s[X] vērtība iepriekš nav zināma, bet tās novērtējumu var iegūt no eksperimentāliem datiem, izmantojot formulu (3.23);

3) (3.26)

ar Pīrsona sadalījumu ar m = N-1, ja X vērtība ir sadalīta normāli.

Atgādinām, ka sadalījuma parametri m ir brīvības pakāpju skaitļi. Turklāt šeit tiek izmantoti šādi apzīmējumi: - vidējā aritmētiskā vērtība, - vidējā kvadrātiskā vērtība, kas vienāda ar dispersijas kvadrātsakni, [X] - vidējās kadra vērtības novērtējums, kas definēts kā kvadrātsakne no objektīva novērtējuma. dispersija, N - izlases lielums.

Z un t funkcijas var izmantot, lai izveidotu ticamības intervālu matemātiskās cerības, savukārt funkcija c 2 tiek izmantota, lai izveidotu ticamības intervālu dispersijai.


Izveidosim ticamības intervālu matemātiskajai cerībai, ja mūsu rīcībā ir normāli sadalīta lieluma X novērojumu N rezultāti un vidējā kvadrātiskā vērtība ir iepriekš zināma no neatkarīgiem novērojumiem. Tā kā funkcija Z ir parasti sadalīta, varat izmantot atbilstošo tabulu, lai noteiktu z a vērtību tā, lai ārpus - z a un + z a paliktu daļa no laukuma zem sadalījuma līknes summā, kas vienāda ar a, savukārt [- z a ,+ z a ] ir daļa no laukuma , kas vienāda ar 1 - a . Tikko teiktais atbilst šādam varbūtības apgalvojumam:

Р(- z a £ £+z a )= 1-a. (3,27)

(Iekavās ieliktās nevienādības izpildes varbūtība ir 1-a.). Pārveidosim izteiksmi iekavās:

Р(-z a )= 1 - a

Mēs saucam vērtību 1-a = Р d par ticamības varbūtību Р d. Saskaņā ar (3.28) ar šo ticamības varbūtību M[X] ticamības intervāls tiek noteikts ar robežām:

. (3.29)

komentēt: Diemžēl galdi normālais sadalījums dažādās grāmatās ir konstruētas atšķirīgi. Dažreiz tiek norādīts varbūtības integrālis

Ф(z) =

Pieņemsim, ka mums ir liels skaits preču ar normālu dažu īpašību sadalījumu (piemēram, pilna viena veida dārzeņu noliktava, kuras izmērs un svars atšķiras). Jūs vēlaties uzzināt visas preču partijas vidējās īpašības, bet jums nav ne laika, ne vēlēšanās izmērīt un nosvērt katru dārzeņu. Jūs saprotat, ka tas nav nepieciešams. Bet cik gabalu jums vajadzētu ņemt izlases veida pārbaudei? Pirms sniegt dažas šajā situācijā noderīgas formulas, atceramies dažus apzīmējumus. Pirmkārt, ja mēs izmērītu visu dārzeņu noliktavu (šo elementu kopu sauc par vispārējo populāciju), mēs ar visu mums pieejamo precizitāti noskaidrotu visas partijas svara vidējo vērtību. Sauksim šo par vidējo X vidējais gēns. - vispārējais vidējais. Mēs jau zinām, kas ir pilnībā noteikts, ja ir zināma tā vidējā vērtība un novirze s. Tiesa, līdz šim mēs nezinām ne X vidējo gēnu, ne s no vispārējās populācijas. Varam paņemt tikai kādu paraugu, izmērīt mums vajadzīgās vērtības un aprēķināt šim paraugam gan vidējo vērtību X vid., gan standartnovirzi S vyb. Ir zināms, ka, ja mūsu izlases pārbaudē ir liels skaits elementu (parasti n vairāk nekā 30), un tie ir ņemti patiešām nejauši, tad populācijas s gandrīz neatšķirsies no S paraugiem. Turklāt gadījumā normālu sadalījumu, mēs varam izmantot šādas formulas:

ar 95% varbūtību

ar 99% varbūtību

.

IN vispārējs skats ar varbūtību Р(t)

Sakarību starp t vērtību un varbūtības P(t) vērtību, ar kuru mēs vēlamies uzzināt ticamības intervālu, var iegūt no šādas tabulas:

P(t) 0,683 0,950 0,954 0,990 0,997
t 1,00 1,96 2,00 2,58 3,00

Tādējādi mēs esam noteikuši, kādā diapazonā ir vidējā vērtība vispārējai populācijai (ar noteiktu varbūtību).

Ja mums nav pietiekami lielas izlases, mēs nevaram apgalvot, ka populācijai ir s = S izlases. Turklāt šajā gadījumā parauga tuvums normālajam sadalījumam ir problemātisks. Šajā gadījumā formulā izmantojiet arī S s, nevis s:

bet t vērtība fiksētai varbūtībai P(t) būs atkarīgs no elementu skaita paraugā n. Jo lielāks n, jo tuvāk iegūtais ticamības intervāls būs vērtībai, kas norādīta ar formulu (1). T vērtības šajā gadījumā ir ņemtas no citas tabulas (Studenta t-tests), kuru mēs sniedzam zemāk:

Studenta t-testa vērtības varbūtībai 0,95 un 0,99 

n P n P
0.95 0.99 0.95 0.99
2 12.71 63.66 18 2.11 2.90
3 4.30 9.93 19 2.10 2.88
4 3.18 5.84 20 2.093 2.861
5 2.78 4.60 25 2.064 2.797
6 2.57 4.03 30 2.045 2.756
7 2.45 3.71 35 2.032 2.720
8 2.37 3.50 40 2.022 2.708
9 2.31 3.36 45 2.016 2.692
10 2.26 3.25 50 2.009 2.679
11 2.23 3.17 60 2.001 2.662
12 2.20 3.11 70 1.996 2.649
13 2.18 3.06 80 1.991 2.640
14 2.16 3.01 90 1.987 2.633
15 2.15 2.98 100 1.984 2.627
16 2.13 2.95 120 1.980 2.617
17 2.12 2.92 >120 1.960 2.576

3. piemērs No uzņēmuma darbiniekiem nejauši tika atlasīti 30 cilvēki. Saskaņā ar paraugu, izrādījās, ka vidējā alga (mēnesī) ir 10 tūkstoši rubļu ar vidējo kvadrātveida novirzi 3 tūkstoši rubļu. Ar varbūtību 0,99 nosakiet vidējo algu uzņēmumā. Risinājums: Pēc nosacījuma mums ir n = 30, X sk. =10000, S=3000, P=0,99. Lai atrastu ticamības intervālu, mēs izmantojam Studenta kritērijam atbilstošu formulu. Saskaņā ar tabulu n \u003d 30 un P \u003d 0,99 mēs atrodam t \u003d 2,756, tāpēc

tie. vēlamais ticamības intervāls 27484< Х ср.ген < 32516.

Tātad ar varbūtību 0,99 var apgalvot, ka intervāls (27484; 32516) satur vidējo algu uzņēmumā.
Mēs ceram, ka izmantosit šo metodi, katru reizi neņemot līdzi izklājlapu. Aprēķinus var veikt automātiski programmā Excel. Atrodoties Excel failā, augšējā izvēlnē noklikšķiniet uz pogas fx. Pēc tam atlasiet no funkcijām veidu "statistiskais" un no piedāvātā saraksta lodziņā - STEUDRASP. Pēc tam uzvednē, novietojot kursoru laukā "varbūtība", ierakstiet abpusējas varbūtības vērtību (tas ir, mūsu gadījumā varbūtības 0,95 vietā jāievada varbūtība 0,05). Acīmredzot izklājlapa ir veidota tā, lai rezultāts atbildētu uz jautājumu, cik iespējams, ka mēs varam kļūdīties. Līdzīgi laukā "Brīvības pakāpe" ievadiet sava parauga vērtību (n-1).

Pārliecības intervāls matemātiskām cerībām - tas ir tāds intervāls, kas aprēķināts no datiem, kas ar zināmu varbūtību satur vispārējās populācijas matemātisko cerību. Matemātiskās cerības dabiskais novērtējums ir tās novēroto vērtību vidējais aritmētiskais. Tāpēc turpmāk nodarbības laikā lietosim jēdzienus "vidējā", "vidējā vērtība". Uzticamības intervāla aprēķināšanas uzdevumos visbiežāk tiek prasīta atbilde "Vidējā skaitļa [vērtība konkrētā uzdevumā] ticamības intervāls ir no [mazāka vērtība] līdz [augstāka vērtība]". Ar ticamības intervāla palīdzību iespējams novērtēt ne tikai vidējās vērtības, bet arī vienas vai otras pazīmes īpatsvaru kopējā populācijā. Nodarbībā tiek analizētas vidējās vērtības, dispersija, standarta novirze un kļūda, caur kurām nonāksim pie jaunām definīcijām un formulām. Izlases un populācijas raksturojums .

Punktu un intervālu aplēses par vidējo

Ja vispārējās kopas vidējo vērtību aprēķina pēc skaitļa (punkta), tad konkrēts vidējais, kas aprēķināts no novērojumu izlases, tiek pieņemts kā vispārējās populācijas nezināmā vidējā aplēse. Šajā gadījumā parauga vidējā vērtība ir nejaušais mainīgais- nesakrīt ar kopējo iedzīvotāju vidējo vērtību. Tāpēc, norādot izlases vidējo vērtību, vienlaikus ir jānorāda arī izlases kļūda. Standarta kļūda tiek izmantota kā izlases kļūdas mērs, ko izsaka tādās pašās vienībās kā vidējo. Tāpēc bieži tiek lietots šāds apzīmējums: .

Ja vidējā aplēse ir jāsaista ar noteiktu varbūtību, tad vispārējās interesējošās populācijas parametrs jānovērtē nevis pēc viena skaitļa, bet pēc intervāla. Ticamības intervāls ir intervāls, kurā ar noteiktu varbūtību P tiek atrasta kopējās populācijas novērtētā rādītāja vērtība. Pārliecības intervāls, kurā ar varbūtību P = 1 - α ir nejaušs mainīgais , aprēķina šādi:

,

α = 1 - P, kuru var atrast gandrīz jebkuras statistikas grāmatas pielikumā.

Praksē populācijas vidējā vērtība un dispersija nav zināma, tāpēc populācijas dispersiju aizstāj ar izlases dispersiju, bet populācijas vidējo ar izlases vidējo. Tādējādi ticamības intervālu vairumā gadījumu aprēķina šādi:

.

Ticamības intervāla formulu var izmantot, lai novērtētu populācijas vidējo vērtību, ja

  • ir zināma vispārējās populācijas standartnovirze;
  • vai arī populācijas standartnovirze nav zināma, bet izlases lielums ir lielāks par 30.

Izlases vidējais rādītājs ir objektīvs populācijas vidējā aprēķins. Savukārt izlases dispersija nav objektīvs populācijas dispersijas novērtējums. Lai iegūtu objektīvu populācijas dispersijas novērtējumu izlases dispersijas formulā, izlases lielums ir n jāaizstāj ar n-1.

1. piemērs No 100 nejauši izvēlētām kafejnīcām noteiktā pilsētā tiek apkopota informācija, ka vidējais darbinieku skaits tajās ir 10,5 ar standartnovirzi 4,6. Nosakiet ticamības intervālu 95% no kafejnīcas darbinieku skaita.

kur ir nozīmīguma līmeņa standarta normālā sadalījuma kritiskā vērtība α = 0,05 .

Tādējādi 95% ticamības intervāls vidējam kafejnīcu darbinieku skaitam bija no 9,6 līdz 11,4.

2. piemērs Nejaušam paraugam no vispārējās 64 novērojumu kopas tika aprēķinātas šādas kopējās vērtības:

novērojumu vērtību summa,

vērtību kvadrātu noviržu summa no vidējā .

Aprēķiniet paredzamās vērtības 95% ticamības intervālu.

Aprēķiniet standarta novirzi:

,

Aprēķiniet vidējo vērtību:

.

Aizstāt vērtības izteiksmē ticamības intervālam:

kur ir nozīmīguma līmeņa standarta normālā sadalījuma kritiskā vērtība α = 0,05 .

Mēs iegūstam:

Tādējādi šīs izlases matemātiskās cerības 95% ticamības intervāls svārstījās no 7,484 līdz 11,266.

3. piemērs Nejaušam paraugam no 100 novērojumu vispārējās populācijas tika aprēķināta vidējā vērtība 15,2 un standarta novirze 3,2. Aprēķiniet paredzamās vērtības 95% ticamības intervālu, pēc tam 99% ticamības intervālu. Ja izlases jauda un tā variācija paliek nemainīga, bet ticamības koeficients palielinās, vai ticamības intervāls sašaurinās vai paplašināsies?

Mēs aizstājam šīs vērtības ticamības intervāla izteiksmē:

kur ir nozīmīguma līmeņa standarta normālā sadalījuma kritiskā vērtība α = 0,05 .

Mēs iegūstam:

.

Tādējādi 95% ticamības intervāls šīs izlases vidējam rādītājam bija no 14,57 līdz 15,82.

Atkal mēs aizstājam šīs vērtības ticamības intervāla izteiksmē:

kur ir nozīmīguma līmeņa standarta normālā sadalījuma kritiskā vērtība α = 0,01 .

Mēs iegūstam:

.

Tādējādi 99% ticamības intervāls šīs izlases vidējam rādītājam bija no 14,37 līdz 16,02.

Kā redzams, pieaugot ticamības koeficientam, pieaug arī standarta normālā sadalījuma kritiskā vērtība, un tāpēc intervāla sākuma un beigu punkti atrodas tālāk no vidējā un līdz ar to arī matemātiskās gaidas ticamības intervāls. palielinās.

Īpatnējā smaguma punktu un intervālu aprēķini

Kādas izlases pazīmes daļu var interpretēt kā daļas punktveida novērtējumu lpp tā pati īpašība vispārējā populācijā. Ja šī vērtība ir jāsaista ar varbūtību, tad jāaprēķina īpatnējā smaguma ticamības intervāls lpp iezīmi vispārējā populācijā ar varbūtību P = 1 - α :

.

4. piemērs Noteiktā pilsētā ir divi kandidāti A Un B kandidē uz mēra amatu. Pēc nejaušības principa tika aptaujāti 200 pilsētas iedzīvotāji, no kuriem 46% atbildēja, ka balsotu par kandidātu A, 26% - kandidātam B un 28% nezina, par ko balsos. Nosakiet 95% ticamības intervālu pilsētas iedzīvotāju daļai, kas atbalsta kandidātu A.