A matematikai statisztika módszereinek jellemzői és korlátai. A matematikai statisztika módszerei (2) - Absztrakt. számítsuk ki a minta szórását és a minta szórását s

1. Alapfogalmak és definíciók

Bernoulli populációt mintavételező statisztika

A statisztika fogalma

A statisztikát, vagy inkább kutatási módszereit széles körben használják az emberi tudás különböző területein. Azonban, mint minden tudomány, ez is megköveteli a vizsgálat tárgyának meghatározását. E tekintetben különbséget tesznek a társadalomtudományok köréhez tartozó társadalmi-gazdasági jelenségek vizsgálatával foglalkozó statisztikát és a természettudományok körébe tartozó természeti jelenségek törvényszerűségeivel foglalkozó statisztikát.

A legtöbb modern hazai statisztikaelméleti egyetemi tankönyv szerzői (általános statisztikaelmélet) a statisztikát társadalomtudományi tárgyként értik, i.e. tudomány, amelynek megvan a maga speciális tárgya és tudásmódszere.

Statisztika - társadalomtudomány, amely a minőségileg meghatározott tömeges társadalmi-gazdasági jelenségek és folyamatok mennyiségi oldalát, szerkezetét és eloszlását, térben való elhelyezkedését, időben való mozgását vizsgálja, feltárva a meglévő mennyiségi függőségeket, trendeket és mintázatokat, valamint sajátos hely- és időviszonyok között.

A statisztika tárgya

A statisztika mint tudomány nem egyedi tényeket, hanem tömeges társadalmi-gazdasági jelenségeket és folyamatokat vizsgál, amelyek egyéni és általános jellemzőkkel is rendelkező egyéni tényezők sokaságaként működnek.

A statisztikai kutatás tárgyát a statisztikában statisztikai sokaságnak nevezzük.

Népesség - ez olyan egységek halmaza, amelyek tömegjelleggel, homogenitással, bizonyos integritással, az egyes egységek állapotának kölcsönös függésével és variáció jelenlétével rendelkeznek.

Például a statisztikai kutatások speciális tárgyaiként, pl. statisztikai aggregátumok alapján sok kereskedelmi bank lehet bejegyezve a területen Orosz Föderáció, Egy csomó részvénytársaságok, valamely ország állampolgárainak halmaza stb. Fontos megjegyezni, hogy a statisztikai sokaság valóban létező anyagi objektumokból áll.

Ennek a halmaznak minden egyes elemét a statisztikai sokaság egységének nevezzük.

A statisztikai sokaság egységeit az jellemzi közös tulajdonságok, amelyre a statisztika hivatkozik jelek , azaz Egy aggregátum minőségi homogenitása alatt az egységek (tárgyak, jelenségek, folyamatok) egyes lényeges jellemzők szerinti hasonlóságát értjük, de más jellemzőkben különböznek egymástól.

A sokaság egységei, valamint az összes egységre jellemző jellemzők, amelyek meghatározzák a sokaság minőségi bizonyosságát, szintén rendelkeznek egyéni jellemzőkés az őket egymástól megkülönböztető különbségek, pl. létezik jellemző variáció . Ennek oka a feltételek eltérő kombinációja, amely meghatározza a halmaz elemeinek fejlődését.

Például a banki alkalmazottak munkatermelékenységének szintjét életkoruk, képzettségük, munkához való hozzáállásuk stb.

Az eltérések jelenléte az, ami előre meghatározza a statisztikák szükségességét. . Egy jellemző változása tükröződhet a populációs egységek statisztikai eloszlásában.

A statisztika mint tudomány mindenekelőtt a társadalmi jelenségek és folyamatok mennyiségi oldalát vizsgálja a sajátos hely- és időviszonyok között, azaz. a statisztika tárgya a társadalmi-gazdasági jelenségek mérete és mennyiségi összefüggései, kapcsolódásuk, fejlődésük mintázata.

A statisztika mennyiségi jellemzőt fejez ki egy bizonyos típusú számon keresztül, amelyeket statisztikai mutatóknak nevezünk.

statisztikai tükrözi a mérési eredményt a sokaság egységeire és a sokaság egészére vonatkozóan.

A statisztika, mint tudomány elméleti alapjai

Minden tudomány elméleti alapja, így a statisztika is, fogalmakból és kategóriákból épül fel, amelyek összességében e tudomány alapelvei fejeződnek ki.

A statisztikai aggregátumok bizonyos tulajdonságokkal rendelkeznek, amelyek hordozói a sokaság (jelenség) bizonyos jellemzőkkel rendelkező egységei. A külső kifejezés formája szerint a jeleket attributív (leíró, minőségi) és mennyiségi jelekre osztják. Az attribúciós (kvalitatív) jelek nem alkalmasak mennyiségi (numerikus) kifejezésre.

A mennyiségi jelek diszkrétre és folyamatosra oszthatók.

fontos a statisztika egy kategóriája egyben statisztikai szabályszerűség is.

statisztikai szabályszerűség - ez az ok-okozati összefüggés megnyilvánulási formája, amely az események sorrendjében, szabályosságában, ismétlődésében fejeződik ki magas fok valószínűségek, ha az eseményeket előidéző ​​okok (feltételek) nem, vagy csekély mértékben változnak.

A statisztikai törvényszerűség megállapítása tömeges adatok elemzése alapján történik. Ez határozza meg a joghoz való viszonyát nagy számok.

A nagy számok törvényének lényege abban rejlik, hogy a tömeges megfigyelések eredményét összegző számokban olyan törvényszerűségek jelennek meg, amelyek kis számú tényezőn nem mutathatók ki. A nagy számok törvényét a tömegjelenségek tulajdonságai generálják. A nagy számok törvényének segítségével feltárt tendenciák, törvényszerűségek csak tömegtendenciákként érvényesek, de nem törvényszerűségként minden egyes, egyedi esetre.

Statisztikai módszer

A statisztika mint tudomány technikákat és módszereket dolgozott ki a tömeges társadalmi jelenségek tanulmányozására, a tárgy sajátosságaitól és a vizsgálata során felmerülő feladatoktól függően. Azok a technikák és módszerek, amelyekkel a statisztika tárgyát tanulmányozza, alkotják a statisztikai módszertant.

A statisztikai módszertan azt jelenti technikák, módszerek és módszerek rendszere, amelyek a társadalmi-gazdasági jelenségek szerkezetében, dinamikájában és kapcsolataiban megnyilvánuló mennyiségi minták vizsgálatát célozzák.

A statisztikai kutatás feladata A társadalmi élet olyan általánosító jellemzőinek megszerzésében és olyan minták azonosításában áll meghatározott hely- és időviszonyok között, amelyek csak a jelenségek nagy tömegében nyilvánulnak meg az egyes elemeiben rejlő véletlenszerűség leküzdése révén.

A statisztikai kutatás három szakaszból áll:

statisztikai megfigyelés;

a megfigyelési eredmények összefoglalása és csoportosítása;

a kapott általánosító mutatók elemzése.

Mindhárom szakasz összefügg egymással, és mindegyiknél speciális módszereket alkalmaznak, az elvégzett munka tartalmával magyarázva.

A szelektív megfigyelés fogalma

A tömegjelenségek tanulmányozásának statisztikai módszertana, mint ismeretes, két megfigyelési módszert különböztet meg az objektum lefedettségének teljességétől függően: folyamatos és nem folyamatos. A nem folyamatos megfigyelés szelektív.

Szelektív megfigyelés alatt alatt olyan nem folyamatos megfigyelést értünk, amelyben a vizsgált sokaság véletlenszerűen kiválasztott egységeit statisztikai vizsgálatnak (megfigyelésnek) vetjük alá.

A szelektív megfigyelés maga elé állítja a feladatot - a vizsgált résznél jellemezze a teljes egységhalmazt, az összes lebonyolítási szabály és elv betartásával statisztikai megfigyelésés tudományosan szervezett munka az egységek kiválasztására.

A mintavételi módszer elfogadható pontossággal biztosítja a szükséges információkat, ha az idő- és költségtényezők nem teszik lehetővé a folyamatos fejlesztést.

A minta és az általános sokaság jellemzői

A statisztikában a felméréshez kiválasztott mértékegységek halmazát általában ún szelektív , és az egységek halmaza, amelyből a kiválasztás történik - Tábornok.

Az általános és mintapopulációk paramétereinek főbb jellemzőit bizonyos szimbólumok jelzik ( lapon. 1.1 ).

1.1. táblázat Az általános és mintapopulációk paramétereinek főbb jellemzőinek szimbólumai

Jellegzetes

Népesség

Mintapopuláció

Népesség mennyisége (egységek száma)

A vizsgált tulajdonsággal rendelkező egységek száma

A vizsgált tulajdonsággal rendelkező egységek aránya

Átlagos funkcióméret

Kvantitatív Variancia

Oszd meg a szórást

A mintavételezés során, mint általában minden felmérés adatainak elemzésekor, a statisztika kétféle hibát különböztet meg: a regisztrációt és a reprezentativitást.

Regisztrációs hibák lehet véletlenszerű (nem szándékos) vagy szisztematikus (tendenciális) természetű. Ezzel elkerülhetők megfelelő szervezésés megfigyelés végrehajtása.

Reprezentatív hibák szervesen benne vannak a szelektív megfigyelésben, és abból fakadnak, hogy a minta nem reprodukálja teljesen az általánost.

A reprezentativitási hibákat nem lehet elkerülni, azonban a nagy számok törvényének határérték-tételein alapuló valószínűségszámítási módszerekkel ezek a hibák minimális értékekre redukálhatók, amelyek határai kellően nagy pontossággal vannak meghatározva;

Mintavételi hiba - ez a paraméter általános sokaságban mért értéke és a mintamegfigyelés eredményeiből számított értéke közötti különbség.

Az átlagos értéknél a hiba a következőképpen lesz meghatározva:

Ahol, . (1.1)

Az értéket marginális mintavételi hibának nevezzük .

A marginális mintavételi hiba véletlenszerű. A nagy számok törvényének határtételei a véletlenszerű mintavételi hibák mintázatainak vizsgálatára szolgálnak.

Ezeket a mintákat legteljesebben L.L. tételei fedik fel. Csebisev és A.M. Ljapunov.

P. L. Csebisev tétele : kellően nagy számú független megfigyelés mellett egyhez közeli valószínűséggel (azaz szinte biztosan) kijelenthető, hogy a minta átlagának eltérése az általánostól tetszőlegesen kicsi lesz.

A tétel bizonyítja, hogy a hiba értéke nem haladhatja meg.

A minta átlagának az általános átlagtól való szórását kifejező érték viszont a tulajdonság ingadozásától az általános sokaságban és a kiválasztott egységek számától függ.

Ezt a függőséget a képlet fejezi ki

Ahol - mintavételi hibát jelent (a mintavételi módszertől függ);

Általános diszperzió;

Minta nagysága.

Könnyen belátható, hogy nagy számú egység kiválasztásakor kisebbek lesznek az eszközök közötti eltérések, pl. fordított összefüggés van az átlagos mintavételi hiba és a mintavételezett egységek száma között.

Bizonyítható, hogy egy jellemző variabilitásának növekedése a szórás növekedésével, következésképpen hibákkal jár.

Az általános és a minta sokaság szórása közötti arányt a képlet fejezi ki

Mivel a kellően nagy értéke közel van a -hoz, megközelítőleg feltételezhetjük, hogy a minta szórása megegyezik az általános szórással, azaz. .

Ennélfogva, átlagos mintavételi hiba mutatja , a minta sokaság jellemzőinek milyen lehetséges eltérései lehetnek az általános sokaság megfelelő jellemzőitől. Ennek a hibának a nagysága azonban bizonyos valószínűséggel megítélhető. A szorzó a valószínűség nagyságát jelzi.

A. M. Ljapunov bebizonyította, hogy a mintaátlagok eloszlása ​​(és ebből következően azok eltérése az általános átlagtól) kellően nagy számú független megfigyeléssel megközelítőleg normális, feltéve, hogy az általános sokaság véges átlaggal és korlátozott szórással rendelkezik.

Matematikailag Ljapunov tétele így írható:

Ahol - marginális mintavételi hiba .

Ennek az integrálnak a megbízhatósági együttható különböző értékeire vonatkozó értékeit kiszámították, és speciális matematikai táblázatokban adják meg.

Például:

t = 1 F(t) = 0,683; t = 1,5 F(t) = 0,866;

t=2F(t)=0,954; t = 2,5 F(t) = 0,988;

t = 3 F(t) = 0,997; t = 3,5 F(t) = 0,999.

Ez a következőképpen olvasható: Valószínűséggel állítható, hogy a minta és az általános átlag közötti különbség nem haladja meg az átlagos mintavételi hiba egy értékét.

Vagyis olyan esetekben, amikor a reprezentativitási hiba nem lépi túl a határokat stb.

A jellemző mintaközépértékének és a határmintavételi hibának a ismeretében meg lehet határozni azokat a határokat (határokat), amelyek az általános átlagot tartalmazzák:

Bernoulli tétele egy alternatív jellemző mintavételi hibáját veszi figyelembe, amelynek csak két lehetséges kimenetele van: a jellemző jelenléte () és hiánya (0).

Bernoulli tétele kimondja , hogy kellően nagy mintaméret esetén a jellemző mintapopulációban () és a jellemzőnek az általános sokaságban () való részesedése közötti eltérés valószínűsége egységnyi lesz:

azok. az egyhez tetszőlegesen közeli valószínűséggel vitatható, hogy kellően nagy mintaméret mellett egy jellemző gyakorisága (mintarészesedés) tetszőlegesen keveset fog eltérni egy jellemző arányától (az általános sokaságban).

Tekintettel a hogy a gyakoriság és az arány eltérésének valószínűsége követi a törvényt normális eloszlás, ez a valószínűség az adott érték függvényében a függvényből megkereshető.

Egy alternatív jellemző átlagos mintavételi hibáját a képlet határozza meg

Mivel egy jellemző részesedése a mintában nem ismert, helyettesíteni kell ugyanazon jellemzőnek az általános sokaságban való részesedésével, pl. vegyük, és vegyük az alternatív jellemző varianciáját mint.

Ekkor az átlagos mintavételi hibát a képlet fejezi ki

A gyakoriság és az arány különbségének határértékét ún marginális mintavételi hiba .

A határhiba nagysága bizonyos valószínűséggel megítélhető, ami a szorzótól függ, hiszen.

A tulajdonság mintaarányának és a mintavételi határhibának ismeretében meg lehet határozni az általános részesedést tartalmazó határokat:

A szelektív statisztikai vizsgálat eredményei nagymértékben függenek a megfigyelési folyamat előkészítésének szintjétől.

Képzettségi szint alatt ebben az esetben bizonyos szabályok és elvek betartását jelenti a mintavételes felmérés megtervezésekor. A tervezés legfontosabb eleme a szelektív megfigyelés szervezeti tervének elkészítése.

A szervezeti terv tartalmazza következő kérdésekre:

  • 1. A megfigyelés céljának és célkitűzéseinek meghatározása.
  • 2. A vizsgált tárgy határainak meghatározása.
  • 3. A megfigyelési program kidolgozása (kérdőív, kérdőív, beszámolólap, stb. összeállítása) és anyagainak kidolgozása.
  • 4. A kiválasztási eljárás, a kiválasztási módszer és a mintanagyság meghatározása.
  • 5. A személyzet képzése megfigyelésre, nyomtatványok sokszorosítására, oktató dokumentumokra stb.
  • 6. A minta jellemzőinek számítása és a mintavételi hibák meghatározása.
  • 7. A mintaadatok elosztása a teljes sokaságra.
  • 2. A mintapopuláció kialakításának főbb módszerei

A mintaadatokból számított jellemzők megbízhatóságát nagymértékben meghatározza a minta reprezentativitása, ami viszont attól függ, hogy az általános sokaságból milyen módszerrel választják ki az egységeket.

Megkülönböztetés megjelenés alapján egyéni, csoportos és kombinált kiválasztás.

Nál nél egyéni kiválasztás az általános sokaság egyes egységeit választjuk ki a mintakészletben, azzal csoport kiválasztása - egységcsoportok, ill kombinált kiválasztás csoportos és egyéni kiválasztás kombinációját foglalja magában.

A kiválasztási módszer határozza meg, hogy a kiválasztott egység továbbra is részt vehet-e a kiválasztási eljárásban.

Megismételhetetlen olyan szelekciónak nevezzük, amelyben a mintába került egység nem kerül vissza abba a sokaságba, amelyből további szelekció történik.

Nál nél megismételt A kiválasztás során a mintába kerülő egység a megfigyelt jellemzők regisztrálása után visszatér az eredeti (általános) sokasághoz, hogy részt vegyen a további kiválasztási eljárásban.

Ezzel a módszerrel az általános sokaság mérete változatlan marad, ami állandó valószínűséggel a sokaság összes egységének mintájába kerül.

A mintavételes felmérések gyakorlatában a következő mintákat használják legszélesebb körben:

valójában véletlenszerű;

mechanikai;

tipikus;

sorozatszám;

kombinált.

Önvéletlen mintavétel

Egy ilyen minta esetén az egységek kiválasztása az általános sokaságból véletlenszerűen vagy véletlenszerűen történik, a konzisztencia minden eleme nélkül. Ugyanakkor a teljes sokaság minden egységének kivétel nélkül abszolút egyenlő eséllyel kell bekerülnie a mintába.

Technikailag a megfelelő véletlenszerű kiválasztás sorshúzással vagy véletlenszám-táblázat alapján történik.

Az önvéletlenszerű kiválasztás ismétlődő és nem ismétlődő is lehet.

Tegyük fel, hogy a városlakók életkörülményeinek mintavételezése során, véletlenszerű újramintavétel alapján, a következő eloszlási sorozatot kaptuk ( lapon. 2.1 ).

2.1. táblázat A városlakók életkörülményeinek mintavételes felmérésének eredményei

Az átlagos mintavételi hiba meghatározásához ki kell számítani a vizsgált tulajdonság mintaátlagát és szórását (2.2. v.).

2.2 táblázat Az egy főre jutó lakások átlagos teljes (hasznos) területének és szórásának számítása

A lakások teljes (hasznos) területe, 1 főre, m 2

Lakosok száma f

Intervallum x

  • 5,0-10,0
  • 10,0-15,0
  • 15,0-20,0
  • 20,0-25,0
  • 25,0-30,0
  • 30.0 és újabb
  • 712,5
  • 2550,0
  • 4725,0
  • 4725,0
  • 3575,0
  • 2697,5
  • 5343,75
  • 31875,0
  • 82687,5
  • 106312,5
  • 98312,5
  • 87668,75

Közepes a mintavételi hiba a következő:

Határozzuk meg a határmintavételi hibát a következő valószínűséggel:

Állítsuk meg az általános átlag határait:

Így az elvégzett mintavételes felmérés alapján valószínűsíthető, hogy az egy főre jutó összterület átlagos nagysága a város egészében től ​​ig terjed.

A véletlenszerű, nem ismétlődő minta átlagos hibájának kiszámításakor figyelembe kell venni a nem ismétlődő kiválasztás korrekcióját:

Feltételezve, hogy a bemutatott lapon. 2.1 az adatok nem ismétlődő szelekció eredménye (az általános sokaság egységeket tartalmaz), akkor az átlagos mintavételi hiba valamivel kisebb lesz:

Ennek megfelelően a mintavételi határhiba is csökkenni fog, ami az általános átlag határainak szűkülését okozza.

Használjuk újra az adatokat lapon. 2.1 annak érdekében, hogy meghatározzák azon személyek arányának határait, akiknek a lakhatási ellátása alacsonyabb.

A felmérés eredményei szerint az ilyen személyek száma egy főt tett ki.

Határozzuk meg a minta törtét és szórását:

Számítsa ki az átlagos mintavételi hibát:

A határérték mintavételi hiba adott valószínűséggel:

Határozzuk meg az általános részesedés határait:

Valószínűsíthető tehát, hogy a város egészében az egy főre jutó kevesebbel rendelkezők aránya től ig terjedő tartományban van.

Mechanikus mintavétel

A mechanikus mintavételt olyan esetekben alkalmazzák, amikor a sokaság valamilyen módon rendezett, pl. egy bizonyos sorrend van az egységek elrendezésében (választói névjegyzék, válaszadók telefonszáma, házak és lakások száma stb.).

A mechanikus mintavételhez szelekciós arányt állapítanak meg, amelyet a minta és az általános sokaság térfogatának korrelációjával határoznak meg.

Az egységek kiválasztása a megállapított aránynak megfelelően, rendszeres időközönként történik. Például egy arány (minta) esetén minden egység ki van jelölve.

Az általános sokaság a mechanikai szelekció során a vizsgált tulajdonság értéke, illetve azzal összefüggésbe hozható rangsorolható vagy rendezhető, ami növeli a minta reprezentativitását.

Ebben az esetben azonban megnő a szisztematikus hiba kockázata, amely a vizsgált tulajdonság értékének alulbecslésével (ha az első értéket minden intervallumból rögzítve van), vagy túlbecslésével (ha az utolsó értéket minden intervallumból rögzíti).

Célszerű a kijelölést az első intervallum közepétől kezdeni, például mintavételkor a következő egységeket azonos intervallummal jelöljük ki.

A mechanikai mintavétel átlagos hibájának meghatározásához az önvéletlen, nem ismétlődő szelekció átlagos hibájának képletét használjuk.

tipikus kiválasztás

Ezt a kiválasztási módszert olyan esetekben alkalmazzák, amikor az általános sokaság minden egysége több tipikus csoportra osztható.

A tipikus szelekció magában foglalja az egységek kiválasztását minden tipikus csoportból tisztán véletlenszerűen vagy mechanikus módon.

Az egységek kiválasztása egy tipikus mintában történhet a tipikus csoportok térfogatának arányában, vagy egy tulajdonság csoporton belüli differenciálódása arányában.

A tipikus csoportok méretével arányos mintavételnél az egyes csoportokból kiválasztandó egységek számát a következőképpen határozzuk meg:

hol a csoport térfogata;

A csoportból származó minta nagysága.

Egy ilyen minta átlagos hibáját a következő képletek határozzák meg:

- (újraválasztás); (2.1)

- (nem ismétlődő kiválasztás), (2.2)

ahol a csoporton belüli diszperziók átlaga.

A tulajdonság differenciálásával arányos mintavételkor az egyes csoportok megfigyelések számát a következő képlettel számítjuk ki:

ahol a tulajdonság szórása a csoportban.

Egy ilyen kiválasztás átlagos hibáját a következőképpen határozzuk meg:

- (újraválasztás), (2.4)

- (nem ismétlődő kiválasztás). (2.5)

Tekintsük egy tipikus minta mindkét változatát egy feltételes példa segítségével.

Tegyük fel, hogy az átmeneti rokkantságból eredő veszteségek felmérése érdekében a vállalkozás dolgozóinak nem ismétlődő, tipikus, a műhelyek méretével arányos kiválasztása a következő eredményekhez vezetett: lapon. 2.3 ).

2.3. táblázat A vállalkozás dolgozóinak felmérésének eredményei

Határozzuk meg az átlagos és a határmintavételi hibákat (valószínűséggel):

Számítsa ki a minta átlagát:

Valószínűleg azt a következtetést vonhatjuk le, hogy egy munkavállaló átmeneti rokkantsági napjainak átlagos száma a teljes vállalkozásban belül van:

Használjuk a kapott csoporton belüli varianciákat a tulajdonság differenciálódásával arányos szelekció elvégzésére.

Határozza meg a szükséges mintaméretet minden műhelyhez:

A kapott értékeket figyelembe véve kiszámítjuk az átlagos mintavételi hibát:

Ebben az esetben az átlag, és ennek következtében a határhiba valamivel kisebb lesz, ami az általános átlag határait is érinti.

sorozat kiválasztása

Ez a szelekciós módszer olyan esetekben kényelmes, amikor a populációs egységek kis csoportokba vagy sorozatokba vannak csoportosítva. Mint ilyen sorozat, bizonyos mennyiségű készterméket tartalmazó csomagok, árutételek, diákcsoportok, brigádok és egyéb egyesületek.

A soros mintavétel lényege a sorozatok tényleges véletlenszerű vagy mechanikus kiválasztása, amelyen belül az egységek folyamatos felmérése történik.

Az átlagos soros mintavételi hiba (egyenlő sorozatok kiválasztásakor) csak a csoportközi (sorok közötti) variancia értékétől függ, és a következő képletekkel határozzuk meg:

(újraválasztás); (2.6)

(nem ismétlődő kijelölés), (2.7)

ahol a kiválasztott sorozatok száma;

Az epizódok teljes száma.

A csoportok közötti variancia kiszámítása a következőképpen történik:

hol a sorozat átlaga;

A teljes minta általános átlaga.

Kombinált kiválasztás

A statisztikai felmérések gyakorlatában a fentebb tárgyalt kiválasztási módszerek mellett ezek kombinációját is alkalmazzák.

Lehetőség van a típus- és a sorozatmintavétel kombinálására, ha a sorozatokat több tipikus csoportból választják ki előírt módon. Sorozatos és megfelelő véletlenszerű kiválasztás kombinációja is lehetséges, amelyben az egyes egységek a sorozaton belül megfelelő véletlenszerű sorrendben kerülnek kiválasztásra.

Egy ilyen minta hibáját a lépésenkénti kiválasztás határozza meg.

többlépcsős szelekciónak nevezik, amelyben először kinagyított csoportokat vonnak ki az általános sokaságból, majd kisebbeket, és így tovább, amíg ki nem választják azokat az egységeket, amelyekre a felmérés vonatkozik.

Többfázisú mintavétel magában foglalja ugyanazon mintavételi egység megőrzését a megvalósítás minden szakaszában, miközben az egyes szakaszokban kiválasztott egységek vizsgálat tárgyát képezik (a kiválasztás minden további szakaszában a felmérési program kibővül).

A fentiek alapján a gyakorlatban leggyakrabban használt minta sokaságképzési módszereihez a határmintavételi hiba képleteit mutatjuk be ( lapon. 2.4 ).

2.4. táblázat: Marginális mintavételi hiba egyes mintavételi módszereknél

Matematikai statisztika egy modern iparág matematikai tudomány, amely a kísérletek és megfigyelések eredményeinek statisztikai leírásával, valamint épület fogalmakat tartalmazó matematikai modellek valószínűségek. elméleti alapja matematikai statisztika szolgál Valószínűségi elmélet.

A matematikai statisztika szerkezetében hagyományosan két fő szakaszt különböztetnek meg: leíró statisztikaés statisztikai következtetés (1.1. ábra).

Rizs. 1.1. A matematikai statisztika főbb részei

Leíró statisztika a következőkre használják:

o egy változó mutatóinak általánosítása (véletlen minta statisztikái);

o két vagy több változó közötti kapcsolatok azonosítása (korrelációs-regressziós elemzés).

A leíró statisztika lehetővé teszi az új információk megszerzését, azok gyors megértését és átfogó értékelését, azaz ellátja a vizsgálati tárgyak leírásának tudományos funkcióját, ami igazolja elnevezését. A leíró statisztika módszerei arra szolgálnak, hogy az egyedi empirikus adatok halmazát formák és számok rendszerévé alakítsák, amelyek az észlelés szempontjából vizuálisak: gyakorisági eloszlások; trendek mutatói, változékonyság, kommunikáció. Ezek a módszerek véletlen minta statisztikáit számítják ki, amelyek a statisztikai következtetések végrehajtásának alapjául szolgálnak.

Statisztikai következtetés adj lehetőséget:

o értékelje a mintastatisztika pontosságát, megbízhatóságát és eredményességét, megtalálja a folyamat során előforduló hibákat statisztikai tanulmányok(statisztikai értékelés)

o a mintastatisztika alapján kapott általános sokaság paramétereinek általánosítása (statisztikai hipotézisek tesztelése).

a fő cél tudományos kutatás- ez új ismeretek megszerzése a jelenségek, személyek vagy események nagy csoportjáról, amelyeket általános népességnek neveznek.

Népesség a tanulmányi tárgyak összessége, minta- bizonyos tudományosan alátámasztott módon kialakított része 2.

Az "általános populáció" kifejezést akkor használják, amikor a vizsgált objektumok nagy, de véges halmazáról van szó. Például a 2009-es ukrajnai kérelmezők összességéről vagy a gyerekek összességéről óvodás korú Rivne városa. Az általános populációk jelentős mennyiséget érhetnek el, lehetnek végesek és végtelenek. A gyakorlatban általában véges halmazokkal foglalkozunk. Ha pedig az általános sokaság méretének és a minta méretének aránya több, mint 100, akkor Glass és Stanley szerint a véges és a végtelen sokaságra vonatkozó becslési módszerek lényegében ugyanazt az eredményt adják. Az általános halmazt nevezhetjük valamely attribútum teljes értékkészletének is. Az általános sokaság jellemzőinek a minta jellemzői alapján történő értékelésének fő alapja a minta általános sokasághoz való tartozása.

ötlet A matematikai statisztika azon a meggyőződésen alapul, hogy az általános populáció összes tárgyának teljes körű tanulmányozása a legtöbb tudományos probléma esetében gyakorlatilag lehetetlen vagy gazdaságilag kivitelezhetetlen, mivel sok időt és jelentős anyagi költségeket igényel. Ezért a matematikai statisztikában ezt használják szelektív megközelítés,ábrán látható diagramon az elve látható. 1.2.

Például a formálási technológia szerint a minták randomizáltak (egyszerű és szisztematikus), rétegzettek, klaszterezettek (lásd 4. fejezet).

Rizs. 1.2. A matematikai statisztika módszereinek alkalmazási sémája Aszerint szelektív megközelítés a matematikai és statisztikai módszerek alkalmazása a következő sorrendben hajtható végre (lásd 1.2. ábra):

o -val Általános népesség, amelyek tulajdonságai kutatás tárgyát képezik, bizonyos módszerek mintát alkotnak- tipikus, de korlátozott számú objektum, amelyre kutatási módszereket alkalmaznak;

o megfigyelési módszerek, kísérleti akciók és mintatárgyakon végzett mérések eredményeként empirikus adatok nyerhetők;

o az empirikus adatok leíró statisztikai módszerekkel történő feldolgozása mintamutatókat ad, amelyeket statisztikusoknak nevezünk - mint egyébként a tudományág neve;

o statisztikai következtetési módszerek alkalmazása a statisztikus, a tulajdonságokat jellemző paramétereket kapni az általános lakosság.

Példa 1.1. A tudásszint stabilitásának felmérése érdekében (változó x) térfogatú, 3 fős véletlenszerű minta tesztelése n. A tesztek m feladatot tartalmaztak, amelyek mindegyikét a pontozási rendszer szerint értékelték: "teljesített" "- 1", nem teljesült "- 0. A tanulók jelenlegi átlagos teljesítménye X maradt

3 randomizált minta(az angol. Random - random) egy reprezentatív minta, amelyet a véletlenszerű tesztek stratégiája szerint alakítanak ki.

az előző évek szintjén / h? Megoldás sorrendje:

o találjunk ki egy értelmes hipotézist a következő típusból: "ha a jelenlegi teszteredmények nem térnek el a korábbiaktól, akkor a tanulók tudásszintjét változatlannak tekinthetjük, ill. oktatási folyamat- stabil";

o megfogalmazni egy adekvát statisztikai hipotézist, például a nullhipotézist H 0 hogy az „aktuális GPA X statisztikailag nem tér el a korábbi évek átlagától / h”, azaz. H 0: X = ⁄ r, szemben a megfelelő alternatív hipotézissel X Ф ^ ;

o építeni a vizsgált X változó empirikus eloszlásai;

o meghatározni(ha szükséges) összefüggések, például egy változó között xés egyéb mutatók, épít regressziós egyenesek;

o ellenőrizze az empirikus eloszlás normál törvénynek való megfelelését;

o felméri a pontmutatók értékét és megbízhatósági intervallum paraméterek, például átlag;

o meghatározza a statisztikai tesztelés kritériumait hipotézisek;

o statisztikai hipotézisek tesztelése a kiválasztott kritériumok alapján;

o döntést fogalmazni a statisztikai nullhipotézisről egy bizonyos szignifikancia szint;

o elmozdulni az értelmes hipotézisre vonatkozó következtetések értelmezésének statisztikai nullhipotézisének elfogadása vagy elutasítása mellett;

o értelmes következtetéseket fogalmazzon meg.

Tehát, ha összefoglaljuk a fenti eljárásokat, akkor a statisztikai módszerek alkalmazása három fő blokkból áll:

Átmenet a valóság tárgyáról egy absztrakt matematikai és statisztikai sémára, vagyis egy jelenség, folyamat, tulajdonság valószínűségi modelljének megalkotása;

Számítási műveletek elvégzése megfelelő matematikai eszközökkel a mérések, megfigyelések, kísérletek eredményeire, statisztikai következtetések megfogalmazására épülő valószínűségi modell keretein belül;

A valós helyzetre vonatkozó statisztikai következtetések értelmezése és megfelelő döntés meghozatala.

Az adatok feldolgozásának és értelmezésének statisztikai módszerei a valószínűségszámításon alapulnak. A valószínűségelmélet a matematikai statisztika módszereinek alapja. A valószínűségszámítás alapvető fogalmainak és törvényeinek alkalmazása nélkül lehetetlen általánosítani a matematikai statisztika következtetéseit, és így azok tudományos és gyakorlati célokra való ésszerű felhasználását.

A leíró statisztika feladata tehát az, hogy a mintaadatok halmazát mutatószámok - statisztikák - gyakorisági eloszlások, központi tendencia és változékonyság mértékei, csatolási együtthatók és hasonlók rendszerévé alakítsa. A statisztikák azonban valójában egy adott minta jellemzői. Természetesen lehetséges a mintaeloszlások, mintaátlagok, szórások stb. kiszámítása, de az ilyen "adatelemzés" korlátozott tudományos és oktatási értékű. Az ilyen mutatók alapján levont következtetések „mechanikus” átvitele más populációkra nem helyes.

Ahhoz, hogy a mintamutatókat vagy másokat, vagy gyakoribb populációkra át lehessen vinni, matematikailag indokoltnak kell lenni rendelkezések a minta jellemzőinek e közös, úgynevezett általános sokaságok jellemzőivel való összhangjáról és képességéről. Az ilyen rendelkezések elméleti megközelítéseken és valószínűségi modellekhez kapcsolódó sémákon alapulnak, például az axiomatikus megközelítésen, a nagy számok törvényében stb. Csak segítségükkel lehetséges a korlátozott empirikus információk elemzésének eredményei alapján megállapított tulajdonságokat más vagy széles körben elterjedt halmazokba átvinni. Így a konstrukció, a működés törvényei, a valószínűségi modellek használata a „valószínűségelmélet” nevű matematikai terület tárgya, a statisztikai módszerek lényegévé válik.

Így a matematikai statisztikában két párhuzamos mutatósort használnak: az első sort, amely a gyakorlat szempontjából releváns (ezek mintamutatók), a másodikat pedig az elméleten alapuló (ezek egy valószínűségi modell mutatói). Például a mintán meghatározott empirikus gyakoriságok megfelelnek az elméleti valószínűség fogalmának; mintaátlag (gyakorlat) megfelel várható érték(elmélet) stb. Ezenkívül a tanulmányokban a szelektív jellemzők általában elsődlegesek. Ezeket megfigyelések, mérések, kísérletek alapján számítják ki, majd a kutatási célnak megfelelően statisztikailag értékelik a képességet és eredményességet, tesztelik a statisztikai hipotéziseket, és végül bizonyos valószínűséggel elfogadják a vizsgált populációk tulajdonságainak mutatójaként.

Kérdés. Feladat.

1. Ismertesse a matematikai statisztika főbb részeit!

2. Mi a matematikai statisztika fő gondolata?

3. Ismertesse az általános és a mintapopuláció arányát!

4. Ismertesse a matematikai statisztika módszereinek alkalmazási sémáját!

5. Adja meg a matematikai statisztika fő feladatainak listáját!

6. Melyek a statisztikai módszerek alkalmazásának főbb blokkjai? Jellemezni őket.

7. Bővítse a matematikai statisztika és a valószínűségszámítás közötti kapcsolatot!

Matematikai statisztika- ez a matematikának egy olyan ága, amely a meglévő minták azonosítását célzó kísérlet eredményei alapján közelítő módszereket vizsgál az adatok gyűjtésére és elemzésére, pl. a valószínűségi változók eloszlási törvényeinek és numerikus jellemzőinek megtalálása.

A matematikai statisztikában két fő kutatási területet szokás megkülönböztetni:

1. Az általános sokaság paramétereinek becslése.

2. Statisztikai hipotézisek tesztelése (néhány a priori feltételezés).

A matematikai statisztika alapfogalmai: általános sokaság, minta, elméleti funkciója terjesztés.

Általános népesség egy valószínűségi változó megfigyelései során elképzelhető összes statisztikai adat halmaza.

X G \u003d (x 1, x 2, x 3, ..., x N, ) \u003d ( x i; i \u003d 1, N)

A megfigyelt X valószínűségi változót jellemzőnek vagy mintavételi tényezőnek nevezzük. Az általános sokaság egy valószínűségi változó statisztikai analógja, N térfogata általában nagy, ezért ebből választják ki az adatok egy részét, nevezzük mintapopulációnak vagy egyszerűen mintának.

X B \u003d (x 1, x 2, x 3, ..., x n, ) \u003d ( x i; i \u003d 1,n)

Х В М Х Г, n £ N

Minta az általános populációból véletlenszerűen kiválasztott megfigyelések (objektumok) gyűjteménye közvetlen tanulmányozás céljából. A mintában lévő objektumok számát mintaméretnek nevezzük, és n-nel jelöljük. A minta jellemzően az általános populáció 5–10%-a.

A minta felhasználása olyan minták megalkotására, amelyeknek egy megfigyelt valószínűségi változó ki van téve, lehetővé teszi annak folyamatos (tömeges) megfigyelésének elkerülését, ami gyakran erőforrás-igényes folyamat, sőt egyszerűen lehetetlen.

Például a populáció egyedek halmaza. Egy teljes populáció vizsgálata fáradságos és költséges, ezért az e populáció képviselőinek tekintett egyedek mintáján gyűjtenek adatokat, amelyek lehetővé teszik, hogy következtetéseket vonjunk le erről a populációról.

A mintának azonban szükségszerűen meg kell felelnie a feltételnek reprezentativitás, azaz ésszerű képet adjon a lakosságról. Hogyan alakítsunk ki reprezentatív (reprezentatív) mintát? Ideális esetben véletlenszerű (randomizált) mintát keresünk. Ehhez összeállítják a populáció összes egyedének listáját, és véletlenszerűen kiválasztják. De előfordulhat, hogy a lista összeállításának költségei elfogadhatatlanok, majd egy elfogadható mintát vesznek, például egy klinikán, kórházban, és megvizsgálják a klinikán lévő összes beteget, akiknél ez a betegség szenved.

A minta minden elemét változatnak nevezzük. Az opciók ismétlődéseinek számát a mintában az előfordulás gyakoriságának nevezzük. Az értéket ún relatív gyakoriság opciók, pl. a változatok abszolút gyakoriságának a teljes mintamérethez viszonyított arányaként található. Növekvő sorrendben írt opciók sorozatát hívjuk meg variációs sorozat.


Tekintsük a variációs sorozat három formáját: a tartományt, a diszkrétet és az intervallumot.

rangsorolt ​​sor- ez a populáció egyes egységeinek listája a vizsgált tulajdonság szerint növekvő sorrendben.

Diszkrét variációs sorozat egy táblázat, amely grafikonokból vagy vonalakból áll: az x i attribútum meghatározott értéke és az x attribútum i-edik értékének megnyilvánulásának n i abszolút gyakorisága (vagy relatív gyakorisága ω i).

Változatsorozatra példa a táblázat

Írja fel a relatív gyakoriságok eloszlását!

Megoldás: Keresse meg a relatív frekvenciákat. Ehhez elosztjuk a gyakoriságokat a minta méretével:

A relatív gyakoriságok eloszlása ​​a következőképpen alakul:

0,15 0,5 0,35

Kontroll: 0,15 + 0,5 + 0,35 = 1.

Egy diszkrét sorozat grafikusan ábrázolható. A derékszögű derékszögű koordinátarendszerben () vagy () koordinátájú pontok vannak kijelölve, amelyeket egyenesek kötnek össze. Az ilyen törött vonalat ún frekvencia sokszög.

Készítsen diszkrét variációs sorozatot (DVR) és rajzoljon egy eloszlási poligont 45 jelentkező számára a felvételi vizsgákon szerzett pontok száma szerint:

39 41 40 42 41 40 42 44 40 43 42 41 43 39 42 41 42 39 41 37 43 41 38 43 42 41 40 41 38 44 40 39 41 40 42 40 41 42 40 43 38 39 41 41 42.

Megoldás: Variációs sorozat felépítése különféle jelentések Az x jellemzőt (opciók) növekvő sorrendbe rendezzük, és minden egyes érték alá felírjuk a gyakoriságát.

Építsünk egy sokszöget ebből az eloszlásból:

Rizs. 13.1. Frekvencia sokszög

Intervallum variációs sorozat számos megfigyeléshez használják. Egy ilyen sorozat felépítéséhez ki kell választania a jellemzőintervallumok számát, és be kell állítania az intervallum hosszát. Nagy számú csoport esetén az intervallum minimális lesz. A variációs sorozatban lévő csoportok számát a Sturges-képlet segítségével találhatjuk meg: (k a csoportok száma, n a minta mérete), az intervallum szélessége pedig

hol a maximum; - a változat minimális értéke, és ezek különbsége R fesztáv variáció.

Egy orvosi egyetem hallgatóinak összességéből 100 fős mintát vizsgálunk.

Megoldás: Számítsa ki a csoportok számát: . Így egy intervallumsor összeállításához jobb, ha ezt a mintát 7 vagy 8 csoportra osztjuk. A csoportok halmazát, amelyekre a megfigyelések eredményeit felosztjuk, és az egyes csoportokban a megfigyelések eredményeinek megszerzésének gyakoriságát ún. összesített.

A statisztikai eloszlás megjelenítésére hisztogramot használnak.

Frekvencia hisztogram- ez egy lépcsőzetes ábra, amely egyazon egyenesre épített szomszédos téglalapokból áll, amelyeknek az alapja megegyezik és egyenlő az intervallum szélességével, a magasság pedig megegyezik az intervallumba esés gyakoriságával vagy a relatív ω i gyakorisággal.

A Geiger-számlálót egy percig tartó részecskék számának megfigyelése a következő eredményeket adta:

21 30 39 31 42 34 36 30 28 30 33 24 31 40 31 33 31 27 31 45 31 34 27 30 48 30 28 30 33 46 43 30 33 28 31 27 31 36 51 34 31 36 34 37 28 30 39 31 42 37.

Ezen adatok alapján készítsen egy intervallumvariáció sorozatot egyenlő intervallumokkal (I intervallum 20-24; II intervallum 24-28 stb.), és rajzoljon egy hisztogramot.

Megoldás:n=50

Az eloszlás hisztogramja így néz ki:

Rizs. 13.2. Eloszlási hisztogram

Feladat opciók

№ 13.1. Óránként megmérték a hálózati feszültséget. Ebben az esetben a következő értékeket kaptuk (B):

227 219 215 230 232 223 220 222 218 219 222 221 227 226 226 209 211 215 218 220 216 220 220 221 225 224 212 217 219 220.

Statisztikai eloszlás felépítése és sokszög rajzolása.

№ 13.2. A vércukorszint 50 embernél végzett megfigyelése a következő eredményeket adta:

3.94 3.84 3.86 4.06 3.67 3.97 3.76 3.61 3.96 4.04

3.82 3.94 3.98 3.57 3.87 4.07 3.99 3.69 3.76 3.71

3.81 3.71 4.16 3.76 4.00 3.46 4.08 3.88 4.01 3.93

3.92 3.89 4.02 4.17 3.72 4.09 3.78 4.02 3.73 3.52

3.91 3.62 4.18 4.26 4.03 4.14 3.72 4.33 3.82 4.03

Ezen adatok alapján készítsen egy intervallumvariáció sorozatot egyenlő intervallumokkal (I - 3,45-3,55; II - 3,55-3,65 stb.), és ábrázolja grafikusan, rajzoljon hisztogramot.

№ 13.3. Állítson össze egy frekvenciatartományt az eritrocita ülepedési sebesség (ESR) eloszlására 100 emberben.

Küldje el a jó munkát a tudásbázis egyszerű. Használja az alábbi űrlapot

Diákok, végzős hallgatók, fiatal tudósok, akik a tudásbázist tanulmányaikban és munkájukban használják, nagyon hálásak lesznek Önnek.

közzétett http://www.allbest.ru/

Bevezetés

A matematikai statisztika a statisztikai adatok rendszerezésére és tudományos és gyakorlati következtetésekre való felhasználására szolgáló matematikai módszerek tudománya. A matematikai statisztika számos részében a valószínűségelméletre épül, amely lehetővé teszi a korlátozott statisztikai anyag alapján levont következtetések megbízhatóságának és pontosságának felmérését (például a szükséges mintanagyság becslése, hogy a mintavételes felmérés során megkapjuk a szükséges pontosság eredményét).

A valószínűségelméletben adott eloszlású valószínűségi változókat vagy véletlenszerű kísérleteket vesznek figyelembe, amelyek tulajdonságai teljesen ismertek. A valószínűségszámítás tárgya ezen mennyiségek (eloszlások) tulajdonságai és kapcsolatai.

De gyakran a kísérlet egy fekete doboz, amely csak néhány eredményt ad, amelyhez magának a kísérletnek a tulajdonságairól kell következtetést levonnia. A megfigyelő numerikus (vagy számszerűsíthető) eredményekkel rendelkezik, amelyeket ugyanazon véletlenszerű kísérlet azonos körülmények között történő megismétlésével kap.

Ebben az esetben például a következő kérdések merülnek fel: Ha megfigyelünk egy valószínűségi változót, hogyan vonhatunk le a legpontosabb következtetést annak eloszlására több kísérletben szereplő értékhalmazból? matematikai statisztikai variancia hisztogram

Egy ilyen kísérletsorozatra példa a gazdasági mutatók halmazának szociológiai felmérése, vagy végül a címer- és faroksor ezerszeres érmefeldobása során. A fenti tényezők mindegyike meghatározza a munka tárgyának relevanciáját és jelentőségét a jelenlegi szakaszban, amelynek célja a matematikai statisztika alapfogalmainak mély és átfogó tanulmányozása.

1. A matematikai statisztika tárgya és módszere

A megfigyelések konkrét eredményeinek matematikai természetétől függően a matematikai statisztikákat számstatisztikákra osztják. Statisztikai analízis nem numerikus jellegű objektumok függvényeinek (folyamatainak) és idősoros statisztikáinak elemzése. A matematikai statisztikák jelentős része valószínűségi modelleken alapul. Külön kiemeljük a becslési adatok leírásának és a hipotézisek tesztelésének általános feladatait. Különösebb feladatokat is fontolóra vesznek a mintafelvételek lebonyolításával, a függőségek helyreállításával, az osztályozások (tipológiák) felépítésével és használatával, stb.

Az adatok leírására diagramtáblázatokat és egyéb vizuális reprezentációkat építenek, például korrelációs mezőket. Valószínűségi modelleket általában nem használnak. Egyes adatleírási módszerek a fejlett elméletre és a modern számítógépek képességeire támaszkodnak. Ide tartozik különösen az egymáshoz hasonló objektumok csoportjainak azonosítását célzó klaszteranalízis, valamint a többdimenziós skálázás, amely lehetővé teszi az objektumok egy síkon történő megjelenítését a köztük lévő távolság legkisebb torzításával.

A becslési és hipotézisvizsgálati módszerek valószínűségi adatgenerálási modelleken alapulnak. Ezeket a modelleket paraméteres és nem paraméteres modellekre osztják. A parametrikus modellekben feltételezzük, hogy a vizsgált objektumokat eloszlásfüggvények írják le kisszámú (1-4) numerikus paramétertől függően. A nemparaméteres modellekben az eloszlásfüggvényeket tetszőleges folytonosnak tételezzük fel. A matematikai statisztikában kiértékelik az eloszlás paramétereit és jellemzőit (a kvantilis medián varianciájának elvárása stb.), a változók közötti függőség sűrűség- és eloszlásfüggvényeit (lineáris és nem paraméteres korrelációs együtthatók, valamint függvények parametrikus vagy nem paraméteres becslései), függőségi értékeket és intervallumokat kifejező igaz becslések (gi stb.)

A matematikai statisztikában ott általános elmélet hipotézisvizsgálat és nagy szám konkrét hipotézisek tesztelésére szolgáló módszerek. Hipotéziseket mérlegelnek a paraméterek és jellemzők értékeiről, a homogenitás ellenőrzéséről (vagyis a jellemzők vagy eloszlási függvények egybeeséséről két mintában), az empirikus eloszlásfüggvénynek egy adott eloszlásfüggvénnyel vagy az ilyen függvények parametrikus családjával, az eloszlási szimmetriával stb.

Kiemelkedő jelentőségű a matematikai statisztika azon része, amely a mintavételes felmérések lefolytatásához kapcsolódik a különböző mintavételi sémák tulajdonságaival, valamint a hipotézisek becslésére és tesztelésére alkalmas módszerek kidolgozása.

A függőségi helyreállítási problémákat több mint 200 éve vizsgálják aktívan, amióta K. Gauss 1794-ben kidolgozta a legkisebb négyzetek módszerét. Jelenleg a változók informatív részhalmazának keresési módszerei és a nem paraméteres módszerek a legrelevánsabbak.

Az adatközelítési módszerek és a leírási dimenziócsökkentés fejlesztése több mint 100 évvel ezelőtt kezdődött, amikor K. Pearson megalkotta a főkomponens módszert. Később faktoranalízist és számos nemlineáris általánosítást dolgoztak ki.

A különböző konstrukciós (klaszteranalízis) elemzési és osztályozási (tipológiák) felhasználási (diszkriminanciaanalízis) módszereket mintafelismerésnek (tanárral és tanár nélkül), automatikus osztályozásnak stb.

A statisztikában a matematikai módszerek vagy összegek (a valószínűségszámítás központi határtétele alapján), vagy különbségkitevők (távolságmérők) használatán alapulnak, mint a nem numerikus objektumok statisztikájában. Általában csak az aszimptotikus eredményeket támasztják alá szigorúan. Napjainkban a számítógépek nagy szerepet játszanak a matematikai statisztikákban. Számításokhoz és számításokhoz egyaránt használják szimulációs modellezés(különös tekintettel a mintavételi módszerekre és az aszimptotikus eredmények alkalmasságának vizsgálatára).

1.1 A matematikai statisztika alapfogalmai

Kizárólagosan fontos szerep számos pszichológiai és pedagógiai jelenség elemzésében olyan középértékek játszanak, amelyek egy minőségileg homogén halmaz általánosított jellemzői egy bizonyos mennyiségi jellemző szerint. Lehetetlen például kiszámítani az egyetemi hallgatók átlagos szakterületét vagy nemzetiségét, mivel ezek minőségileg heterogén jelenségek. Másrészt meg lehet és szükséges átlagosan meghatározni az előrehaladásuk számszerű jellemzőjét (átlagpontszám), a hatékonyságot. módszertani rendszerekés fogadások stb.

A pszichológiai és pedagógiai kutatásokban általában alkalmazzák különböző fajtákátlagértékek: számtani átlag, geometriai átlag, medián, módus és mások. A leggyakoribb a számtani átlag, a medián és a módusz.

A számtani átlagot olyan esetekben használjuk, amikor a meghatározó tulajdonság és e jellemző között egyenesen arányos kapcsolat áll fenn (például ha a vizsgált csoport teljesítménye javul, az egyes tagok teljesítménye javul).

A számtani átlag az értékek összegének a számukkal való elosztásának hányadosa, és a következő képlettel számítjuk ki:

közzétett http://www.allbest.ru/

ahol X a számtani átlag; X1, X2, X3 ... Xn - az egyéni megfigyelések eredményei (technikák, akciók),

n - a megfigyelések száma (módszerek, intézkedések),

Az összes megfigyelés (technika, akció) eredményének összege.

A medián (Me) az átlagos pozíció mérőszáma, amely egy jellemző értékét jellemzi egy rendezett (növekedés vagy csökkenés alapján épített) skálán, amely a vizsgált sokaság közepének felel meg. A medián az ordinális és mennyiségi jellemzőkre határozható meg. Ennek az értéknek a helyét a következő képlet határozza meg:

Medián hely = (n + 1) / 2

Például. A vizsgálat eredményei alapján megállapították, hogy:

„Kiváló” vizsgálaton - 5 fő vett részt a kísérletben;

"Jó" tanulmányon - 18 fő;

A "kielégítő" - 22 fő;

A "nem kielégítő" - 6 fő.

Mivel összesen N = 54 fő vett részt a kísérletben, a minta közepe egyenlő a fővel. Ebből az a következtetés vonható le, hogy a hallgatók több mint fele a „jó” jegy alatt tanul, vagyis a medián több mint „kielégítő”, de kevesebb, mint „jó”.

A Mode (Mo) a leggyakoribb jellemző érték a többi érték között. A legmagasabb frekvenciájú osztálynak felel meg. Ezt az osztályt modális értéknek nevezzük.

Például.

Ha a kérdőív kérdése: „jelölje meg a tulajdon fokát idegen nyelv” – osztották szét a válaszokat:

1 - folyékonyan - 25

2 – eleget tudok a kommunikációhoz – 54

3 - Tudom, de kommunikációs nehézségeim vannak - 253

4 - nehezen érti meg - 173

5 - nem rendelkezik - 28

Nyilvánvaló, hogy itt a legjellemzőbb jelentése - „Tudom, de nehézségeim vannak a kommunikációban”, ami modális lesz. Tehát a mód -253.

A matematikai módszerek alkalmazása során a pszichológiai és pedagógiai kutatásokban nagy jelentőséget tulajdonítanak a variancia és a négyzetes (szórás) számításának.

A variancia egyenlő az opciók értékének az átlagtól való eltéréseinek négyzetes átlagával. Ez a vizsgált változó értékeinek (például tanulói osztályzatok) átlagérték körüli szóródásának egyéni eredményeinek egyik jellemzője. A diszperzió kiszámítása a következők meghatározásával történik: eltérések az átlagértéktől; a megadott eltérés négyzete; az eltérés négyzeteinek és az eltérés négyzetének átlagának összege.

A diszperziós értéket különféle statisztikai számításokban használják, de közvetlenül nem figyelhetők meg. A megfigyelt változó tartalmához közvetlenül kapcsolódó mennyiség a szórás.

A szórás megerősíti a számtani átlag tipikusságát és indikatív jellegét, tükrözi az előjelek számértékei ingadozásának mértékét, amelyből az átlagérték származik. Ez egyenlő a diszperzió négyzetgyökével, és a képlet határozza meg:

(2) Feladás dátuma: http://www.allbest.ru/

ahol: - négyzetgyök. Kis számú megfigyelés (művelet) esetén - kevesebb, mint 100 - a képlet értéke nem „N”, hanem „N - 1” lehet.

A számtani átlag és az átlagos négyzet a vizsgálat során kapott eredmények fő jellemzői. Lehetővé teszik az adatok összegzését, összehasonlítását, az egyik pszichológiai és pedagógiai rendszer (program) előnyeinek megállapítását a másikkal szemben.

A négyzetes (standard) eltérést széles körben használják a diszperzió mértékeként különböző jellemzők esetében.

A vizsgálat eredményeinek értékelésekor fontos meghatározni egy valószínűségi változó szóródását az átlagérték körül. Ezt a diszperziót a Gauss-törvény (egy valószínűségi változó valószínűségének normális eloszlásának törvénye) segítségével írjuk le. A törvény lényege, hogy egy adott attribútum mérése során egy adott elemhalmazban számos ellenőrizhetetlen ok miatt mindig mindkét irányban vannak eltérések a normától, és minél nagyobbak az eltérések, annál ritkábban fordulnak elő.

További adatfeldolgozással azonosítható: a vizsgált jelenség variációs együtthatója (stabilitása), amely a szórás százalékos aránya a számtani átlaghoz képest; a ferdeség mértéke, amely megmutatja, hogy a túlnyomó számú eltérés melyik irányba irányul; a hidegség mértéke, amely megmutatja egy valószínűségi változó értékeinek az átlag körüli felhalmozódásának mértékét stb. Mindezek a statisztikák segítenek a vizsgált jelenségek jeleinek pontosabb azonosításában.

A változók közötti asszociációs mérőszámok. A statisztikákban két vagy több változó közötti kapcsolatokat (függőségeket) korrelációknak nevezzük. A becslés a korrelációs együttható értékével történik, amely a kapcsolat mértékének és nagyságának mértéke.

Sok korrelációs együttható létezik. Ezeknek csak egy részét tekintsük, amely figyelembe veszi a változók közötti lineáris kapcsolat meglétét. Választásuk a változók mérésére szolgáló skáláktól függ, amelyek közötti kapcsolatot fel kell mérni. A Pearson és Spearman együtthatók leggyakrabban a pszichológiában és a pedagógiában használatosak.

1.2 A mintavétel alapfogalmai

Legyen egy véletlenszerű kísérletben megfigyelt valószínűségi változó. Feltételezzük, hogy a valószínűségi tér adott (és nem fog minket érdekelni).

Feltételezzük, hogy miután ezt a kísérletet egyszer, azonos feltételek mellett elvégeztük, számokat kaptunk - ennek a valószínűségi változónak az értékeit az első másodpercben stb. kísérletek. Egy valószínűségi változónak van olyan eloszlása, amely részben vagy teljesen ismeretlen számunkra.

Nézzük meg közelebbről a mintának nevezett halmazt.

A már elvégzett kísérletek sorozatában a minta számok halmaza. De ha ezt a kísérletsorozatot újra megismételjük, akkor e halmaz helyett egy új számkészletet kapunk. Szám helyett egy másik szám jelenik meg - egy valószínűségi változó egyik értéke. Vagyis (és stb.) egy olyan változó, amely ugyanazokat az értékeket veheti fel, mint egy valószínűségi változó, és ugyanolyan gyakran (ugyanolyan valószínűségekkel). Ezért a kísérlet előtt - a kísérlettel és után egyenlő eloszlású valószínűségi változó - az a szám, amelyet ebben az első kísérletben megfigyelünk, i.e. a valószínűségi változó egyik lehetséges értéke.

A térfogatminta független és egyenlő eloszlású valószínűségi változók ("kópiák") halmaza, amelyek azonos eloszlásúak.

Mit jelent „mintából következtetést levonni az eloszlásról”? Az eloszlást egy eloszlásfüggvény-sűrűség, a táblázatot pedig a numerikus jellemzők halmaza jellemzi -- stb. A minta alapján mindezekre a jellemzőkre közelítéseket kell tudni építeni.

1.3 Mintavétel

Fontolja meg a mintavétel végrehajtását egy elemi eredményre - egy számkészletre. Egy megfelelő valószínűségi téren bevezetünk egy valószínűségi változót, amely valószínűségi értékeket vesz fel (ha néhány érték egyezik, adja hozzá a valószínűségeket a megfelelő számú alkalommal).

Egy mennyiség eloszlását empirikus vagy mintaeloszlásnak nevezzük. Számítsuk ki egy mennyiség matematikai elvárását és szórását, és vezessük be ezeknek a mennyiségeknek a jelölését:

Ugyanígy számítjuk ki a rendelés pillanatát

Általános esetben a mennyiséggel jelöljük

Ha az általunk bevezetett összes jellemző megalkotásakor a mintát valószínűségi változók halmazának tekintjük, akkor ezek a jellemzők maguk -- -- valószínűségi változókká válnak. Ezeket a mintaeloszlási jellemzőket arra használjuk, hogy megbecsüljük (közelítőleg) a valódi eloszlás megfelelő ismeretlen jellemzőit.

Az oka annak, hogy az eloszlási jellemzőket használjuk a valódi eloszlás (vagy) jellemzőinek becslésére, ezeknek az eloszlásoknak a közelében van.

Vegyük például egy szokásos kocka feldobását. Legyen a dobáskor elejtett pontok száma. Tételezzük fel, hogy a mintában egy egyszer fordul elő kettesben – egyszer, és így tovább. Ekkor a valószínűségi változó 1 6 értéket vesz fel valószínűségekkel. De ezek az arányok a nagy számok törvénye szerint közelednek a növekedéshez. Vagyis a nagyságrendi eloszlás bizonyos értelemben megközelíti a kiesett pontok számának valódi eloszlását, amikor a megfelelő kocka feldob.

1.4 Empirikus eloszlásfüggvény hisztogram

Mivel az ismeretlen eloszlás leírható például az eloszlásfüggvényével, ezért a minta alapján készítünk egy „becslést” erre a függvényre.

Definíció 1. Egy térfogatmintára épített empirikus eloszlásfüggvény egy véletlenfüggvény minden egyenlőséghez

Emlékeztető: Véletlenszerű funkció

eseményjelzőnek nevezzük. Mindegyik esetében ez egy valószínűségi változó, amelynek Bernoulli-eloszlása ​​paraméterrel

Más szavakkal, bármely olyan érték esetén, amely egyenlő annak a valós valószínűségével, hogy egy valószínűségi változó kisebb, azt a kisebb mintaelemek arányával becsüljük meg.

Ha a mintaelemeket növekvő sorrendbe rendezzük (minden elemi eredménynél), akkor egy új valószínűségi változó-készletet kapunk, amelyet variációs sorozatnak nevezünk:

Az elemet a variációs sorozat th tagjának vagy harmadrendű statisztikának nevezzük.

Az empirikus eloszlásfüggvényben ugrások vannak a mintapontokon, az ugrás értéke egy pontban ahol a megfelelő mintaelemek száma.

Lehetőség van empirikus eloszlásfüggvény összeállítására a variációs sorozatokhoz:

Az eloszlás másik jellemzője a táblázat (for diszkrét eloszlások) vagy sűrűség (abszolút folyamatos esetén). Egy táblázat vagy sűrűség empirikus vagy mintaanalógja az úgynevezett hisztogram. A hisztogram csoportosított adatokon alapul. Egy valószínűségi változó becsült értéktartománya (vagy a mintaadatok tartománya) a mintától függetlenül meghatározott számú (nem feltétlenül azonos) intervallumra van felosztva. Legyenek intervallumok a csoportosítási intervallumoknak nevezett vonalon. Jelöljük az intervallumba eső mintaelemek számával:

Mindegyik intervallumra egy téglalapot építünk, amelynek területe arányos. Az összes téglalap összterületének egyenlőnek kell lennie eggyel. Legyen az intervallum hossza. A fenti téglalap magassága a

Az így kapott ábrát hisztogramnak nevezzük.

Osszuk fel a szakaszt 4 egyenlő részre. A szegmens 4 mintaelemet tartalmazott -- 6 in -- 3, a szegmens pedig 2 mintaelemet. Készítünk egy hisztogramot (2. ábra). ábrán. A 3 ugyanannak a mintának a hisztogramja is, de ha a területet 5 egyenlő szegmensre osztjuk.

Az ökonometria kurzus azt állítja, hogy a csoportosítási intervallumok legjobb száma (a "Sturgess-képlet")

Itt -- decimális logaritmus, Ezért

azok. ha a mintát megduplázzuk, a csoportosítási intervallumok száma 1-gyel nő. Vegye figyelembe, hogy minél több csoportosítási intervallum, annál jobb. De ha az intervallumok számát vesszük, mondjuk a sorrendből, akkor növekedéssel a hisztogram nem fogja megközelíteni a sűrűséget.

A következő állítás igaz:

Ha a minta sűrűsége az folyamatos funkció, akkor azért, hogy a hisztogram valószínűségének pontszerű konvergenciája megtörténjen a sűrűséghez.

A logaritmus választása tehát ésszerű, de nem az egyetlen lehetséges.

Az Allbest.ru oldalon található

...

Hasonló dokumentumok

    Relatív gyakorisági tartomány felépítése, empirikus eloszlásfüggvény, kumulánsok és hisztogramok. Ismeretlen numerikus jellemzők pontbecslésének számítása. Az eloszlás típusára vonatkozó hipotézis tesztelése egyszerű és csoportosított eloszlási sorozat esetén.

    szakdolgozat, hozzáadva 2011.09.28

    A matematikai statisztika tárgya, módszerei és fogalmai, kapcsolata a valószínűségelmélettel. A mintavételi módszer alapfogalmai. Az empirikus eloszlásfüggvény jellemzői. A hisztogram fogalma, felépítésének elve. Szelektív elosztás.

    oktatóanyag, hozzáadva: 2009.04.24

    Véletlenszerű események osztályozása. elosztási függvény. Diszkrét valószínűségi változók numerikus jellemzői. A valószínűségek egyenletes eloszlásának törvénye. Diákosztás. A matematikai statisztika problémái. A populációs paraméterek becslései.

    előadás, hozzáadva 2011.12.12

    Az eloszlási paraméterek becslései, a matematikai statisztikában használt legfontosabb eloszlások: normál eloszlás, Pearson, Student, Fisher eloszlások. Tényezőtér, a kísérlet céljának megfogalmazása és a válaszok megválasztása.

    absztrakt, hozzáadva: 2011.01.01

    A minta numerikus jellemzői. Statisztikai sorozatok és eloszlásfüggvények. A statisztikai sokaság fogalma és grafikus ábrázolása. Maximum likelihood módszer az eloszlási sűrűség megállapítására. A legkisebb négyzetek módszerének alkalmazása.

    ellenőrzési munka, hozzáadva 2011.02.20

    A matematikai statisztika problémái. Egy valószínűségi változó megoszlása ​​kísérleti adatok alapján. Empirikus eloszlásfüggvény. Az eloszlási paraméterek statisztikai becslései. Valószínűségi változó normál eloszlása, hipotézisvizsgálat.

    szakdolgozat, hozzáadva 2009.10.13

    Napi számítástechnikai osztálymunka időellenőrzési adatainak statisztikai feldolgozása (órában). Abszolút frekvenciák sokszöge. Az empirikus eloszlásfüggvény és a hisztogram burkológörbéjének ábrázolása. Az általános sokaság elméleti megoszlása.

    teszt, hozzáadva 2015.08.23

    A közlekedési és technológiai gépekre vonatkozó információk eredményeinek feldolgozása matematikai statisztika módszerével. A normális eloszlás integrálfüggvényének meghatározása, a Weibull-törvény függvénye. Az eltolás értékének meghatározása a paramétereloszlás elejére.

    ellenőrzési munka, hozzáadva 2017.03.05

    A matematikai statisztika fogalma, mint a statisztikai adatok rendszerezésének és felhasználásának matematikai módszereinek tudománya tudományos és gyakorlati következtetések levonására. Pontbecslések a statisztikai eloszlások paramétereire. Átlagok számításának elemzése.

    szakdolgozat, hozzáadva 2014.12.13

    Matematikai statisztika alapfogalmai, intervallumbecslések. A momentumok és a maximális valószínűség módszere. Statisztikai hipotézisek tesztelése az eloszlási törvény formájáról a Pearson-kritérium segítségével. Becslések tulajdonságai, folytonos eloszlások.

A matematikai statisztika egy olyan tudomány egyik fő része, mint a matematika, és bizonyos adatok feldolgozásának módszereit és szabályait tanulmányozó ág. Más szóval, a mintavételezés alapján feltárja az azonos tárgyak nagy gyűjteményében rejlő mintákat.

Ennek a fejezetnek az a feladata, hogy a kapott eredmények alapján módszereket építsenek fel a kialakuló események valószínűségének becslésére, illetve bizonyos döntések meghozatalára. Az adatok leírására táblázatok, diagramok és korrelációs mezők szolgálnak. ritkán alkalmazzák.

A matematikai statisztikát a tudomány különböző területein használják. Például a gazdaság számára fontos, hogy a jelenségek és tárgyak homogén halmazairól információkat dolgozzon fel. Lehetnek ipar által gyártott termékek, személyzet, profitadatok stb. A megfigyelések eredményeinek matematikai jellegétől függően kiemelhető a számstatisztika, a nem numerikus jellegű függvények és objektumok elemzése, valamint a többdimenziós elemzés. Emellett általános és speciális (függőségek helyreállításával, osztályozások használatával, szelektív vizsgálatokkal kapcsolatos) feladatokat is mérlegelnek.

Egyes tankönyvek szerzői úgy vélik, hogy a matematikai statisztika elmélete csak egy része a valószínűségelméletnek, míg mások úgy vélik, hogy önálló tudomány, amelynek saját céljai, célkitűzései és módszerei vannak. Használata azonban mindenesetre igen kiterjedt.

Így a matematikai statisztika leginkább a pszichológiában alkalmazható. Használata lehetővé teszi a szakember számára, hogy helyesen alátámassza, megtalálja az adatok közötti kapcsolatot, általánosítsa azokat, elkerülje a sok logikai hibát és még sok mást. Meg kell jegyezni, hogy sokszor egyszerűen lehetetlen megmérni ezt vagy azt a pszichológiai jelenséget vagy személyiségjegyet számítási eljárások nélkül. Ez arra utal, hogy e tudomány alapjaira szükség van. Más szóval a valószínűségszámítás forrásának és alapjának nevezhető.

A statisztikai adatok figyelembevételére épülő kutatási módszert más területeken is alkalmazzák. Mindazonáltal azonnal meg kell jegyezni, hogy jellemzői, ha eltérő eredetű tárgyakra alkalmazzák, mindig egyediek. Ezért nincs értelme a fizikai tudományt egyetlen tudományba egyesíteni. Ennek a módszernek az általános jellemzői egy bizonyos számú objektum megszámlálására korlátozódnak, amelyek egy adott csoportba tartoznak, valamint a mennyiségi jellemzők eloszlásának tanulmányozására és a valószínűségi elmélet alkalmazására bizonyos következtetések levonására.

A matematikai statisztika elemeit olyan területeken használják, mint a fizika, csillagászat stb. Itt figyelembe vehetők a jellemzők és paraméterek értékei, hipotézisek a két minta jellemzőinek egybeeséséről, az eloszlás szimmetriájáról és még sok más.

Megvalósításukban fontos szerepet játszik a matematikai statisztika, melynek célja leggyakrabban a hipotézisek becslésére és tesztelésére alkalmas módszerek kiépítése. Jelenleg nagy jelentősége van ebben a tudományban Számítógépes technológiák. Lehetővé teszik nemcsak a számítási folyamat jelentős egyszerűsítését, hanem a minták létrehozását is replikációhoz vagy a kapott eredmények gyakorlati alkalmasságának vizsgálatához.

A matematikai statisztika módszerei általános esetben két következtetés levonását segítik elő: vagy a kívánt ítélet meghozatalát a vizsgált adatok természetéről, tulajdonságairól és azok kapcsolatairól, vagy annak bizonyítását, hogy a kapott eredmények nem elegendőek a következtetések levonásához.