A statisztikai mutatók egymásra utaltságának vizsgálata. A kapcsolat statisztikai vizsgálata. a kapcsolat szorosságára vonatkozó kvantitatív becslések felállítása, jellemezve a faktorjelek hatásos hatásának erősségét.

8.1. A korreláció- és regresszióanalízis alapfogalmai

A természet, a társadalom, a gazdaság feltárása során figyelembe kell venni a megfigyelt folyamatok és jelenségek kapcsolatát. Ebben az esetben a leírás teljességét így vagy úgy határozzák meg. mennyiségi jellemzők ok-okozati összefüggések közöttük. Ezek közül a legjelentősebbek, illetve egyes tényezők másokra gyakorolt ​​hatásának értékelése a statisztika egyik fő feladata.

Az összefüggések megnyilvánulási formái nagyon változatosak. Mint a két leggyakoribb típus funkcionális kiosztani(teljes) és korreláció(hiányos) kapcsolat. Az első esetben a faktorattribútum értéke szigorúan megfelel a függvény egy vagy több értékének. Elég gyakran a funkcionális kapcsolat a fizikában, kémiában nyilvánul meg. A közgazdaságtanban erre példa a munkatermelékenység és a termelés növekedése közötti egyenes arányosság.

A korreláció (amit hiányosnak vagy statisztikainak is neveznek) tömeges megfigyeléseknél átlagosan akkor jelenik meg, amikor a függő változó adott értékei megfelelnek a független változó bizonyos számú valószínű értékének. Ennek magyarázata a vizsgált tényezők közötti kapcsolatok bonyolultsága, amelyek kölcsönhatását befolyásolják a nem feltárt Véletlen változók. Ezért a jelek közötti kapcsolat csak átlagosan, az esetek tömegében nyilvánul meg. Egy korrelációval az argumentum minden értéke megfelel a függvény véletlenszerűen elosztott értékeinek egy bizonyos intervallumban.

Például az argumentum bizonyos növekedése csak a függvény átlagos növekedését vagy csökkenését vonja maga után (iránytól függően), míg az egyes megfigyelési egységek specifikus értékei eltérnek az átlagtól. Ezek a függőségek mindenütt jelen vannak. Például a mezőgazdaságban ez lehet az összefüggés a hozam és a kijuttatott műtrágya mennyisége között. Nyilvánvalóan az utóbbiak részt vesznek a termés kialakulásában. De minden egyes táblán, parcellán azonos mennyiségű műtrágya eltérő termésnövekedést okoz, mivel még mindig több van a kölcsönhatásban egész sor tényezők (időjárás, talajviszonyok stb.), amelyek a végeredményt alkotják. Átlagosan azonban ilyen összefüggés figyelhető meg - a kijuttatott műtrágyák tömegének növekedése a hozam növekedéséhez vezet.

A kommunikáció irányában vannak egyenes, amikor a függő változó a faktorjellemző növekedésével nő, és fordított, amelynél az utóbbi növekedése a funkció csökkenésével jár. Az ilyen kapcsolatokat pozitívnak és negatívnak is nevezhetjük.

Analitikus kommunikációs formájukat tekintve vannak lineárisÉs nem lineáris. Az első esetben átlagosan lineáris kapcsolatok jelennek meg a jelek között. A nemlineáris összefüggést egy nemlineáris függvény fejezi ki, és a változók átlagosan nem lineárisan kapcsolódnak egymáshoz.

A kapcsolatoknak van még egy igen fontos jellemzője a kölcsönható tényezők szempontjából. Ha két jellemző kapcsolatát jellemezzük, akkor ún gőzszoba. Ha kettőnél több változót vizsgálunk − többszörös.

A fenti osztályozási jellemzők leggyakrabban a Statisztikai analízis. De a fentieken kívül vannak még közvetlen, közvetettÉs hamis kapcsolatokat. Valójában mindegyiknek a lényege nyilvánvaló a névből. Az első esetben a tényezők közvetlenül kölcsönhatásba lépnek egymással. A közvetett kapcsolatot valamilyen harmadik változó részvétele jellemzi, amely a vizsgált tulajdonságok közötti kapcsolatot közvetíti. A hamis összefüggés formálisan megállapított, és általában csak mennyiségi becslésekkel megerősített kapcsolat. Nincs minőségi alapja, vagy értelmetlen.

Erőben különböznek egymástól gyengeÉs erős kapcsolatokat. Ezt a formális jellemzőt meghatározott értékek fejezik ki, és a specifikus mutatók kapcsolatának erősségére vonatkozó általánosan elfogadott kritériumok szerint értelmezik.

A legtöbbben Általános nézet a statisztika feladata a kapcsolatok tanulmányozása területén azok jelenlétének és irányának számszerűsítése, valamint egyes tényezők másokra gyakorolt ​​hatásának erősségének és formájának jellemzése. Ennek megoldására két módszercsoportot használnak, amelyek közül az egyik a korrelációelemzés módszereit, a másik pedig a regressziós elemzést tartalmazza. Ugyanakkor számos kutató ezeket a módszereket korrelációs-regressziós elemzéssé kombinálja, aminek van néhány alapja: számos közös számítási eljárás jelenléte, komplementaritás az eredmények értelmezésében stb.

Ebben az összefüggésben tehát tág értelemben vett korrelációelemzésről beszélhetünk - amikor a kapcsolatot átfogóan jellemezzük. Ugyanakkor megkülönböztetik a korrelációs elemzést szűk értelemben- amikor a kapcsolat erősségét vizsgálják - és regressziós elemzést, melynek során értékelik annak formáját és egyes tényezők hatását másokra.

Megfelelő feladatok korrelációs elemzés a változó tulajdonságok közötti kapcsolat szorosságának mérésére, az ismeretlen ok-okozati összefüggések azonosítására és azon tényezők felmérésére redukálódnak, amelyek a legnagyobb hatással vannak az eredményül kapott tulajdonságra.

Feladatok regresszió analízis a függőség formájának megállapítása, a regressziós függvény meghatározása, egy egyenlet felhasználásával a függő változó ismeretlen értékeinek becslésére.

E problémák megoldása megfelelő technikákon, algoritmusokon, indikátorokon alapul, amelyek használata okot ad az összefüggések statisztikai vizsgálatáról beszélni.

Meg kell jegyezni, hogy a hagyományos korrelációs és regressziós módszerek széles körben képviseltetik magukat a különféle számítógépes statisztikai szoftvercsomagokban. A kutatónak nem marad más hátra, mint az információk megfelelő előkészítése, az elemzés követelményeinek megfelelő szoftvercsomag kiválasztása és a kapott eredmények értelmezésére. A kommunikációs paraméterek kiszámítására számos algoritmus létezik, és jelenleg aligha célszerű egy ilyen összetett típusú elemzést manuálisan elvégezni. A számítási eljárások önálló érdeklődésre tartanak számot, de az eredmények értelmezése egyes módszerei összefüggéseinek, lehetőségeinek és korlátainak vizsgálata elveinek ismerete a kutatás előfeltétele.

A kapcsolat szorosságának értékelésére szolgáló módszereket korrelációs (paraméteres) és nem paraméteresre osztják. A paraméteres módszerek általában a normál eloszlási becslések használatán alapulnak, és olyan esetekben használatosak, amikor a vizsgált sokaság olyan mennyiségekből áll, amelyek megfelelnek a normális eloszlási törvénynek. A gyakorlatban ezt az álláspontot leggyakrabban a priori veszik fel. Valójában ezek a módszerek parametrikusak, és általában korrelációs módszereknek nevezik.

A nem paraméteres módszerek nem szabnak korlátozást a vizsgált mennyiségek eloszlásának törvényére. Előnyük a számítások egyszerűsége is.

8.2. Párkorreláció és páros lineáris regresszió

A két jellemző közötti kapcsolat azonosításának legegyszerűbb módszere az építés korrelációs táblázat:

\Y
\
X\
I 1 Y2 ... Yz Teljes Y i
x1 f 11 12 ... f 1z
x1 f 21 22 ... f2z
... ... ... ... ... ... ...
X r f k1 k2 ... fkz
Teljes ... n
... -

A csoportosítás két összefüggésben vizsgált tulajdonságon - X és Y -n alapul. Az f ij gyakoriságok X és Y megfelelő kombinációinak számát mutatják. Ha f ij véletlenszerűen vannak elrendezve a táblázatban, akkor beszélhetünk arról, hogy nincs kapcsolat a változókat. Bármilyen f ij karakterisztikus kombináció kialakulása esetén megengedhető az összefüggés állítása X és Y között. Ebben az esetben, ha f ij a két átló valamelyike ​​közelében összpontosul, közvetlen vagy fordított lineáris kapcsolat áll fenn.

A korrelációs táblázat vizuális ábrázolása az korrelációs mező. Ez egy grafikon, ahol az X értékeket az abszcissza tengelyen, az Y értékeket az ordináta tengelyen, az X és Y kombinációt pedig pontok jelzik. A pontok elhelyezkedése szerint ezek koncentrációja egy bizonyos irányban meg lehet ítélni a kapcsolat meglétét.

A sorokra és oszlopokra vonatkozó korrelációs táblázat eredményeiben két eloszlást adunk meg - az egyik X-re, a másik Y-re. Számítsuk ki minden X i-re Y átlagos értékét, azaz! , Hogyan

A pontsorozat (X i , ) olyan grafikont ad, amely szemlélteti az Y effektív jellemző átlagértékének függését az X tényezőtől, - empirikus regressziós egyenes, megmutatja, hogyan változik Y X változásával.

Lényegében mind a korrelációs táblázat, mind a korrelációs mező, mind az empirikus regressziós egyenes korábban jellemzi a kapcsolatot, amikor a faktor és az eredő jellemzőket kiválasztjuk, és feltételezéseket kell megfogalmazni a kapcsolat formájáról és irányáról. A kapcsolat szorosságának kvantitatív értékelése ugyanakkor további számításokat igényel.

A gyakorlatban a kapcsolat szorosságának számszerűsítésére a lineáris korrelációs együttható. Néha egyszerűen korrelációs együtthatónak nevezik. Ha az X és Y változók értékei adottak, akkor a képlet alapján számítjuk ki

Használhat más képleteket is, de az eredménynek minden számítási lehetőségnél azonosnak kell lennie.

A korrelációs együttható -1 és + 1 tartományban vesz fel értékeket. Általánosan elfogadott, hogy ha |r| < 0,30, то связь слабая; при |r| = (0,3÷0,7) – átlagos; nál nél |r| > 0,70 - erős vagy közel. Amikor |r| = 1 – funkcionális kapcsolat. Ha r 0 közeli értéket vesz fel, akkor ez alapot ad arra, hogy Y és X között nincs lineáris kapcsolat. Ebben az esetben azonban nemlineáris kölcsönhatás lehetséges. amely további hitelesítést és az alábbiakban tárgyalt egyéb mérőket igényel.

Az X változásainak Y változására gyakorolt ​​hatásának jellemzésére regressziós elemzési módszereket alkalmazunk. Gőzfürdő esetén lineáris függőség regressziós modellt építenek

ahol n megfigyelések száma;
a 0 , a 1 – az egyenlet ismeretlen paraméterei;
e i az Y valószínűségi változó hibája.

A regressziós egyenlet a következőképpen van felírva

ahol Y iteor az effektív jellemző számított kiegyenlített értéke az X egyenletbe való behelyettesítés után.

Az a 0 és a 1 paraméterek becslése eljárásokkal történik, amelyek közül a legszélesebb körben használt legkisebb négyzetes módszer. Lényege abban rejlik, hogy ag-ra és a-ra a legjobb becslést akkor kapjuk, amikor

azok. a függő változó tapasztalati értékeinek a regressziós egyenlettel számított eltérések négyzetes összege minimális legyen. A négyzetes eltérések összege az a 0 és a 1 paraméterek függvénye. Minimalizálása az egyenletrendszer megoldásával történik

Használhat más képleteket is, amelyek a legkisebb négyzetek módszeréből következnek, például:

A lineáris regressziós berendezés meglehetősen jól fejlett, és általában szabványos programokban áll rendelkezésre a számítógép kapcsolatának értékelésére. A paraméterek jelentése fontos: 1 pedig egy regressziós együttható, amely az X változásának Y-ra gyakorolt ​​hatását jellemzi. Megmutatja, hogy átlagosan hány egység változik Y, ha X egy egységgel változik. Ha a nagyobb, mint 0, akkor pozitív összefüggés figyelhető meg. Ha a értéke negatív, akkor X eggyel történő növekedése Y átlagosan 1-gyel csökken. Az a 1 paraméternek az Y és X arány dimenziója van.

Az a 0 paraméter egy állandó érték a regressziós egyenletben. Véleményünk szerint nincs közgazdasági jelentése, de bizonyos esetekben W kezdőértékeként értelmezik.

Például az X berendezés költségére és az Y munkatermelékenységre vonatkozó adatok szerint a legkisebb négyzetek módszere kapta az egyenletet

Y \u003d -12,14 + 2,08X.

Az a együttható azt jelenti, hogy a berendezés költsége 1 millió rubelrel nő. a munkatermelékenység átlagosan 2,08 ezer rubel növekedéséhez vezet.

Az Y \u003d a 0 + a 1 X függvény értékét számított értéknek nevezzük, és a grafikonon jelenik meg elméleti regressziós egyenes.

Az elméleti regresszió jelentése az, hogy az Y változó átlagos értékének becslése egy adott X értékre.

A párkorreláció vagy a párregresszió egy speciális esetnek tekinthető, amely egyrészt valamely függő változó, másrészt a sok független változó egyikének kapcsolatát tükrözi. Amikor a független változók teljes meghatározott halmazának kapcsolatát kell jellemezni az eredő attribútummal, akkor arról beszélünk, hogy többszörös korreláció vagy többszörös regresszió.

8.3. Kapcsolati paraméterek jelentőségének felmérése

A korrelációs és regressziós becslések megszerzése után ellenőrizni kell, hogy azok megfelelnek-e a kapcsolat valódi paramétereinek.

A létező számítógépes programok rendszerint számos leggyakoribb kritériumot tartalmaznak. A párkorrelációs együttható szignifikanciájának értékeléséhez a korrelációs együttható standard hibáját számítjuk ki:

Első közelítésként szükséges, hogy . Az r xy jelentőségét úgy ellenőrizzük, hogy összehasonlítjuk -val, és megkapjuk

ahol t calc a t-kritérium úgynevezett számított értéke.

Ha t calc nagyobb, mint a Student-féle t-próba (t tabl) elméleti (t tabl) értéke egy adott valószínűségi szintre és (n-2) szabadsági fokra, akkor vitatható, hogy r xy szignifikáns.

Hasonlóképpen a megfelelő képletek alapján kiszámítjuk a regressziós egyenlet paramétereinek standard hibáit, majd az egyes paraméterekre a t-próbákat. Fontos még egyszer ellenőrizni, hogy a feltétel t calc > t tab. Ellenkező esetben nincs ok megbízni a kapott paraméterbecslésben.

A kapcsolat típusának helyes megválasztására és a teljes regressziós egyenlet szignifikancia jellemzőire vonatkozó következtetést az F-kritérium segítségével kapjuk, kiszámítva annak számított értékét:

ahol n a megfigyelések száma;
m a regressziós egyenlet paramétereinek száma.

V 1 = (m-1) és v 2 = (n-m) szabadsági fokon az F calc nagyobbnak kell lennie, mint az F elmélet. Ellenkező esetben az egyenlet alakját, a változók listáját stb. felül kell vizsgálni.

8.4. Nem paraméteres módszerek a kapcsolatok becslésére

A korreláció- és varianciaanalízis módszerei nem univerzálisak: akkor alkalmazhatók, ha az összes vizsgált jellemző mennyiségi. Ezen módszerek alkalmazásakor nem nélkülözhetjük a fő eloszlási paraméterek (átlagok, varianciák) kiszámítását, ezért ezeket ún. parametrikus módszerek.

Mindeközben a statisztikai gyakorlatban meg kell küzdeni a minőségi jellemzők közötti kapcsolat mérésének problémáival, amelyekre a parametrikus elemzési módszerek a szokásos formájukban nem alkalmazhatók. A statisztika olyan módszereket dolgozott ki, amelyek segítségével az attribútum mennyiségi értékei, és ezáltal az eloszlási paraméterek használata nélkül mérhető a jelenségek közötti kapcsolat. Az ilyen módszereket ún nem paraméteres.

Ha két minőségi jellemző kapcsolatát vizsgáljuk, akkor a populációs egységek kombinációs eloszlását ún. keresztkötésű táblázatok.

Tekintsük a keresztkontingencia táblák elemzési módszerét konkrét példa a társadalmi mobilitás mint a lakosság egyes társadalmi és szakmai csoportjai elszigeteltségének leküzdésének folyamata. Az alábbiakban közöljük a középiskolát végzettek foglalkoztatási körök szerinti megoszlását, szüleik hasonló társadalmi csoportjainak megoszlásával.

A keresztcsatolási táblázat soraiban és oszlopaiban található gyakorisági eloszlás lehetővé teszi a társadalmi mobilitás főbb mintáinak azonosítását: az 1. csoportba („Ipar és építőipar”) tartozó szülők gyermekeinek 42,9%-a dolgozik a szociális területen. szellemi munka (91-ből 39); a gyerekek 38,9%-a. akinek a szülei mezőgazdaságban, iparban dolgoznak (88-ból 34) stb.

Egyértelmű öröklődés is észrevehető a szakma átadásában. Így a mezőgazdaságba kerültek közül 29 fő, 64,4%-a mezőgazdasági dolgozók gyermeke; a szellemi munka területén több mint 50%-nak vannak szülei társadalmi csoport stb.

Fontos azonban, hogy olyan általánosító mutatót kapjunk, amely a jellemzők közötti kapcsolat szorosságát jellemzi, és lehetővé teszi a kapcsolat megnyilvánulásának összehasonlítását a különböző populációkban. Erre a célra pl. konjugálási együtthatók Pearson (C) és Chuprov (C):

ahol f 2 a kontingencia indexe, amelyet úgy határoznak meg, hogy a korrelációs táblázat egyes celláinak gyakorisági négyzeteinek az összegéből kivonnak egyet a megfelelő oszlop és sor gyakoriságainak szorzatából:

K 1 és K 2 - az egyes jelek csoportjainak száma. A kölcsönös esetlegesség együtthatójának értéke, amely a minőségi jellemzők közötti kapcsolat szorosságát tükrözi, az ezen mutatók esetében szokásos tartományon belül ingadozik 0 és 1 között.

A társadalmi-gazdasági vizsgálatokban gyakran adódnak olyan helyzetek, amikor egy jellemzőt nem mennyiségileg fejeznek ki, de a sokaság egységei rendezhetők. A sokaság egységeinek ilyen sorrendjét az attribútum értéke szerint nevezzük rangsor. Ilyen lehet például a tanulók (tanulók) képességek szerinti rangsorolása, bármilyen embercsoport iskolai végzettség, szakma, kreatív készség, stb.

A rangsorolás során a sokaság minden egysége hozzá van rendelve rang, azok. sorozatszám. Ha az attribútum értéke azonos a különböző egységeknél, akkor ezekhez egy kombinált átlagos sorozatszámot rendelnek. Például, ha a sokaság 5. és 6. egysége azonos tulajdonságokkal rendelkezik, akkor mindkettő (5 + 6) / 2 = 5,5 rangot kap.

A rangsorolt ​​jellemzők közötti kapcsolatot a segítségével mérjük rangkorrelációs együtthatók Spearman (r) és Kendall (t). Ezek a módszerek nemcsak minőségi, hanem mennyiségi mutatókra is alkalmazhatók, különösen kis populáció esetén, mivel a rangkorreláció nem paraméteres módszerei nem kapcsolódnak a tulajdonság eloszlásának természetére vonatkozó korlátozásokhoz.

Előző

MÓDSZERTANI UTASÍTÁSOK A JELLEMZŐ FELADATOK MEGOLDÁSÁHOZ

A jelenségfejlődés jellemzőinek azonosításához, a trendek észleléséhez, a függőségek megállapításához szükséges a statisztikai adatok csoportosítása. Ebből a célból kiválasztunk egy csoportosítási attribútumot, és kidolgozunk egy összefoglaló indikátorrendszert, amely jellemzi a kiválasztott csoportokat, amelyekhez táblázatelrendezést állítunk össze.

A táblázat elrendezése olyan táblázat, amely sorokból és oszlopokból áll, amelyek nincsenek kitöltve számokkal. Minden statisztikai táblázatnak (vagy elrendezésnek) van tárgya és állítmánya. A tárgy a vizsgálat tárgya. A predikátum egy olyan mutatórendszer, amely a vizsgálat tárgyát jellemzi. Az alany a bal oldalon található vízszintes vonalak neve formájában, az állítmány pedig a jobb oldalon, függőleges oszlopok neve formájában.

A tantárgy felépítésétől függően a következő táblázattípusokat különböztetjük meg: egyszerű, csoportos, kombinációs.

A csoporttáblázatok azok, amelyek tárgya a populációs egységek egy attribútum szerinti csoportosítását tartalmazza.

A társadalmi termelésben minden folyamat szorosan összefügg egymással. A jellemzők között funkcionális és korrelációs kapcsolatok vannak. A funkcionális kapcsolatok olyan kapcsolatok, amelyekben a vizsgált tulajdonság értékét egy vagy több tényező határozza meg. Sőt, a faktoriális jellemzők változásával az eredményül kapott jellemző mindig ugyanannyival változik. A társadalmi termelésben azonban ez a fajta függőség ritka.

A gazdasági jelenségek jeleinek kölcsönhatásai általában korrelációs jellegűek. A korrelációs kapcsolatokkal a vizsgált tulajdonság egyik értéke egy másik vagy más tulajdonságok sok értékének felelhet meg, és egy tulajdonság megváltozásával más tulajdonságok különböző irányokba változnak.

Vannak összefüggések: egyszerű és többszörös (a kapcsolat jeleinek száma szerint); pozitív és negatív (irány szerint); egyenes és görbe vonalú (az analitikai kifejezés szerint).

A párkorreláció két jellemző közötti kapcsolatokat jeleníti meg. Többszörös korreláció esetén egy gazdasági jelenséget sok tényező hatásának kombinációjának tekintünk.

A pozitív korreláció egyenes arányban tükrözi az előjelek változását. Azokat a kapcsolatokat, amikor az egyik attribútum növekedése (csökkenése) egy másik attribútum csökkenésével (növekedésével) jár együtt, negatívnak nevezzük.

Az egyenes vonalú összefüggés, amelyet az egyenlettel lehet kifejezni lineáris függvény. A görbe vonal egyenletével kifejezett görbe vonalú kapcsolatra jellemző, hogy az egyik előjel növekedésével a második először nő, majd csökken, miután elérte. bizonyos szint fejlesztés.


A korrelációelemzés során a következő együtthatók használatosak: lineáris korreláció (r), korrelációs arány (h), asszociáció (r a), kölcsönös kontingencia (r c), rangkorreláció (r p), többszörös korreláció (r xyz), korreláció index (I r), regresszió (R).

A lineáris korrelációs együttható egy olyan mutató, amely a lineáris kapcsolatokkal rendelkező (vagy közeli) jelek közötti kapcsolat szorosságának irányát és mértékét tükrözi.

Kis minták esetén a lineáris korrelációs együtthatót a következő képlettel számítjuk ki:

x, y - a vizsgált jellemzők értékei;

Az egyes jellemzők átlagos értékei;

A jellemzők szorzatának átlagos értéke xÉs y;

n a sor száma.

A legkényelmesebb képlet a korrelációs együttható kiszámításához a következő:

A korrelációs együttható -1 és +1 között változik. Minél közelebb van a korrelációs együttható egyhez, annál szorosabb a kapcsolat a jellemzők között.

A kapcsolat szignifikanciája a Chaddock táblák segítségével durván felmérhető, de gyakran van szükség a szignifikancia pontosabb értékelésére akár a t-próba (kis minták esetén), akár a Fisher-féle F-próba alapján. A korrelációs együttható szignifikanciájának valószínűségi értékelését kis mintával célszerű a t érték kiszámítása alapján elvégezni - Student-féle kritérium

ahol r a korrelációs együttható;

n az egyező megfigyeléspárok száma.

A kapott t - Student-kritérium számított értékét az 5%-os és 1%-os szignifikanciaszinttől és n-1 számú szabadsági foktól függően összehasonlítjuk annak elméleti értékével (B. melléklet).

Ha t számolt > t fülre. , akkor a faktor és az eredmény közötti kapcsolat szignifikáns és fordítva, ha t kalc.< t табл. , то связь несущественная и данный фактор исключается из дальнейшего исследования.

Ha a minta mérete 30-nál nagyobb, akkor a minta korrelációs együtthatójának véletlenszerű hibáját először a következő képlet határozza meg:

ahol 2 - teljes variancia;

S 2 az empirikus adatok és a regressziós egyenes közötti különbségek varianciája (maradék variancia).

ahol y az effektív jellemző tapasztalati értékei;

A hatásos jellemző becsült értékei.

A t - Student-kritérium számított értékeit meghatározzuk:

A korrelációs együttható csak akkor becsüli meg pontosan a kapcsolat szorosságának mértékét, ha a jellemzők között lineáris kapcsolat van. Ha van görbe függőség, akkor empirikus korrelációs arányt vagy korrelációs indexet használunk a jellemzők közötti kapcsolat szorosságának mértékére. A korrelációs arányt a következő képlet határozza meg:

a korrelációs index kiszámítása:

s 2 tény. - a hatásos jellemző változása tényezők hatására;

s 2 összesen - a hatásos jellemző változása minden tényező hatására;

s 2 pihenő. - A hatásos jellemző változása más tényezők hatására.

A számított korrelációs arány szignifikanciáját a Fisher-féle F-próba alapján határozzuk meg:

m a paraméterek száma a regressziós egyenletben.

Az F-kritérium számított értékét összehasonlítjuk az F-eloszlási táblázatok szerinti elméleti értékkel a V 1 =k-1 számláló és a V 2 =n-k nevező szabadságfokainak számával a kiválasztott szignifikanciaszinten ( a=0,05 vagy a=0,01) (E függelék).

Ha F kalc. > F fülre. , akkor az előjelek közötti kapcsolat szignifikáns (esszenciális), ha F kalc.< F табл то связь не существенна и фактор следует исключить их дальнейшего исследования.

A jelenség tanulmányozása során nemcsak a kapcsolat szorosságának megállapítása fontos, hanem a jelek közötti kapcsolatot jellemző mutatók kiszámítása is. Ez bizonyos regressziós egyenletek megoldásával történik. Az egyenes vonalú regresszió analitikus kifejezésére az egyenes képletet használjuk:

ahol az effektív jellemző igazított értéke;

a, b - az állandó mutatók átlagos értékeit képviselő paraméterek;

Egyenlet opciók aÉs b a legkisebb négyzetek módszere alapján határozzák meg, amelyre normális egyenletrendszert oldanak meg.

A számításokat táblázatos formában végezzük, amelyben az å x, å y, å x 2, å xy értékeket számítjuk ki.

A paraméterek megtalálása után AÉs b felírjuk a parametrizált egyenes egyenletet.

De a lineáris forma nem mindig tükrözi a jelenség lényegét, bár előnyösebb, mert könnyen értelmezhető. Ezért a kommunikációs forma kiválasztásakor feltétlenül figyelembe kell venni a görbe vonalú függőségeket is:

parabolikus

hiperbolikus

vegyes

demonstráció

féllogaritmikus

és mások.

Az egyenlet paramétereit a legkisebb négyzetek módszere alapján is megtaláljuk. Tehát egy parabolára a következő egyenletrendszer van megoldva:

A kutató köteles mérlegelni a lehetséges matematikai modelleket, majd a talált parametrizált egyenletek közül kiválasztani egy közelítő egyenletet (az empirikus kétdimenziós eloszlássorozatot a legpontosabban megjelenítőt). Ez a közelítési hiba alapján történik:

A közelítő az egyik paraméterezett egyenlet lesz, amelynél a hiba minimális, de gyakorlati célokra olyan egyenletet használnak, amelyre e a £5%.

Ezután ellenőrizni kell az egyenlet közelítésének paramétereit a szignifikancia szempontjából.

Lehetőségek AÉs b statisztikai szempontok szerint kell értékelni (t - Student teszt, F - Fisher teszt). Speciális figyelem paramétert kell megadni b regressziós együtthatónak nevezzük. Ez annak a ténynek köszönhető, hogy ez a mutató, mint egy tényezőnek tekintett függő attribútum változásának mértéke, megkapja az extrapolációs művelet alapértékeit.

Paraméter lényegességi értékelés b a regressziós együttható hibája alapján kell elkészíteni:

ahol S2 - maradék diszperzió;

x - sorozatopciók (tényezőjel);

A sorozat átlagos értéke;

A t-kritérium számított értékét a következők határozzák meg:

A t-kritérium számított értékét összehasonlítjuk annak elméleti értékével a Student-táblázatok szerint (B függelék), n-2 szabadsági fokon, 5%-os és 1%-os szignifikancia szinten. Ha t számolt >t fülre. , majd a paraméter b alapvető.

Paraméter A képlet szerint becsüljük meg:

t becsült értéke - a paraméter kritériumai a meghatározott:

A fentiekhez hasonlóan összehasonlítjuk az elméleti értékkel, és következtetést vonunk le a paraméter jelentőségéről. Aés következtetést vonunk le a kapott modell gyakorlati felhasználásáról tervezési, előrejelzési célokra

Ha több tényező hatását kell meghatározni az effektív tulajdonságra, akkor többszörös regressziós modellt építünk:

Háromdimenziós eloszlás esetén a regressziós egyenlet a következő lesz:

az egyenlet paraméterei a szimplex módszer alapján kereshetők, ill.

Megjegyzés: Legtöbbnek statisztikai tanulmányok fontos a folyamatban lévő jelenségek és folyamatok közötti meglévő kapcsolatok azonosítása. A társadalom gazdasági életének szinte minden megfigyelt jelensége, függetlenül attól, hogy első pillantásra mennyire függetlennek tűnik, általában bizonyos tényezők hatásának eredménye. Például egy vállalkozás nyereségéhez számos mutató kapcsolódik: az alkalmazottak száma, végzettsége, a termelési eszközök költsége stb.

12.1. A funkcionális és a korreláció fogalma

A társadalmi és gazdasági jelenségek között két fő kapcsolat létezik - funkcionális és statisztikai (más néven sztochasztikus, valószínűségi vagy korrelációs). Mielőtt részletesebben megvizsgálnánk őket, bemutatjuk a független és függő jellemzők fogalmát.

Független vagy faktoriális jelek, amelyek változást okoznak más kapcsolódó jelekben. Azokat a jeleket, amelyek változását bizonyos tényezők hatására nyomon kell követni, függőnek vagy hatásosnak nevezzük.

Funkcionális kapcsolat esetén a független változók változása a függő változó pontosan meghatározott értékeinek megszerzéséhez vezet.

Leggyakrabban a funkcionális kapcsolatok abban nyilvánulnak meg természettudományok, például a mechanikában a funkcionális egy tárgy által megtett távolság függése a mozgás sebességétől stb.

Statisztikai kapcsolattal az X független változó minden értéke az Y függő változó értékkészletének felel meg, és nem ismert előre, hogy melyik. Például tudjuk, hogy egy kereskedelmi bank nyeresége bizonyos módon összefügg a jegyzett tőkéjének nagyságával (ez a tény nem kétséges). Ennek ellenére lehetetlen kiszámítani a nyereség pontos összegét az utolsó mutató adott értékéhez, mivel ez sok más tényezőtől is függ, az alaptőke nagyságán kívül, amelyek között véletlenszerűek is vannak. Esetünkben nagy valószínűséggel csak a nyereség átlagos értékét határozzuk meg, amely a hasonló összegű jegyzett tőkével rendelkező bankok összességében fog befolyni. Így egy statisztikai kapcsolat a funkcionálistól a függő változóra ható számos tényező jelenléte által különbözik.

Megjegyzendő, hogy a statisztikai kapcsolat csak "általánosan és átlagosan" nyilvánul meg nagy számok a jelenség megfigyelése. Tehát intuitív módon feltételezhetjük, hogy kapcsolat van a vállalkozás befektetett eszközeinek mennyisége és a kapott nyereség között, vagyis az első növekedésével a nyereség összege nő. De lehet ezt kifogásolni, és példát mondani egy olyan vállalkozásra, amely elegendő mennyiségű modern gyártóberendezéssel rendelkezik, de ennek ellenére veszteségeket szenved. Ebben az esetben van jó példa statisztikai összefüggés, amely csak a több tíz és száz egységet tartalmazó nagy populációkban nyilvánul meg, ellentétben a funkcionálissal, amely minden megfigyelésnél megerősített.

A korreláció a jellemzők közötti statisztikai kapcsolat, amelyben az X független változó értékeinek változása szabályos változáshoz vezet. matematikai elvárás Y valószínűségi változó.

12.1. példa. Tegyük fel, hogy a vállalkozásokra vonatkozóan rendelkezésre állnak adatok az előző évi eredménytartalék összegéről, a beruházások volumenéről. főtőke valamint az értékpapírok vásárlására elkülönített összegekről (ezer den. egység):

12.1. táblázat.
Céges szám Előző évi eredménytartalék Értékpapírok beszerzése Befektetett eszközökbe történő befektetések
1 3 010 190 100
2 3 100 182 250
3 3 452 185 280
4 3 740 170 270
5 3 980 172 330
6 4 200 160 420
7 4 500 145 606
8 5 020 120 690
9 5 112 90 800
10 5 300 30 950

A táblázat azt mutatja, hogy közvetlen összefüggés van a vállalkozás felhalmozott eredménye és a befektetései között főtőke: a felhalmozott eredmény növekedésével a beruházások volumene is nő. Most figyeljünk a felhalmozott eredmény mutatója és a vásárolt értékpapírok mennyisége közötti összefüggésre. Itt teljesen más jellegű: az első mutató növekedése ellenkező hatáshoz vezet - a vásárolt értékpapírok értéke ritka kivételekkel (ami már egyértelműen kizárja a funkcionális kapcsolat jelenlétét) csökken. Az ilyen vizuális adatelemzést, amelyben a megfigyeléseket a független x érték növekvő vagy csökkenő sorrendjében rangsorolják, majd az y függő változó értékeinek változását elemzik, párhuzamos adatredukciós módszernek nevezzük.

A vizsgált példában az első esetben a kapcsolat közvetlen stb. az egyik mutató növekedése (csökkenése) egy másik növekedését (csökkenését) vonja maga után (a mutatók változásai megfelelnek), a másodikban pedig az ellenkezője stb. az egyik mutató csökkenése egy másik növekedését okozza, vagy az egyik növekedése egy másik mutató csökkenésének felel meg.

Közvetlen és inverz függőségek jellemzik a tulajdonságok közötti kapcsolat irányát, amely a korrelációs mező segítségével grafikusan is szemléltethető. Amikor be van építve téglalap alakú rendszer az abszcissza tengely koordinátái az x független változó értékei, az ordináta tengelyen pedig a függő y. A koordináták metszéspontját a megfigyeléseket szimbolizáló pontok jelzik. A korrelációs mező pontjainak szóródásának alakja a kapcsolat alakjának és szorosságának megítélésére szolgál. A 12.1. ábra a megfelelő korrelációs mezőket mutatja különféle formák kapcsolatokat.


Rizs. 12.1.

a - közvetlen (pozitív) kapcsolat;

b - visszacsatolásos (negatív) kapcsolat;

c - kommunikáció hiánya

A statisztikatudománynak a társadalmi-gazdasági jelenségek és folyamatok közötti ok-okozati összefüggések vizsgálatával foglalkozó része, amelynek mennyiségi kifejeződése van, a korrelációs-regressziós elemzés. Lényegében az elemzésnek két külön területe van: a korreláció és a regresszió. Tekintettel azonban arra, hogy a gyakorlatban leggyakrabban komplex módon alkalmazzák őket (a korrelációs elemzés eredményei alapján regressziós elemzést végeznek), egy típusba egyesítik őket.

A korrelációs-regressziós elemzés elvégzése a következő feladatok megoldását jelenti:

A felsorolt ​​feladatok közül az első kettő közvetlenül a korrelációelemzés problémáihoz, a következő három a regresszióanalízishez köthető, és csak a mennyiségi mutatók vonatkozásában.

12.1.1. A korreláció- és regresszióanalízis módszereivel vizsgált statisztikai információkkal szemben támasztott követelmények

A korrelációs és regressziós elemzési módszerek nem alkalmazhatók minden statisztikai adatra. Felsoroljuk az elemzett információkkal szemben támasztott fő követelményeket:

  1. a vizsgálathoz használt megfigyeléseket véletlenszerűen kell kiválasztani az objektumok általános sokaságából. Ellenkező esetben a kiindulási adatok, amelyek egy bizonyos minta a teljes sokaságból, nem tükrözik majd a természetüket, az azokból levont következtetések a fejlődési mintákról értelmetlennek és gyakorlati értéktelennek bizonyulnak;
  2. az a követelmény, hogy a megfigyelések függetlenek legyenek egymástól. A megfigyelések egymástól való függését autokorrelációnak nevezzük, ennek kiküszöbölésére a korrelációs-regressziós elemzés elméletében speciális módszereket hoztak létre;
  3. a kiindulási adathalmaznak homogénnek kell lennie, rendellenes megfigyelések nélkül. Valójában egyetlen, kiugró megfigyelés katasztrofális következményekkel járhat a regressziós modellre nézve, paraméterei elfogultak, a következtetések abszurdnak bizonyulnak;
  4. kívánatos, hogy az elemzéshez szükséges kiindulási adatok megfeleljenek a normál eloszlási törvénynek. normális törvény Az eloszlás a korrelációs együtthatók szignifikanciájának ellenőrzésére szolgál, és intervallumhatárokat állítunk fel rájuk, így bizonyos kritériumok használhatók. Ha nem szükséges ellenőrizni a szignifikancia és az intervallumbecsléseket, akkor a változóknak bármilyen eloszlási törvénye lehet. A regresszióanalízisben a regressziós egyenlet felépítésénél a kiindulási adatok normális eloszlásának követelménye csak az eredményül kapott Y változóra vonatkozik, a független tényezők nem véletlenszerű változóknak számítanak, és valójában bármilyen eloszlási törvényük lehet. A korrelációs elemzéshez hasonlóan a normális eloszlás követelménye szükséges a regressziós egyenlet szignifikanciájának, együtthatóinak ellenőrzéséhez és a konfidenciaintervallumok megtalálásához;
  5. azon megfigyelések számának, amelyekkel a jellemzők kapcsolatát megállapítják és egy regressziós modellt építenek fel, legalább 3-4-szeresével (lehetőleg 8-10-szeresével) meg kell haladnia a faktorjellemzők számát. Amint azt fentebb is jeleztük, a statisztikai összefüggés csak jelentős számú megfigyelés esetén jelenik meg a törvény működése alapján nagy számok, és minél gyengébb a kapcsolat, annál több megfigyelésre van szükség a kapcsolat létrehozásához, annál erősebb - annál kevésbé;
  6. Az X faktorjelek funkcionálisan nem függhetnek egymástól. A független (faktoriális, magyarázó) jellemzők egymás közötti jelentős kapcsolata multikolleniaritást jelez. Jelenléte instabil regressziós modellek, "hamis" regressziók felépítéséhez vezet.

12.1.2. Lineáris és nemlineáris kapcsolatok

A lineáris összefüggést egyenes, a nem lineáris összefüggést egy görbe vonal fejezi ki. A lineáris összefüggést az egyenes egyenlete fejezi ki: y = a 0 + a i *x. Az egyenes a legvonzóbb az egyenlet paramétereinek kiszámításának egyszerűsége szempontjából. Mindig igénybe veszik, beleértve a nemlineáris kapcsolatokat is, ha nem fenyeget jelentős veszteség a becslések pontosságában. Egyes függőségek esetében azonban a lineáris formában való ábrázolás ahhoz vezet, hogy nagy hibákat(közelítési hibák), és ennek következtében téves következtetésekre. Ezekben az esetekben nemlineáris regressziós függvényeket használnak, amelyek általános esetben tetszőleges alakúak lehetnek, különösen mivel a modern szoftver lehetővé teszi azok gyors felépítését. Leggyakrabban a következő nemlineáris egyenleteket használják a nemlineáris összefüggés kifejezésére: hatvány, parabola, hiperbolikus, logaritmikus.

Ezen modellek paramétereit, akárcsak a lineáris függőségek esetében, szintén a legkisebb négyzetek módszere alapján becsüljük meg (lásd 12.3.1. fejezet).

12.2. Korrelációs-regressziós elemzés

A korrelációelemzés fő feladatai a kiválasztott jellemzők közötti kapcsolat meglétének megállapítása, irányának megállapítása, valamint a kapcsolat szorosságának számszerűsítése. Ehhez a korrelációs analízis során először a páros korrelációs együtthatók mátrixát becsüljük meg, majd ennek alapján határozzuk meg a parciális és többszörös korrelációs együtthatókat, valamint a determinációs együtthatókat. Az együtthatók értékének megtalálása után a szignifikancia ellenőrzésre kerül. A korrelációs elemzés végeredménye az X faktorjelek kiválasztása egy olyan regressziós egyenlet további felépítéséhez, amely lehetővé teszi a kapcsolat kvantitatív leírását.

Tekintsük részletesebben a korrelációelemzés szakaszait.

12.2.1. Páros (lineáris) korrelációs együtthatók

A korrelációs elemzés a páros (lineáris) korrelációs együtthatók kiszámításával kezdődik.

A párkorrelációs együttható két változó közötti lineáris kapcsolat mérőszáma a modellben szereplő többi változó hatásának hátterében.

Attól függően, hogy melyik számítási sorrend kényelmesebb a kutató számára, ezt az együtthatót a következő képletek egyikével számítják ki:

A párkorrelációs együttható -1 és +1 között változik. Az eggyel egyenlő abszolút érték azt jelzi, hogy a kapcsolat funkcionális: -1 - fordított (negatív), +1 - közvetlen (pozitív). Az együttható nulla értéke azt jelzi, hogy a jellemzők között nincs lineáris kapcsolat.

A páros korrelációs együtthatók kapott mennyiségi értékeinek minőségi értékelése a táblázatban bemutatott skála alapján adható meg. 12.2.

Megjegyzés: az együttható pozitív értéke azt jelzi, hogy az előjelek közötti kapcsolat közvetlen, a negatív érték inverz.

12.2.2. Kommunikációs lényegesség értékelése

Az együtthatók értékének megszerzése után ellenőrizni kell azok jelentőségét. Mivel a kezdeti adat, amely szerint a jellemzők kapcsolatát megállapítják, egy bizonyos minta az objektumok bizonyos általános sokaságából, az ezekből az adatokból számított párkorrelációs együtthatók szelektívek lesznek. Így csak megbecsülik a kapcsolatot azon információk alapján, amelyeket a kiválasztott megfigyelési egységek hordoznak. Ha a kiindulási adatok "jól" tükrözik az általános sokaság szerkezetét és mintázatait, akkor az ezekből számolt korrelációs együttható valódi, a valóságban rejlő összefüggést fogja mutatni a teljes vizsgált objektumpopulációban. Ha az adatok nem „másolják” a populáció egészének kapcsolatát, akkor a számított korrelációs együttható hamis képet alkot a kapcsolatról. Ideális esetben ennek megállapításához a teljes sokaság adatai alapján ki kell számítani a korrelációs együtthatót, és össze kell vetni azt a kiválasztott megfigyelésekből számolttal. A gyakorlatban azonban ezt általában nem lehet megtenni, mivel a teljes populáció gyakran ismeretlen vagy túl nagy. Ezért csak hozzávetőlegesen lehet megítélni, hogy az együttható mennyire reálisan reprezentálja a valóságot. A logika alapján könnyen arra a következtetésre juthatunk, hogy nyilvánvalóan a megfigyelések számának növekedésével (-re) nő a számított együttható megbízhatósága.

A páronkénti korrelációs együtthatók jelentőségét kétféleképpen teszteljük: a Fisher-Yates táblázat vagy a Student-féle t-próba segítségével. Tekintsük a Fisher-Yates táblázatot használó ellenőrzési módszert a legegyszerűbbnek.

A teszt elején beállítanak egy szignifikancia szintet (leggyakrabban a görög ábécé "alfa" - ) betűjével jelölik, amely a hibás döntés valószínűségét jelzi. A tévedés lehetősége abból adódik, hogy nem a teljes populációt, hanem annak csak egy részét veszik alapul a kapcsolat meghatározásához. Általában a következő értékeket veszi fel: 0,05; 0,02; 0,01; 0,001. Például, ha = 0,05, akkor ez azt jelenti, hogy átlagosan százból öt esetben döntés a párosított korrelációs együtthatók jelentőségéről (vagy jelentéktelenségéről) téves lesz; at = 0,001 - ezerből egy esetben stb.

A második paraméter a szignifikancia ellenőrzésekor a v szabadsági fokok száma, amelyet ebben az esetben a következőképpen számítunk ki: v = n - 2. A Fisher-Yates táblázat szerint az r cr korrelációs együttható kritikus értéke található. (=0,05, v=n-2). Azokat az együtthatókat tekintjük szignifikánsnak, amelyek modulusa nagyobb, mint a talált kritikus érték.

Példa 12.2. Tegyük fel, hogy az első esetben 12 megfigyelés van, és ezekből számították ki a párkorrelációs együtthatót, amely 0,530-nak bizonyult, a másodikban - 92 megfigyelés, és a számított párkorrelációs együttható 0,36 volt. De ha ellenőrizzük a jelentőségüket, az első esetben az együttható jelentéktelennek, a másodikban pedig szignifikánsnak bizonyul, annak ellenére, hogy sokkal kisebb. Kiderül, hogy az első esetben túl kevés a megfigyelés, ami növeli a követelményeket, és a párkorrelációs együttható kritikus értéke = 0,05 szignifikancia szinten 0,576 (v = 12 - 2), a második esetben pedig ott van. sokkal több megfigyelés van, és elegendő a 0,205-ös kritikus értéket túllépni (v = 92 - 2), hogy a korrelációs együttható ugyanazon a szinten szignifikáns legyen. Így minél kevesebb megfigyelés történik, az együttható kritikus értéke mindig magasabb lesz.

A szignifikanciavizsgálat lényegében eldönti, hogy a számított eredmények véletlenszerűek-e vagy sem.

12.2.3. A többszörös korrelációs együttható meghatározása

A korrelációelemzés következő lépése a többszörös (halmozott) korrelációs együttható számítása.

A többszörös korrelációs együttható jellemzi a lineáris kapcsolat szorosságát egy változó és a korrelációs elemzésben figyelembe vett egyéb változók halmaza között.

Ha az eredményül kapott y jellemző és csak két, x 1 és x 2 tényezőjellemző közötti kapcsolatot vizsgáljuk, akkor a következő képlet segítségével számítható ki a többszörös korrelációs együttható, amelynek összetevői páros korrelációs együtthatók:

ahol r páronkénti korrelációs együtthatók.

A természet, a társadalom, a gazdaság feltárása során figyelembe kell venni a megfigyelt folyamatok és jelenségek kapcsolatát. Ugyanakkor a leírás teljességét valamilyen módon meghatározzák a köztük lévő ok-okozati összefüggések mennyiségi jellemzői. Ezek közül a legjelentősebbek, illetve egyes tényezők másokra gyakorolt ​​hatásának értékelése a statisztika egyik fő feladata.

Az összefüggések megnyilvánulási formái nagyon változatosak. A két leggyakoribb típus a funkcionális (teljes) és korreláció(hiányos) kapcsolat. Az első esetben a faktorattribútum értéke szigorúan megfelel a függvény egy vagy több értékének. Elég gyakran a funkcionális kapcsolat a fizikában, kémiában nyilvánul meg. A közgazdaságtanban erre példa a munkatermelékenység és a termelés növekedése közötti egyenes arányosság.

A korreláció (amit hiányosnak vagy statisztikainak is neveznek) tömeges megfigyeléseknél átlagosan akkor jelenik meg, amikor a függő változó adott értékei megfelelnek a független változó bizonyos számú valószínű értékének. Ennek magyarázata az elemzett tényezők közötti kapcsolatok összetettsége, amelyek kölcsönhatását befolyásolják

nem vették figyelembe a valószínűségi változókat. Ezért a jelek közötti kapcsolat csak átlagosan, az esetek tömegében nyilvánul meg. Egy korrelációval az argumentum minden értéke megfelel a függvény véletlenszerűen elosztott értékeinek egy bizonyos intervallumban.

A kommunikáció irányában vannak egyenes, amikor a függő változó a faktorjellemző növekedésével nő, és fordított, amelynél az utóbbi növekedése a funkció csökkenésével jár. Az ilyen hivatkozásokat rendre hívhatjuk pozitív és negatív.

Az övével kapcsolatban elemző forma kapcsolatok vannak lineárisÉs nem lineáris. Az első esetben átlagosan lineáris kapcsolatok jelennek meg a jelek között. A nemlineáris összefüggést egy nemlineáris függvény fejezi ki, és a változók átlagosan nem lineárisan kapcsolódnak egymáshoz.

A kapcsolatoknak van egy másik igen fontos jellemzője a szempontból kölcsönható tényezők. Ha két jellemző kapcsolatát jellemezzük, akkor ún gőzszoba. Ha kettőnél több változót tanulmányozunk - többszörös.

A fenti osztályozási jellemzők leggyakrabban a statisztikai elemzésben találhatók meg. De a fentieken kívül vannak még közvetlen, közvetettÉs hamis kapcsolatokat. Valójában mindegyiknek a lényege nyilvánvaló a névből. Az első esetben a tényezők közvetlenül kölcsönhatásba lépnek egymással. A közvetett kapcsolatot valamilyen harmadik változó részvétele jellemzi, amely a vizsgált tulajdonságok közötti kapcsolatot közvetíti. A hamis összefüggés formálisan megállapított, és általában csak mennyiségi becslésekkel megerősített kapcsolat. Nincs minőségi alapja, vagy értelmetlen.

Erőben különböznek egymástól gyengeés erős kötelékek. Ezt a formális jellemzőt meghatározott értékek fejezik ki, és a specifikus mutatók kapcsolatának erősségére vonatkozó általánosan elfogadott kritériumok szerint értelmezik.

A legáltalánosabb formában a statisztika feladata a kapcsolatok tanulmányozása területén azok jelenlétének és irányának számszerűsítése, valamint egyes tényezők másokra gyakorolt ​​hatásának erősségének és formájának jellemzése. Ennek megoldására két módszercsoportot használnak, amelyek közül az egyik a korrelációelemzés módszereit, a másik pedig a regressziós elemzést tartalmazza. Ugyanakkor számos kutató ezeket a módszereket korrelációs-regressziós elemzéssé kombinálja, aminek van néhány alapja: számos közös számítási eljárás jelenléte, komplementaritás az eredmények értelmezésében stb.

Ebben az összefüggésben tehát tág értelemben vett korrelációelemzésről beszélhetünk - amikor a kapcsolatot átfogóan jellemezzük. Ugyanakkor létezik a szűk értelemben vett korrelációelemzés - amikor a kapcsolat erősségét vizsgáljuk - és regresszióelemzés, amely során értékelik annak formáját és egyes tényezők hatását másokra.

Megfelelő feladatok korrelációs elemzés a változó tulajdonságok közötti kapcsolat szorosságának mérésére, az ismeretlen ok-okozati összefüggések meghatározására, valamint az eredményül kapott tulajdonságra a legnagyobb hatást gyakorló tényezők felmérésére korlátozódnak:

Feladatok regresszió analízis a függőség formájának megállapítása, a regressziós függvény meghatározása, a kiértékelés egyenlete ismeretlen értékek függő változó.

E problémák megoldása megfelelő technikákon, algoritmusokon, indikátorokon alapul, amelyek használata okot ad az összefüggések statisztikai vizsgálatáról beszélni.

Meg kell jegyezni, hogy a hagyományos korrelációs és regressziós módszerek széles körben képviseltetik magukat a különféle számítógépes statisztikai szoftvercsomagokban. A kutatónak nem marad más hátra, mint az információk megfelelő előkészítése, az elemzés követelményeinek megfelelő szoftvercsomag kiválasztása és a kapott eredmények értelmezésére. A kommunikációs paraméterek kiszámítására számos algoritmus létezik, és jelenleg aligha célszerű egy ilyen összetett típusú elemzést manuálisan elvégezni. A számítási eljárások önálló érdeklődésre tartanak számot, de az eredmények értelmezése egyes módszerei összefüggéseinek, lehetőségeinek és korlátainak vizsgálata elveinek ismerete a kutatás előfeltétele.

A kapcsolat szorosságának értékelésére szolgáló módszereket korrelációs (paraméteres) és nem paraméteresre osztják. A paraméteres módszerek általában a normál eloszlási becslések használatán alapulnak, és olyan esetekben használatosak, amikor a vizsgált sokaság olyan mennyiségekből áll, amelyek megfelelnek a normális eloszlási törvénynek. A gyakorlatban ezt az álláspontot leggyakrabban a priori veszik fel. Valójában ezek a módszerek parametrikusak, és általában korrelációs módszereknek nevezik.

A nem paraméteres módszerek nem szabnak korlátozást a vizsgált mennyiségek eloszlásának törvényére. Előnyük a számítások egyszerűsége is.

2. Az összefüggések azonosításának módszerei

3. Egyirányú korrelációs-regressziós elemzés

4. Többváltozós korrelációs és regressziós elemzés

5. A kommunikáció nem paraméteres mutatói

1. A kapcsolatok típusai és a korrelációs függőség fogalma

Minden statisztikai mutató bizonyos összefüggésekben és összefüggésekben összefügg egymással.

A statisztikai kutatás feladata ennek a kapcsolatnak a természetének meghatározása.

A következő típusú kapcsolatok léteznek:

1. Faktoriális. Ebben az esetben az összefüggések ugyanazon populáció különböző jellemzőinek összehangolt variációjában nyilvánulnak meg. Ebben az esetben az egyik jel tényezőként, a másik pedig következményként hat. Ezen összefüggések vizsgálata a csoportosítás módszerével, valamint a korrelációelmélet segítségével történik .

2. Alkatrész. Ebbe a típusba olyan összefüggések tartoznak, amelyekben valamely komplex jelenség változását teljes mértékben az ebbe a komplex jelenségbe, mint faktorba tartozó összetevők változása határozza meg (X=x·f). Ehhez az index módszert használják.

Például egy összefüggő indexrendszer segítségével megtudják, hogyan változott a forgalom az eladott áruk számának és árának változása miatt.

3. Egyensúly. Az erőforrások kialakításában és elosztásában fennálló összefüggések, arányok elemzésében használják őket. A mérleg olyan mutatók rendszere, amely két abszolút érték összegéből áll, amelyeket egyenlőségjel köt össze,

a + b = c + d.

Például az anyagi erőforrások egyensúlya:

egyenleg + bevétel = kiadás + egyenleg

kezdeti vége

A kapcsolatok tanulmányozásában a jelek (mutatók) 2 típusra oszthatók:

jelek amelyek másokban változásokat okoznak, az úgynevezett faktoriális, vagy egyszerűen tényezőket.

jelek, változó faktorjelek hatására, vannak termelő.

2 típusú kapcsolat létezik: funkcionálisÉs sztochasztikus.

funkcionális olyan kapcsolatot neveznek, amelyben az effektív attribútumnak csak egy értéke felel meg a faktorattribútum egy bizonyos értékének.

Ha az ok-okozati összefüggés nem minden esetben, hanem általában átlagosan, nagyszámú megfigyelés mellett jelenik meg, akkor egy ilyen összefüggést ún. sztochasztikus.

A sztochasztikus kapcsolat speciális esete az korreláció, amelynél az effektív attribútum átlagértékének változása a faktoriális változásának köszönhető.

A sztochasztikus (korrelációs) kapcsolatok jellemzői:

Nem elszigetelt esetekben találhatók meg, hanem általában és átlagosan nagy számú megfigyeléssel;

- hiányosak, nem veszik figyelembe az összes létező tényezőt, csak a lényegeseket;

Visszafordíthatatlanok. Például egy funkcionális kapcsolatot lehet alakítani

egyéb funkcionális kapcsolat. Ha azt mondjuk, hogy a termelékenység

a mezőgazdasági termékek a kijuttatott műtrágya mennyiségétől függenek, a fordított állítás értelmetlen.

Felé kapcsolat kiosztása közvetlenÉs fordított. Nál nél közvetlen kapcsolat a faktorelőjel növekedésével az eredő előjel növekedése következik be. Amikor Visszacsatolás a faktorelőjel növekedésével az eredő előjel csökkenése következik be.

Analitikus kifejezéssel kapcsolatokat kiosztani lineáris (egyenes)És nem lineáris (görbe vonalú). Ha a jelenségek közötti kapcsolatot egy egyenes egyenletével fejezzük ki, akkor az lineáris. Ha a kapcsolatot egy görbe vonal egyenletével fejezzük ki (parabola, hiperbola, exponenciális, exponenciális stb.), akkor nemlineáris.

Számos tényező szerint, az effektív jelre ható, megkülönböztetni az összefüggéseket egytényezősÉs többtényezős. Ha van egy előjel-tényező és egy effektív előjel, akkor a kapcsolat egytényezős (páros regresszió). Ha 2 vagy több jel-tényező van, akkor a kapcsolat többtényezős (többszörös regresszió).

A kapcsolatokat a fokozat is megkülönbözteti a kommunikáció közelsége(lásd Chaddock táblázatát).