Regressiya tahlilini qanday qilish kerak. Regressiya tahlili tasodifiy miqdorning o'zgaruvchilarga bog'liqligini o'rganishning statistik usulidir. Excel elektron jadvalidan foydalangan holda yechim

Regressiya va korrelyatsion tahlil - statistik tadqiqot usullari. Bu parametrning bir yoki bir nechta mustaqil o'zgaruvchilarga bog'liqligini ko'rsatishning eng keng tarqalgan usullari.

Quyida maxsus amaliy misollar Keling, iqtisodchilar orasida juda mashhur bo'lgan ushbu ikkita tahlilni ko'rib chiqaylik. Ularni birlashtirganda natijalarni olish misolini ham keltiramiz.

Excelda regressiya tahlili

Ba'zi qiymatlarning (mustaqil, mustaqil) qaram o'zgaruvchiga ta'sirini ko'rsatadi. Masalan, iqtisodiy faol aholi soni korxonalar soniga, qiymatiga qanday bog'liq ish haqi va boshqa parametrlar. Yoki: xorijiy investitsiyalar, energiya narxlari va boshqalar YaIM darajasiga qanday ta'sir qiladi.

Tahlil natijasi sizga ustuvorlik berishga imkon beradi. Va asosiy omillarga asoslanib, ustuvor yo'nalishlarni rivojlantirishni bashorat qilish, rejalashtirish, boshqaruv qarorlarini qabul qilish.

Regressiya sodir bo'ladi:

  • chiziqli (y = a + bx);
  • parabolik (y = a + bx + cx 2);
  • eksponensial (y = a * exp(bx));
  • quvvat (y = a*x^b);
  • giperbolik (y = b/x + a);
  • logarifmik (y = b * 1n(x) + a);
  • eksponentsial (y = a * b^x).

Excelda regressiya modelini yaratish va natijalarni sharhlash misolini ko'rib chiqing. Keling, olamiz chiziqli turi regressiya.

Vazifa. 6 ta korxona bo‘yicha o‘rtacha oylik ish haqi va ishdan ketgan xodimlar soni tahlil qilindi. Pensiyaga chiqqan xodimlar sonining o'rtacha ish haqiga bog'liqligini aniqlash kerak.

Chiziqli regressiya modeli quyidagi shaklga ega:

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

Bu erda a - regressiya koeffitsientlari, x - ta'sir qiluvchi o'zgaruvchilar va k - omillar soni.

Bizning misolimizda Y - ishdan bo'shatilgan ishchilar ko'rsatkichi. Ta'sir etuvchi omil - bu ish haqi (x).

Excelda chiziqli regressiya modelining parametrlarini hisoblash uchun ishlatilishi mumkin bo'lgan o'rnatilgan funktsiyalar mavjud. Ammo Analysis ToolPak plaginlari buni tezroq bajaradi.

Kuchli tahliliy vositani faollashtiring:

Faollashtirilgandan so'ng, plagin Ma'lumotlar yorlig'ida mavjud bo'ladi.

Endi biz to'g'ridan-to'g'ri regressiya tahlili bilan shug'ullanamiz.



Avvalo, biz R-kvadrat va koeffitsientlarga e'tibor beramiz.

R-kvadrat - determinatsiya koeffitsienti. Bizning misolimizda u 0,755 yoki 75,5% ni tashkil qiladi. Bu shuni anglatadiki, modelning hisoblangan parametrlari o'rganilayotgan parametrlar orasidagi bog'liqlikni 75,5% ga tushuntiradi. Determinatsiya koeffitsienti qanchalik yuqori bo'lsa, model shunchalik yaxshi bo'ladi. Yaxshi - 0,8 dan yuqori. Yomon - 0,5 dan kam (bunday tahlilni oqilona deb hisoblash qiyin). Bizning misolimizda - "yomon emas".

64.1428 koeffitsienti ko'rib chiqilayotgan modeldagi barcha o'zgaruvchilar 0 ga teng bo'lsa Y qanday bo'lishini ko'rsatadi. Ya'ni modelda tavsiflanmagan boshqa omillar ham tahlil qilinayotgan parametr qiymatiga ta'sir qiladi.

-0,16285 koeffitsienti X o'zgaruvchisining Y bo'yicha og'irligini ko'rsatadi. Ya'ni, ushbu model doirasidagi o'rtacha oylik ish haqi -0,16285 og'irlikdagi ishdan bo'shaganlar soniga ta'sir qiladi (bu kichik ta'sir darajasi). "-" belgisi ko'rsatadi yomon ta'sir: ish haqi qanchalik yuqori bo'lsa, ishdan bo'shatish shunchalik kam bo'ladi. Qaysi adolatli.



Excelda korrelyatsiya tahlili

Korrelyatsiya tahlili bir yoki ikkita namunadagi ko'rsatkichlar o'rtasida bog'liqlik mavjudligini aniqlashga yordam beradi. Masalan, mashinaning ishlash muddati va ta'mirlash xarajatlari, uskunaning narxi va ishlash muddati, bolalarning bo'yi va vazni va boshqalar.

Agar munosabatlar mavjud bo'lsa, unda bir parametrning o'sishi ikkinchisining o'sishiga (ijobiy korrelyatsiya) yoki kamayishiga (salbiy) olib keladimi. Korrelyatsiya tahlili tahlilchiga bir ko'rsatkichning qiymati boshqasining mumkin bo'lgan qiymatini bashorat qila oladimi yoki yo'qligini aniqlashga yordam beradi.

Korrelyatsiya koeffitsienti r bilan belgilanadi. +1 dan -1 gacha o'zgaradi. Turli sohalar uchun korrelyatsiyalarning tasnifi har xil bo'ladi. 0 koeffitsienti bilan chiziqli bog'liqlik namunalar orasida mavjud emas.

Korrelyatsiya koeffitsientini topish uchun Exceldan qanday foydalanishni ko'rib chiqing.

CORREL funksiyasi juftlashgan koeffitsientlarni topish uchun ishlatiladi.

Vazifa: stanokning ish vaqti va unga texnik xizmat ko'rsatish xarajatlari o'rtasida bog'liqlik mavjudligini aniqlang.

Kursorni istalgan katakchaga qo'ying va fx tugmasini bosing.

  1. "Statistika" toifasida CORREL funksiyasini tanlang.
  2. Argument "1-massiv" - qiymatlarning birinchi diapazoni - mashinaning vaqti: A2: A14.
  3. Argument "2-massiv" - qiymatlarning ikkinchi diapazoni - ta'mirlash narxi: B2: B14. OK tugmasini bosing.

Ulanish turini aniqlash uchun siz koeffitsientning mutlaq soniga qarashingiz kerak (har bir faoliyat sohasi o'z shkalasiga ega).

Bir nechta parametrlarni (2 dan ortiq) korrelyatsion tahlil qilish uchun "Ma'lumotlarni tahlil qilish" ("Analiz paketi" qo'shimchasi) dan foydalanish qulayroqdir. Ro'yxatda siz korrelyatsiyani tanlashingiz va massivni belgilashingiz kerak. Hammasi.

Olingan koeffitsientlar korrelyatsiya matritsasida ko'rsatiladi. Bu kabi:

Korrelyatsiya-regressiya tahlili

Amalda, bu ikki usul ko'pincha birgalikda qo'llaniladi.

Misol:


Ma'lumotlar endi ko'rinadi regressiya tahlili.

Zamonaviy siyosatshunoslik jamiyatdagi barcha hodisa va jarayonlarning munosabatlari haqidagi pozitsiyadan kelib chiqadi. Jamiyatning siyosiy sohasida mavjud bo‘lgan bog‘liqlik va bog‘liqliklarni o‘rganmay turib, voqea va jarayonlarni tushunish, siyosiy hayot hodisalarini bashorat qilish va boshqarish mumkin emas. Siyosat tadqiqotining eng keng tarqalgan vazifalaridan biri ba'zi kuzatiladigan o'zgaruvchilar o'rtasidagi munosabatlarni o'rganishdir. Ushbu muammoni hal qilishga yordam beradi statistik tahlil usullarining butun sinfi, birlashtirilgan umumiy ism"Regressiya tahlili" (yoki "korrelyatsiya-regressiya tahlili" deb ham ataladi). Biroq, agar korrelyatsion tahlil ikki o'zgaruvchi o'rtasidagi munosabatlarning kuchini baholashga imkon bersa, regressiya tahlili yordamida ushbu munosabatlar turini aniqlash, har qanday o'zgaruvchining qiymatining boshqa o'zgaruvchining qiymatiga bog'liqligini taxmin qilish mumkin. .

Birinchidan, korrelyatsiya nima ekanligini eslaylik. Korrelyativ bir o'zgaruvchining teng qiymatlari turli xil o'zgaruvchilarga mos kelishidan iborat bo'lgan statistik munosabatlarning eng muhim maxsus holati deb ataladi. o'rtacha qiymatlar boshqa. X atributi qiymatining o'zgarishi bilan y atributining o'rtacha qiymati tabiiy ravishda o'zgaradi, har bir alohida holatda esa atributning qiymati o'zgaradi. da(turli ehtimollik bilan) juda ko'p turli qiymatlarni qabul qilishi mumkin.

Statistikada "korrelyatsiya" atamasining paydo bo'lishi (va siyosatshunoslik o'z muammolarini hal qilish uchun statistik yutuqni jalb qiladi, shuning uchun siyosatshunoslik bilan bog'liq fan) ingliz biologi va statistik Frensis Galton nomi bilan bog'liq. 19-asrda taklif qilgan. nazariy asos korrelyatsiya va regressiya tahlili. Fanda “korrelyatsiya” atamasi avval ham ma’lum bo‘lgan. Xususan, paleontologiyada 18-asrda. uni frantsuz olimi Jorj Kyuvie qo'llagan. U korrelyatsiya qonuni deb ataladigan qonunni kiritdi, uning yordamida qazish paytida topilgan hayvonlarning qoldiqlariga ko'ra, ularning tashqi ko'rinishini tiklash mumkin edi.

Bu olimning nomi va uning korrelyatsiya qonuni bilan bog'liq mashhur hikoya bor. Xullas, universitet ta’til kunlarida mashhur professorga nayrang o‘ynashga qaror qilgan talabalar shoxli va tuyog‘li echki terisini bitta talabaning ustiga tortib olishdi. U Kyuvierning yotoqxonasining derazasiga chiqib, baqirdi: "Men seni yeyman". Professor uyg'onib, siluetga qaradi va javob berdi: "Agar shoxlaringiz va tuyoqlaringiz bo'lsa, demak siz o'txo'rsiz va meni yemaysiz. Va korrelyatsiya qonunini bilmaslik uchun siz ikkilik olasiz. U o'girilib uxlab qoldi. Hazil - bu hazil, ammo bu misolda biz ko'p korrelyatsiya-regressiya tahlilidan foydalanishning alohida holatini ko'ramiz. Bu erda professor o'zaro bog'liqlik qonuniga asoslanib, kuzatilgan ikkita belgi (shox va tuyoqlarning mavjudligi) qiymatlari haqidagi bilimga asoslanib, uchinchi belgining o'rtacha qiymatini chiqardi (bu hayvon qaysi sinfga tegishli). o'txo'r hisoblanadi). Bunday holda, biz ushbu o'zgaruvchining o'ziga xos qiymati haqida gapirmayapmiz (ya'ni, bu hayvon olishi mumkin). turli ma'nolar nominal miqyosda - bu echki, qo'chqor va buqa bo'lishi mumkin ...).

Endi “regressiya” atamasiga o‘tamiz. Qat'iy aytganda, bularning ma'nosi bilan bog'liq emas statistik vazifalar bu usul yordamida hal qilinadi. Atamaga tushuntirish faqat xususiyatlar o'rtasidagi munosabatlarni o'rganish usullarining rivojlanish tarixi haqidagi bilimlar asosida berilishi mumkin. Ushbu turdagi tadqiqotlarning birinchi namunalaridan biri statistik F.Galton va K.Pirsonning ishlari bo'lib, ular otalar va ularning bolalarining o'sishi o'rtasidagi ikkita kuzatiladigan belgi bo'yicha qonuniyatni topishga harakat qildilar (bu erda). X- otaning bo'yi va U- bolalarning o'sishi). O'z tadqiqotlarida ular o'rtacha bo'yli otalar o'rtacha bo'yli bolalarni tarbiyalashlari haqidagi dastlabki farazni tasdiqladilar. Xuddi shu tamoyil past otalar va bolalar uchun ham amal qiladi. Vaholanki, agar olimlar shu yerda to‘xtaganlarida, ularning ishlari hech qachon statistika bo‘yicha darsliklarda tilga olinmagan bo‘lardi. Tadqiqotchilar yuqorida aytib o'tilgan tasdiqlangan gipoteza ichida yana bir naqsh topdilar. Ular juda baland bo'yli otalar o'rtacha bo'yli, lekin bo'yi bo'yicha otalari o'rtachadan yuqori bo'lsa-da, o'rtacha bo'ydan unchalik farq qilmaydigan bolalardan unchalik farq qilmasligini isbotladilar. Xuddi shu narsa bo'yi juda kichik bo'lgan (qisqa guruhdagi o'rtacha ko'rsatkichdan chetga chiqqan) otalar uchun ham amal qiladi - ularning farzandlari, o'rtacha, otalari oddiygina past bo'lgan tengdoshlaridan bo'yi bo'yicha farq qilmadi. Ular bu muntazamlikni tavsiflovchi funktsiyani chaqirdilar regressiya funktsiyasi. Ushbu tadqiqotdan keyin o'xshash funktsiyalarni tavsiflovchi va shunga o'xshash tarzda tuzilgan barcha tenglamalar regressiya tenglamalari deb atala boshlandi.

Regressiya tahlili - bir bog'liq va bir nechta (yoki bitta) mustaqil o'zgaruvchilar o'rtasidagi munosabatlarni o'rganish yoki modellashtirish uchun mo'ljallangan statistik usullar to'plamini birlashtirgan ko'p o'lchovli statistik ma'lumotlarni tahlil qilish usullaridan biri. Statistikada qabul qilingan an'anaga ko'ra, qaram o'zgaruvchi javob deb ataladi va quyidagicha belgilanadi. V Mustaqil o'zgaruvchilar bashorat qiluvchilar deb ataladi va ular sifatida belgilanadi x. Tahlil davomida ba'zi o'zgaruvchilar javob bilan zaif bog'liq bo'ladi va oxir-oqibat tahlildan chiqarib tashlanadi. Bog'liq bilan bog'liq qolgan o'zgaruvchilarni ham omillar deb atash mumkin.

Regression tahlil boshqa o'zgaruvchiga (masalan, ta'lim darajasiga qarab noan'anaviy siyosiy xatti-harakatlarga moyillik) yoki bir nechta o'zgaruvchilarga qarab bir yoki bir nechta o'zgaruvchilarning qiymatlarini taxmin qilish imkonini beradi. Kompyuterda hisoblab chiqiladi. Boshqariladigan xususiyatning omillarga bog'liqlik darajasini o'lchash imkonini beruvchi regressiya tenglamasini tuzish uchun professional matematik-dasturchilarni jalb qilish kerak. Regressiya tahlili siyosiy vaziyat rivojlanishining bashoratli modellarini yaratishda, ijtimoiy keskinlik sabablarini baholashda va nazariy tajribalar o‘tkazishda bebaho xizmat ko‘rsatishi mumkin. Regressiya tahlili fuqarolarning saylovdagi xatti-harakatlariga bir qator ijtimoiy-demografik parametrlarning ta'sirini o'rganish uchun faol foydalaniladi: jinsi, yoshi, kasbi, yashash joyi, millati, daromad darajasi va tabiati.

Regressiya tahliliga nisbatan tushunchalar mustaqil Va qaram o'zgaruvchilar. Mustaqil o'zgaruvchi bu boshqa o'zgaruvchining o'zgarishini tushuntiruvchi yoki sabab bo'ladigan o'zgaruvchidir. Tobe o'zgaruvchi - bu qiymati birinchi o'zgaruvchining ta'siri bilan izohlanadigan o'zgaruvchi. Masalan, 2004 yilgi prezidentlik saylovlarida hal qiluvchi omillar, ya'ni. mustaqil o'zgaruvchilar mamlakat aholisining moliyaviy ahvolini barqarorlashtirish, nomzodlarning mashhurlik darajasi va omil kabi ko'rsatkichlar edi. majburiyat. Bunda nomzodlar uchun berilgan ovozlar foizini qaram o‘zgaruvchi sifatida ko‘rish mumkin. Xuddi shunday, “saylovchining yoshi” va “saylov faolligi darajasi” juftligida birinchisi mustaqil, ikkinchisi bog'liq.

Regressiya tahlili quyidagi muammolarni hal qilishga imkon beradi:

  • 1) Ci o'rtasida statistik jihatdan ahamiyatli munosabat mavjudligi yoki yo'qligi haqiqatini aniqlang x;
  • 2) regressiya funktsiyasining eng yaxshi (statistik ma'noda) baholarini qurish;
  • 3) berilgan qiymatlarga muvofiq X noma'lum uchun bashorat yaratish Da
  • 4) har bir omil ta'sirining solishtirma og'irligini baholash X yoqilgan Da va shunga mos ravishda, ahamiyatsiz xususiyatlarni modeldan chiqarib tashlash;
  • 5) o'zgaruvchilar o'rtasidagi sababiy munosabatlarni aniqlash orqali, tushuntirish o'zgaruvchilari qiymatlarini sozlash orqali P qiymatlarini qisman boshqaring x.

Regressiya tahlili o'rganilayotgan ko'rsatkich qiymatiga ta'sir qiluvchi o'zaro mustaqil o'zgaruvchilarni tanlash, regressiya tenglamasi shaklini aniqlash va birlamchi sotsiologik ma'lumotlarni qayta ishlashning statistik usullaridan foydalangan holda parametrlarni baholash zarurati bilan bog'liq. Ushbu turdagi tahlil munosabatlarning shakli, yo'nalishi va yaqinligi (zichligi) g'oyasiga asoslanadi. Farqlash bug 'xonasi Va ko'p regressiya o'rganilgan xususiyatlar soniga qarab. Amalda regressiya tahlili odatda korrelyatsiya tahlili bilan birgalikda amalga oshiriladi. Regressiya tenglamasi miqdorlar o'rtasidagi raqamli munosabatni tavsiflaydi, bir o'zgaruvchining ko'payishi yoki kamayishi, ikkinchisining o'sishi yoki kamayishi tendentsiyasi sifatida ifodalanadi. Shu bilan birga, razl va h a yut l sovuq Va chiziqli bo'lmagan regressiya. Ta'riflashda siyosiy jarayonlar regressiyaning ikkala varianti ham bir xilda aniqlanadi.

Siyosiy maqolalardagi qiziqishlarning o'zaro bog'liqligini taqsimlash uchun scatterplot ( U) va respondentlarning ta'limi (X) chiziqli regressiya hisoblanadi (30-rasm).

Guruch. o'ttiz.

Saylov faolligi darajasini taqsimlash grafigi ( U) va respondentning yoshi (A) (shartli misol) chiziqli bo'lmagan regressiyadir (31-rasm).


Guruch. 31.

Juftlangan regressiya modelida ikkita xususiyatning (A "va Y") munosabatini tasvirlash uchun foydalaning chiziqli tenglama

Bu erda a, xususiyatlarning o'zgarishi bilan tenglama xatosining tasodifiy qiymati, ya'ni. tenglamaning "chiziqlilik" dan chetlanishi.

Koeffitsientlarni baholash uchun A Va b Regressiya chizig'idan tarqalish chizig'idagi har bir nuqtaning kvadratik og'ishlari yig'indisi minimal bo'lishi kerak deb hisoblaydigan eng kichik kvadratlar usulidan foydalaning. Imkoniyatlar a h b tenglamalar tizimi yordamida hisoblash mumkin:

Eng kichik kvadratlarni baholash usuli koeffitsientlarning bunday baholarini beradi A Va b, buning uchun chiziq koordinatali nuqtadan o'tadi X Va y, bular. nisbat mavjud da = ax + b. Regressiya tenglamasining grafik tasviri deyiladi nazariy regressiya chizig'i. Chiziqli bog'liqlik bilan regressiya koeffitsienti grafikda nazariy regressiya chizig'ining x o'qiga qiyaligi tangensini ifodalaydi. Koeffitsientdagi belgi ulanish yo'nalishini ko'rsatadi. Agar u noldan katta bo'lsa, u holda munosabatlar to'g'ridan-to'g'ri, agar u kamroq bo'lsa, teskari bo'ladi.

"Siyosiy Peterburg-2006" tadqiqotining quyidagi misoli (56-jadval) fuqarolarning hozirgi hayotdan qoniqish darajasi haqidagi tasavvurlari va kelajakda hayot sifatining o'zgarishini kutishlari o'rtasidagi chiziqli bog'liqlikni ko'rsatadi. Ulanish to'g'ridan-to'g'ri, chiziqli (standartlashtirilgan regressiya koeffitsienti 0,233, ahamiyatlilik darajasi 0,000). Bunday holda, regressiya koeffitsienti yuqori emas, lekin u statistik ahamiyatga ega ko'rsatkichning pastki chegarasidan oshadi (Pirson koeffitsientining statistik ahamiyatli ko'rsatkichi kvadratining pastki chegarasi).

56-jadval

Hozirgi vaqtda fuqarolarning hayot sifatining umidlarga ta'siri

(Sankt-Peterburg, 2006 yil)

* Bog'liq o'zgaruvchi: "Yaqin 2-3 yil ichida hayotingiz qanday o'zgaradi deb o'ylaysiz?"

Siyosiy hayotda o'rganilayotgan o'zgaruvchining qiymati ko'pincha bir vaqtning o'zida bir nechta xususiyatlarga bog'liq. Masalan, siyosiy faoliyat darajasi va tabiatiga bir vaqtning o'zida davlatning siyosiy rejimi, siyosiy an'analar, ma'lum bir hududdagi odamlarning siyosiy xatti-harakatlarining o'ziga xos xususiyatlari va respondentning ijtimoiy mikroguruhi, uning yoshi, ma'lumoti, daromadi ta'sir qiladi. darajasi, siyosiy yo'nalishi va boshqalar. Bunday holda, siz tenglamadan foydalanishingiz kerak ko'p regressiya, u quyidagi shaklga ega:

bu erda koeffitsient b.- qisman regressiya koeffitsienti. Bu har bir mustaqil o'zgaruvchining mustaqil (natija) o'zgaruvchining qiymatlarini aniqlashga qo'shgan hissasini ko'rsatadi. Agar qisman regressiya koeffitsienti 0 ga yaqin bo'lsa, mustaqil va qaram o'zgaruvchilar o'rtasida to'g'ridan-to'g'ri bog'liqlik yo'q degan xulosaga kelishimiz mumkin.

Bunday modelni hisoblash matritsali algebra yordamida shaxsiy kompyuterda amalga oshirilishi mumkin. Ko'p regressiya ijtimoiy aloqalarning ko'p faktorli xususiyatini aks ettirishga va har bir omilning alohida va birgalikda natijaviy xususiyatga ta'sir darajasini aniqlashga imkon beradi.

Belgilangan koeffitsient b, chiziqli regressiya koeffitsienti deyiladi va omil atributining o'zgarishi o'rtasidagi munosabatlarning kuchini ko'rsatadi. X va o'zgaruvchanlik samarali xususiyat Y Bu koeffitsient munosabatlarning kuchini xususiyatlarning mutlaq o'lchov birliklarida o'lchaydi. Shu bilan birga, xususiyatlar korrelyatsiyasining yaqinligini natijaviy xususiyatning standart og'ishi bilan ham ifodalash mumkin (bunday koeffitsient korrelyatsiya koeffitsienti deb ataladi). Regressiya koeffitsientidan farqli o'laroq b korrelyatsiya koeffitsienti xususiyatlarning qabul qilingan o'lchov birliklariga bog'liq emas va shuning uchun uni har qanday xususiyatlar uchun solishtirish mumkin. Odatda, /> 0,7, o'rtacha zichlik - 0,5 g 0,5 bo'lsa, ulanish kuchli hisoblanadi.

Ma'lumki, har bir alohida qiymatga ega bo'lganda, eng yaqin aloqa funktsional ulanishdir Y qiymatga yagona belgilanishi mumkin x. Shunday qilib, korrelyatsiya koeffitsienti 1 ga qanchalik yaqin bo'lsa, funktsional bog'liqlik shunchalik yaqin bo'ladi. Regressiya tahlili uchun ahamiyatlilik darajasi 0,001 dan oshmasligi kerak.

Korrelyatsiya koeffitsienti qadimdan xususiyatlar munosabatlarining yaqinligining asosiy ko'rsatkichi sifatida qaralib kelgan. Biroq, keyinchalik determinatsiya koeffitsienti shunday ko'rsatkichga aylandi. Ushbu koeffitsientning ma'nosi quyidagicha - u hosil bo'lgan xususiyatning umumiy dispersiyadagi ulushini aks ettiradi Da, xususiyatning xilma-xilligi bilan izohlanadi x. U korrelyatsiya koeffitsientini oddiygina kvadratga solish orqali topiladi (0 dan 1 gacha) va o'z navbatida chiziqli munosabatlar uchun 0 dan (0%) gacha bo'lgan ulushni aks ettiradi. 1 (100%) xarakterli qiymatlar Y, atributning qiymatlari bilan aniqlanadi x. Sifatida qayd etilgan men 2, va SPSS paketidagi regressiya tahlilining natijaviy jadvallarida - kvadratsiz.

Ko'p regressiya tenglamasini tuzishning asosiy masalalarini belgilaymiz.

  • 1. Regressiya tenglamasiga kiritilgan omillarni tanlash. Bu bosqichda tadqiqotchi birinchi navbatda nazariyaga ko'ra o'rganilayotgan hodisani aniqlaydigan asosiy sabablarning umumiy ro'yxatini tuzadi. Keyin u regressiya tenglamasidagi xususiyatlarni tanlashi kerak. Tanlashning asosiy qoidasi shundan iboratki, tahlilga kiritilgan omillar bir-biri bilan imkon qadar kamroq korrelyatsiya qilishi kerak; faqat shu holatda ta'sirning miqdoriy o'lchovini ma'lum bir omil-atributga bog'lash mumkin.
  • 2. Ko'p regressiya tenglamasining shaklini tanlash(amalda chiziqli yoki chiziqli-logarifmik ko'proq qo'llaniladi). Shunday qilib, ko'p regressiyadan foydalanish uchun tadqiqotchi birinchi navbatda bir nechta mustaqil o'zgaruvchilarning natijaga ta'sirining gipotetik modelini qurishi kerak. Olingan natijalar ishonchli bo'lishi uchun model haqiqiy jarayonga to'liq mos kelishi kerak, ya'ni. o'zgaruvchilar orasidagi bog'lanish chiziqli bo'lishi kerak, birorta ham muhim mustaqil o'zgaruvchini e'tiborsiz qoldirib bo'lmaydi, xuddi shu tarzda, o'rganilayotgan jarayonga bevosita bog'liq bo'lmagan birorta ham o'zgaruvchini tahlilga kiritish mumkin emas. Bundan tashqari, o'zgaruvchilarning barcha o'lchovlari juda aniq bo'lishi kerak.

Yuqoridagi tavsifdan ushbu usulni qo'llash uchun bir qator shartlar kelib chiqadi, ularsiz ko'p regressiya tahlili (MRA) protsedurasiga o'tish mumkin emas. Faqat quyidagi barcha fikrlarga rioya qilish regressiya tahlilini to'g'ri bajarishga imkon beradi.

O'qish davomida talabalar ko'pincha turli xil tenglamalarga duch kelishadi. Ulardan biri - regressiya tenglamasi - ushbu maqolada ko'rib chiqiladi. Ushbu turdagi tenglama matematik parametrlar orasidagi bog'lanish xususiyatlarini tavsiflash uchun maxsus qo'llaniladi. Tenglikning bu turi statistika va ekonometriyada qo'llaniladi.

Regressiya ta'rifi

Matematikada regressiya deganda ma'lumotlar to'plamining o'rtacha qiymatining boshqa miqdorning qiymatlariga bog'liqligini tavsiflovchi ma'lum miqdor tushuniladi. Regressiya tenglamasi ma'lum bir xususiyatning funktsiyasi sifatida boshqa xususiyatning o'rtacha qiymatini ko'rsatadi. Regressiya funktsiyasi shaklga ega oddiy tenglama y \u003d x, bunda y - qaram o'zgaruvchi va x - mustaqil o'zgaruvchi (xususiyat omili). Aslida regressiya y = f (x) shaklida ifodalanadi.

O'zgaruvchilar o'rtasidagi munosabatlarning turlari qanday

Umuman olganda, munosabatlarning ikki qarama-qarshi turi farqlanadi: korrelyatsiya va regressiya.

Birinchisi shartli o'zgaruvchilarning tengligi bilan tavsiflanadi. Bunday holda, qaysi o'zgaruvchining boshqasiga bog'liqligi aniq ma'lum emas.

Agar o'zgaruvchilar o'rtasida tenglik bo'lmasa va shartlar qaysi o'zgaruvchining tushuntirish va qaysi bog'liqligini aytsa, ikkinchi turdagi bog'lanish mavjudligi haqida gapirish mumkin. Chiziqli regressiya tenglamasini qurish uchun qanday turdagi munosabatlar kuzatilayotganligini aniqlash kerak bo'ladi.

Regressiya turlari

Bugungi kunga kelib regressiyaning 7 xil turi mavjud: giperbolik, chiziqli, ko'p, chiziqli bo'lmagan, juftlik, teskari, logarifmik chiziqli.

Giperbolik, chiziqli va logarifmik

Lineer regressiya tenglamasi statistikada tenglamaning parametrlarini aniq tushuntirish uchun ishlatiladi. y = c + m * x + E ga o'xshaydi. Giperbolik tenglama muntazam giperbola y \u003d c + m / x + E ko'rinishiga ega. Logarifmik chiziqli tenglama munosabatlarni ifodalaydi logarifmik funktsiya: In y \u003d In c + t * In x + In E.

Ko'p va chiziqli bo'lmagan

Regressiyaning yana ikkita murakkab turi ko'p va chiziqli bo'lmagan. Ko'p regressiya tenglamasi y \u003d f (x 1, x 2 ... x c) + E funktsiyasi bilan ifodalanadi. Bunday vaziyatda y bog'liq o'zgaruvchi va x tushuntirish o'zgaruvchisidir. E o'zgaruvchisi stokastik bo'lib, tenglamadagi boshqa omillarning ta'sirini o'z ichiga oladi. Chiziqli bo'lmagan regressiya tenglamasi biroz mos kelmaydi. Bir tomondan, hisobga olingan ko'rsatkichlarga nisbatan, u chiziqli emas, ikkinchi tomondan, ko'rsatkichlarni baholash rolida chiziqli.

Teskari va juft regressiyalar

Teskari funktsiya chiziqli shaklga aylantirilishi kerak bo'lgan funktsiyadir. Eng an'anaviy amaliy dasturlarda u y \u003d 1 / c + m * x + E funksiyasi ko'rinishiga ega. Juftlangan regressiya tenglamasi y = f(x) + E funksiyasi sifatida ma’lumotlar o‘rtasidagi munosabatni ko‘rsatadi. Xuddi boshqa tenglamalar singari, y ham x ga bog‘liq va E stokastik parametrdir.

Korrelyatsiya tushunchasi

Bu ikki hodisa yoki jarayon o'rtasida bog'liqlik mavjudligini ko'rsatadigan ko'rsatkichdir. Aloqaning mustahkamligi korrelyatsiya koeffitsienti sifatida ifodalanadi. Uning qiymati [-1;+1] oralig'ida o'zgarib turadi. Salbiy ko'rsatkich teskari aloqa mavjudligini, ijobiy ko'rsatkich to'g'ridan-to'g'ri ekanligini ko'rsatadi. Agar koeffitsient 0 ga teng qiymatni qabul qilsa, unda hech qanday bog'liqlik yo'q. Qiymat 1 ga qanchalik yaqin bo'lsa - parametrlar o'rtasidagi bog'liqlik qanchalik kuchli bo'lsa, 0 ga yaqinroq - zaifroq.

Usullari

Korrelyatsiya parametrik usullari munosabatlarning mustahkamligini baholashi mumkin. Oddiy taqsimot qonuniga bo'ysunadigan parametrlarni o'rganish uchun ular taqsimot baholari asosida qo'llaniladi.

Chiziqli regressiya tenglamasining parametrlari bog'liqlik turini, regressiya tenglamasining funktsiyasini aniqlash va tanlangan munosabatlar formulasining ko'rsatkichlarini baholash uchun zarurdir. Korrelyatsiya maydoni munosabatlarni aniqlash usuli sifatida ishlatiladi. Buning uchun barcha mavjud ma'lumotlar grafik ko'rinishda ifodalanishi kerak. To'rtburchaklar ikki o'lchovli koordinatalar tizimida barcha ma'lum ma'lumotlar chizilgan bo'lishi kerak. Korrelyatsiya maydoni shunday shakllanadi. Ta'riflovchi omilning qiymati abscissa bo'ylab, qaram omilning qiymatlari esa ordinat bo'ylab belgilanadi. Parametrlar o'rtasida funksional bog'liqlik mavjud bo'lsa, ular chiziq shaklida joylashgan.

Agar bunday ma'lumotlarning korrelyatsiya koeffitsienti 30% dan kam bo'lsa, biz ulanishning deyarli to'liq yo'qligi haqida gapirishimiz mumkin. Agar u 30% dan 70% gacha bo'lsa, bu o'rtacha yaqinlikdagi aloqalar mavjudligini ko'rsatadi. 100% ko'rsatkich funktsional ulanishning dalilidir.

Chiziqli bo'lmagan regressiya tenglamasi, xuddi chiziqli kabi, korrelyatsiya indeksi (R) bilan to'ldirilishi kerak.

Ko'p regressiya uchun korrelyatsiya

Determinatsiya koeffitsienti ko'p korrelyatsiya kvadratining ko'rsatkichidir. U taqdim etilgan ko'rsatkichlar to'plamining o'rganilayotgan belgi bilan bog'liqligi haqida gapiradi. Parametrlarning natijaga ta'sirining tabiati haqida ham gapirish mumkin. Ko'p regressiya tenglamasi ushbu ko'rsatkich yordamida baholanadi.

Ko'p korrelyatsiya indeksini hisoblash uchun uning indeksini hisoblash kerak.

Eng kichik kvadrat usuli

Bu usul regressiya omillarini baholash usulidir. Uning mohiyati omilning funktsiyaga bog'liqligi tufayli olingan kvadrat og'ishlar yig'indisini minimallashtirishdan iborat.

Juftlangan chiziqli regressiya tenglamasini shunday usul yordamida baholash mumkin. Ushbu turdagi tenglamalar juft chiziqli munosabatlarning ko'rsatkichlari o'rtasida aniqlanganda qo'llaniladi.

Tenglama variantlari

Chiziqli regressiya funktsiyasining har bir parametri o'ziga xos ma'noga ega. Juftlangan chiziqli regressiya tenglamasi ikkita parametrni o'z ichiga oladi: c va m.. Parametr t y funksiyaning yakuniy ko'rsatkichining o'rtacha o'zgarishini ko'rsatadi, x o'zgaruvchisi bitta shartli birlikka kamayishi (o'sish) sharti bilan. Agar x o'zgaruvchisi nolga teng bo'lsa, u holda funktsiya c parametriga teng bo'ladi. Agar x o'zgaruvchisi nolga teng bo'lmasa, u holda c omil iqtisodiy ma'noga ega emas. Funksiyaga faqat c omil oldidagi belgi ta'sir qiladi. Agar minus bo'lsa, unda omilga nisbatan natijaning sekin o'zgarishi haqida aytishimiz mumkin. Agar ortiqcha bo'lsa, bu natijaning tezlashtirilgan o'zgarishini ko'rsatadi.

Regressiya tenglamasining qiymatini o'zgartiruvchi har bir parametr tenglama orqali ifodalanishi mumkin. Masalan, c omil c = y - mx ko'rinishga ega.

Guruhlangan ma'lumotlar

Vazifaning shunday shartlari mavjudki, unda barcha ma'lumotlar x atributiga ko'ra guruhlanadi, lekin shu bilan birga, ma'lum bir guruh uchun bog'liq ko'rsatkichning mos keladigan o'rtacha qiymatlari ko'rsatiladi. Bunday holda, o'rtacha qiymatlar indikatorning x ga bog'liqligini tavsiflaydi. Shunday qilib, guruhlangan ma'lumotlar regressiya tenglamasini topishga yordam beradi. U munosabatlar tahlili sifatida ishlatiladi. Biroq, bu usul o'zining kamchiliklariga ega. Afsuski, o'rtacha ko'rsatkichlar ko'pincha tashqi tebranishlarga duchor bo'ladi. Bu tebranishlar munosabatlar naqshlarining aksi emas, ular shunchaki uning "shovqinini" niqoblaydi. O'rtachalar chiziqli regressiya tenglamasidan ko'ra yomonroq munosabatlar naqshlarini ko'rsatadi. Biroq, ular tenglamani topish uchun asos sifatida ishlatilishi mumkin. Muayyan populyatsiyaning hajmini mos keladigan o'rtacha ko'rsatkichga ko'paytirish orqali siz guruh ichidagi y ning yig'indisini olishingiz mumkin. Keyinchalik, siz barcha olingan miqdorlarni nokaut qilishingiz va yakuniy ko'rsatkichni topishingiz kerak y. Xy yig'indisi ko'rsatkichi bilan hisob-kitob qilish biroz qiyinroq. Agar intervallar kichik bo'lsa, shartli ravishda barcha birliklar (guruh ichidagi) uchun x ko'rsatkichini bir xil qabul qilishimiz mumkin. X va y ko‘paytmalarining yig‘indisini topish uchun uni y yig‘indisiga ko‘paytiring. Keyinchalik, barcha summalar bir-biriga uriladi va umumiy xy yig'indisi olinadi.

Ko'p juftlik tenglamalari regressiyasi: munosabatlarning ahamiyatini baholash

Yuqorida aytib o'tilganidek, ko'p regressiya y \u003d f (x 1, x 2, ..., x m) + E ko'rinishidagi funktsiyaga ega. Ko'pincha bunday tenglama tovarlarga bo'lgan talab va taklif, sotib olingan aktsiyalar bo'yicha foiz daromadlari, ishlab chiqarish xarajatlari funktsiyasining sabablari va turlarini o'rganish uchun ishlatiladi. Bundan tashqari, u turli xil makroiqtisodiy tadqiqotlar va hisob-kitoblarda faol qo'llaniladi, ammo mikroiqtisodiyot darajasida bu tenglama biroz kamroq qo'llaniladi.

Ko'p regressiyaning asosiy vazifasi har bir omilning alohida va ularning jamiligida modellashtiriladigan ko'rsatkich va uning koeffitsientlariga qanday ta'sir qilishini aniqlash uchun katta hajmdagi ma'lumotlarni o'z ichiga olgan ma'lumotlar modelini yaratishdir. Regressiya tenglamasi turli qiymatlarni qabul qilishi mumkin. Bunday holda, munosabatlarni baholash uchun odatda ikki turdagi funktsiyalar qo'llaniladi: chiziqli va chiziqli bo'lmagan.

Chiziqli funktsiya shunday munosabat ko'rinishida tasvirlangan: y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m. Bunda a2, a m lar «sof» regressiya koeffitsientlari hisoblanadi. Ular y parametrining o'rtacha o'zgarishini har bir mos keladigan x parametrning bir birlikka o'zgarishi (kamayishi yoki ortishi) bilan, boshqa ko'rsatkichlarning barqaror qiymati sharti bilan tavsiflash uchun zarurdir.

Nochiziqli tenglamalar, masalan, y=ax 1 b1 x 2 b2 ...x m bm quvvat funksiyasi shakliga ega. Bunda b 1, b 2 ..... b m ko'rsatkichlari egiluvchanlik koeffitsientlari deyiladi, ular tegishli ko'rsatkich x 1% ga oshishi (kamayishi) bilan natija qanday o'zgarishini (qancha% ga) ko'rsatadi. va boshqa omillarning barqaror ko'rsatkichi bilan.

Ko'p regressiyani qurishda qanday omillarni hisobga olish kerak

Ko'p regressiyani to'g'ri qurish uchun qaysi omillarga alohida e'tibor berish kerakligini aniqlash kerak.

Iqtisodiy omillar va modellashtirilgan munosabatlar o'rtasidagi munosabatlarning mohiyatini biroz tushunish kerak. Kiritilgan omillar quyidagi mezonlarga javob berishi kerak:

  • O'lchanadigan bo'lishi kerak. Ob'ektning sifatini tavsiflovchi omildan foydalanish uchun har qanday holatda, unga miqdoriy shakl berilishi kerak.
  • Faktorlarning o'zaro bog'liqligi yoki funktsional aloqasi bo'lmasligi kerak. Bunday harakatlar ko'pincha qaytarilmas oqibatlarga olib keladi - oddiy tenglamalar tizimi shartsiz bo'lib qoladi va bu uning ishonchsizligi va noaniq baholarini keltirib chiqaradi.
  • Katta korrelyatsiya ko'rsatkichi bo'lsa, indikatorning yakuniy natijasiga omillarning izolyatsiya qilingan ta'sirini aniqlashning hech qanday usuli yo'q, shuning uchun koeffitsientlar izohlanmaydi.

Qurilish usullari

Tenglama uchun omillarni qanday tanlash mumkinligini tushuntirishning juda ko'p usullari va usullari mavjud. Biroq, bu usullarning barchasi korrelyatsiya indeksidan foydalangan holda koeffitsientlarni tanlashga asoslangan. Ular orasida:

  • Cheklash usuli.
  • Usulni yoqish.
  • Bosqichli regressiya tahlili.

Birinchi usul jami to'plamdan barcha koeffitsientlarni saralashni o'z ichiga oladi. Ikkinchi usul ko'plab qo'shimcha omillarni kiritishni o'z ichiga oladi. Xo'sh, uchinchisi, tenglamaga ilgari qo'llaniladigan omillarni yo'q qilish. Ushbu usullarning har biri mavjud bo'lish huquqiga ega. Ularning ijobiy va salbiy tomonlari bor, lekin ular keraksiz ko'rsatkichlarni tekshirish masalasini o'zlari hal qilishlari mumkin. Qoida tariqasida, har bir individual usul bilan olingan natijalar juda yaqin.

Ko'p o'lchovli tahlil usullari

Faktorlarni aniqlashning bunday usullari o'zaro bog'liq xususiyatlarning individual birikmalarini hisobga olishga asoslangan. Bularga diskriminant tahlili, naqshni aniqlash, asosiy komponentlar tahlili va klaster tahlili kiradi. Bundan tashqari, omil tahlili ham mavjud, ammo u komponent usulini ishlab chiqish natijasida paydo bo'ldi. Ularning barchasi muayyan sharoitlarda, ma'lum shartlar va omillar ostida qo'llaniladi.

1. Birinchi marta «regressiya» atamasi biometrika asoschisi F.Galton (XIX asr) tomonidan kiritilgan bo‘lib, uning g‘oyalari uning izdoshi K.Pirson tomonidan ishlab chiqilgan.

Regressiya tahlili- bir yoki bir nechta sabablar (omil belgilari) va oqibat (samarali belgi) o'rtasidagi bog'liqlikni o'lchash imkonini beruvchi statistik ma'lumotlarni qayta ishlash usuli.

belgisi- bu o'rganilayotgan hodisa yoki jarayonning asosiy farqlovchi belgisi, xususiyati.

Samarali belgi - tekshirilgan ko'rsatkich.

Faktor belgisi- samarali xususiyatning qiymatiga ta'sir qiluvchi ko'rsatkich.

Regressiya tahlilining maqsadi samarali xususiyatning o'rtacha qiymatining funktsional bog'liqligini baholashdir ( da) faktorial ( x 1, x 2, ..., x n), sifatida ifodalanadi regressiya tenglamalari

da= f(x 1, x 2, ..., x n). (6.1)

Ikki xil regressiya mavjud: juftlik va ko'p.

Juftlangan (oddiy) regressiya- shakl tenglamasi:

da= f(x). (6.2)

Juftlik regressiyadagi natijaviy xususiyat bitta argumentning funktsiyasi sifatida qaraladi, ya'ni. bitta omil.

Regressiya tahlili quyidagi bosqichlarni o'z ichiga oladi:

funksiya turini aniqlash;

regressiya koeffitsientlarini aniqlash;

Samarali xususiyatning nazariy qiymatlarini hisoblash;

Regressiya koeffitsientlarining statistik ahamiyatini tekshirish;

Regressiya tenglamasining statistik ahamiyatini tekshirish.

Ko'p regressiya- shakl tenglamasi:

da= f(x 1, x 2, ..., x n). (6.3)

Natijada paydo bo'lgan xususiyat bir nechta argumentlarning funktsiyasi sifatida qaraladi, ya'ni. ko'p omillar.

2. Funksiya turini to’g’ri aniqlash uchun nazariy ma’lumotlarga tayangan holda bog’lanish yo’nalishini topish kerak.

Bog'lanish yo'nalishi bo'yicha regressiya quyidagilarga bo'linadi:

· to'g'ridan-to'g'ri regressiya, mustaqil qiymatning oshishi yoki kamayishi bilan yuzaga keladigan " X" bog'liq miqdorning qiymatlari " da" ham mos ravishda oshirish yoki kamaytirish;

· teskari regressiya, mustaqil qiymatning oshishi yoki kamayishi sharti bilan yuzaga keladi "X" bog'liq qiymat " da" mos ravishda kamayadi yoki ortadi.

Munosabatlarni tavsiflash uchun juftlashgan regressiya tenglamalarining quyidagi turlari qo'llaniladi:

· y=a+bxchiziqli;

· y=e ax + b – eksponensial;

· y=a+b/x – giperbolik;

· y=a+b 1 x+b 2 x 2 – parabolik;

· y=ab x – eksponensial va boshq.

Qayerda a, b1, b2- tenglamaning koeffitsientlari (parametrlari); da- samarali belgi; X- omil belgisi.

3. Regressiya tenglamasini qurish uning koeffitsientlarini (parametrlarini) baholashga qisqartiriladi, buning uchun ular foydalanadilar. eng kichik kvadrat usuli(MNK).

Eng kichik kvadratlar usuli sizga samarali xususiyatning haqiqiy qiymatlarining kvadratik og'ishlari yig'indisi bo'lgan parametrlarning bunday baholarini olish imkonini beradi. da»nazariydan» y x» minimal, ya'ni

Regressiya tenglamalari variantlari y=a+bx Eng kichik kvadratlar usuli bilan quyidagi formulalar yordamida baholanadi:

Qayerda A - erkin koeffitsient, b- regressiya koeffitsienti, natija belgisi qanchalik o'zgarishini ko'rsatadi y» omil atributini o'zgartirganda « x» o'lchov birligi uchun.

4. Regressiya koeffitsientlarining statistik ahamiyatini baholash uchun Student t-testidan foydalaniladi.

Regressiya koeffitsientlarining ahamiyatini tekshirish sxemasi:

1) H 0: a=0, b=0 - regressiya koeffitsientlari noldan unchalik farq qilmaydi.

H 1: a≠ 0, b≠ 0 - regressiya koeffitsientlari noldan sezilarli darajada farq qiladi.

2) R=0,05 – ahamiyatlilik darajasi.

Qayerda m b,m a- tasodifiy xatolar:

; . (6.7)

4) t jadvali(R; f),

Qayerda f=n-k- 1 - erkinlik darajalari soni (jadval qiymati), n- kuzatishlar soni, k X".

5) Agar , keyin chetga chiqadi, ya'ni. muhim koeffitsient.

Agar , keyin qabul qilinadi, ya'ni. koeffitsienti ahamiyatsiz.

5. Tuzilgan regressiya tenglamasining to'g'riligini tekshirish uchun Fisher mezoni qo'llaniladi.

Regressiya tenglamasining ahamiyatini tekshirish sxemasi:

1) H 0: regressiya tenglamasi ahamiyatli emas.

H 1: regressiya tenglamasi muhim ahamiyatga ega.

2) R=0,05 – ahamiyatlilik darajasi.

3) , (6.8)

kuzatishlar soni qayerda; k- o'zgaruvchilar bilan tenglamadagi parametrlar soni " X"; da- samarali xususiyatning haqiqiy qiymati; y x- samarali xususiyatning nazariy qiymati; - juft korrelyatsiya koeffitsienti.

4) F jadvali(R; f 1 ; f2),

Qayerda f 1 \u003d k, f 2 \u003d n-k-1- erkinlik darajalari soni (jadval qiymatlari).

5) Agar F calc >F jadvali, keyin regressiya tenglamasi to'g'ri tanlanadi va amaliyotda qo'llanilishi mumkin.

Agar F hisob , keyin regressiya tenglamasi noto'g'ri tanlangan.

6. Regressiya tahlilining sifati o'lchovini aks ettiruvchi asosiy ko'rsatkich hisoblanadi aniqlash koeffitsienti (R 2).

Aniqlash koeffitsienti qaram o'zgaruvchining qancha qismini ko'rsatadi " da» tahlil qilishda hisobga olinadi va tahlilga kiritilgan omillar ta’siridan kelib chiqadi.

Aniqlash koeffitsienti (R2) diapazondagi qiymatlarni oladi. Agar regressiya tenglamasi sifatli hisoblanadi R2 ≥0,8.

Aniqlash koeffitsienti korrelyatsiya koeffitsientining kvadratiga teng, ya'ni.

6.1-misol. Quyidagi ma'lumotlarga asoslanib, regressiya tenglamasini tuzing va tahlil qiling:

Yechim.

1) Korrelyatsiya koeffitsientini hisoblang: . Belgilar o'rtasidagi munosabat to'g'ridan-to'g'ri va mo''tadil.

2) Juftlangan chiziqli regressiya tenglamasini tuzing.

2.1) Hisoblash jadvalini tuzing.

X da Hu x 2 y x (y-y x) 2
55,89 47,54 65,70
45,07 15,42 222,83
54,85 34,19 8,11
51,36 5,55 11,27
42,28 45,16 13,84
47,69 1,71 44,77
45,86 9,87 192,05
so'm 159,45 558,55
O'rtacha 77519,6 22,78 79,79 2990,6

,

Juftlangan chiziqli regressiya tenglamasi: y x \u003d 25,17 + 0,087x.

3) Nazariy qiymatlarni toping " y x» regressiya tenglamasiga haqiqiy qiymatlarni almashtirish orqali « X».

4) Haqiqiy "grafiklarni chizing" da" va nazariy qadriyatlar " y x» samarali xususiyat (6.1-rasm): r xy =0,47) va oz sonli kuzatishlar.

7) Determinatsiya koeffitsientini hisoblang: R2=(0,47) 2 =0,22. Tuzilgan tenglama sifatsiz.

Chunki regressiya tahlili paytida hisob-kitoblar juda katta, maxsus dasturlardan foydalanish tavsiya etiladi ("Statistica 10", SPSS va boshqalar).

6.2-rasmda "Statistica 10" dasturi yordamida o'tkazilgan regressiya tahlili natijalari bilan jadval ko'rsatilgan.

6.2-rasm. "Statistica 10" dasturi yordamida amalga oshirilgan regression tahlil natijalari

5. Adabiyot:

1. Gmurman V.E. Ehtimollar nazariyasi va matematik statistika: Proc. Universitetlar uchun qo'llanma / V.E. Gmurman. - M.: Oliy maktab, 2003. - 479 b.

2. Qo‘ychubekov B.K. Biostatistika: darslik. - Olmaota: Evero, 2014. - 154 b.

3. Lobotskaya N.L. Oliy matematika. / N.L. Lobotskaya, Yu.V. Morozov, A.A. Dunaev. - Minsk: Oliy maktab, 1987. - 319 p.

4. Shifokor V.A., Tokmachev M.S., Baliqchi B.B. Tibbiyot va biologiya bo'yicha statistika: qo'llanma. 2 jildda / Ed. Yu.M. Komarov. T. 1. Nazariy statistika. - M .: Tibbiyot, 2000. - 412 p.

5. Aholi salomatligi va sog'liqni saqlashni o'rganish uchun statistik tahlil usullarini qo'llash: darslik / ed. Kucherenko V.Z. - 4-nashr, qayta ko'rib chiqilgan. va qo'shimcha - M.: GEOTAR - Media, 2011. - 256 b.

Regressiya tahlilining asosiy maqsadi munosabatlarning analitik shaklini aniqlashdan iborat bo‘lib, bunda natijaviy atributning o‘zgarishi bir yoki bir nechta omil belgilarining ta’siridan kelib chiqadi va natijaviy xususiyatga ham ta’sir etuvchi boshqa barcha omillar to‘plami doimiy va o‘rtacha qiymatlar sifatida qabul qilinadi. .
Regressiya tahlilining vazifalari:
a) Tobelik shaklini belgilash. Hodisalar o'rtasidagi munosabatlarning tabiati va shakliga kelsak, ijobiy chiziqli va chiziqli bo'lmagan va manfiy chiziqli va chiziqli bo'lmagan regressiya mavjud.
b) regressiya funktsiyasini u yoki bu turdagi matematik tenglama ko'rinishida aniqlash va izohli o'zgaruvchilarning bog'liq o'zgaruvchiga ta'sirini o'rnatish.
c) qaram o'zgaruvchining noma'lum qiymatlarini baholash. Regressiya funktsiyasidan foydalanib, siz tushuntiruvchi o'zgaruvchilarning berilgan qiymatlari oralig'ida bog'liq o'zgaruvchining qiymatlarini ko'paytirishingiz mumkin (ya'ni, interpolyatsiya muammosini hal qilish) yoki belgilangan oraliqdan tashqarida jarayonning borishini baholashingiz mumkin (ya'ni, ekstrapolyatsiya masalasini yechish). Natijada bog'liq o'zgaruvchining qiymatini taxmin qilish mumkin.

Juftlik regressiya - ikki o'zgaruvchining y va x munosabatlari tenglamasi: y=f(x), bu erda y - bog'liq o'zgaruvchi (natija belgisi); x - mustaqil, izohlovchi o'zgaruvchi (xususiyat-omil).

Chiziqli va chiziqli bo'lmagan regressiyalar mavjud.
Chiziqli regressiya: y = a + bx + e
Nochiziqli regressiyalar ikki sinfga bo'linadi: tahlilga kiritilgan izohli o'zgaruvchilarga nisbatan chiziqli bo'lmagan, lekin taxmin qilingan parametrlarga nisbatan chiziqli bo'lgan regressiyalar va taxmin qilingan parametrlarga nisbatan chiziqli bo'lmagan regressiyalar.
Tushuntiruvchi o'zgaruvchilarda chiziqli bo'lmagan regressiyalar:

Hisoblangan parametrlarda chiziqli bo'lmagan regressiyalar:

  • quvvat y=a x b e
  • eksponensial y=a b x e
  • eksponensial y=e a+b x e
Regressiya tenglamasini qurish uning parametrlarini baholashga qisqartiriladi. Parametrlari bo'yicha chiziqli bo'lgan regressiyalar parametrlarini baholash uchun eng kichik kvadratlar usuli (LSM) qo'llaniladi. LSM parametrlarning bunday baholarini olish imkonini beradi, ular ostida y samarali xususiyatning haqiqiy qiymatlarining y x nazariy qiymatlaridan kvadrat og'ishlarining yig'indisi minimal bo'ladi, ya'ni.
.
Chiziqli va chiziqli bo'lmagan tenglamalar uchun a va b uchun quyidagi tizim yechiladi:

Siz ushbu tizimdan kelib chiqadigan tayyor formulalardan foydalanishingiz mumkin:

O'rganilayotgan hodisalar orasidagi bog'lanishning yaqinligi chiziqli regressiya uchun (-1≤r xy ≤1) chiziqli juft korrelyatsiya koeffitsienti r xy bilan baholanadi:

va korrelyatsiya indeksi p xy - chiziqli bo'lmagan regressiya uchun (0≤p xy ≤1):

Tuzilgan modelning sifatini baholash aniqlash koeffitsienti (indeks), shuningdek, o'rtacha yaqinlashish xatosi bilan beriladi.
O'rtacha taxminiy xato - bu hisoblangan qiymatlarning haqiqiy qiymatlardan o'rtacha og'ishi:
.
A qiymatlarining ruxsat etilgan chegarasi - 8-10% dan oshmasligi kerak.
E o'rtacha elastiklik koeffitsienti x omili o'rtacha qiymatidan 1% ga o'zgarganda y natija o'rtacha necha foizga o'zgarishini ko'rsatadi:
.

Dispersiyani tahlil qilish vazifasi qaram o'zgaruvchining dispersiyasini tahlil qilishdan iborat:
∑(y-y )²=∑(y x -y )²+∑(y-y x)²
bu erda ∑(y-y)² - kvadrat og'ishlarning umumiy yig'indisi;
∑(y x -y)² - regressiya ("tushuntirilgan" yoki "faktorial") tufayli kvadrat og'ishlar yig'indisi;
∑(y-y x)² - kvadrat og'ishlarning qoldiq yig'indisi.
Regressiya bilan izohlangan dispersiyaning y samarali xususiyatning umumiy dispersiyadagi ulushi R2 aniqlash koeffitsienti (indeks) bilan tavsiflanadi:

Determinatsiya koeffitsienti koeffitsient yoki korrelyatsiya indeksining kvadratidir.

F-testi - regressiya tenglamasining sifatini baholash - gipotezani tekshirishdan iborat Ammo regressiya tenglamasining statistik ahamiyatsizligi va ulanishning yaqinlik ko'rsatkichi haqida. Buning uchun haqiqiy F fakti va Fisher F-mezonining qiymatlarining kritik (jadvalli) F jadvalini taqqoslash amalga oshiriladi. F fakt bir erkinlik darajasi uchun hisoblangan faktorial va qoldiq dispersiyalarning qiymatlari nisbati asosida aniqlanadi:
,
bu yerda n - aholi birliklari soni; m - x o'zgaruvchilar uchun parametrlar soni.
F jadvali - berilgan erkinlik darajalari va ahamiyatlilik darajasi a uchun tasodifiy omillar ta'sirida mezonning mumkin bo'lgan maksimal qiymati. Muhimlik darajasi a - to'g'ri bo'lgan farazni rad etish ehtimoli. Odatda a 0,05 yoki 0,01 ga teng qabul qilinadi.
Agar F jadvali< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F fakt, u holda H haqidagi gipoteza rad etilmaydi va regressiya tenglamasining statistik ahamiyatsizligi, ishonchsizligi tan olinadi.
Regressiya va korrelyatsiya koeffitsientlarining statistik ahamiyatini baholash uchun ko'rsatkichlarning har biri uchun Student t-testi va ishonch intervallari hisoblanadi. Ko'rsatkichlarning tasodifiy tabiati haqida H gipotezasi ilgari suriladi, ya'ni. noldan ularning ahamiyatsiz farqi haqida. Talabaning t-testi yordamida regressiya va korrelyatsiya koeffitsientlarining ahamiyatini baholash ularning qiymatlarini tasodifiy xatoning kattaligi bilan solishtirish orqali amalga oshiriladi:
; ; .
Chiziqli regressiya parametrlari va korrelyatsiya koeffitsientining tasodifiy xatolari quyidagi formulalar bilan aniqlanadi:



T-statistikaning haqiqiy va kritik (jadvalli) qiymatlarini solishtirsak - t tabl va t fakt - biz H o gipotezasini qabul qilamiz yoki rad etamiz.
Fisherning F-testi va Student t-statistikasi oʻrtasidagi bogʻliqlik tenglik bilan ifodalanadi

Agar t jadvali< t факт то H o отклоняется, т.е. a , b и r xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >t haqida H gipotezasi rad etilmaganligi va a, b yoki r xy hosil bo'lishining tasodifiy tabiati tan olinganligi.
Ishonch oralig'ini hisoblash uchun har bir ko'rsatkich uchun D chegaraviy xatosini aniqlaymiz:
D a =t jadval m a, D b =t jadval m b.
Ishonch oraliqlarini hisoblash uchun formulalar quyidagicha:
g a \u003d aDA a; g a \u003d a-DA a; g a =a+DA
g b = bD b; g b = b-D b; gb =b+DB
Agar nol ishonch oralig'i chegaralariga tushsa, ya'ni. Agar pastki chegara salbiy bo'lsa va yuqori chegara ijobiy bo'lsa, u holda taxminiy parametr nolga teng deb qabul qilinadi, chunki u bir vaqtning o'zida ijobiy va salbiy qiymatlarni qabul qila olmaydi.
Prognoz qiymati y p mos (prognoz) qiymatini x p regressiya tenglamasiga y x =a+b·x almashtirish orqali aniqlanadi. Prognozning o'rtacha standart xatosi m y x hisoblanadi:
,
Qayerda
va qurilmoqda ishonch oralig'i prognoz:
g y x =y p D y p ; g y x min=y p -D y p ; g y x max=y p +D y p
Bu yerda D y x =t jadval ·m y x.

Yechimga misol

Vazifa raqami 1. Ural viloyatining ettita hududi uchun 199X uchun ikkita belgining qiymati ma'lum.
1-jadval.

Majburiy: 1. y ning x ga bog’liqligini xarakterlash uchun quyidagi funksiyalarning parametrlarini hisoblang:
a) chiziqli;
b) kuch qonuni (ilgari har ikkala qismning logarifmini olish orqali o'zgaruvchilarni chiziqli qilish protsedurasini bajarish kerak edi);
c) ko'rgazmali;
d) teng qirrali giperbola (shuningdek, ushbu modelni qanday qilib oldindan chiziqli qilish kerakligini aniqlab olishingiz kerak).
2. Har bir modelni o'rtacha yaqinlashish xatosi A va Fisherning F-testi orqali baholang.

Yechim (variant №1)

y=a+b·x chiziqli regressiyaning a va b parametrlarini hisoblash uchun (hisoblash kalkulyator yordamida amalga oshirilishi mumkin).
ga nisbatan normal tenglamalar sistemasini yeching A Va b:
Dastlabki ma'lumotlarga asoslanib, biz ∑y, ∑x, ∑y x, ∑x², ∑y² ni hisoblaymiz:
y x yx x2 y2 y xy-y xAi
l68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
Jami405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
Chorshanba qiymat (Jami/n)57,89
y
54,90
x
3166,05
x y
3048,34
3383,68
XX8,1
s 5,74 5,86 XXXXXX
s232,92 34,34 XXXXXX


a=y -b x = 57,89+0,35 54,9 ≈ 76,88

Regressiya tenglamasi: y= 76,88 - 0,35X. O'rtacha kunlik ish haqining 1 rublga oshishi bilan. oziq-ovqat mahsulotlarini sotib olishga sarflangan xarajatlar ulushi o'rtacha 0,35% punktga kamaydi.
Juftlik korrelyatsiyasining chiziqli koeffitsientini hisoblang:

Muloqot mo''tadil, teskari.
Determinatsiya koeffitsientini aniqlaymiz: r² xy =(-0,35)=0,127
Natijaning 12,7% o'zgarishi x omilining o'zgarishi bilan izohlanadi. Haqiqiy qiymatlarni regressiya tenglamasiga almashtirish X, biz y x ning nazariy (hisoblangan) qiymatlarini aniqlaymiz. O'rtacha yaqinlashish xatosi A qiymatini topamiz:

O'rtacha hisoblangan qiymatlar haqiqiydan 8,1% ga og'adi.
F-mezonini hisoblaymiz:

Olingan qiymat aniqlangan bog'liqlikning tasodifiy tabiati va tenglama parametrlarining statistik ahamiyatsizligi va ulanishning yaqinligi ko'rsatkichi haqida H 0 gipotezasini qabul qilish zarurligini ko'rsatadi.
1b. y=a x b quvvat modelini qurishdan oldin o'zgaruvchilarni chiziqlilashtirish protsedurasi amalga oshiriladi. Misolda linearizatsiya tenglamaning ikkala tomonining logarifmini olish orqali amalga oshiriladi:
lg y=lg a + b lg x
Y=C+b Y
Bu yerda Y=lg(y), X=lg(x), C=lg(a).

Hisoblash uchun biz jadvaldagi ma'lumotlardan foydalanamiz. 1.3.
1.3-jadval

YX YX Y2 x2 y xy-y x(y-yx)²Ai
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
Jami12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
O'rtacha qiymati1,7605 1,7370 3,0572 3,1011 3,0194 XX28,27 8,0
σ 0,0425 0,0484 XXXXXXX
s20,0018 0,0023 XXXXXXX

C va b ni hisoblang:

C=Y -b X = 1,7605+0,298 1,7370 = 2,278126
Chiziqli tenglamani olamiz: Y=2,278-0,298 X
Uni kuchaytirgandan so'ng, biz quyidagilarga erishamiz: y=10 2,278 x -0,298
Ushbu tenglamada haqiqiy qiymatlarni almashtirish X, biz natijaning nazariy qiymatlarini olamiz. Ularga asoslanib, biz ko'rsatkichlarni hisoblaymiz: ulanishning zichligi - korrelyatsiya indeksi p xy va o'rtacha yaqinlashish xatosi A .

Quvvat modelining xarakteristikalari uning biroz yaxshiroq ekanligini ko'rsatadi chiziqli funksiya munosabatini tasvirlaydi.

1c. Eksponensial egri y \u003d a b x tenglamasini qurishdan oldin tenglamaning ikkala qismining logarifmini olishda o'zgaruvchilarni chiziqli qilish tartibi amalga oshiriladi:
lg y=lg a + x lg b
Y=C+B x
Hisoblash uchun biz jadval ma'lumotlaridan foydalanamiz.

Yx Yx Y2 x2y xy-y x(y-yx)²Ai
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
Jami12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
Chorshanba zn.1,7605 54,9 96,5711 3,1011 3048,34 XX28,68 8,0
σ 0,0425 5,86 XXXXXXX
s20,0018 34,339 XXXXXXX

A va regressiya parametrlarining qiymatlari IN tashkil etdi:

A=Y -B x = 1,7605+0,0023 54,9 = 1,887
Chiziqli tenglama olinadi: Y=1,887-0,0023x. Olingan tenglamani kuchaytiramiz va uni odatdagi shaklda yozamiz:
y x =10 1,887 10 -0,0023x = 77,1 0,9947 x
O'zaro bog'liqlikning mustahkamligini p xy korrelyatsiya ko'rsatkichi orqali baholaymiz:

3588,01 56,9 3,0 9,00 5,0 4 56,7 0,0162 0,9175 0,000262 3214,89 55,5 1,2 1,44 2,1 5 55 0,0170 0,9354 0,000289 3025,00 56,4 -1,4 1,96 2,5 6 54,3 0,0212 1,1504 0,000449 2948,49 60,8 -6,5 42,25 12,0 7 49,3 0,0181 0,8931 0,000328 2430,49 57,5 -8,2 67,24 16,6 Jami405,2 0,1291 7,5064 0,002413 23685,76 405,2 0,0 194,90 56,5 O'rtacha qiymati57,9 0,0184 1,0723 0,000345 3383,68 XX27,84 8,1 σ 5,74 0,002145 XXXXXXX s232,9476 0,000005 XX