Логистикалык регрессия: модели жана ыкмалары

Мазмуну:

Логистикалык регрессия: модели жана ыкмалары
Логистикалык регрессия: модели жана ыкмалары
Anonim

Логистикалык регрессиянын жана дискриминанттык анализдин ыкмалары респонденттерди максаттуу категориялар боюнча так дифференциялоо зарыл болгондо колдонулат. Бул учурда, топтордун өздөрү бир варианттуу параметрдин деңгээли менен көрсөтүлөт. Келгиле, логистикалык регрессия моделин кененирээк карап чыгалы жана ал эмне үчүн керек экенин билели.

логистикалык регрессия
логистикалык регрессия

Жалпы маалымат

Логистикалык регрессия колдонулган көйгөйдүн мисалы катары респонденттерди горчица сатып алган жана сатып албаган топторго классификациялоону айтсак болот. Дифференциялоо социалдык-демографиялык өзгөчөлүктөргө ылайык жүргүзүлөт. Аларга, атап айтканда, жаш, жыныс, туугандардын саны, киреше ж.б. кирет. Операцияларда дифференциация критерийлери жана өзгөрмө бар. Акыркысы респонденттерди бөлүү керек болгон максаттуу категорияларды коддойт.

Нюанстар

Логистикалык регрессия колдонулган учурлардын диапазону дискриминанттык анализге караганда бир топ тар экенин айтуу керек. Ушуга байланыштуу дифференциялоонун универсалдуу ыкмасы катары акыркысын колдонуу каралатартык. Мындан тышкары, эксперттер дискриминанттык талдоо менен классификациялык изилдөөлөрдү баштоону сунуштайт. Ал эми жыйынтыктар белгисиз болгон учурда гана логистикалык регрессияны колдоно аласыз. Бул муктаждык бир нече факторлорго байланыштуу. Логистикалык регрессия көз карандысыз жана көз каранды өзгөрмөлөрдүн түрүн так түшүнгөндө колдонулат. Буга ылайык, мүмкүн болгон 3 процедуранын бири тандалып алынат. Дискриминанттык анализде изилдөөчү дайыма бир статикалык операция менен алектенет. Ал бир көз каранды жана бир нече көз карандысыз категориялык өзгөрмөлөрдү камтыйт.

Көрүүлөр

Логистикалык регрессияны колдонгон статистикалык изилдөөнүн милдети – белгилүү бир респонденттин белгилүү бир топко дайындалуу ыктымалдыгын аныктоо. Дифференциация белгилүү бир параметрлер боюнча жүргүзүлөт. Иш жүзүндө, бир же бир нече көз карандысыз факторлордун баалуулуктары боюнча, респонденттерди эки топко бөлүүгө болот. Бул учурда, бинардык логистикалык регрессия ишке ашат. Ошондой эле, көрсөтүлгөн параметрлер экиден ашык топторго бөлүнгөндө колдонулушу мүмкүн. Мындай кырдаалда мультиномиялык логистикалык регрессия ишке ашат. Натыйжадагы топтор бир өзгөрмөнүн деңгээлинде көрсөтүлөт.

логистикалык регрессия
логистикалык регрессия

Мисалы

Москванын чет жакасынан жер тилкесин сатып алуу сунушуна кызыкдарбы деген суроого респонденттердин жооптору бар дейли. Варианттар "жок"жана Ооба. Потенциалдуу сатып алуучулардын чечимине кайсы факторлор басымдуу таасирин тийгизерин аныктоо зарыл. Бул үчүн респонденттерге аймактын инфраструктурасы, борборго чейинки аралык, участоктун аянты, турак жайдын бар/жоктугу ж. респонденттер эки топко бөлүнөт. Биринчиси сатып алууга кызыкдар болгондорду - потенциалдуу сатып алуучуларды, экинчисине, тиешелүүлүгүнө жараша, мындай сунушка кызыкпагандарды камтыйт. Мындан тышкары, ар бир респондент үчүн тигил же бул категорияга ыйгаруу ыктымалдыгы эсептелет.

Салыштырма мүнөздөмөлөр

Жогорудагы эки варианттан айырмасы топтордун ар кандай саны жана көз каранды жана көз карандысыз өзгөрмөлөрдүн түрү. Бинарлык регрессияда, мисалы, дихотомиялык фактордун бир же бир нече көз карандысыз шарттарга көз карандылыгы изилденет. Анын үстүнө, акыркы масштабдын ар кандай түрү болушу мүмкүн. Мультиномдук регрессия бул классификация вариантынын вариациясы болуп эсептелет. Анда 2ден ашык топ көз каранды өзгөрмөгө кирет. Көз карандысыз факторлордун иреттик же номиналдык шкала болушу керек.

Spssдеги логистикалык регрессия

11-12-статистикалык пакетте анализдин жаңы версиясы киргизилди - иреттик. Бул ыкма көз каранды фактор бир аталыштагы (реттик) шкалага таандык болгондо колдонулат. Бул учурда, көз карандысыз өзгөрмөлөр белгилүү бир типтен тандалып алынат. Алар ординалдуу же номиналдуу болушу керек. Бир нече категорияга классификация эң көп деп эсептелетуниверсалдуу. Бул ыкма логистикалык регрессияны колдонгон бардык изилдөөлөрдө колдонулушу мүмкүн. Бирок моделдин сапатын жакшыртуунун бирден-бир жолу бул үч ыкманы тең колдонуу.

адекваттуу сапатты текшерүү жана логистикалык регрессия
адекваттуу сапатты текшерүү жана логистикалык регрессия

Ординалдуу классификация

Мындан мурда статистикалык пакетте көз каранды факторлор үчүн иреттүү шкала менен адистештирилген анализ жүргүзүүнүн типтүү мүмкүнчүлүгү жок экенин айтуу керек. 2ден ашык топтору бар бардык өзгөрмөлөр үчүн мультиноминалдык вариант колдонулган. Салыштырмалуу жакында эле киргизилген ординалдык анализ бир катар өзгөчөлүктөргө ээ. Алар масштабдын өзгөчөлүгүн эске алышат. Ошол эле учурда, окуу куралдарында, ординалдык логистикалык регрессия көбүнчө өзүнчө ыкма катары каралбайт. Бул төмөнкүлөргө байланыштуу: иреттүү анализдин көп мүчөгө караганда олуттуу артыкчылыгы жок. Изилдөөчү экинчисин иреттик жана номиналдык көз каранды өзгөрмөнүн катышуусунда колдонушу мүмкүн. Ошол эле учурда классификация процесстери бири-биринен дээрлик айырмаланбайт. Бул иреттүү талдоо жүргүзүү эч кандай кыйынчылык жаратпайт дегенди билдирет.

Талдоо опциясы

Жөнөкөй ишти карап көрөлү - бинардык регрессия. Маркетингдик изилдөөнүн жүрүшүндө белгилүү бир борбор шаардагы университеттин бүтүрүүчүлөрүнө болгон суроо-талапка баа берилди дейли. Анкетада респонденттерге суроолор берилди, анын ичинде:

  1. Сиз жумушсузбу? (ql).
  2. Бүтүрүү жылын киргизиңиз (21-к).
  3. Орто деген эмнебүтүрүү упай (орто).
  4. Жыныс (22-q).

Логистикалык регрессия ql өзгөрмөсүнө aver, q 21 жана q 22 көз карандысыз факторлордун таасирин баалайт. Жөнөкөй сөз менен айтканда, анализдин максаты адистиги, бүтүргөн жылы жана GPA жөнүндө маалыматтын негизинде бүтүрүүчүлөрдүн иш менен камсыз болушун аныктоо болот.

логистикалык сигмоиддик регрессия көрсөткүчү
логистикалык сигмоиддик регрессия көрсөткүчү

Логистикалык регрессия

Бинардык регрессияны колдонуу менен параметрлерди коюу үчүн Analyze►Regression►Binary Logistic менюсун колдонуңуз. Логистикалык регрессия терезесинде сол жактагы жеткиликтүү өзгөрмөлөрдүн тизмесинен көз каранды факторду тандаңыз. Бул ql. Бул өзгөрмө Көз каранды талаага жайгаштырылышы керек. Андан кийин Ковариаттардын сюжетине көз карандысыз факторлорду киргизүү керек - q 21, q 22, aver. Андан кийин сиз аларды анализиңизге кантип киргизүүнү тандап алышыңыз керек. Эгерде көз карандысыз факторлордун саны 2ден көп болсо, анда демейки боюнча коюлган бардык өзгөрмөлөрдү бир убакта киргизүү ыкмасы колдонулат, бирок этап менен. Эң популярдуу жолу - Backward:LR. Тандоо баскычын колдонуп, изилдөөгө бардык респонденттерди эмес, белгилүү бир максаттуу категорияны гана кошо аласыз.

Категориялык өзгөрмөлөрдү аныктоо

Категориялык баскыч көз карандысыз өзгөрмөлөрдүн бири 2 категориядан ашык номиналдуу болгондо колдонулушу керек. Мындай жагдайда Категориялык өзгөрмөлөрдү аныктоо терезесинде Категориялык Ковариаттар бөлүмүндө дал ушундай параметр жайгаштырылат. Бул мисалда мындай өзгөрмө жок. Андан кийин, ачылуучу тизмеде Contrast төмөнкүдөйЧеттөө пунктун тандап, Өзгөртүү баскычын басыңыз. Натыйжада, ар бир номиналдык фактордон бир нече көз каранды өзгөрмөлөр түзүлөт. Алардын саны баштапкы шарттын категорияларынын санына туура келет.

Жаңы өзгөрмөлөрдү сактоо

Изилдөөнүн негизги диалог терезесиндеги Сактоо баскычын колдонуу менен жаңы параметрлерди түзүү орнотулат. Алар регрессия процессинде эсептелген көрсөткүчтөрдү камтыйт. Атап айтканда, сиз аныктаган өзгөрмөлөрдү түзө аласыз:

  1. Белгилүү бир классификация категориясына таандык (Топко мүчөлүк).
  2. Ар бир изилдөө тобуна респондентти дайындоо ыктымалдыгы (Ыктымалдуулуктар).

Параметрлер баскычын колдонууда изилдөөчү эч кандай маанилүү опцияларды албайт. Ошого жараша ага көңүл бурбай коюуга болот. "OK" баскычын чыкылдаткандан кийин анализдин натыйжалары негизги терезеде көрсөтүлөт.

логистикалык регрессия коэффициенти
логистикалык регрессия коэффициенти

Адекваттуулугун жана логистикалык регрессиянын сапатын текшерүү

Модель коэффициенттеринин Omnibus Tests таблицасын карап көрүңүз. Бул моделдин жакындаштыруу сапатын талдоонун натыйжаларын көрсөтөт. Этап-этабы менен вариант коюлгандыктан, акыркы этаптын (2-кадам) жыйынтыгын карашыңыз керек. Маанилүүлүктүн жогорку даражасында кийинки баскычка өтүүдө Хи-квадрат көрсөткүчүнүн жогорулашы табылса, оң натыйжа каралат (Сиг. < 0,05). Моделдин сапаты Модель линиясында бааланат. терс маани алынган болсо, бирок ал моделдин жалпы жогорку материалдуулугу менен маанилүү деп эсептелбейт, акыркыиш жүзүндө ылайыктуу деп эсептесе болот.

Таблицалар

Модель Кыскача маалыматы курулган модель (R Square индекси) менен сүрөттөлгөн жалпы дисперсия индексин баалоого мүмкүндүк берет. Бул Nagelker маанисин колдонуу сунуш кылынат. Nagelkerke R Square параметри 0,50 жогору болсо, оң көрсөткүч катары каралышы мүмкүн. Андан кийин классификациянын натыйжалары бааланат, мында изилденүүчү тигил же бул категорияга тиешелүүлүгүнүн иш жүзүндөгү көрсөткүчтөрү регрессиялык моделдин негизинде болжолдонгондор менен салыштырылат. Бул үчүн классификация таблицасы колдонулат. Ал ошондой эле каралып жаткан ар бир топ үчүн дифференциялоонун тууралыгы жөнүндө тыянак чыгарууга мүмкүндүк берет.

логистикалык регрессия модели
логистикалык регрессия модели

Төмөнкү таблица анализге киргизилген көз карандысыз факторлордун, ошондой эле ар бир стандартташтырылбаган логистикалык регрессия коэффициентинин статистикалык маанисин билүү мүмкүнчүлүгүн берет. Бул көрсөткүчтөрдүн негизинде тандоодогу ар бир респонденттин белгилүү бир топко тиешелүүлүгүн алдын ала айтууга болот. Сактоо баскычын колдонуу менен сиз жаңы өзгөрмөлөрдү киргизе аласыз. Алар белгилүү бир классификация категориясына таандык экендиги (Болжолдонгон категория) жана бул топторго кошулуу ыктымалдыгы (Болжолдонгон ыктымалдуулуктардын мүчөлүгү) жөнүндө маалыматты камтыйт. "OK" баскычын чыкылдаткандан кийин эсептөө натыйжалары Multinomial Logistic Regression негизги терезесинде пайда болот.

Изилдөөчү үчүн маанилүү индикаторлорду камтыган биринчи таблица – Моделди тууралоо маалыматы. Статистикалык маанинин жогорку деңгээли жогорку сапатты жанапрактикалык маселелерди чечүүдө моделди колдонуунун ылайыктуулугу. Дагы бир маанилүү таблица Pseudo R-Square. Ал талдоо үчүн тандалган көз карандысыз өзгөрмөлөр тарабынан аныкталуучу көз каранды фактордогу жалпы дисперсиянын үлүшүн баалоого мүмкүндүк берет. Ыктымалдуулук катышы тесттеринин таблицасына ылайык, биз акыркынын статистикалык мааниси жөнүндө тыянак чыгара алабыз. Параметрдик баа стандартташтырылбаган коэффициенттерди чагылдырат. Алар теңдемени түзүүдө колдонулат. Мындан тышкары, өзгөрмөлөрдүн ар бир айкалышы үчүн алардын көз каранды факторго тийгизген таасиринин статистикалык мааниси аныкталган. Ошол эле учурда маркетинг изилдөөлөрүндө респонденттерди категориялар боюнча жекече эмес, максаттуу топтун бир бөлүгү катары айырмалоо зарыл болуп калат. Бул үчүн Байкоочу жана Болжолдонгон жыштыктар таблицасы колдонулат.

Практикалык колдонмо

Каралып жаткан талдоо ыкмасы соодагерлердин ишинде кеңири колдонулат. 1991-жылы логистикалык сигмоиддик регрессия көрсөткүчү иштелип чыккан. Бул мүмкүн болгон бааларды алар "ысып кеткенге" чейин алдын ала айтуу үчүн колдонууга оңой жана эффективдүү курал. Индикатор диаграммада эки параллелдүү сызыктан түзүлгөн канал катары көрсөтүлгөн. Алар трендден бирдей аралыкта жайгашкан. Коридордун туурасы бир гана мөөнөткө жараша болот. Индикатор дээрлик бардык активдер менен иштөөдө колдонулат - валюта жуптарынан баалуу металлдарга чейин.

spss логистикалык регрессия
spss логистикалык регрессия

Практикада аспапты колдонуунун 2 негизги стратегиясы иштелип чыккан: үзгүлтүккө учуратуу жанабурулуш үчүн. Акыркы учурда, соодагер каналдын ичиндеги баанын өзгөрүү динамикасына басым жасайт. Маани колдоо же каршылык сызыгына жакындаганда, кыймыл карама-каршы багытта башталышы ыктымалдыгына коюм коюлат. Эгерде баа жогорку чекке жакын болсо, анда сиз активден кутула аласыз. Эгерде ал төмөнкү чекте болсо, анда сиз сатып алуу жөнүндө ойлонушуңуз керек. Бөлүү стратегиясы буйруктарды колдонууну камтыйт. Алар салыштырмалуу аз аралыкта чектен тышкары орнотулган. Кээ бир учурларда баа кыска убакытка аларды бузгандыгын эске алып, аны коопсуз ойноп, жоготууларды токтотуу керек. Ошол эле учурда, албетте, тандалган стратегияга карабастан, соодагер рынокто пайда болгон кырдаалды мүмкүн болушунча тынч кабылдап, баа бериши керек.

Тыянак

Ошентип, логистикалык регрессияны колдонуу респонденттерди берилген параметрлер боюнча категорияларга тез жана оңой классификациялоого мүмкүндүк берет. Талдоо жүргүзүүдө сиз кандайдыр бир конкреттүү ыкманы колдоно аласыз. Атап айтканда, көп мүчөлүү регрессия универсалдуу. Бирок, адистер жогоруда айтылган бардык ыкмаларды айкалыштырып колдонууну сунуштайт. Бул бул учурда моделдин сапаты бир кыйла жогору боло тургандыгы менен байланыштуу. Бул өз кезегинде анын колдонуу чөйрөсүн кеңейтет.

Сунушталууда: