Статистикалык моделдөө: методдор, сүрөттөмө, колдонуу

Мазмуну:

Статистикалык моделдөө: методдор, сүрөттөмө, колдонуу
Статистикалык моделдөө: методдор, сүрөттөмө, колдонуу
Anonim

Статистикалык моделдөөдө камтылган божомолдор ыктымалдык бөлүштүрүүнүн жыйындысын сүрөттөйт, алардын кээ бирлери бөлүштүрүүнү адекваттуу болжолдойт деп болжолдонот. Белгилүү бир маалымат топтому аныктамадан тандалып алынат. Статистикалык моделдерге мүнөздүү болгон ыктымалдык бөлүштүрүүлөр статистикалык моделдерди башка, статистикалык эмес, математикалык моделдерден айырмалап турат.

Image
Image

Математика менен байланыш

Бул илимий ыкма биринчи кезекте математикага негизделген. Системаларды статистикалык моделдөө, адатта, бир же бир нече кокустук чоңдуктарды жана мүмкүн башка кокустук эмес чоңдуктарды байланыштырган математикалык теңдемелер аркылуу берилет. Ошентип, статистикалык модель "теориянын формалдуу чагылдырылышы" болуп саналат (Герман Адер, Кеннет Болленден цитата келтирген).

Бардык статистикалык гипотеза тесттери жана бардык статистикалык баа статистикалык моделдерден алынган. Жалпысынан статистикалык моделдер статистикалык корутундунун негизинин бир бөлүгү болуп саналат.

Статистикалык методдормоделдөө

Формалдуу эмес, статистикалык моделди белгилүү бир касиетке ээ болгон статистикалык божомол (же статистикалык болжолдоолордун жыйындысы) катары кароого болот: бул божомол кандайдыр бир окуянын ыктымалдыгын эсептөөгө мүмкүндүк берет. Мисал катары, кадимки алты жактуу сөөктөрдү карап көрөлү. Биз сөөк жөнүндө эки башка статистикалык божомолду изилдейбиз.

Биринчи статистикалык божомол статистикалык моделди түзөт, анткени бир гана божомол менен биз кандайдыр бир окуянын ыктымалдыгын эсептей алабыз. Альтернативалуу статистикалык божомол статистикалык моделди түзбөйт, анткени бир гана божомол менен биз ар бир окуянын ыктымалдыгын эсептей албайбыз.

Типтүү статистикалык модель
Типтүү статистикалык модель

Биринчи божомол менен жогорудагы мисалда окуянын ыктымалдыгын эсептөө оңой. Бирок, кээ бир башка мисалдарда, эсептөө татаал же ал тургай мүмкүн эмес болушу мүмкүн (мисалы, миллиондогон жылдык эсептөөнү талап кылышы мүмкүн). Статистикалык моделди түзгөн божомол үчүн бул кыйынчылык алгылыктуу: эсептөөнү аткаруу практикалык жактан мүмкүн болушу шарт эмес, жөн гана теориялык жактан мүмкүн.

Моделдердин мисалдары

Бизде балдары бирдей бөлүштүрүлгөн мектеп окуучуларынын саны бар дейли. Баланын бою стохастикалык түрдө жашына байланыштуу болот: мисалы, баланын 7 жашта экенин билгенде, бул баланын боюнун 5 фут (болжол менен 152 см) болушу ыктымалдыгына таасир этет. Бул мамилени сызыктуу регрессия моделинде формалдаштырсак болот, мисалы: өсүү=b0 + b1agei+ εi, мында b0 - кесилишет, b1 - өсүү болжолун алууда жаш көбөйтүлгөн параметр, εi - ката мөөнөтү. Бул бойдун жашы боюнча кандайдыр бир ката менен алдын ала айтылганын билдирет.

Жарактуу модель бардык маалымат чекиттерине дал келиши керек. Демек, түз сызык (heighti=b0 + b1agei) маалымат модели үчүн теңдеме боло албайт - эгерде ал бардык маалымат чекиттерине туура келбесе, б.а. бардык маалымат чекиттери сызыкта кемчиликсиз жатпаса. Моделдин бардык маалымат чекиттерине туура келиши үчүн εi ката термини теңдемеге кошулушу керек.

гендердик статистика
гендердик статистика

Статистикалык тыянак чыгаруу үчүн, адегенде εi үчүн кээ бир ыктымалдык бөлүштүрүүнү кабыл алышыбыз керек. Мисалы, биз εi бөлүштүрүлүшү нөл орточо менен Гаусс деп болжолдоого болот. Бул учурда, модель 3 параметрге ээ болот: b0, b1 жана Гаусс бөлүштүрүүнүн дисперсиясы.

Жалпы сүрөттөмө

Статистикалык модель – математикалык моделдин өзгөчө классы. Статистикалык моделди башка математикалык моделдерден айырмалоочу нерсе анын детерминистикалык эместигинде. Ал статистикалык маалыматтарды моделдөө үчүн колдонулат. Ошентип, математикалык теңдемелер менен аныкталган статистикалык моделде кээ бир өзгөрмөлөр конкреттүү маанилерге ээ эмес, анын ордуна ыктымалдык бөлүштүрүүгө ээ; башкача айтканда, кээ бир өзгөрмөлөр стохастикалык болуп саналат. Жогорудагы мисалда ε стохастикалык өзгөрмө; бул өзгөрмө жок, модель болгондетерминисттик болмок.

Статистикалык моделдер көбүнчө статистикалык талдоодо жана моделдөөдө колдонулат, атүгүл моделделип жаткан физикалык процесс детерминисттик болсо да. Мисалы, монеталарды ыргытуу принципиалдуу түрдө детерминисттик процесс; бирок ал адатта стохастикалык катары моделделет (Бернулли процесси аркылуу).

жылытуу статистикасы
жылытуу статистикасы

Параметрдик моделдер

Параметрикалык моделдер эң көп колдонулган статистикалык моделдер. Жарым параметрлик жана параметрлик эмес моделдер тууралуу сэр Дэвид Кокс мындай деди: "Алар жалпысынан бөлүштүрүүнүн түзүмү жана формасы жөнүндө азыраак божомолдорду камтыйт, бирок, адатта, күчтүү көз карандысыздык божомолдорун камтыйт." Башка бардык айтылган моделдер сыяктуу эле, алар математикалык моделдөөнүн статистикалык методунда да көп колдонулат.

Көп деңгээлдүү моделдер

Көп деңгээлдүү моделдер (иерархиялык сызыктуу моделдер, уяланган маалымат моделдери, аралаш моделдер, кокустук коэффициенттер, кокус эффекттердин моделдери, кокустук параметр моделдери же бөлүнгөн моделдер катары да белгилүү) бирден ашык деңгээлде өзгөргөн статистикалык параметр моделдери. Мисал катары жеке окуучулар үчүн көрсөткүчтөрдү, ошондой эле студенттер топтоштурулган класстар үчүн көрсөткүчтөрдү камтыган окуучунун жетишкендик модели саналат. Бул моделдерди сызыктуу моделдердин жалпылоосу катары кароого болот (атап айтканда, сызыктуу регрессия), бирок аларды сызыктуу эмес моделдерге да жайылтууга болот. Бул моделдер болуп калдыЖетиштүү эсептөө күчү жана программалык камсыздоо жеткиликтүү болгондон кийин, алда канча популярдуу болуп калды.

Сегменттик статистика
Сегменттик статистика

Көп деңгээлдүү моделдер өзгөчө катышуучулар үчүн маалыматтар бирден ашык деңгээлде уюштурулган изилдөө долбоорлоруна ылайыктуу (б.а., уяланган маалыматтар). Талдоо бирдиктери, адатта, контексттин/агрегаттык бирдиктердин (жогорку деңгээлде) ичинде жайгашкан индивиддер (төмөнкү деңгээлде) болуп саналат. Көп деңгээлдүү моделдердеги маалыматтардын эң төмөнкү деңгээли, адатта, индивидуалдуу болсо да, индивиддердин кайталанган өлчөөлөрү да каралышы мүмкүн. Ошентип, көп деңгээлдүү моделдер бир же көп өзгөрмөлүү кайталануучу өлчөөлөрдү талдоо үчүн альтернативдүү анализ түрүн камсыз кылат. өсүү ийри жеке айырмачылыктар каралышы мүмкүн. Кошумчалай кетсек, көп деңгээлдүү моделдер ANCOVAга альтернатива катары колдонулушу мүмкүн, мында көз каранды өзгөрмө баллдары дарылоонун айырмасын текшерүүдөн мурун ковариаттар үчүн (мисалы, жеке айырмачылыктар) туураланат. Көп деңгээлдүү моделдер бул эксперименттерди ANCOVA талап кылган бирдиктүү регрессиялык эңкейиштерсиз талдай алат.

Көп деңгээлдүү моделдер көп деңгээлдеги маалыматтар үчүн колдонулушу мүмкүн, бирок эки деңгээлдүү моделдер эң кеңири таралган жана бул макаланын калган бөлүгү ушуларга багытталган. Көз каранды өзгөрмө анализдин эң төмөнкү деңгээлинде каралышы керек.

Атмосфералык басымдын графиги
Атмосфералык басымдын графиги

Модель тандоо

Модел тандоостатистикалык моделдөөнүн алкагында жүргүзүлүүчү маалыматтар берилген талапкер моделдердин жыйындысынан тандоо милдети. Жөнөкөй учурларда, мурунтан эле бар маалымат топтому каралат. Бирок, тапшырма ошондой эле чогултулган маалыматтар моделди тандоо тапшырмасына ылайыктуу болушу үчүн эксперименттерди долбоорлоону камтышы мүмкүн. Окшош болжолдоочу же түшүндүрүүчү күчкө ээ талапкер моделдерин эске алганда, эң жөнөкөй модель эң жакшы тандоо болушу мүмкүн (Оккам устарасы).

Кониши & Китагава мындай дейт: "Статистикалык тыянак көйгөйлөрүнүн көбүн статистикалык моделдөө менен байланышкан көйгөйлөр катары кароого болот." Ошо сыяктуу эле, Кокс мындай деди: "Статистикалык моделге предметтин которулушу көбүнчө анализдин эң маанилүү бөлүгү болуп саналат."

Моделди тандоо, ошондой эле белгисиздикте чечим чыгаруу же оптималдаштыруу максатында эсептөө моделдеринин чоң топтомунан бир нече өкүл моделдерди тандоо көйгөйүнө да кайрылышы мүмкүн.

Графикалык үлгүлөр

Графикалык модель, же ыктымалдык графикалык модель, (PGM) же структураланган ыктымалдык модель, график кокус чоңдуктар ортосундагы шарттуу байланыштын түзүмүн туюндурган ыктымалдык модель. Алар көбүнчө ыктымалдуулук теориясында, статистикада (айрыкча Байес статистикасында) жана машина үйрөнүүдө колдонулат.

График менен статистикалык модель
График менен статистикалык модель

Эконометрикалык моделдер

Эконометрикалык моделдер колдонулган статистикалык моделдерэконометрика. Эконометрикалык модель белгилүү бир экономикалык кубулуш менен байланышкан ар кандай экономикалык чоңдуктардын ортосунда бар деп эсептелген статистикалык байланыштарды аныктайт. Эконометрикалык модель белгисиздикти эске алган детерминисттик экономикалык моделден же өзү стохастикалык болгон экономикалык моделден алынышы мүмкүн. Бирок, кандайдыр бир экономикалык теорияга байланышпаган эконометрикалык моделдерди да колдонсо болот.

Сунушталууда: