Гипотеза тестирлөө статистикада зарыл процедура. Гипотеза тести үлгү маалыматтары кайсы билдирүүнү эң жакшы колдой турганын аныктоо үчүн бири-бирин жокко чыгарган эки билдирүүнү баалайт. Табылды статистикалык жактан маанилүү деп айтса, ал гипотеза тестине байланыштуу.
Текшерүү ыкмалары
Статистикалык гипотезаларды текшерүү ыкмалары статистикалык анализдин ыкмалары болуп саналат. Эреже катары, статистиканын эки топтому салыштырылат, же тандалып алынган маалымат топтому идеалдаштырылган моделдин синтетикалык маалымат топтому менен салыштырылат. Маалыматтар жаңы маанилерди кошо тургандай чечмеленүүгө тийиш. Сиз аларды акыркы натыйжанын белгилүү структурасын кабыл алуу жана статистикалык ыкмаларды колдонуу менен чечмелей аласыз, бул божомолду ырастоо же четке кагуу. Болжолдоо гипотеза, ал эми бул максатта колдонулган статистикалык тесттер статистикалык гипотеза деп аталат.
H0 жана H1 гипотезалары
Эки негизги нерсе баргипотезаларды статистикалык текшерүү түшүнүктөрү - "негизги, же нөлдүк гипотеза" жана "альтернативдик гипотеза" деп аталган. Алар ошондой эле Нейман-Пирсон гипотезалары деп аталат. Статистикалык тесттин болжолу нөлдүк гипотеза, негизги гипотеза же кыскача Н0 деп аталат. Ал көбүнчө демейки божомол же эч нерсе өзгөргөн жок деген божомол деп аталат. Сыноо болжолунун бузулушу көбүнчө биринчи гипотеза, альтернативдүү гипотеза же H1 деп аталат. H1 башка гипотезанын стенографиясы, анткени биз ал жөнүндө H0 дайындарын жокко чыгарууга болорун билебиз.
Нөл гипотезаны четке кагуудан же четке кагуудан мурун, тесттин жыйынтыгын чечмелөө керек. Салыштыруу статистикалык жактан маанилүү деп эсептелинет, эгерде маалыматтар топтомдорунун ортосундагы байланыш босого ыктымалдуулукка - маанилик деңгээлге ылайык нөлдүк гипотезанын ишке ашырылышы күмөндүү болсо. Статистикалык гипотезаны текшерүү үчүн ылайыктуу критерийлер да бар. Бул белгисиз бөлүштүрүүнүн болжолдуу мыйзамы менен байланышкан гипотезаны текшерүү критерийинин аталышы. Бул эмпирикалык жана теориялык бөлүштүрүүнүн ортосундагы карама-каршылыктын сандык көрсөткүчү.
Статистикалык гипотезаларды текшерүүнүн тартиби жана критерийлери
Кеңири таралган гипотеза тандоо ыкмалары Акайке маалымат критерийине же Байес коэффициентине негизделген. Статистикалык гипотеза тестирлөө эки түрү көрүнүктүү айырмачылыктарга ээ болсо да, тыянак чыгарууда да, Байездик корутундуда да негизги ыкма болуп саналат. Статистикалык гипотеза тесттеритуура эмес дефолт же нөл гипотеза боюнча жаңылыш чечим кабыл алуу ыктымалдыгын көзөмөлдөгөн процедураны аныктоо. Процедура анын иштөө ыктымалдуулугуна негизделет. Бул туура эмес чечим чыгаруу ыктымалдыгы нөлдүк гипотезанын чын болушунун жана өзгөчө альтернативалуу гипотезанын жок болушунун ыктымалсыздыгы болуп саналат. Тест анын чын же жалган экенин көрсөтө албайт.
Чечимдер теориясынын альтернативалуу ыкмалары
Чечим теориясынын альтернативалуу ыкмалары бар, мында нөл жана биринчи гипотезалар бирдей негизде каралат. Башка чечимдерди кабыл алуу ыкмалары, мисалы, Байес теориясы, бир нөлдүк гипотезага көңүл бурбастан, бардык мүмкүнчүлүктөр боюнча жаман чечимдердин кесепеттерин тең салмактоого аракет кылат. Гипотезалардын кайсынысы туура экендигин аныктоонун бир катар башка жолдору маалыматтарга негизделген, алардын кайсынысы каалаган касиеттерге ээ. Бирок гипотеза тестирлөө илимдин көптөгөн тармактарында маалыматтарды талдоодо үстөмдүк кылуучу ыкма болуп саналат.
Статистикалык гипотезаны текшерүү
Натыйжалардын бир топтому башка топтомдон айырмаланган сайын, статистикалык гипотезаны текшерүүгө же статистикалык гипотеза тесттерине таянуу керек. Алардын чечмелөө p-баалуулуктарды жана критикалык баалуулуктарды туура түшүнүүнү талап кылат. Маанилүүлүктүн деңгээлине карабастан, тесттер дагы эле каталарды камтышы мүмкүн экенин түшүнүү да маанилүү. Демек, корутунду туура эмес болушу мүмкүн.
Тест процесси төмөнкүлөрдөн туратбир нече кадам:
- Изилдөө үчүн баштапкы гипотеза түзүлүүдө.
- Тиешелүү нөл жана альтернативалуу гипотезалар көрсөтүлгөн.
- Сыноодогу үлгү жөнүндө статистикалык божомолдорду түшүндүрөт.
- Кайсы тест ылайыктуу экенин аныктоо.
- Нөл гипотеза четке кага турган маанилүүлүк деңгээлин жана ыктымалдык босогосун тандаңыз.
- Нөл гипотеза сыноо статистикасынын бөлүштүрүлүшү нөлдүк гипотеза четке кагылган мүмкүн болгон маанилерди көрсөтөт.
- Эсептөө жүрүп жатат.
- Нөл гипотезаны четке кагуу же альтернатива үчүн кабыл алуу чечими кабыл алынат.
P-маанисин колдонгон альтернатива бар.
Маанилүүлүк сыноолору
Таза маалымат чечмеленбестен практикалык жактан эч кандай пайдасы жок. Статистикада, маалыматтар жөнүндө суроолорду берүүгө жана натыйжаларды чечмелөөгө келгенде, жооптордун тактыгын же ыктымалдыгын камсыз кылуу үчүн статистикалык ыкмалар колдонулат. Статистикалык гипотезаларды текшерүүдө методдордун бул классы статистикалык тестирлөө же маанилик тесттер деп аталат. «Гипотеза» термини гипотеза жана теориялар изилденген илимий методдорду эске салат. Статистикада гипотеза сынагынын жыйынтыгында берилген болжолдогон сан чыгат. Бул божомолдун чын же бузуу болгонун чечмелөөгө мүмкүндүк берет.
Тесттердин статистикалык чечмелөөсү
Гипотеза тесттериКайсы изилдөө натыйжалары маанилүүлүктүн алдын ала белгиленген деңгээлинде нөлдүк гипотезаны четке кагууга алып келерин аныктоо үчүн колдонулат. Статистикалык гипотеза тестинин натыйжалары анын үстүндө иш улана тургандай чечмеленүүгө тийиш. Статистикалык гипотезаны текшерүү критерийлеринин эки жалпы түрү бар. Бул p-маани жана критикалык баалуулуктар. Тандалган критерийге жараша, алынган натыйжалар башкача чечмелениши керек.
P-маани деген эмне
Чыгуу p-маанисин чечмелөөдө статистикалык маанилүү деп сүрөттөлөт. Чынында, бул көрсөткүч нөлдүк гипотеза четке кагылган болсо, ката ыктымалдыгын билдирет. Башка сөз менен айтканда, ал тесттин натыйжасын чечмелөө же сандык аныктоо үчүн колдонула турган маанини атоо үчүн жана нөлдүк гипотезаны четке кагуудагы ката ыктымалдыгын аныктоо үчүн колдонулушу мүмкүн. Мисалы, сиз берилиштердин үлгүсү боюнча нормалдуулук сынагын аткарып, чектен чыгуу мүмкүнчүлүгү аз экенин таба аласыз. Бирок, нөлдүк гипотеза четке кагылышы керек эмес. Статистикалык гипотеза сыноо p-баасын кайтарышы мүмкүн. Бул p маанисин маанилик деңгээли деп аталган алдын ала белгиленген чектик мааниге салыштыруу аркылуу жасалат.
Маанилүүлүк деңгээли
Маанилүүлүк деңгээли көбүнчө гректин кичине тамгасы "альфа" менен жазылат. Alpha үчүн колдонулган жалпы маани 5% же 0,05. Кичирээк альфа мааниси нөлдүк гипотезанын ишенимдүү чечмелөөнү сунуштайт. p-мааниси менен салыштырылаталдын ала тандалган альфа мааниси. Эгерде p-маани альфадан аз болсо, натыйжа статистикалык жактан маанилүү болот. Маанилүүлүк деңгээлин бирден кемитүү менен тескери алса болот. Бул байкалган үлгү маалыматтарын эске алуу менен гипотезанын ишеним деңгээлин аныктоо үчүн жасалат. Статистикалык гипотезаларды текшерүүнүн бул ыкмасын колдонууда Р-баалыгы ыктымалдык болуп саналат. Бул статистикалык тесттин жыйынтыгын чечмелөө процессинде эмненин чын же жалган экенин билбейт дегенди билдирет.
Статистикалык гипотезаны текшерүү теориясы
Нөл гипотезаны четке кагуу анын ыктымалдуу көрүнгөнүнө жетиштүү статистикалык далилдер бар экенин билдирет. Болбосо, аны четке кагууга статистика жетишсиз дегенди билдирет. Статистикалык тесттер жөнүндө нөл гипотезаны четке кагуу жана кабыл алуу дихотомиясы боюнча ойлонсо болот. Нөл гипотезаны статистикалык текшерүүнүн коркунучу, эгерде кабыл алынса, ал чындык болуп көрүнүшү мүмкүн. Анын ордуна, нөлдүк гипотеза четке кагылбайт деп айтуу туурараак болот, анткени аны четке кагуу үчүн жетиштүү статистикалык далилдер жок.
Бул көз ирмем көп учурда башталгыч кошумчаларды чаташтырат. Мындай учурда, натыйжа ыктымалдуу экенин жана нөлдүк гипотезаны кабыл алуу дагы деле катага азыраак мүмкүнчүлүк берерин эскертип коюу керек.
Чын же жалган нөл гипотеза
p маанисин чечмелөө нөл дегенди билдирбейтгипотеза чын же жалган. Бул эмпирикалык маалыматтардын жана тандалган статистикалык тесттин негизинде статистикалык маанинин белгилүү деңгээлинде нөлдүк гипотезаны четке кагуу же четке кагуу тандоосу жасалганын билдирет. Ошондуктан, p-маанисин статистикалык тесттерге камтылган алдын ала аныкталган божомол боюнча берилген маалыматтардын ыктымалдыгы катары кароого болот. p-мааниси нөлдүк гипотеза чын болсо, берилиштер үлгүсү канчалык деңгээлде байкалаарынын өлчөмү.
Критикалык баалуулуктарды чечмелөө
Кээ бир сыноолор кайтарылбайт б. Анын ордуна, алар критикалык баалуулуктардын тизмесин кайтарып бериши мүмкүн. Мындай изилдөөнүн натыйжалары да ушундай жол менен чечмеленет. Маанилүүлүктүн алдын ала аныкталган деңгээли менен бир гана p-бааны салыштыруунун ордуна, тест статистикасы критикалык мааниге салыштырылат. Эгерде ал азыраак болуп чыкса, анда нөлдүк гипотезаны четке кагуу мүмкүн болгон жок дегенди билдирет. Эгерде андан чоң же барабар болсо, нөлдүк гипотеза четке кагылышы керек. Статистикалык гипотезаны текшерүү алгоритминин мааниси жана анын натыйжасын чечмелөө p-маанисине окшош. Тандалган маанилүүлүк деңгээли – берилиштер берилген базалык тесттик божомолду четке кагуу же четке кагуу үчүн ыктымалдык чечим.
Статистикалык тесттердеги каталар
Статистикалык гипотеза тестинин чечмелөө ыктымалдык. Статистикалык гипотезаларды текшерүү милдети туура же жалган билдирүүнү табуу эмес. Сыноо далилдери ката болушу мүмкүн. Мисалы, альфа 5% болсо, бул көпчүлүк бөлүгү 20дан 1 экенин билдиретнөл гипотеза ката менен четке кагылат. Же бул маалымат үлгүсүндөгү статистикалык ызы-чуудан улам болбойт. Бул пунктту эске алуу менен, нөлдүк гипотезаны четке кагуу үчүн кичинекей p мааниси анын жалган экенин же ката кетирилгенин билдириши мүмкүн. Эгер катанын бул түрү жасалса, натыйжа жалган оң деп аталат. Жана мындай ката статистикалык гипотезаларды текшерүүдө биринчи түрдөгү ката болуп саналат. Башка жагынан алганда, эгерде p-мааниси нөлдүк гипотезаны четке кагуу үчүн жетиштүү чоң болсо, бул анын чын экенин билдире алат. Же туура эмес, жана ката кетирилген кандайдыр бир күмөндүү окуя болгон. Катанын бул түрү жалган терс деп аталат.
Каталардын ыктымалдыгы
Статистикалык гипотезаларды сынап жатканда, каталардын бул түрлөрүн жасоо мүмкүнчүлүгү дагы эле бар. Жалган маалыматтар же жалган корутундулар болушу мүмкүн. Идеалында, бул каталардын биринин ыктымалдыгын азайткан маанилүүлүк деңгээли тандалышы керек. Мисалы, нөлдүк гипотезалардын статистикалык текшерүүсү өтө төмөн мааниге ээ болушу мүмкүн. 0,05 жана 0,01 сыяктуу маанилик даражалары илимдин көптөгөн тармактарында кеңири таралганы менен, эң көп колдонулган маанилүүлүк деңгээли 310^-7 же 0,0000003. Ал көбүнчө “5-сигма” деп аталат. Бул эксперименттердин 3,5 миллион көз карандысыз кайталанышынын 1 ыктымалдыгы менен корутунду кокустук болгонун билдирет. Статистикалык гипотезаларды текшерүү мисалдары көбүнчө ушундай каталарды камтыйт. Бул да көз карандысыз натыйжаларга ээ болуу маанилүү себеби болуп саналат.текшерүү.
Статистикалык текшерүүнү колдонуу мисалдары
Практикада гипотезаны текшерүүнүн бир нече кеңири таралган мисалдары бар. Эң популярдуулардын бири "Чайдын даамын татуу" деп аталат. Биометриканын негиздөөчүсү Роберт Фишердин кесиптеши, доктор Мюриэль Бристоль ал биринчи жолу чайга же сүткө кошулганын так айта алат деп ырастады. Фишер ага сегиз чөйчөктү (ар бир сорттон төрттөн) туш келди берүүнү сунуштады. Сынактын статистикасы жөнөкөй эле: чөйчөктү тандоодогу ийгиликтердин санын эсептөө. Критикалык аймак, балким, кадимки ыктымалдык критерийинин негизинде (< 5%; 70те 1 ≈ 1,4%), 4 ичинен жалгыз ийгилик болду. Фишер альтернативалуу гипотеза талап кылынбайт деп ырастады. Айым ар бир чөйчөктү туура аныктаган, бул статистикалык жактан маанилүү жыйынтык деп эсептелген. Бул тажрыйба Фишердин "Изилдөөчүлөр үчүн статистикалык методдор" китебине алып келди.
Айыпталуучунун мисалы
Статистикалык соттук териштирүүнүн жол-жобосу соттолуучунун күнөөсү далилденмейинче күнөөсүз деп эсептелген жазык сотуна салыштырууга болот. Прокурор соттолуучунун күнөөсүн далилдөөгө аракет кылат. Айыптоо үчүн жетиштүү далилдер болгондо гана соттолуучу күнөөлүү деп табылышы мүмкүн. Процедуранын башында “Соттолуучу күнөөлүү эмес” жана “Соттолуучу күнөөлүү” деген эки гипотеза бар. Күнөөсүздүк гипотезасынан ката кетирүү ыктымалы аз болгондо гана четке кагылышы мүмкүн, анткени адам күнөөсүз соттолуучуну соттогусу келбейт. Мындай ката I типтеги ката деп аталат жана анын пайда болушусейрек көзөмөлдөнөт. Мындай ассиметриялык жүрүм-турумдун натыйжасында II типтеги ката, башкача айтканда, кылмышкерди актоо кеңири таралган.
Статистика чоң көлөмдөгү маалыматтарды талдоодо пайдалуу. Бул илимий теория жок болсо да тыянактарды актай ала турган гипотезаларды текшерүүгө да тиешелүү. Чайдын даамын татып көрүү мисалында сүттү чайга куюунун же сүткө чай куюунун ортосунда эч кандай айырма жок экени "ачык эле" көрүнүп турду.
Гипотезаларды текшерүүнүн реалдуу практикалык колдонулушу төмөнкүлөрдү камтыйт:
- эркектер аялдарга караганда көбүрөөк жаман түш көрөрүн текшерүү;
- документтин атрибуту;
- Толук айдын жүрүм-турумуна таасирин баалоо;
- жарганат жаңырык аркылуу курт-кумурсканы таба ала турган диапазонду аныктоо;
- тамекини таштоонун эң жакшы жолун тандоо;
- Бампер чаптамалары унаа ээсинин жүрүм-турумун чагылдырабы же жокпу текшерилүүдө.
Статистикалык гипотезаны текшерүү жалпы статистикада жана статистикалык жыйынтык чыгарууда маанилүү роль ойнойт. Нарктык тестирлөө илимий методдун өзөгүндө болжолдонгон маанини жана эксперименттик натыйжаны салттуу салыштыруунун ордуна колдонулат. Теория мамилелердин белгисин алдын ала айтууга гана жөндөмдүү болгондо, багытталган гипотеза тесттери теорияны статистикалык маанилүү жыйынтык гана колдой тургандай конфигурацияланышы мүмкүн. Баалоо теориясынын бул формасы эң катаалгипотеза тестинин колдонулушун сынга алуу.