Статистикалык маалымат: чогултуу, иштетүү, талдоо

Мазмуну:

Статистикалык маалымат: чогултуу, иштетүү, талдоо
Статистикалык маалымат: чогултуу, иштетүү, талдоо
Anonim

Статистиканын бүткүл тарыхында өлчөө деңгээлдеринин таксономиясын түзүүгө ар кандай аракеттер жасалган. Психофизик Стэнли Смит Стивенс номиналдык, иреттик, интервалдык жана пропорционалдык шкалаларды аныктаган.

Номиналдык өлчөөлөрдүн маанилер арасында даражалардын олуттуу тартиби жок жана бирден-бир конверсияга мүмкүндүк берет.

Кадимки өлчөмдөрдө ырааттуу маанилердин ортосунда так айырмачылыктар бар, бирок ал маанилердин белгилүү бир тартиби бар жана тартипти сактоочу трансформацияга жол берет.

Интервалдык өлчөөлөрдүн чекиттердин ортосундагы маанилүү аралыктары бар, бирок нөл мааниси ыктыярдуу (узундук менен температураны Цельсий же Фаренгейт боюнча өлчөөлөрдөгүдөй) жана ар кандай сызыктуу трансформацияга мүмкүндүк берет.

Катыштын өлчөмдөрү нөлдүк мааниге да, ар кандай өлчөмдөрдүн ортосундагы аралыктарга да ээ жана бардык масштабдуу трансформацияга мүмкүндүк берет.

Image
Image

Өзгөрмөлөр жана маалыматтын классификациясы

Анткени өзгөрмөлөрноминалдык же иреттик өлчөөлөргө гана туура келген сандык өлчөө мүмкүн эмес жана кээде категориялык өзгөрмөлөр катары топтолот. Катыш жана интервалдык өлчөөлөр сандык мүнөздөгү улам дискреттик же үзгүлтүксүз болушу мүмкүн болгон сандык өзгөрмөлөр катары топтоштурулган. Мындай айырмачылыктар көбүнчө информатика илиминде берилиштердин түрү менен тыгыз байланышта болот, анткени дихотомиялык категориялык өзгөрмөлөр логикалык маанилер, интегралдык маалымат түрүндөгү ыктыярдуу бүтүн сандары бар политомдук категориялык өзгөрмөлөр жана калкыма чекиттерди эсептөөнү камтыган реалдуу компоненттери бар үзгүлтүксүз өзгөрмөлөр менен көрсөтүлүшү мүмкүн. Бирок статистикалык маалымат түрлөрүн көрсөтүү кайсы классификация колдонулганына жараша болот.

Жумушчулар боюнча статистикалык маалымат
Жумушчулар боюнча статистикалык маалымат

Башка классификациялар

Статистикалык маалыматтардын (маалыматтын) башка классификациялары да түзүлдү. Мисалы, Мостеллер жана Тукей класстарды, даражаларды, саналган үлүштөрдү, сандарды, суммаларды жана баланстарды айырмалаган. Нелдер бир убакта үзгүлтүксүз эсептөөлөрдү, үзгүлтүксүз катыштарды, санактын корреляциясын жана маалыматтарды берүүнүн категориялык жолдорун сүрөттөгөн. Бул классификациянын бардык ыкмалары статистикалык маалыматты чогултууда колдонулат.

Көйгөйлөр

Ар кандай өлчөө (жыйноо) процедуралары аркылуу алынган маалыматтарга статистикалык ыкмалардын ар кандай түрлөрүн колдонуу туурабы деген суроо өзгөрмөлөрдү конвертациялоого жана суроолорду так чечмелөөгө байланышкан маселелер менен татаалдашат.изилдөө. Маалыматтар менен ал сүрөттөлгөн нерселердин ортосундагы байланыш жөн гана статистикалык билдирүүлөрдүн айрым түрлөрү белгилүү бир трансформацияларда инвариант болбогон чындык баалуулуктарына ээ болушу мүмкүн экендигин чагылдырат. Трансформацияны карап чыгуу керекпи же жокпу, сиз жооп берүүгө аракет кылып жаткан сурооңуздан көз каранды.

Статистикалык маалыматтын мисалы
Статистикалык маалыматтын мисалы

Дайындардын түрү деген эмне

Маалымат түрү өзгөрмөнүн семантикалык мазмунунун негизги компоненти болуп саналат жана өзгөрмөнү, ага уруксат берилген операцияларды, аны болжолдоо үчүн колдонулган регрессиялык анализдин түрүн сүрөттөө үчүн логикалык жактан кандай ыктымалдык бөлүштүрүүнү колдонсо болорун көзөмөлдөйт., ж.б. Маалымат түрүнүн концепциясы өлчөө деңгээли түшүнүгү боюнча окшош, бирок конкреттүү - мисалы, маалыматтарды эсептөө терс эмес реалдуу маанилерге караганда башка бөлүштүрүүнү (Пуассон же биномдук) талап кылат, бирок экөө тең бирдей өлчөө деңгээли (коэффицент шкаласы).

Судьялар боюнча статистикалык маалымат
Судьялар боюнча статистикалык маалымат

Таразалар

Статистикалык маалыматты иштетүү үчүн өлчөө деңгээлдеринин таксономиясын түзүүгө ар кандай аракеттер жасалды. Психофизик Стэнли Смит Стивенс номиналдык, иреттик, интервалдык жана пропорционалдык шкалаларды аныктаган. Номиналдуу өлчөөлөр баалуулуктар арасында даражалардын олуттуу тартибине ээ эмес жана бирден-бир конверсияга мүмкүндүк берет. Кадимки өлчөөлөр ырааттуу маанилердин ортосунда так эмес айырмачылыктарга ээ, бирок ошол маанилердин олуттуу тартибинде айырмаланат жанакандайдыр бир тартипти сактоо трансформация. Интервалдык өлчөөлөр өлчөөлөрдүн ортосундагы маанилүү аралыктарга ээ, бирок нөлдүк маани ыктыярдуу (узундукту жана температураны Цельсий же Фаренгейт боюнча өлчөөлөрдөгүдөй) жана ар кандай сызыктуу трансформацияга мүмкүндүк берет. Катыштын өлчөмдөрү маанилүү нөлдүк мааниге жана ар кандай аныкталган өлчөмдөрдүн ортосундагы аралыктарга ээ жана бардык масштабдуу трансформацияга мүмкүндүк берет.

Диаграмма модели
Диаграмма модели

Бир санды колдонуу менен сыпаттоо мүмкүн болбогон маалыматтар көбүнчө чыныгы кокус чоңдуктардын кокус векторлоруна кирет, бирок аларды өзүңүз иштетүү тенденциясы өсүп жатат. Мындай мисалдар төмөндө талкууланат.

Кокус векторлор

Жеке элементтердин бири-бирине байланышы жок болушу мүмкүн. Корреляцияланган кокус векторлорду сүрөттөө үчүн колдонулган бөлүштүрүүнүн мисалдары көп өзгөрмөлүү нормалдуу бөлүштүрүү жана көп өзгөрмөлүү t-бөлүштүрүү болуп саналат. Жалпысынан алганда, ар кандай элементтердин ортосунда ыктыярдуу корреляциялар болушу мүмкүн, бирок бул көп учурда белгилүү бир өлчөмдөн жогору башкарууга мүмкүн эмес болуп калат жана корреляцияланган компоненттерге кошумча чектөөлөрдү талап кылат.

статистикалык атрибуттар
статистикалык атрибуттар

Кокус матрицалар

Кокус матрицаларды сызыктуу жайгаштырып, кокус векторлор катары кароого болот, бирок бул ар кандай элементтердин ортосундагы корреляцияны көрсөтүүнүн эффективдүү жолу болбошу мүмкүн. Кээ бир ыктымалдык бөлүштүрүү кадимки матрица сыяктуу кокус матрицалар үчүн атайын иштелип чыкканбөлүштүрүү жана Wishart бөлүштүрүү.

Кокус ырааттуулук

Кээде алар кокус векторлор менен бирдей каралат, бирок башка учурларда бул термин ар бир кокустук чоңдук жакынкы өзгөрмөлөр менен гана корреляцияланган учурларга карата колдонулат (Марковдун моделиндегидей). Бул Bayesian тармагынын өзгөчө учуру жана ген чынжырлары же узун тексттик документтер сыяктуу өтө узун тизмектер үчүн колдонулат. Бир катар моделдер жашыруун Марков ырааттуулугу сыяктуу ырааттуулуктар үчүн атайын иштелип чыккан.

Типтүү диаграмма
Типтүү диаграмма

Кокус процесс

Алар кокус ырааттуулуктарга окшош, бирок ырааттуулуктун узундугу чексиз же чексиз болгондо гана жана ырааттуулуктагы элементтер бирден иштетилгенде. Бул көп учурда убакыт сериясы катары сүрөттөлгөн маалыматтар үчүн колдонулат. Бул, мисалы, кийинки күндөгү акциянын баасына келгенде туура болот.

Тыянак

Статистикалык маалыматты талдоо толугу менен аны чогултуунун сапатына көз каранды. Акыркысы, өз кезегинде, аны классификациялоонун мүмкүнчүлүктөрү менен тыгыз байланышта. Албетте, статистикалык маалыматты классификациялоонун көптөгөн түрлөрү бар, аларды окурман бул макаланы окуп жатканда көрө алган. Ошого карабастан, эффективдүү инструменттердин болушу жана математиканы жакшы билүү, ошондой эле социология жаатындагы билим, каталарды олуттуу оңдоосуз каалаган сурамжылоону же изилдөөнү жүргүзүүгө мүмкүндүк берет. Формада статистикалык маалыматтын булактарыадамдар, уюмдар жана социологиянын башка предметтери, бактыга жараша, абдан көп чагылдырылган. Чыныгы изилдөөчүнүн жолунда эч кандай кыйынчылык тоскоол боло албайт.

Сунушталууда: