Көп өлчөмдүү масштабдоо: аныктама, максаттар, милдеттер жана мисал

2025 Автор: Angel Austin | [email protected]. Акыркы өзгөртүү: 2025-06-01 07:35

Көп варианттуу масштабдоо (MDS) - маалымат топтомундагы айрым иштердин окшоштук деңгээлин визуалдаштыруу куралы. Бул маалыматты визуализациялоодо, атап айтканда, аралык матрицасында камтылган маалыматты көрсөтүү үчүн колдонулган тиешелүү дайындоо ыкмаларынын жыйындысын билдирет. Бул сызыктуу эмес өлчөмдүүлүктү азайтуунун бир түрү. MDS алгоритми ар бир объектти N-өлчөмдүү мейкиндикке объекттердин ортосундагы аралыктар мүмкүн болушунча жакшыраак сакталгандай кылып жайгаштырууга багытталган. Андан кийин ар бир объектке N өлчөмдүн ар биринде координаттар дайындалат.

MDS диаграммасынын өлчөмдөрүнүн саны 2ден ашышы мүмкүн жана априори көрсөтүлгөн. N=2ди тандоо 2D чачыратуу диаграммасы үчүн объекттин жайгашуусун оптималдаштырат. Көп өлчөмдүү масштабдын мисалдарын макаладагы сүрөттөрдөн көрө аласыз. Орус тилиндеги символдор бар мисалдар өзгөчө иллюстрациялуу.

Эссенция

Көп өлчөмдүү масштабдоо ыкмасы (MMS,MDS) - жоготуу функцияларынын комплекси үчүн оптималдаштыруу процедурасын жалпылоочу классикалык инструменттердин кеңейтилген комплекси жана белгилүү аралыктардын салмагы жана башкалар менен кириш матрицалары. Бул контекстте, пайдалуу жоготуу функциясы стресс деп аталат, ал көбүнчө стрессти чоңойтуу деп аталган процедура менен азайтылат.

Кол

Көп өлчөмдүү масштабдоо үчүн бир нече варианттар бар. MDS программалары чечимди алуу үчүн жүктү автоматтык түрдө азайтат. Метрикалык эмес MDS алгоритминин өзөгүн эки тараптуу оптималдаштыруу процесси түзөт. Биринчиден, оптималдуу монотондук жакындык трансформациясын табуу керек. Экинчиден, конфигурация чекиттери алардын аралыктары масштабдуу жакындык маанилерине мүмкүн болушунча жакын болушу үчүн оптималдуу жайгаштырылышы керек.

Кеңейтүү

Статистикадагы метрикалык көп өлчөмдүү масштабдын кеңейтилиши, мында максаттуу мейкиндик ыктыярдуу жылмакай евклиддик эмес мейкиндик болуп саналат. Бул жерде айырмачылыктар беттеги аралыктар жана максаттуу мейкиндик башка бет. Тематикалык программалар бир беттин экинчи бетине минималдуу бурмаланган тиркемени табууга мүмкүндүк берет.

Кадамдар

Көп өзгөрмөлүү масштабдоону колдонуу менен изилдөө жүргүзүүдө бир нече кадамдар бар:

Маселени түзүү. Кандай өзгөрмөлөрдү салыштыргыңыз келет? Канча өзгөрмөлөрдү салыштыргыңыз келет? Изилдөө кандай максатта колдонулат?
Киргизилген дайындар алынууда. Респонденттерге бир катар суроолор берилет. Продукциянын ар бир түгөйү үчүн алардан окшоштукка баа берүү суралат (көбүнчө 7 баллдык Лайкерт шкаласы боюнча абдан окшоштон абдан окшош эмеске чейин). Биринчи суроо Coca-Cola/Pepsi үчүн болушу мүмкүн, мисалы, кийинкиси сыра үчүн, кийинкиси Dr. Pepper үчүн, ж.б. суроолордун саны бренддердин санына жараша болот.

Альтернативдик ыкмалар

Башка эки ыкма бар. Продукциялар атрибуттарга бөлүнөт жана семантикалык дифференциалдык шкалада бааланат "Кабылдоо маалыматтары: Туунду мамиле" деген техника бар. Дагы бир ыкма респонденттерге окшоштуктар эмес, артыкчылыктар жөнүндө суралган "артыкчылыктар боюнча маалымат ыкмасы".

Ал төмөнкү кадамдардан турат:

MDS статистикалык программасын ишке киргизүү. Процедураны аткаруу үчүн программалык камсыздоо көптөгөн статистикалык программалык пакеттерде бар. Көбүнчө метрикалык MDS (ал интервал же катыш деңгээлинин берилиштери менен алектенет) жана метрикалык эмес MDS (тартиптик берилиштер менен алектенет) ортосунда тандоо бар.
Өлчөөлөрдүн санын аныктоо. Изилдөөчү компьютерде түзгүсү келген өлчөөлөрдүн санын аныкташы керек. Канчалык көп өлчөө болсо, ошончолук статистикалык туура келет, бирок натыйжаларды чечмелөө ошончолук кыйын болот.
Натыйжаларды көрсөтүү жана өлчөөлөрдү аныктоо - статистикалык программа (же тиешелүү модуль) натыйжаларды көрсөтөт. Карта ар бир продуктуну көрсөтөт (көбүнчө 2D).космос). Продукциялардын бири-бирине жакындыгы алардын окшоштугун же кайсы ыкма колдонулганына жараша артыкчылыктарын көрсөтөт. Бирок, өлчөөлөр чындыгында системанын жүрүм-турумунун өлчөөлөрүнө кандайча туура келери дайыма эле ачык боло бербейт. Бул жерде шайкештикти субъективдүү баамдаса болот.
Натыйжалардын ишенимдүүлүгүн жана негиздүүлүгүн текшерүү - MDS процедурасы менен эсепке алынышы мүмкүн болгон масштабдуу берилиштердин дисперсиясынын үлүшүн аныктоо үчүн R-квадратты эсептеңиз. Square R 0,6 минималдуу алгылыктуу деңгээл болуп эсептелет. R квадраты 0,8 метрикалык масштабдоо үчүн жакшы, ал эми 0,9 метрикалык эмес масштабдоо үчүн жакшы деп эсептелет.

Ар кандай сыноолор

Башка мүмкүн болгон тесттер: Крускал тибиндеги стресс-тесттер, бөлүштүрүлгөн маалымат тесттери, берилиштердин туруктуулугунун сыноолору жана ишенимдүүлүк тесттери. Сынактын жыйынтыгы тууралуу толук жазыңыз. Картага түшүрүү менен бирге, жок эле дегенде, аралыктын өлчөмү (мисалы, Соренсон индекси, Жаккар индекси) жана ишенимдүүлүк (мисалы, стресс мааниси) көрсөтүлүшү керек.

Ошондой эле алгоритмди (мисалы, Kruskal, Mather) берүү абдан жакшы болот, ал көп учурда колдонулган программа менен аныкталат (кээде алгоритм отчетун алмаштырат), эгерде сиз баштапкы конфигурацияны берген болсоңуз же кокусунан тандап алган болсоңуз, анда сан өлчөмдөрдүн чуркоолору, Монте-Карло натыйжалары, итерациялардын саны, туруктуулук упайы жана ар бир октун пропорционалдык дисперсиясы (r-квадрат).

Визуалдык маалымат жана маалыматтарды талдоо ыкмасыкөп өлчөмдүү масштабдоо

Маалыматтын визуализациясы - адамдын таанып-билүүсүн өркүндөтүү үчүн абстрактуу маалыматтардын интерактивдүү (визуалдык) репрезентацияларын изилдөө. Абстракттуу маалыматтар тексттик жана географиялык маалымат сыяктуу сандык жана сандык эмес маалыматтарды камтыйт. Бирок маалыматтын визуализациясы илимий визуализациядан айырмаланат: "бул мейкиндик чагылдырылганда маалыматтык (маалымат визуализациясы), ал эми мейкиндик чагылдырылганда scivis (илимий визуализация)"

Маалыматтын визуализация тармагы адам менен компьютердин өз ара аракеттенүүсү, информатикадагы колдонмолор, графика, визуалдык дизайн, психология жана бизнес ыкмаларын изилдөөнүн натыйжасында пайда болгон. Ал барган сайын илимий изилдөөлөрдө, санариптик китепканаларда, маалыматтарды казып алууда, каржылык маалыматтарда, рынокту изилдөөдө, өндүрүштү көзөмөлдөөдө жана башкаларда маанилүү компонент катары колдонулууда.

Усулдар жана принциптер

Маалыматтын визуализациясы визуализация жана өз ара аракеттенүү ыкмалары адамдын кабылдоосунун байлыгынан пайдаланып, колдонуучуларга бир эле учурда чоң көлөмдөгү маалыматты көрүүгө, изилдөөгө жана түшүнүүгө мүмкүндүк берет. Маалымат визуализациясы абстрактуу маалыматтарды, маалыматты интуитивдик жол менен жеткирүү ыкмаларын түзүүгө багытталган.

Маалыматтарды талдоо өнөр жайдагы бардык прикладдык изилдөөлөрдүн жана көйгөйлөрдү чечүүнүн ажырагыс бөлүгү болуп саналат. КөпчүлүкМаалыматтарды талдоодо фундаменталдуу ыкмалар болуп визуализация (гистограммалар, чачырандылар, жер үстүндөгү графиктер, дарак карталары, параллелдүү координаттык графиктер ж.б.), статистика (гипотеза тестирлөө, регрессия, PCA ж.б.), маалыматтарды талдоо (матташтыруу ж.б.) саналат..d.) жана машинаны үйрөнүү ыкмалары (кластерлөө, классификация, чечим дарактар, ж.б.).

Бул ыкмалардын арасында маалыматты визуализациялоо же визуалдык маалыматтарды талдоо аналитикалык кызматкерлердин когнитивдик көндүмдөрүнө эң көп көз каранды жана адамдын фантазиясы жана чыгармачылыгы менен гана чектелген структураланбаган иш жүзүнө ашырылуучу түшүнүктөрдү ачууга мүмкүндүк берет. Аналитик маалымат визуализациясын чечмелөө үчүн кандайдыр бир татаал ыкмаларды үйрөнүүнүн кереги жок. Маалымат визуализациясы да гипотеза түзүү схемасы болуп саналат, ал адатта статистикалык гипотезаны текшерүү сыяктуу аналитикалык же формалдуу талдоо менен коштолот.

Окуу

Визуализацияны заманбап изилдөө компьютердик графикадан башталган, ал "эң башынан эле илимий маселелерди изилдөө үчүн колдонулган. Бирок, алгачкы жылдары графикалык күчтүн жетишсиздиги көбүнчө анын пайдалуулугун чектеп койгон. Визуализацияга артыкчылык бериле баштаган. 1987-жылы компьютердик графика жана илимий эсептөөдө визуализация үчүн атайын программалык камсыздоонун чыгышы менен иштелип чыккан. Ошондон бери IEEE Компьютер коому жана ACM SIGGRAPH биргелешип уюштурган бир нече конференциялар жана семинарлар болуп өттү".

Алар маалыматтарды визуалдаштыруунун, маалыматты визуалдаштыруунун жана илимий визуалдаштыруунун жалпы темаларын камтыды,ошондой эле үндү көрсөтүү сыяктуу конкреттүү аймактар.

Корытынды

Жалпыланган көп өлчөмдүү масштабдоо (GMDS) - максаттуу мейкиндик Евклиддик эмес болгон метрикалык көп өлчөмдүү масштабдын кеңейтүүсү. Айырмачылыктар беттеги аралыктар болсо, ал эми максаттуу мейкиндик башка бет болсо, GMDS минималдуу бурмалоолор менен бир беттин экинчи беттин уясын табууга мүмкүндүк берет.

GMDS изилдөөнүн жаңы багыты. Учурда негизги колдонмолор деформациялануучу объектти таануу (мисалы, бетти 3D таануу үчүн) жана текстураны картага түшүрүү болуп саналат.

Көп өлчөмдүү масштабдаштыруунун максаты көп өлчөмдүү маалыматтарды көрсөтүү. Көп өлчөмдүү маалыматтарды, башкача айтканда, көрсөтүү үчүн эки же үч өлчөмдөн ашык талап кылган маалыматтарды чечмелөө кыйын болушу мүмкүн. Жөнөкөйлөштүрүүгө болгон бир ыкма кызыккан маалыматтар жогорку өлчөмдүү мейкиндикте камтылган сызыктуу эмес коллектордо жатат деп болжолдоо болуп саналат. Коллектордун көлөмү жетишерлик төмөн болсо, маалыматтарды аз өлчөмдүү мейкиндикте көрүүгө болот.

Сызыктуу эмес өлчөмдүүлүктү азайтуу ыкмаларынын көбү сызыктуу методдорго байланыштуу. Сызыктуу эмес методдорду жалпысынан эки топко классификациялоого болот: карта түзүүнү камсыз кылгандар (же чоң өлчөмдүү мейкиндиктен төмөн өлчөмдүү киргизүүгө, же тескерисинче) жана жөн эле визуалдаштырууну камсыз кылгандар. Машина үйрөнүү контекстинде карта түзүү ыкмалары катары кароого болотөзгөчөлүктөрдү чыгаруунун алдын ала этабы, андан кийин үлгү таануу алгоритмдери колдонулат. Адатта, жөн гана визуализацияларды бергендер жакындык маалыматтарына негизделет - б.а. аралыкты өлчөө. Көп өлчөмдүү масштабдоо психологияда жана башка гуманитардык илимдерде да кеңири таралган.

Эгер атрибуттардын саны көп болсо, анда уникалдуу мүмкүн болгон саптардын мейкиндиги да экспоненциалдуу түрдө чоң болот. Ошентип, өлчөмү канчалык чоң болсо, мейкиндикти чагылдыруу ошончолук кыйындайт. Бул көптөгөн көйгөйлөрдү жаратат. Өлчөмдүү маалыматтарда иштеген алгоритмдер өтө жогорку убакыт татаалдыгына ээ. Маалыматтарды азыраак өлчөмдөргө чейин кыскартуу көбүнчө анализ алгоритмдерин натыйжалуураак кылат жана машинаны үйрөнүү алгоритмдерине так божомолдорду жасоого жардам берет. Ушундан улам көп өлчөмдүү маалыматтарды масштабдоо абдан популярдуу.