Logo bg.boatexistence.com

K означава ли работа с категорични данни?

Съдържание:

K означава ли работа с категорични данни?
K означава ли работа с категорични данни?

Видео: K означава ли работа с категорични данни?

Видео: K означава ли работа с категорични данни?
Видео: 🤔 CRDI лучше всяких TDI и CDI ? Ищем недостатки в корейском турбодизеле 2.2 CRDI (D4HB). 2024, Може
Anonim

Алгоритъмът k-Means не е приложим за категорични данни, тъй като категоричните променливи са дискретни и нямат естествен произход. Така че изчисляването на евклидово разстояние за такова пространство няма смисъл.

Можем ли да използваме групиране за категорични данни?

Категоричните данни са преобразувани в числови чрез присвояване на стойност на ранг. Това е, че категоричен набор от данни може да бъде направен клъстер като набори от числови данни.. Наблюдава се, че прилагането на тази логика, k-средно дава същата производителност, както се използва в цифровите набори от данни.

Може ли да се използва за категорични променливи?

Няма начинда се намери средна стойност от тези данни, защото няма "среден" цвят на очите. Можете да намерите пропорциите, но не и средната стойност. Надявам се това да помогне!

Какво трябва да се използва, когато данните са категорични?

Категоричните данни се анализират с помощта на режим и медианни разпределения, където номиналните данни се анализират с режим, докато редовите данни използват и двете. В някои случаи, редовните данни могат също да бъдат анализирани с помощта на едномерна статистика, двувариантна статистика, регресионни приложения, линейни тенденции и методи за класификация.

Какво е групиране с категорични атрибути?

Клъстериране на категорични данни се отнася до случая, когато обектите с данни са дефинирани върху категорични атрибути … Тоест, няма единична функция за подреждане или присъща функция на разстояние за категоричните стойности и няма съпоставяне от категорични към числови стойности, което да е семантично разумно.

Препоръчано: