Normalization е добре да се използва, когато знаете, че разпределението на вашите данни не следва гаусово разпределение. … Стандартизацията, от друга страна, може да бъде полезна в случаите, когато данните следват гаусово разпределение.
Трябва ли да използвам нормализиране или стандартизация?
Нормализацията е полезна, когато вашите данни имат различни мащаби и алгоритъмът, който използвате, не прави предположения за разпределението на вашите данни, като k-най-близки съседи и изкуствени невронни мрежи. Стандартизация предполага, че вашите данни имат гаусово (камбанова крива) разпределение.
Стандартизацията същата ли е като нормализирането?
В света на бизнеса "нормализиране" обикновено означава, че диапазонът от стойности са "нормализирани да бъде от 0.0 до 1,0". "Стандартизация" обикновено означава, че диапазонът от стойности е "стандартизиран", за да се измери колко стандартни отклонения е стойността от нейната средна стойност..
Винаги ли е добре да се нормализират данните?
Чрез нормализиране вие всъщност изхвърляте някаква информация за данните като абсолютните максимални и минимални стойности. Така че, няма практическо правило. Както казаха други, нормализирането не винаги е приложимо; напр. от практическа гледна точка.
Кога не трябва да нормализирате данните?
Някои добри причини да не се нормализира
- Съединяванията са скъпи. Нормализирането на вашата база данни често включва създаване на много таблици. …
- Нормализираният дизайн е труден. …
- Бързото и мръсното трябва да бъде бързо и мръсно. …
- Ако използвате NoSQL база данни, традиционното нормализиране не е желателно.