Normalization хорошо использовать, когда вы знаете, что распределение ваших данных не соответствует распределению Гаусса. … Стандартизация, с другой стороны, может быть полезной в тех случаях, когда данные подчиняются распределению Гаусса.
Должен ли я использовать нормализацию или стандартизацию?
Нормализация полезна, когда ваши данные имеют разные масштабы, а используемый вами алгоритм не делает предположений о распределении ваших данных, таких как k-ближайшие соседи и искусственные нейронные сети. Стандартизация предполагает, что ваши данные имеют распределение Гаусса (гауссова кривая).
Является ли стандартизация тем же, что и нормализация?
В деловом мире «нормализация» обычно означает, что диапазон значений «нормализован до нуля. От 0 до 1,0». «Стандартизация» обычно означает, что диапазон значений «стандартизирован» для измерения того, сколько стандартных отклонений значения от его среднего значения.
Всегда ли нормализация данных полезна?
Выполняя нормализацию, вы фактически отбрасываете некоторую информацию о данных, такую как абсолютные максимальные и минимальные значения. Итак, нет никакого практического правила. Как говорили другие, нормализация не всегда применима; например с практической точки зрения.
Когда не следует нормализовать данные?
Некоторые веские причины не нормализовать
- Соединения стоят дорого. Нормализация вашей базы данных часто требует создания большого количества таблиц. …
- Нормализованный дизайн сложен. …
- Быстро и грязно должно быть быстро и грязно. …
- Если вы используете базу данных NoSQL, традиционная нормализация нежелательна.