Что лучше: нормализация или стандартизация?

Оглавление:

Что лучше: нормализация или стандартизация?
Что лучше: нормализация или стандартизация?

Видео: Что лучше: нормализация или стандартизация?

Видео: Что лучше: нормализация или стандартизация?
Видео: Лекция 2.6: Нормализация. 2024, Ноябрь
Anonim

Normalization хорошо использовать, когда вы знаете, что распределение ваших данных не соответствует распределению Гаусса. … Стандартизация, с другой стороны, может быть полезной в тех случаях, когда данные подчиняются распределению Гаусса.

Должен ли я использовать нормализацию или стандартизацию?

Нормализация полезна, когда ваши данные имеют разные масштабы, а используемый вами алгоритм не делает предположений о распределении ваших данных, таких как k-ближайшие соседи и искусственные нейронные сети. Стандартизация предполагает, что ваши данные имеют распределение Гаусса (гауссова кривая).

Является ли стандартизация тем же, что и нормализация?

В деловом мире «нормализация» обычно означает, что диапазон значений «нормализован до нуля. От 0 до 1,0». «Стандартизация» обычно означает, что диапазон значений «стандартизирован» для измерения того, сколько стандартных отклонений значения от его среднего значения.

Всегда ли нормализация данных полезна?

Выполняя нормализацию, вы фактически отбрасываете некоторую информацию о данных, такую как абсолютные максимальные и минимальные значения. Итак, нет никакого практического правила. Как говорили другие, нормализация не всегда применима; например с практической точки зрения.

Когда не следует нормализовать данные?

Некоторые веские причины не нормализовать

  1. Соединения стоят дорого. Нормализация вашей базы данных часто требует создания большого количества таблиц. …
  2. Нормализованный дизайн сложен. …
  3. Быстро и грязно должно быть быстро и грязно. …
  4. Если вы используете базу данных NoSQL, традиционная нормализация нежелательна.

Рекомендуемые: