In statistica, la normalizzazione consiste essenzialmente nel limitare l'escursione di un insieme di valori entro un certo intervallo predefinito, che solitamente coincide con i numeri reali compresi tra 0 e 1.

Sia x n o r m {\displaystyle x_{norm}} la normalizzazione di x {\displaystyle x} allora:

x n o r m = ( x m i n ( x ) ) / ( m a x ( x ) m i n ( x ) ) {\displaystyle x_{norm}=(x-min(x))/(max(x)-min(x))}

Dunque, i dati sono caratterizzati da campo di variazione coincidente con l'intervallo [0,1]-

Vantaggi e svantaggi

Vantaggi:

  • consente di comparare grandezze su scale differenti
  • non sfrutta assunzioni sulla distribuzione dei dati

Svantaggi:

  • è molto sensibile ai valori anomali

Voci correlate

  • Standardizzazione

Normalization Min Max Normalization Code Institute DE

Numerische Daten Normalisierung Machine Learning Google for Developers

Was ist die Normalisierung von Datenbanken? Data Basecamp

Normalisierung • Definition Gabler Wirtschaftslexikon

Introduction to Normalization in Statistics Decoding Data Science