Le variabili categoriche e le variabili non categoriche sono due tipi principali di variabili utilizzate nella statistica, nell’analisi dei dati e nell’apprendimento automatico (machine learning).

Variabili Categoriche

  1. Definizione: Le variabili categoriche, anche conosciute come variabili qualitative o nominali, rappresentano categorie o gruppi di oggetti che non hanno un ordine intrinseco o una scala. Queste categorie sono solitamente descritte da etichette o nomi. Ad esempio, il genere (maschio, femmina, altro), il colore (rosso, verde, blu), il livello di istruzione (scuola elementare, scuola superiore, laurea) sono esempi di variabili categoriche.
  2. Rappresentazione: Queste variabili vengono solitamente rappresentate da etichette o stringhe anziché da numeri. Nel contesto dell’apprendimento automatico, è necessario convertirle in una forma numerica utilizzando tecniche come il one-hot encoding.
  3. Utilizzo: Le variabili categoriche sono spesso utilizzate per descrivere caratteristiche o attributi che non possono essere misurati su una scala numerica, ma sono essenziali per l’analisi e la modellazione. Possono essere utilizzate in analisi di segmentazione, classificazione, raggruppamento e altro.
  4. Tipologie: dobbiamo distinguere fra caratteristiche nominali e ordinali. Le caratteristiche ordinali sono valori categorici che possono essere ordinati. Per esempio, T-shirt size sarebbe una caratteristica ordinale, poiché possiamo definire un ordine XL > L > M. Al contrario, le caratteristiche nominali non prevedono alcun ordine e, con riferimento all’esempio precedente, potremmo considerare T-shirt color come una caratteristica nominale, in quanto, in genere, non ha senso dire che, per esempio, il rosso è maggiore del blu.

Variabili Non Categoriche (o Variabili Numeriche)

  1. Definizione: Le variabili non categoriche, anche chiamate variabili quantitative, rappresentano misure o valori che possono essere espressi su una scala numerica. Queste variabili possono avere valori numerici che possono essere sottoposti a operazioni matematiche come addizione, sottrazione, moltiplicazione, ecc. Ad esempio, l’età di una persona, il reddito annuo, la temperatura, il peso sono esempi di variabili non categoriche.
  2. Rappresentazione: Queste variabili sono rappresentate direttamente da numeri e possono essere utilizzate in calcoli matematici. Possono essere suddivise ulteriormente in variabili continue (come l’età) o variabili discrete (come il numero di figli).
  3. Utilizzo: Le variabili non categoriche sono spesso utilizzate per misurare quantità o valori su una scala numerica. Possono essere utilizzate in analisi statistiche, modelli di regressione, analisi dei trend, ecc.