Aldo Agostinelli

Algoritmi, modelli e dati per risolvere problemi e ottenere stime corrette. Dall’industria al marketing, ecco come funziona l’apprendimento supervisionato

Il supervised learning è un tipo di approccio all’interno del machine learning, un ramo di applicazione dell’intelligenza artificiale. Si fonda su algoritmi che elaborano dati e trova applicazione in molti contesti. 

Come funziona il supervised learning?

Il supervised learning o apprendimento supervisionato si basa su quelli che sono degli elementi tipici del machine learning, tra cui:

  • algoritmo, un insieme di regole per ottenere degli schemi da dati statistici;
  • dataset di training, insieme di dati da fornire alla macchina per creare un modello;
  • dataset di test, set di dati usati per valutare la precisione e l’accuratezza del modello dopo la fase di training;
  • modello, la rappresentazione di un benchmark reale.

Con il supervised learning, la macchina quindi impara dall’esperienza e dagli esempi per poi applicare ciò che ha appreso negli ambiti in cui trova spazio: un susseguirsi di passaggi che ricorda da vicino l’apprendimento umano.

Leggi anche: Web development: tutto quello che c’è da sapere

Quali sono gli algoritmi di supervised learning?

Durante il processo di apprendimento automatico sono impiegati diversi algoritmi e più tecniche di calcolo.

Come primo passaggio, i supervised learning algorithms possono essere divisi in due grandi gruppi:

  1. algoritmi di classificazione;
  2. algoritmi di regressione.

Con gli algoritmi di classificazione, l’output viene identificato come label o etichetta e la variabile è suddivisa in:

  • binaria come “sì o no”, “vero o falso”, “spam o no spam”; 
  • nominale come “colore degli occhi” o “tipi di animale”;
  • ordinale come “inferiore”, “medio”, “superiore”.

Quanto agli algoritmi di regressione, l’output è un valore numerico continuo all’interno di un intervallo, come “prezzo di vendita” o “temperatura”. 

In particolare, gli algoritmi di machine learning comprendono:

  • Regressione lineare;
  • Regressione logistica;
  • Naive Bayes;
  • Reti neurali artificiali;
  • Support Vector Machine (SVM);
  • K-nearest neighbor (KNN);
  • Random forest.

Proviamo a riassumere le loro caratteristiche. 

  • La regressione lineare viene utilizzata per prevedere risultati e identificare la relazione tra una variabile dipendente e quelle indipendenti. 
  • La regressione logistica prevede che la variabile dipendente sia binaria e, non a caso, è utile per affrontare problemi di classificazione binaria: riconoscere, ad esempio, se un messaggio è spam o no. 
  • Gli algoritmi Naive Bayes si basano sul teorema di Bayes per fissare dei classificatori probabilistici: ai dati viene assegnata una classe come accade con la regressione logistica per cui una mail viene identificata come spam o meno.
  • Le reti neurali artificiali replicano l’interconnettività del cervello dell’uomo per elaborare i dataset di training. 
  • L’algoritmo SVM o Support Vector Machine è sfruttato per la classificazione ed è efficace per dataset di grandi dimensioni. 
  • Il K-nearest neighbor trova spazio nel riconoscimento delle immagini o per i motori di consiglio sui prodotti perché classifica i dati in base alla loro vicinanza con altri dati. 
  • Il Random forest è una tipologia di algoritmo di apprendimento supervisionato per operare classificazioni dalla raccolta di alberi decisionali (da qui il termine Random forest), processati per offrire previsioni accurate.

Qual è la differenza tra apprendimento supervisionato e non supervisionato?

Il supervised learning non è l’unico modello di machine learning: pensiamo soltanto al fatto che esiste anche il cosiddetto apprendimento non supervisionato. Una dimensione completamente opposta.

  • L’apprendimento non supervisionato non prevede dati etichettati, ma identifica dei modelli per risolvere problemi di clustering o di associazione. Il modello è costruito solo con input e non output. L’algoritmo scopre così da solo le relazioni nei dati. 
  • Può portare risultati quando si è alla ricerca di una tendenza nascosta che non appare agli occhi dell’osservazione dei dati e questo vale anche di fronte di un dataset particolarmente voluminoso.
  • Manca la fase di training che invece caratterizza l’apprendimento supervisionato.

Un esempio concreto di applicazione dell’apprendimento non supervisionato riguarda l’organizzazione di archivi di dati di notevole dimensioni, non etichettati, allo scopo di trovare un modello per arrivare a raggruppare dati simili o scovare anomalie. Tra le ipotesi ritroviamo il raggruppamenti dei clienti secondo i rispettivi comportamenti di acquisto

Supervised learning e apprendimento non supervisionato possono essere utilizzati in contemporanea. Si ottiene così l’apprendimento semi-supervisionato, un machine learning per:

  • analizzare i sentiment;
  • classificare i documenti;
  • scovare le frodi. 

Sono sfere accomunate dalla complessità dei dati, campo in cui come abbiamo visto l’apprendimento non supervisionato si dimostra particolarmente funzionante, e dalla necessità di disporre di risultati accurati che derivano dalla fase di apprendimento tipica del supervised learning. 

Leggi anche: Che cos’è e cosa serve il process mining?

Supervised learning: alcuni esempi

Sono molteplici gli ambiti in cui aziende, operatori e professionisti possono trarre vantaggi dall’apprendimento supervisionato. Vediamone alcuni.

  • Analytics predittiva. Fornisce approfonditi insight sull’attività commerciale condotta. In questo modo le aziende sono in grado di guardare avanti e prevedere i risultati: uno strumento per studiare e impostare strategie di business.
  • Manutenzione predittiva. La capacità di prevedere è trasferita a macchinari, sensori e dispositivi di produzione per segnalare in anticipo la necessità di condurre una manutenzione, evitando così un malfunzionamento.
  • Analisi del sentiment dei clienti. È un altro elemento che aiuta organizzazione e società a prendere decisioni sulla base dei sentiment e delle intenzioni dei clienti. I marchi hanno a disposizione i dati per segmentarli, coinvolgerli e fidelizzarli, ottimizzando le interazioni con loro.
  • Churn Analysis. Strettamente legata all’analisi del sentiment, fornisce una stima sulla probabilità che un cliente chiuda il suo rapporto con un’azienda, come interrompere un servizio. Vengono così proposte campagne personalizzate e mirate. Il modello è replicabile all’interno di un’organizzazione, per valutare il livello di soddisfazione dei dipendenti e le loro intenzioni lavorative.
  • Computer vision. È il riconoscimento di immagini e oggetti da parte di una macchina. Le immagini vengono catalogate e isolate, partendo anche dai video. Dalla sicurezza alla telemedicina alla supervisione dei processi di produzione, la computer vision è una forza tecnologica trasversale. 
  • Posta indesiderata. Viene rilevata e opportunamente etichettata. La corrispondenza elettronica è organizzata con precisione e priva di anomalie che possono rivelarsi dannose.
  • Sicurezza informatica. Non solo spam, ma anche tentativi di frodi online: con il supervised learning vengono monitorate le transazioni e il sistema impara a riconoscere quelle fraudolenti da quelle non fraudolenti. Davanti a casi sospetti, i flussi di denaro sospetti sono segnalati e bloccati. 
  • Chatbot. Il machine learning da apprendimento supervisionato consente di stabilire conversazioni con contatti clienti, gestendoli sempre meglio e riducendo i tempi richiesti dalle conversazioni telefoniche. 

Tanti vantaggi e nuove sfide da affrontare. Se da una parte infatti il supervised learning aiuta le aziende con analisi approfondite e automazione, ci sono passaggio su cui prestare attenzione per la creazione di modelli di apprendimento supervisionato che siano efficienti.

  • I set di dati su cui lavorare potrebbero nascondere errori umani e, di conseguenza, l’algoritmo verrebbe appreso dalla macchina in modo errato.
  • Richiede tempo e competenze perché il risultato finale sia accurato.
  • Mentre l’apprendimento non supervisionato riesce a classificare i dati da solo, ciò non è possibile con quello supervisionato per cui il procedimento deve essere effettuato precedentemente. 

Non vanno escluse ipotesi di bias statistici. Con il termine bias statistico si intendono statistiche che non possiedono una rappresentazione accurata. Si tratta a tutti gli effetti di dati difettosi perché il campione in considerazione non è sufficiente rappresentativo o perché troppe variabili sono state omesse, a discapito della precisione. 

Una volta che questi dati sono integrati nel machine learning, si genera un AI bias, vale a dire un bias (pregiudizio) che compromette i modelli di apprendimento di supervised learning: troppe imprecisioni che compromettono il risultato finale

I dati di scarsa qualità portano ad output altrettanto scadenti, a riprova di come i dati stessi abbiano un ruolo chiave in questo contesto. 

Allo stesso modo, la scarsa quantità di dati impatta negativamente perché il machine learning ha bisogno di migliaia e migliaia di dati tra cui esempi e risposte. Se sono troppo pochi, il risultato corre il rischio di essere difettoso. 

Accortezze fondamentali per sprigionare tutte le potenzialità di uno strumento in continua evoluzione e sempre più sofisticato. 

Aldo Agostinelli