La cluster analysis è un’importante branca della statistica e dell’analisi dei dati che, nata come disciplina umanistica, ad oggi rientra di diritto tra le discipline di studio che coinvolgono l’intelligenza artificiale e i professionisti che la studiano. Per capire a cosa serva è necessario prima chiarire cosa sono i cluster e a cosa servono.
Cosa sono i cluster?
La definizione di cluster e i conseguenti termini clustering o clusterizzazione derivano dagli studi sulla psicologia comportamentale di Robert Tyron, ma oggi fanno parte della scienza statistica e quindi dell’analisi dei dati. Secondo lo studioso un cluster è un insieme di elementi con almeno una caratteristica in comune.
Nel caso degli esseri umani, si può creare un cluster con tutti gli individui dai capelli castani e un altro con gli individui biondi. Il clustering gerarchico permette di suddividere ulteriormente questi gruppi in individui dai capelli castani e con gli occhi chiari; individui con i capelli castani e gli occhi scuri; individui biondi con gli occhi chiari ecc. Proseguendo con questo schema, la clusterizzazione porta alla definizione di gruppi dalle caratteristiche sempre più specifiche e ben delineate.
Appare chiaro come questa metodologia possa essere facilmente applicata all’analisi dei dati degli utenti su un sito web, per esempio attraverso le informazioni raccolte da un software o da un’intelligenza artificiale. L’analisi dei cluster così individuati porta a una semplice segmentazione dell’utenza, che si può poi utilizzare in numerosi settori all’interno di un’azienda.
Tipi di cluster in cui segmentare il pubblico
Se prendiamo a esempio dei tipi di cluster che raggruppano utenti dalla stessa provenienza geografica; che hanno le stesse abitudini di acquisto; che si collegano a un sito dallo stesso tipo di device; possiamo facilmente segmentare il nostro pubblico.
Questo permette innumerevoli vantaggi a livello di:
- marketing locale;
- servizio ai clienti;
- ottimizzazione dei contenuti per device mobili;
- suggerimenti automatici di contenuti, prodotti e servizi che possano interessare all’utente.
Insomma, con l’analisi dei cluster l’intelligenza artificiale conversazionale è in grado di riconoscere ogni utente, posizionarlo nel giusto gruppo target e comportarsi con lui di conseguenza. Ciò consente un rapporto più naturale e personalizzato tra l’AI conversazionale e gli utenti, ma anche un aumento delle vendite e dei tassi di conversione. Il che, alla fin fine, è lo scopo principale dell’impiego di un chatbot o di un voicebot in azienda.
Due modi per fare la clustering
Sappiamo che molte intelligenze artificiali conversazionali imparano dalle loro precedenti interazioni con gli utenti. Sfruttando la disciplina del machine learning, ovvero dell’apprendimento delle macchine in base alle esperienze precedenti, è possibile fare clustering con due metodi.
Apprendimento automatico
Il primo è l’apprendimento automatico, quello più diffuso e usato dalle AI conversazionali. La raccolta dei dati avviene a partire da input che il programmatore fornisce al software.
Il Natural Language Processing che le AI usano per comprendere e imitare il linguaggio umano si basa sull’apprendimento automatico in questi casi:
- la classificazione, cioè il riconoscimento di caratteristiche dell’utente, del luogo, del device a partire da caratteristiche note;
- il disambiguamento tra nomi luoghi, associazioni e organizzazioni con lo stesso nome sulla base del contesto in cui vengono usati;
- le trascrizioni text-to-speech;
- i modelli di causalità tra un testo e le reazioni che suscita (per esempio il numero di cuoricini ricevuti su Twitter da messaggi contenenti determinate parole e argomenti).
Addestramento supervisionato
L’altra tipologia di machine learning è l’addestramento non supervisionato. Al software non vengono fornite informazioni di nessun tipo sui dati, ed è qui che brilla la disciplina della cluster analysis.
Infatti, è la stessa intelligenza artificiale a far emergere dai dati pattern ricorrenti e caratteristiche simili: in poche parole a creare da sé i cluster. In questa maniera il software di intelligenza artificiale generativa può cogliere dai dati forniti dagli utenti e da altre informazioni (da quali device si connettono; quanto tempo trascorrono sul sito; con quale query sono atterrati su quella pagina web) delle informazioni vitali per il proseguimento del rapporto con l’azienda.
Il rapporto tra analisi dei cluster e AI
Il fatto di non conoscere nessuna caratteristica degli utenti potrebbe essere un limite per l’intelligenza artificiale conversazionale. In questa maniera, infatti, il software parte alla cieca, senza avere linee guida, raccogliendo informazioni e scoprendo man mano con chi interagisce. Ciò potrebbe portare a errori e anomalie nella conversazione.
Bisogna tenere a mente però che questo non è necessariamente un limite per l’AI conversazionale: laddove il software riconosce pattern di comportamento simili, reagirà in maniera simile agli input ricevuti dagli utenti. Se invece la cluster analysis è solo un passaggio di una ricerca più grande, la raccolta di questi dati può fornire il punto di partenza per migliorare le capacità e le funzioni di un software conversazionale.
Quello che conta nella cluster analysis è sempre l’elemento umano. Davanti a dati e porzioni di testo sui quali non ha nessuna informazione, l’intelligenza artificiale da sola potrebbe non bastare. L’intuito di data analyst e specialisti del machine learning gioca un ruolo fondamentale.