Intervista a Chiara Martino, AI Conversational Designer e Knowledge Engineer di Assist Digital

Una delle prime Conversational Designer in Italia che da oltre sette anni lavora nel settore dell'Intelligenza Artificiale Conversazionale. Chiara Martino è anche formatrice, scrittrice e fondatrice di "Women in Voice Italy", la community italiana dell'assiociazione internazionale Women in Voice che supporta le donne nella loro carriera nell'IA conversazionale e nelle tecnologie vocali. 

Fra i diversi temi approfonditi, insieme ci siamo chiestə se è possibile progettare algoritmi liberi da sterotipi di genere e qual è il ruolo dei chatbot nelle aziende per le selezioni del personale.
Ci siamo poi soffermate sulle opportunità offerte dalla community "Women in Voice Italy" e infine tra consigli di lettura e approfondimenti, Chiara Martino ci ha letto un estratto del suo interessante e ultimo libro:"Intelligenza Artificiale Conversazionale. Processi, strumenti e professioni per creare chatbot e assistanti vocali" edito da Franco Angeli.

Di cosa si occupa chi, come te, ricopre il ruolo di AI Conversational Designer e Knowledge Engineer?

Chi ricopre questi ruoli si occupa di progettare, implementare e monitorare le interfacce conversazionali, cioè i prodotti capaci di dialogare con le persone, sia in forma scritta, e in questo caso si chiamano chatbot, sia in forma orale, chiamati invece voicebot. 
Queste attività, in realtà, possono riferirsi a due ruoli diversi, come nel mio caso, oppure possono convergere sotto un unico job role, che può essere quello del Full-Stack Conversation Designer o del Linguista Computazionale
La nomenclatura e le responsabilità variano molto da un’azienda all’altra, non ci sono ancora veri standard: il settore della Conversational AI in sé è piuttosto recente e quindi in continua evoluzione, per questo nel mio libro: “Intelligenza Artificiale Conversazionale. Processi, strumenti e professioni per creare chatbot e assistenti vocali”, preferisco parlare di competenze necessarie in un progetto conversazionale, più che di ruoli necessari.

Intelligenza Artificiale e stereotipi di genere. Qual è il tuo punto di vista? Come possiamo “educare” gli algoritmi?

Il tema è molto articolato: nell’Intelligenza Artificiale conversazionale e nella robotica, non si tratta solo di educare gli algoritmi, ma anche di fare scelte ragionate in fase progettuale
Per esempio, nella scelta del genere dell’assistente virtuale: su questo argomento consiglio di leggere il libro: “The Smart Wife: Why Siri, Alexa, and Other Smart Home Devices Need a Feminist Reboot” di Yolande Strengers e Jenny Kennedy, che evidenzia come questi prodotti, in prevalenza di genere femminile e progettati per essere servili e per eseguire i comandi senza discutere, possano perpetrare degli stereotipi di genere
Proprio per evitare di dover assegnare un genere a un prodotto conversazionale, sono state sviluppate anche voci sintetiche genderless, cioè che non siano immediatamente associabili né a una voce femminile né a una maschile: la prima di queste è stata “Q”. 
Discutere di questi argomenti aiuta ad acquisire consapevolezza nelle scelte che facciamo quando creiamo prodotti di AI. Ma la consapevolezza non basta: è anche importante rendere i team che ci lavorano più variegati, sia in termini di genere, che, per esempio, di percorsi professionali e provenienza geografica: ricordiamoci sempre che il genere non è l’unico elemento di discriminazione, anche se è quello di cui si parla di più oggi in Italia.
Per tornare alla domanda aggiungo che è anche importante addestrare gli algoritmi con dati provenienti da campioni di popolazione altrettanto variegati. Non sempre c'è questa possibilità e solitamento in ambito business vengono usati quelli delle grandi aziende tech, come Google, Amazon, e oggi OpenAI. A noi progettisti e sviluppatori non rimane che fare il meglio che possiamo, con ciò che abbiamo a disposizione. 

Molto spesso le aziende scelgono di implementare assistenti virtuali per la selezione del personale. C’è secondo te il rischio che generino disparità di opportunità e discriminazioni? Come un’azienda può assicurarsi che tuttə vengano accompagnati nel processo di selezione senza nessun tipo di disparità?

Non credo si possa ragionare in termini generali, tutto dipende dal singolo prodotto, da cosa fa e da come viene istruito. 
Per esempio, un chatbot potrebbe limitarsi a raccogliere le candidature, chiedendo agli utenti dati anagrafici o informazioni sul percorso formativo e lavorativo. Le domande che questi chatbot faranno ai candidati saranno comunque decise da chi si occupa di selezione del personale, e quindi si può scegliere di evitare del tutto domande “pericolose”, per esempio sul genere del candidato o sulla sua provenienza geografica, e concentrarsi invece solo su skill rilevanti ed esperienza lavorativa. 
Ci si può avvalere anche di altri dispositivi basati su AI, non necessariamente conversazionale, che aiutino nell’analizzare i dati raccolti in maniera oggettiva, confrontandoli e scremandoli ma anche in questo caso, i parametri dovrebbero sempre essere controllati dagli umani, di conseguenza più che preoccuparci del rischio che un’AI possa discriminare, le aziende dovrebbero vigilare e assicurarsi che sia HR, che i team leader e sopratutto i manager siano attenti e adeguatamente formati sul tema delle pari opportunità.  

Linguistica e Conversational AI come si incontrano nel tuo lavoro quotidiano?

I prodotti conversazionali cercano di imitare la capacità umana di dialogare, che è uno dei tratti più distintivi della nostra specie e che si basa proprio sull’uso del linguaggio e sulle dinamiche che regolano la comunicazione, oggetto di studio della linguistica; di conseguenza, questi due settori si intrecciano spesso in diverse fasi: progettazione dell’esperienza conversazionale nel suo complesso, gestione della comprensione del messaggio dell’utente e produzione del messaggio dell’AI. 
Quando si creano assistenti vocali, conoscere fonetica e fonologia aiuta a comprendere e tamponare le difficoltà che possono crearsi fra il riconoscimento automatico del parlato (ASR o STT) e della sintesi vocale (TTS)
Semantica, morfologia e sintassi sono poi importanti nel comprendere come usare e gestire gli errori sia dell’NLU (comprensione del linguaggio naturale) sia dell’NLG (generazione automatica di linguaggio).
Anche la sociolinguistica, la psicolinguistica e la pragmatica hanno un ruolo rilevante nella generazione automatica di linguaggio: la prima ci fa capire come le varianti linguistiche (legate a provenienza geografica, livello di istruzione, età, professione, contesto sociale ecc...) hanno impatto e possono essere gestite sia nell’NLU che nel riconoscimento del parlato mentra la seconda disciplina aiuta invece a comprendere i meccanismi psicologici coinvolti nella comprensione e nella produzione di un messaggio, e quindi fornisce linee guida su come scrivere i messaggi di chatbot e voicebot (quando questi non sono generati in automatico), affinché siano comprensibili, sollecitino la risposta e/o l’emozione desiderata e richiedano il minor sforzo cognitivo possibile dagli utenti. Infine, la pragmatica ci aiuta a comprendere l’influenza del contesto in un atto comunicativo. 

Sei anche fondatrice di Women in Voice Italy, la community italiana dell'associazione internazionale Women in Voice, che supporta le donne nella loro carriera nell'IA conversazionale e nelle tecnologie vocali. Su quali principi si fonda la community?

Come gruppo italiano ci siamo date fin da subito tre obiettivi: fare divulgazione su questo settore di nicchia, dare voce alle donne che ci lavorano, intervistandole e facendone conoscere competenze e successi, e supportare coloro che non fanno ancora parte di in questo settore ma che vorrebbero entrarci. 
La community è aperta a tutti, sia donne che uomini: nei nostri incontri e sui nostri social non trattiamo tematiche di genere, bensì tematiche professionali. 
Le registrazioni dei nostri eventi online e delle nostre interviste sono condivise sul nostro canale YouTube ed è possibile seguirsi sui nostri canali LinkedIn, Instagram, Facebook e Twitter/X. 

Nel tuo lavoro ti è mai capitato di generare un AI Influencer? Quali sono i parametri che solitamente vengono richiesti dalle aziende?

Mi è capitato di creare dei digital human, cioè avatar 3D e iperrealistici, sono in grado di gesticolare e muovere bocca e occhi. Possono essere usati per vari scopi: io, per ora, li ho usati soprattutto per arricchire video o presentazioni. 
In ambito conversazionale questi prodotti hanno molto potenziale, possono sostituire gli avatar statici contribuendo a rendere la comunicazione tra persona e macchina più realistica e completa. Le soluzioni davvero avanzate in commercio hanno costi ancora molto alti: alcune aziende, per esempio, consentono di creare brevi video anche gratuitamente, ma poi propongono pacchetti molto esosi nel momento in cui li si contatta per soluzioni enterprise, che non siano pre-registrate ma che al contrario accompagnino i chatbot live. Tutto ciò scoraggia i clienti, che spesso non sono pronti a fare investimenti ingenti senza poterne prevedere il ROI in maniera chiara e certa. 

Un estratto del tuo nuovo libro “Intelligenza Artificiale Conversazionale. Processi, strumenti e professioni per creare chatbot e assistenti vocali” edito da Franco Angeli che vale la pena citare.

Rimanendo sul tema dell’inclusività e dell’addestramento degli algoritmi, vi propongo questo estratto che fa riferimento agli sforzi che si fanno (soprattutto per la lingua inglese), per superare le difficoltà che i sistemi attuali hanno nel riconoscere e trascrivere il parlato: 
"In alcuni casi, si possono intraprendere delle azioni migliorative nell’addestramento degli algoritmi. Per esempio, per migliorare la comprensione di chi parla con un forte accento o dei locutori non standard, si possono addestrare gli algoritmi con insiemi di dati più equilibrati, cioè provenienti da fonti variegate. 
Il principio è semplice: se addestro un sistema di STT [nota: di riconoscimento automatico nel parlato] con registrazioni provenienti da una sola categoria di persone, per esempio maschi bianchi sui quarant’anni, del nord Italia e in salute, il sistema avrà difficoltà a comprendere tutte le altre categorie di persone, quindi le donne, gli uomini di altre etnie, gli uomini bianchi ma anziani o molto giovani, gli uomini bianchi sui quarant’anni del sud Italia, gli uomini bianchi sui quarant’anni del nord Italia ma affetti dal morbo di Parkinson.Usare training set rappresentativi di diversi gruppi di persone è essenziale per evitare che alcuni gruppi siamo discriminati e rimangano esclusi dall’utilizzo di questi strumenti. 
A tal fine, a livello internazionale, stanno nascendo sempre più progetti che puntano a rendere le tecnologie vocali accessibili anche a persone affette da disabilità, proprio tramite la raccolta di dati vocali molto diversificati. Uno di questi progetti è lo Speech Accessibility Project, lanciato dall’Università dell’Illinois Urbana-Champaign, in collaborazione con organizzazioni no-profit e con aziende leader in ambito tecnologico, come Amazon, Apple, Google, Meta e Microsoft. Mentre i progetti precedenti, portati avanti da singole aziende o organizzazioni, hanno parallelizzato la ricerca e quindi in qualche modo disperso gli sforzi, questo progetto si propone di unire gli sforzi e creare un’unica, ricca raccolta di dati vocali provenienti da persone con patologie come sindrome di Down, SLA, morbo di Parkinson, e paralisi cerebrale.” 

 



Digitale: femminile singolare

Parità di genere e digitale. Storie a confronto tra sfide e opportunità

Iscriviti alla newsletter per restare sempre aggiornatə