“Come si racconta un istogramma con Alexa?” Questa è una delle sfide che ci siamo trovati ad affrontare durante uno dei nostri progetti. In questo caso, l’obiettivo è l’implementazione di una interfaccia vocale, basata sullo smart speaker di Amazon, per il sistema di Business Intelligence del cliente.
Il progetto nasce con la finalità di dare una possibilità aggiuntiva di accesso ai dati di BI in situazioni diverse da quelle in cui è possibile fruirli da uno schermo, come ad esempio mentre si è impegnati a fare altro o in auto.
Inoltre tutto il mondo smart speaker ha come scopo importante anche l’accessibilità verso le persone ipovedenti, Amazon stessa ha rilasciato alcune funzioni interessanti proprio in questa direzione. Anche questo progetto vuole utilizzare la voce come strumento principe, per veicolare informazioni che di solito sono per la maggior parte visuali.
L’aspetto tecnologico
La soluzione tecnica che abbiamo adottato – che è uno standard de facto quando si parla di Skill Alexa – è quella di utilizzare AWS Lamdba. Quando parliamo di dati autenticati, come in questo caso, bisogna adottare una tecnica chiamata account linking per permettere al SDK di Alexa di “convertire” un utente Amazon in un utente del sistema dal quale si vogliono prendere i dati, cioè il sistema di Business Intelligence del nostro cliente. Una volta fatta l’autenticazione, la lamdba è in grado di leggere i dati di Business Intelligence e di convertirli nella forma più comoda per essere “letti” dallo smart speaker.
La VUI
Come accennato all’inizio dell’articolo, la sfida più grande è stata proprio il trasformare un progetto a forte impatto visuale – come un sistema di BI – in qualcosa di presentato esclusivamente attraverso la voce. Seguendo le linee guida di Amazon abbiamo basato il disegno della nostra interfaccia vocale o VUI (Vocal User Interface) sui bisogni e pain point principali degli utenti. In particolare, abbiamo cercato di essere proattivi nel proporre agli utenti di accedere alle sessioni che in base al contesto potevano essere di maggior interesse, evitando quindi la navigazione di menù vocali in stile “call center”.
Non solo Audio
Pur avendo concetrato il focus principalmente sull’interazione vocale, non ci siamo dimenticati dei dispositivi Alexa dotati di schermo. Ne sono un esempio quelli della linea Echo Show o la Fire Stick TV, che porta il mondo Alexa sugli schermi delle TV di casa.
Per questo abbiamo affiancato all’interfaccia vocale un’interfaccia visuale che sia di supporto. Per farlo, abbiamo utilizzato una API apposita dell’ecosistema Alexa chiamato APL (Alexa Presentation Language) che permette di creare elementi visuali e di animarli. Puoi vedere un’anteprima del risultato in questa immagine.
Conclusioni
Alexa si è dimostrata una piattaforma matura e interessante anche per ambienti marcatemente enterprise, sia per il suo ecosistema che per la developer experience. Infine questa è stata un’occasione per fare quello che ci piace di più, portare tutta la nostra cross-funzionalità al servizio di un progetto tecnologicamente all’avanguardia e sfidante.
Photo credits: Carlos Muza on Unsplash