Perché usiamo le API di Google per lo Speech-to-Text? – Ormai creare chatbot privi delle tecnologie Speech-to-Text (STT) è diventato inaccettabile.

La maggioranza degli utenti vogliono interagire con i sistemi delle aziende utilizzando il proprio smartphone e, anche se le ultime generazioni hanno imparato a digitare molto rapidamente sulle piccole tastiere virtuali dei telefoni, è evidente che i sistemi STT sono destinati ad assumere un ruolo sempre più importante in tutte le forme di comunicazione.

Anche se nei loro primi anni, sistemi come Alexa e Google Assistant hanno attirato su di loro critiche e anche parecchia ironia per alcuni casi di malfunzionamento, è innegabile che la loro capacità di interagire con noi sta migliorando con una velocità che non lascia dubbi sulla centralità del ruolo che sono destinati a giocare.

Per quanto riguarda la comprensione del linguaggio, in ogni paese i centri di ricerca, le università e alcune aziende specializzate, da molti anni, lavorano su sistemi che riescono a offrire, per alcune lingue, tra le quali l’Italiano, risultati migliori di quelli offerti dalle API STT di Google.
Nonostante questo, in Athics, quando si è trattato di integrare nella nostra piattaforma Crafter.ai lo speech-to-text non abbiamo avuto esitazioni e la nostra scelta è caduta sulle API di Google.

Perché usiamo le API di Google per lo Speech-to-Text?

Il motivo di una decisione così “rapida” è stata l’osservazione del tasso di miglioramento nel tempo della qualità del servizio offerto da Google.

Anche se oggi il colosso americano non eccelle in tutte le lingue, la velocità con la quale i suoi sistemi si migliorano proietta una curva destinata a superare gran parte dei players che oggi possono vantare una soluzione marginalmente migliore.