Voici une vidéo de Seline datant d'Avril 2006 sur une fonctionnalité présentée depuis 2003. Elle montre la compréhension du langage courant de Seline :



Voici ensuite une vidéo de Siri, nouveauté des iPhone 4S :



L'idée de ce billet n'est pas de montrer une quelconque inspiration : Apple a racheté la société Siri qui avait présenté cette fonctionnalité il y a quelques années, et n'est pas donc pas responsable directement de cela. Non, l'objectif est de montrer que l'évolution est nulle depuis 2006 : nous avons le même problème depuis des années, à savoir le temps de réponse. Entre le moment où vous terminez votre phrase et le moment où l'ordinateur vous répond, il se passe au moins une seconde.
Dans ces conditions, la fonctionnalité reste un gadget puisqu'il est plus rapide de passer par les menus.
A l'époque, nous avions présenté cette fonctionnalité essentiellement pour les mal-voyants (avec la synthèse vocale, cela peut leur rendre de fiers services) et c'est encore le cas aujourd'hui.
Il faut savoir que ce n'est pas un problème d'Intelligence Artificielle qui créé ce délai : celle-ci est instantanée. C'est simplement la reconnaissance vocale qui met un certain temps à transcrire vos paroles en phrases écrites. Avec l'iPhone 4S, tout est réalisé sur des serveurs distants, et est donc très lié à votre connexion (l'iPhone en lui-même ne serait pas assez puissant).
Bref, nous avons encore quelques besoins de puissance de calcul pour réaliser une reconnaissance vocale instantanée :)