Reconnaissance vocale : On fait le point !

de | août 20, 2015

La reconnaissance vocale à beaucoup évoluée ces derniers temps et est un des axes majeurs de développement en informatique. Tout le monde connais maintenant les versions embarquées dans nos téléphones ( SIRI, Google Now, Cortana) et reposant sur des immenses centre de donnée. Si le taux de réponses correctes aux questions posées à ces services est en augmentation, cela se fait au détriment de la vie privée de leurs utilisateurs. Ces solutions demande en effet l’analyse de quantités toujours plus phénoménales de données afin d’apporter des réponses toujours plus fines. Le fait de devoir posséder une connexion internet est un autre facteur limitant. Le temps de réponse ou l’absence de réseau devenant vite problématique pour une utilisation poussée et productive de ces outils.

Je vous propose de faire un tour des différentes solutions qui s’offrent actuellement à nous en dehors de ces services reposant sur le BIG DATA.

  1. S.A.R.A.H : Derrière ce jolie nom, se cache le projet d’un assistant domotique écrit en C# pour la partie client et NodeJS pour la partie serveur. Il est le projet qui semble le plus avancé. Il dispose d’une bonne bibliothèque de plugins permettant d’ajouter pas mal de fonctionnalités. Il n’est toutefois pas exempt de reproche avec une dépendence envers le Kinect de Microsoft pour fonctionner ( même si l’utilisation avec un micro classique est possible),  le système Windows à cause du language C# et en partie Google pour des requêtes plus évoluées (Même problème que décrit en introduction).
  2. JASPER : Ce projet est complètement Open source et se veut comme un assistant personnel et domotique entièrement personnalisable. Il propose pour cela de définir des commandes à reconnaitre et de les associer avec des actions à effectuer. Cela peut allez de la simple réponse vocale au lancement d’une recherche sur internet ou à la prise de contrôle d’un dispositif domotique. A l’origine JASPER utilisait le moteur Pocket Sphinx pour fonctionner. Depuis le support des moteurs de Google, AT&T, Wit.ai et Julius à été ajouté. A noter que seul les moteurs PocketSphinx et Julius fonctionnent hors-ligne.
  3. CMUSphinx : Toujours Open Source, CMUSphinx est le projet à l’origine du moteur PocketSphinx. En plus de ce moteur de reconnaissance vocale, CMUSphinx propose un Framework Java nommé Sphinx 4 permettant le développement d’applications autonomes multiplateformes. Des dictionnaires linguistiques sont inclus pour différent languages mais vous devrez sans doute développer le votre pour obtenir des résultats plus pertinents.
  4. Api Windows : De la même manière que S.A.R.A.H, vous pouvez vous appuyer sur l’api window pour concevoir un logiciel de reconnaissance vocale hors-ligne. Celle-ci gère correctement un bon nombre de langue. Le language C# est de mise ainsi que l’utilisation du système Windows.

En conclusion, il est dorénavant possible de créer un système domotique performant reposant sur la reconnaissance vocale. Il vous faudra toutefois passer du temps à développer ou personnaliser le moteur utilisé afin d’obtenir des réponses pertinentes. Si l’utilisation de vos données par des services tiers ne vous dérange pas, l’api Google offre des résultats plus que satisfaisant.

A bientôt.

00

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.