La reconnaissance vocale est une fonction assez ancienne puisque les premiers outils ont été conçus dans les années 50 dans les laboratoires Bell Labs puis dans les années 70 chez IBM. Le premier dispositif d’assistant vocal commercial a été lancé en 1971, il s’agissait du « Voice Command System » de J.J.W. Glenn et M.H. Hitchcock qui permettait de reconnaître 24 mots isolés après une phase d’apprentissage. Depuis, les assistants vocaux se sont développés et ont connu un essor important à partir des années 1990 avec leur intégration dans les ordinateurs grand public d’IBM puis en 2007 dans Windows Vista, le système d’exploitation de Microsoft. Mais c’est surtout depuis 2011, année du le lancement de Siri, l’assistant vocal d’Apple intégré dans l’iPhone 4S, que les assistants vocaux ont connu un essor important et une démocratisation. De nos jours, la voix est utilisée pour interagir avec un moteur de recherche ou un assistant numérique effectuant de multiples tâches. Le marché compte quatre acteurs principaux : Apple (Siri), Google (Google Assistant), Microsoft (Cortana) et Amazon (Alexa). D’autres initiatives existent et de nombreux assistants se développent avec Facebook (M), Orange et Deustche Telekom (Djingo) ou encore Samsung (Bixby). Le marché pourrait représenter plus de 10 milliards de dollars dès 2020. Ce nouveau type d’interaction entre l’utilisateur et son équipement terminal apparaît comme plus pratique dans de nombreux cas : en voiture, en déplacement, ou lorsque l’utilisateur est occupé par une autre activité. Néanmoins, l’usage de la voix en public, au travail ou dans les transports en commun semble toujours délicat pour une grande partie des utilisateurs qui ne souhaitent pas voir leurs recherches sur internet exposées en public. Ainsi les assistants, pour convaincre l’ensemble des utilisateurs, pourraient évoluer ou se diversifier plus largement vers des interfaces écrites de type chatbots.