Djazairess : La voix devient une interface des services en ligne

Fédération algérienne de Boxe: le président Abdelkader Abbas prend part à la réunion de la World Boxing Chutes de neige, lundi, sur les reliefs dépassant les 1300 m et vents forts sur le Sud à partir de dimanche Formation professionnelle : lancement des qualifications pour les Olympiades des métiers dans les wilayas de l'Est du pays Début à Alger des travaux de l'atelier régional du bureau de liaison pour l'Afrique du nord du CISSA Ghaza : le bilan de l'agression génocidaire sioniste s'alourdit à 51.201 martyrs et 116.869 blessés Meziane appelle les journalistes sportifs à défendre les valeurs et les règles d'éthique professionnelle Aïd El Adha : neuf ports recevront prochainement des navires de moutons importés Une journée où le stress a dominé les rencontres Le MC Alger écope de deux matchs à huis clos Les journalistes piégés dans l'enclave Préparatifs de l'Aïd El-Adha Foot/ Ligue 1 Mobilis : le MCA s'impose à Biskra, le CRB renverse l'ESM Ouverture de la Semaine scientifique de l'Académie algérienne des sciences et des technologies Le parti TAJ réitère son "rejet catégorique" de toute ingérence étrangère dans les affaires intérieures du pays Cybersécurité: Journée d'information et de sensibilisation au profit des élèves du cycle secondaire à Alger Le président de la Fédération équestre algérienne élu au Conseil d'administration de l'Union arabe d'équitation M. Meziane réaffirme l'importance de former des journalistes engagés dans la défense des intérêts du pays et de la société Début des travaux de la 8ème conférence internationale de solidarité avec peuple sahraoui APN: session de formation dimanche sur "La sécurité des Smartphones" Le ministre de la Communication préside à Alger l'ouverture d'une session de formation au profit des journalistes Mobilis : Les médias à la découverte de la 5G Les enjeux des changements climatiques et de la biodiversité débattus Des matchs à double tranchant Le Prix national de l'innovation scolaire lancé Le Quai d'Orsay et le lobby pro-israélien, principaux soutiens de Boualem Sansal Nessim Hachaich plante les couleurs nationales au plus haut sommet du monde Rencontre sur les mécanismes de protection L'Institut d'agriculture de l'Université Djilali-Liabes invite les enfants de l'orphelinat Mois du patrimoine: un programme riche et varié dans les wilayas du Sud Opéra d'Alger: ouverture du 14e Festival international de musique symphonique Malgré le déstockage d'énormes quantités, la pomme de terre reste chère Hamlaoui présente trois projets d'aide pour les femmes du mouvement associatif La Fifa organise un séminaire à Alger Khaled Ouennouf intègre le bureau exécutif L'Algérie et la Somalie demandent la tenue d'une réunion d'urgence du Conseil de sécurité 30 martyrs dans une série de frappes à Shuja'iyya La Coquette se refait une beauté Un rempart nommé ANP Lancement imminent d'une plate-forme antifraude Les grandes ambitions de Sonelgaz La force et la détermination de l'armée Tebboune présente ses condoléances Lutte acharnée contre les narcotrafiquants Cheikh Aheddad ou l'insurrection jusqu'à la mort Un historique qui avait l'Algérie au cœur Création «prochaine» de délégations de wilayas de la société civile

Merci d'avoir signalé!

Cette image sera automatiquement bloquée après qu'elle soit signalée par plusieurs personnes.

La voix devient une interface des services en ligne

Farid Farah Publié dans Le Quotidien d'Oran le 15 - 04 - 2015

La modélisation mathématique permet aujourd'hui de traiter la parole comme une donnée biométrique. La voix remplacera, un jour, l'authentification par mot de passe introduit via un clavier.
Les dix dernières années témoignent des progrès énormes réalisés dans l'amélioration de la fiabilité des systèmes de traitement automatique de la parole. Ce progrès a radicalement changé les environnements software et hardware des télécommunications. Un signal vocal, lors de son traitement par un processeur d'un smartphone, ou lors de son transport par les réseaux des opérateurs des télécommunications, est traité avec plus d'efficacité par les équipements numériques, et ce, grâce aux progrès réalisés dans la modélisation mathématique du processus de la production de la parole humaine. Ces performances scientifiques ont mené à une analyse et synthèse de la parole de qualité supérieure, à une reconnaissance automatique du locuteur et à la réalisation de codeurs de parole.
En incluant les technologies vocales dans les terminaux mobiles et ordinateurs portables, grâce à des logiciels de plus en plus performants de codage et de compression des données, la messagerie électronique vocale (Voice mail), les systèmes de traduction vocale en ligne, les terminaux intelligents, les ordinateurs individuels, les voitures connectées et les réseaux, l'avenir des télécommunications ne se fera aucunement sans évoquer le rôle primordial du traitement automatique du langage naturel joué dans le développement du Dialogue Homme/Machine. Ainsi, le lancement par Apple en 2011 de son service de reconnaissance vocale Siri permettant de commander vocalement son iPhone a simplifié la vie de son utilisateur et a, surtout, prouvé que la voix humaine occupe désormais le premier plan des usages mobiles innovants. Siri est un service qui permet à l'usager d'émettre une commande vocale, qui sera envoyée vers les serveurs Cloud d'Apple pour être analysée, afin d'exécuter l'action désirée par l'utilisateur. Un tel service est le fruit de travaux de recherche effectués dans le domaine de la production de la parole qui sont orientés vers une meilleure caractérisation quantitative de son analyse.
Speech to Text
Cette avancée a été obtenue grâce à une paramétrisation (action de modifier la structure d'un élément numérique) permettant la réduction de la largeur de bande et une représentation par un nombre réduit de paramètres pertinents. Aussi, les avancées réalisées dans l'analyse et la modélisation de la voix ont permis d'atteindre des objectifs inattendus dans le domaine de la recherche par mots clés dans le web. La technique du "Speech to Text" en est un exemple. Il s'agit d'une méthode de transcription automatique des sons des vidéos au format texte pour permettre un meilleur référencement du contenu. L'usager sera alors amené à juger le contenu d'un film avant même de l'avoir vu. La recherche d'une vidéo ou d'un programme TV web devient alors plus simple et surtout plus rapide. Malgré l'intérêt de cette solution de recherche par la parole, elle n'est toujours pas totalement démocratisée. Mais elle est d'une grande utilité dans la mesure où le nombre de vidéos présentes sur la toile a déjà dépassé le nombre de requêtes sur les moteurs de recherche. Le moteur de recherche Google est le premier à introduire la technique "Speech to Text" qui subira prochainement des améliorations inédites. Il sera possible alors de convertir du séquençage vidéo au format texte. Adobe va introduire cette technologie sur certains contenus.
Côté perspectives, l'authentification par signature vocale suscite beaucoup d'intérêts dans le renforcement de la sécurité des réseaux des télécommunications. A l'avenir, les utilisateurs qui accèdent à un réseau par un terminal mobile subiront un contrôle d'identité vocal afin de permettre de détecter des usagers non autorisés. Pour cela il est nécessaire d'implanter un système de reconnaissance vocale du locuteur déporté en ligne qui, en temps réel, authentifie la voix de l'utilisateur. Cependant, la disponibilité de cette technologie est conditionnée par la levée d'un obstacle très important. Il s'agit des limites relevées dans les terminaux dans le computing des programmes nécessaires à cette opération. Ces derniers doivent être stockés dans des serveurs Cloud. C'est pourquoi, les caractéristiques d'un réseau de communication doivent être prises en compte. Par exemple, la voix doit être codée à bas débit pour éviter une consommation trop importante de bande passante, et la transmission des communications doit reposer sur une architecture distribuée. La durée de vie d'un clavier, du moins pour certains usages et applications, est ainsi comptée...

Cliquez ici pour lire l'article depuis sa source.