Amazon a des milliers d'employés qui écoutent les clips audio Echo dans le cadre de l'amélioration de l'apprentissage automatique d'Alexa afin que l'assistant personnel puisse mieux répondre aux commandes vocales.
Ces personnes écoutent ce que certains propriétaires d'Alexa disent à l'assistant, examinant, transcrivant et annotant les enregistrements audio pour aider à former le modèle d'apprentissage automatique d'Alexa.
Bloomberg a l'histoire:
Le travail est surtout banal. Un employé de Boston a déclaré avoir extrait des données vocales accumulées pour des énoncés spécifiques tels que «Taylor Swift» et les annoter pour indiquer que le chercheur voulait dire l'artiste musical.
Jusqu'ici tout va bien, mais…
Parfois, les auditeurs ramassent des choses que les propriétaires d'écho préfèreraient probablement garder privés: une femme qui chante mal sous la douche, par exemple, ou un enfant qui crie à l'aide. Les équipes utilisent des salles de discussion internes pour partager des fichiers lorsqu'elles ont besoin d'aide pour analyser un mot confus ou trouver un enregistrement amusant.
Je partage l'enregistrement audio d'un client avec un collègue dans le but de faire le travail. Mais partager un clip audio avec un collègue simplement parce que l'utilisateur a pu dire quelque chose de drôle ou de stupide me semble totalement faux et non professionnel.
Parfois, ils entendent des enregistrements qu'ils trouvent dérangeants, voire criminels. Deux des travailleurs ont déclaré avoir ramassé ce qu'ils croyaient être une agression sexuelle. Quand quelque chose comme ça arrive, ils peuvent partager l'expérience dans la salle de chat interne comme un moyen de soulager le stress.
Alors qu'Amazon a mis en place un processus que ses employés doivent suivre chaque fois qu'ils entendent quelque chose de pénible, certains employés ont été repoussés sans équivoque avec l'explication que ce n'était pas le travail d'Amazon d'intervenir.
Pour ceux qui sont préoccupés par la vie privée, le rapport affirme que les membres de cette équipe n'écoutent que certains des enregistrements vocaux qui ont été capturés dans les maisons et les bureaux des propriétaires d'Echo..
Un porte-parole d'Amazon a déclaré:
Nous prenons la sécurité et la confidentialité des informations personnelles de nos clients très au sérieux. Nous annotons uniquement un très petit échantillon d'enregistrements vocaux Alexa afin d'améliorer l'expérience client.
Par exemple, ces informations nous aident à former nos systèmes de reconnaissance vocale et de compréhension du langage naturel, afin qu'Alexa puisse mieux comprendre vos demandes et garantir que le service fonctionne bien pour tout le monde..
Les fichiers Sudio sont dépourvus d'informations identifiables comme le nom complet et l'adresse d'un utilisateur. Cela étant dit, Amazon aurait pu être plus transparent avec sa collecte de données:
Le processus de révision vocale Alexa, décrit par sept personnes qui ont travaillé sur le programme, met en évidence le rôle humain souvent négligé dans la formation des algorithmes logiciels. Dans les documents marketing, Amazon dit qu'Alexa «vit dans le cloud et devient toujours plus intelligente». Mais comme de nombreux outils logiciels conçus pour apprendre de l'expérience, les humains font une partie de l'enseignement.
Les utilisateurs peuvent ajuster les paramètres pour empêcher Amazon d'utiliser leurs enregistrements vocaux pour améliorer Alexa.
Le géant de la vente au détail en ligne reconnaît que les requêtes Alexa sont utilisées «pour former nos systèmes de reconnaissance vocale et de compréhension du langage naturel», mais cela est enterré dans une liste de questions fréquemment posées sur leur site Web. Peu importe comment vous le regardez, la reconnaissance vocale contextuelle est un écrou difficile à casser, mais l'apprentissage automatique promet d'être la bonne solution. Le problème est que les modèles d'apprentissage automatique doivent être formés.
Amazon a des équipes de personnes étiquetant et catégorisant les requêtes vocales AlexaPar exemple, Apple a formé Face ID avec plus d'un milliard de photographies de visages de personnes. En ce qui concerne la reconnaissance vocale, l'obtention d'une précision élevée nécessite de grandes quantités de données étiquetées.
C'est pourquoi le lancement de Siri dans une nouvelle langue n'est pas possible sans avoir suffisamment de données pour former les modèles acoustiques, et ces données doivent provenir de vraies personnes effectuant de vraies requêtes vocales. La seule différence entre Amazon et Apple est que le premier a des humains qui écoutent certains de ces enregistrements tandis que le second, sans doute, ne le fait pas.
Maintenant que vous savez qu'Amazon dispose d'une équipe mondiale qui écoute les clips audio Alexa, vous êtes plus ou moins susceptible de continuer à utiliser les produits Echo?
Faites-nous savoir en laissant un commentaire ci-dessous.