Une dictée vocale sous GNU/Linux ?

vendredi 31 décembre 2010
par  Frédéric CUIF

Les professions juridiques ont souvent besoin d’outils comme la dictée vocale.

Dans les structures professionnelles dans lesquelles j’évoluais (sous Windows...) j’ai essayé les premiers logiciels comme IBM Via Voice ou plus tard la solution PHILIPS Speech Mike. Mais c’est rapidement la solution DRAGON NATURALLY SPEAKING qui s’est imposée à moi. Je dictais en direct dans un traitement de texte ou mieux dans l’utilitaire Dragon Pad, ou bien encore en différé dans un dictaphone en laissant le logiciel transcrire à une vitesse phénoménale, avec relativement peu d’erreurs.

Mais depuis plusieurs années que je suis sous GNU/Linux pour mon informatique personnelle (et maintenant pour mon informatique professionnelle, avec un serveur et des postes client sous Mandriva), la dictée vocale est restée dans mon placard...

À ma demande, la société NUANCE a eu dernièrement la gentillesse de me prêter une version d’essai de la DRAGON NATURALLY SPEAKING 11 LEGAL pour faire des essais sous Linux.

Malheureusement, Wine ne permet pas de la faire tourner, même pour des fonctions basiques, le son étant déjà relativement problématique à gérer (dans mon cas, avec Alsa sans PulseAudio pour la 2010.2).

J’ai donc utilisé la dernière version de Virtualbox (v. 4.0) pour virtualiser un Windows XP que je possède. Et alors que la version 8 de Dragon était allergique à Virtualbox, le son étant haché et quasiment inaudible (à mon avis, en raison de problèmes de Kernel RT que je n’avais pas installé), la version 11 fonctionne à merveille !

Bureau KDE

Revers de la médaille : d’une part, il faut encore utiliser Windows et d’autre part pour le virtualiser, je dois prévoir l’achat d’un nouveau matériel avec beaucoup de mémoire vive, puisque DRAGON en réclame au moins 2 Go de RAM pour fonctionner (je penche donc pour un ultraportable, ultragavé de RAM).

Cependant, le commercial de chez NUANCE au demeurant très sympathique, parfaitement compétent et au courant de la situation sur le plan informatique libre, m’a confirmé que l’éditeur cherchait à développer une version native sous GNU/Linux. Il faut dire qu’ils ne sont pas loin du but, puisqu’ils ont franchi le Rubicond avec Mac qui est un cousin... pas si éloigné que cela des architectures GNU/Linux.

NUANCE est par ailleurs intéressé par les retours que des professionnels pourraient faire pour évaluer leurs besoins et la nécessité du portage de son logiciel sous Linux.

Alors, si vous êtes dans ce cas, n’hésitez pas à écrire à l’éditeur pour qu’il porte enfin son logiciel.

PS : À quand le regroupement de l’ensemble des développeurs d’OCR libres pour avoir un produit enfin correct ?

MAJ 27/01/11 : Bon... ce n’est pas gagné cette affaire : la gestion du son sous Virtualbox est problématique, car il n’est pas bon (micro à prise jack), ce qui donne une reconnaissance assez capricieuse. Pour améliorer le son, il faut utiliser un connecteur USB qui élimine notamment une bonne partie du souffle. Mais, je ne parviens pas à faire reconnaître un périphérique USB sous ce maudit Virtualbox, même si la version annonce la prise en charge de l’USB. Je n’ai pas trop le temps de me pencher sur le problème.

NUANCE, au secours ! Je veux ce soft sous Linux !

MAJ DU 5/05/11 : Je voudrais remercier l’un de mes lecteurs, Albert, qui m’a donné la solution pour le problème de l’USB dont je parlais au dessus. Il m’a indiqué qu’il s’agissait sans doute d’un problème de droits dans les groupes, mon user ne faisant pas partie du groupe vboxusers : « BINGO ! » comme disent les anglais. Après le changement de droits, je capture à la main mon périphérique USB et tout fonctionne... quel bonheur !

La solution est d’autant plus agréable que les textes dictés dans le traitement de texte installé dans le SE virtualisé peuvent être exportés par simple copier/coller dans le traitement de texte sous Mandriva, ce qui simplifie nettement mes manipulations (j’utilisais un autre portable préinstallé d’un Windows 7 Pro... ça fait froid dans le dos :) ).

Merci encore Albert A !


Liens associés :


Commentaires

Logo de Frédéric CUIF
mardi 8 février 2011 à 12h41 - par  Frédéric CUIF

Merci de vos félicitations :)
À vrai dire, cet environnement offre une telle facilité d’utilisation qu’il s’est naturellement imposé pour moi après m’avoir déjà convaincu à titre personnel il y a de cela plusieurs années. Tout n’est pas parfait loin de là, mais le confort est déjà nettement plus important que sous un environnement Windows. Par ailleurs, je n’ai pas été séduit par MacOSX et pas seulement pour leurs prix prohibitifs (le Finder est notamment une relique peu conviviale par rapport à Konqueror ou Dolphin sous KDE).

Reste que les fabricants font encore peu de pilotes sous Linux, ce qui est tout de même handicapant pour utiliser nativement toutes les capacités du matériel et peu de professionnels s’intéressent à ce problème. Même constat pour certains logiciels. C’est fatiguant tout de même cette mentalité du moindre effort ! :)

Logo de Sagittarius
lundi 31 janvier 2011 à 12h06 - par  Sagittarius

Je tiens à vous féliciter pour l’utilisation de GNU/Linux dans votre cadre professionnel.
J’ai longtemps pensé être un de ces extravagants à recourir dès 2001 à ce système d’exploitation   en cabinet (Suisse). A l’époque, la lecture du CLUF lors de l’installation de Microsoft Windows imposait d’accorder des droits superutilisateurs à la firme américaine en cas d’appel à la maintenance via le réseau Internet, ce qui nous semblait contraire à la nécessité de protéger dans tous les cas le secret des dossiers.

Parce que les pc seraient connectés à la toile, la décision d’installer GNU/Linux sur tous les postes à été prise par mon boss sans difficulté. Nous pouvions déjà partager un scanner (grâce à Sane) chose impossible avec Windows, faxer depuis OpenOffice, et accélérer la consultation de l’Internet et nous en protéger par un proxy/firewall.

Pour ce qui est de la frappe du texte, abandonner ViaVoice ou Dragon imposait de s’astreindre à taper sur un clavier, de manière orthodoxe, de telle sorte à ne pas engendrer de fatigue visuelle et d’obtenir une vitesse de l’ordre de 50 mots / minutes.
Frapper avec tous les doigts confère un confort incomparable, on ne regarde jamais le clavier et contrairement à ce que l’on pourrait imaginer, l’apprentissage n’est pas très long : c’est une affaire de quelques jours. Je l’encourage toujours.