Un développeur se casse un doigt et ne peut plus taper. Frustré par les outils de dictée payantsmal fichus, il code Handy : une app de transcription 100% locale, gratuite et open source qui tourne sous Whisper. Une alternative simple, qui fonctionne du feu de Dieu.
Un doigt cassé à l'origine du projet
C'est une histoire que rapporte l’ami Korben sur son blog. Un développeur se casse un doigt et se retrouve plâtré, incapable de taper au clavier pendant six semaines. Il cherche alors une solution de dictée vocale (speech-to-text). Son constat est sans appel : les alternatives sont décevantes. Dragon NaturallySpeaking est efficace mais coûte cher. Les outils intégrés à Google Docs fonctionnent bien, mais envoient systématiquement vos enregistrements dans le cloud, posant un vrai problème de confidentialité. D'autres, comme l'outil natif de Windows, sont jugés limités ou bugués. Face à ce vide, il a donc décidé de créer sa propre solution.
Handy : local, privé et open source
Le résultat s'appelle Handy, un outil qui fait une seule chose et la fait bien : vous appuyez sur un raccourci clavier, vous parlez, vous relâchez, et le texte s'écrit là où se trouve votre curseur. L'application fonctionne dans n'importe quel champ de texte. Sa force principale est d'être 100% locale. Handy utilise les modèles Whisper d'OpenAI (ou Parakeet, un autre modèle performant) qui tournent directement sur votre machine, sans jamais rien envoyer sur un serveur. Codé en Rust pour la performance, l'outil est cross-plateforme (macOS, Windows, Linux) et surtout, totalement gratuit et open source sous licence MIT.
Mieux que la dictée native de macOS ?
Sur le papier, Handy entre en concurrence directe avec la fonction "Dictée" intégrée à macOS. Si Apple propose bien un mode "sur l'appareil", la plupart des utilisateurs restent sur le mode par défaut qui, comme Google, envoie les données audio à Apple pour traitement. Handy garantit cette confidentialité par défaut. Mais la différence fondamentale est philosophique. La solution d'Apple est une boîte noire. Handy est transparent : son code est sur GitHub et son objectif n'est pas d'être "le meilleur", mais d'être le plus "forkable" (modifiable). Il se veut une base de départ simple pour l'accessibilité ou l'expérimentation, là où l'outil d'Apple est verrouillé.
On en dit quoi ?
L'initiative est intéressante. Elle rappelle que des solutions payantes ou intégrées par défaut ne sont pas toujours les meilleures. La frustration d'un seul développeur a donné naissance à un outil qui respecte la vie privée, fonctionne hors-ligne et s'avère franchement très performant grâce à l'intégration des modèles Whisper. Handy montre parfaitement la force de l'open source : plutôt que de subir un marché, le développeur a créé un outil qu'il "possède" réellement. C'est une solution d'accessibilité qui n'exige pas de compromis sur la confidentialité, ce qui devient rare. Reste à voir si le grand public est prêt à installer un outil tiers pour un usage que l'OS prétend déjà couvrir. Mais je vous conseille vraiment de tester, c’est vraiment très efficace.