💾 Archived View for unbon.cafe › lejun › posts › 20220610_ipa.gmi captured on 2024-12-17 at 09:49:57. Gemini links have been rewritten to link to archived content
⬅️ Previous capture (2024-05-10)
-=-=-=-=-=-=-
Dans le cadre de la création d’un dictionnaire alsacien-français[1], j’ai voulu mettre en évidence un aspect essentiel du language qu’est la prononciation. À partir de l’orthographe des mots ainsi que de la correspondance des caractères en alphabet phonétique international (IPA), il me fallait trouver une solution pour assurer la conversion des mots autrement que par copier-coller manuel. Dit autrement « Des linguistes travaillent régulièrement avec l’IPA, il devrait exister des solutions répondant à mon besoin ».
Comme l’on pouvait s’y attendre et exposé entre autres par M.Howards[2], écrire en IPA au quotidien se révèle être une tâche complexe. Là où copier-coller quelques symboles est juste ennuyeux, le faire sur de grands jeux de données relève de la folie. Taper les caractères manuellement à l’aide de leur séquence Unicode n’étant guère plus efficace. L’on retrouve ainsi trois possibilités par ordre de complexité :
La première solution bien que restant un clic-o-tron, représente un gain de temps non négligeable par rapport à la méthode copier-coller ; Changer de disposition clavier est l’étape au dessus encore, sous réserve que l’arrangement des touches sur un clavier ordinaire soit adapté ; La dernière méthode reste la plus ouverte et malgré un investissement important tant en terme de moyens financiers que de temps pour la disposition clavier, elle est celle au potentiel le plus important.
La correspondance entre l’orthographe et les symboles phonétiques est relativement simple[3], si bien qu’il paraît possible de procéder par un simple remplacement de caractères exception étant de quelques rares séquences qui doivent être traitées manuellement. S'ajoute à ça une marge de liberté quand aux prononciations qui ne semblent pas avoir de symbole phonétique correspondant totalement – les lettres b et p étant confondues en un son médian, idem pour d/t et k/g –, la tâche se révèle être assez simple.
Tant pis pour le clavier IPA dédié, il semblerait qu’il ne soit pas encore l’heure de son entrée dans ma boîte à outils. Reste qu’il va une fois encore devoir faire appel aux expressions régulières, pour les lettres e et s dont la prononciation varie en fonction de leur voisinage :
Un traitement manuel sera également nécessaire pour les caractères dont la prononciation diffère de manière arbitraire soit i – [e] ou [i] – et ch – [x], [ç] ou [k]. De même, pour la lettre a et ses diacritiques que je soupçonne de s’être perdues dans mes recherches.
[1] Projet de dictionnaire alsacien-français, Lejun 2022
[2] Construction d’un clavier IPA, M.Howards 2018
[3] Table de correspondance caractères et symboles IPA, Lejun 2022