gooopil pfiew | Jubijub a écrit :
Dans mon ancienne boite on avait acheté un soft pour localiser l'outil de gestion des concessions (qui était dispo en 20 langues de mémoire).
C'était une sorte de word, ou tu mettais le texte, et au fur et à mesure, le truc te soumettait des fragments de phrases de ton texte (en se basant sur la ponctuation il me semble) : il te proposait une phrase toute traduite, soit sur la base du fait que le fragment avait déjà été traduit, soit en faisant du mot à mot d'après la base de mots. Dans tous les cas c'était qu'une aide, il fallait valider le fragment pour passer au suivant. La base de mot, c'est un bête dictionnaire qui a chaque mot de la langue d'origine associe un mot dans la/les langues cibles. On avait du vocabulaire hyper spécifique au monde camion / après-vente (sur un faisceau électrique de camion, t'as 3 façons différentes de souder des fils, chacune ayant un nom différent par ex), donc la base de mot est une grosse aide (par ex une soudure à ultra-son ça doit toujours se traduire par splice), et donc ça accélère bien les choses de l'avoir.
Et donc le système "apprend" parce qu'il mémorise les trads que tu valides pour les fragments de phrases. Faux édit : j'ai retrouvé le soft : http://www.metatexis.com/index.htm . ça s'appelle un CAT (Computer assisted translation). Celui-ci offre un plugin pour word, y'en a qui offrent des plugins excel apparemment : http://wordfast.com/products_wordfast_anywhere.html En gros on avait une équipe support en Belgique, et les gars avaient été recrutés parce que outre FR, EN et NL, ils parlaient tous une ou 2 langues étrangères de plus, donc ils nous faisaient les trad pour ES, DE, PT, etc... On avait mesuré la productivité, et on avait eu des gros gain (me souvient plus le chiffre, mais ça avait convaincu le management d'acheter le produit). On avait aussi gagné en qualité, grace à la base de mot (tu traduits les memes mots de manière consistante). Pour les autres langues on passait par des traducteurs, et là on faisait de l'excel sauf erreur...
comment tu gères le max-length ? parce que selon si le mot c'est iiiiiii ou wwwww, un nombre donné de caractères produira des mots de taille très différente... (si t'as une bonne technique ça m'intéresse à fond, ça nous a bien empoisonné au moment de localiser le site pour la suisse, avec DE, IT, FR)
excel c'est clair que c'est flexible...c'est parfois un peu chiant si les gens sont pas discipliné (le goret qui te rajoute des lignes dans un excel, ou fout des commentaires dans des cases réservées à d'autres langues, ça rend parfois la récup de l'excel un peu sport, surtout si tu dois itérer pas mal
|
Ouais des CAT tools y'en a des dizaines. SDL a un cat justement (parmi plein d'autres choses, http://www.sdl.com/solutions/industry/translation/). Ce que tu décris c'est le fonctionnement de base des cat tools, segmentation en unités plus ou moins longues (plus l'unité est longue, moins tu trouves de match, plus c'est court, plus tu trouves de match, mais plus t'as de chances que la trad ramenée ne soit pas correcte.) C'est effectivement utile pour de la trad très technique, mais il faut faire relire systématiquement.
La base de mots, c'est un glossaire terminologique. C'est quelque chose qu'on utilise pas mal dans le JV (typiquement les termes des fabricants de consoles), de sa forme la plus simple sous forme de... fichier Excel (ouais st'une maladie à ce niveau), à sa forme plus évoluée, avec des outils pour vérifier que dans une phrase X, les terme Y apparaît bien avec sa bonne trad dans chaque langue.
Pour les longueurs, on utilise tout le temps le caractère "e" dans la police utilisée. Avec "i", tu surestimes, avec "w", tu sous estimes le nombre de caractères dispo. Ca peut être fait à la main ou automatiquement suivant le moteur qu'on utilise (en général, à la main, tu peux faire une table taille de la boite/taille de la police -> nombre de e dispos)
C'est pas parfait, loin de là, mais ça marche plutôt bien en général.
the real moins moins a écrit :
pour le traducteur. Bah Excel j'ai au moins deux problemes avec: ça veut dire que, de base, on repose sur un workflow genre "renvoie-moi le xls, je transforme +/- à la main dans <wahtever format technique> et je pousse dans les sources" entre le traducteur et le dev. Sans compter que rien ne me dit que le trados a pas pourri les clés, ajouté/deplacé des ligns ou des colonnes. Un systeme comme celui dont j'ai pasté le link plus haut, y'a plus ce workflow du tout et l'outil pousse tout seul dans les sources au besoin.
Le coup de l'encodage, je parle surtout de l'encodage unicode dont j'ai besoin dans mes .properties (Java...); après ouais, certes, y'a ptet une fonction dans excel qui fait cet encoding, mais on en revient au premier probleme. (le trados peut avoir viré la fonction, ne pas l'avoir dans sa version d'excel, ...)
Alors pour du one-shot je veux bien (et c'est sans doute ce qu'on va faire là) mais pour un truc à maintenir non merci.
Sinon c'est quoi SDL ?
|
Tu définies l'encodage de ton Excel en UTF-8 si c'est ce que tu veux, et y'a pas de raison que le traducteur y touche. Le traducteur qui modifie la structure du fichier est un âne, et il devrait pas bosser là dedans. T'as toujours moyen de faire des contrôles pour vérifier ça (tu dupliques la colonne ID à gauche et tout à droite du fichier, et tu vérifies que ça match avant d'importer par exemple, ça élimine les insertions de cellules au milieu du tableau), tu importes en contrôlant par string ID et surtout pas par ligne Excel, tu fais un fichier par langue plutôt qu'un fichier multi langue, tu importes en détectant les colonnes plutôt qu'en faisant confiance à l'ordre...
Le système que t'as linké est pas mal du tout hein, mais je ferais pas confiance en quelque chose que j'héberge pas (et j'aurais pas le droit de toute façon), et qui n'est pas une grosse boite réputée. Un système maison automatisé, c'est pas compliqué, et tellement plus flexible. Mais c'est sûr que pour du one shot, ça vaut pas le coup d'y passer du temps J'avais fait un système similaire dans mon ancienne boite, j'ai du y passer 2 ou 3 mois à temps partiel, mais y'a une dizaine de personnes qui s'en servent tous les jours, plusieurs fois par jour, donc l'investissement était valable.
the real moins moins a écrit :
J'allais demander... parce que je sais plus qui parlait aussi de max length plus tot (c'etait pas toi?) et je trouve pas ça super relevant; effectivement si le texte d'origine est "Toto" et que le trados te propose "verfassungswidrig" on est ptet mal mais bon, entre ça et les LTR vs RTL je sais pas ce qui sera le plus problematique à ajuster.
|
the real moins moins a écrit :
un peu ? On a tenté le coup (via google docs en fait, donc deja on eliminait presque le pb de workflow-via-email) sur une 10aines de langue etun total de ptet 2000 clés (repartis sur plusieurs feuilles, ce qui certes n'aidait pas); un doc par langue, donc meme pas d'overlap entre traducteurs... je crois pas que y'en ai un seul qui soit repassé sans soucis - soit les formules avaient disparus, soit les colonnes etait changées, ..soit je sais plus quoi d'autre mais bref... un merdier)
|
Les traducteurs de JV sont peut être plus éduqués, mais ça nous arrive hyper rarement, et des fichiers Excel, j'en ai vu passer... Faut les éduquer
En résumé, pas de solution miracle, à partir du moment où le format que t'intègres est pas translator-friendly, t'es obligé d'avoir un truc au milieu...
Si jamais tu utilises l'outil que t'as linké, hésite pas à poster un retour, je suis curieux  |