Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
910 connectés 

  FORUM HardWare.fr
  Programmation
  Algo

  Lib pour faire une lemnisation de textes en français

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Lib pour faire une lemnisation de textes en français

n°1782487
rufo
Pas me confondre avec Lycos!
Posté le 04-09-2008 à 11:41:29  profilanswer
 

Je cherche à faire le truc suivant : quand je tombe sur un mot, je voudrais avoir sa forme "initiale" et éventuellement (en bonus track) sa fonction grammaticale.
Ex :
j'ai dans une texte le mot "aimerait" : je voudrais avoir en sortie de mon algo, "aimer, verbe"
"voitures" -> "voiture, nom commun" (où au moins, "voiture, nom" )
...
 
Est-ce que vous connaissez une librairie (si possible en php) qui ferait ça gratuitement? A défaut, est-ce que vous connaitriez un dictionnaire de la langue français en mysql à télécharger librement?
 
J'ai déjà trouvé ça : http://alx2002.free.fr/utilitarism [...] er_fr.html
Mais bon, pour "aimerait", il me donne "aim"... C'est un début.
 
Merci.


---------------
Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta
mood
Publicité
Posté le 04-09-2008 à 11:41:29  profilanswer
 

n°1782511
rufo
Pas me confondre avec Lycos!
Posté le 04-09-2008 à 12:19:34  profilanswer
 

En lisant qq pdf trouvés par google, je suis tombé là-dessus : http://www.lexique.org/telecharger.php
 
Ca m'a l'air prometteur.


---------------
Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta
n°1786143
dan38700
Posté le 12-09-2008 à 16:38:19  profilanswer
 

Bonjour,
 
J'utilisais aussi le terme de lemnisation, mais il semble que les termes plus utilisés sont LEMMISATION ou mieux LEMMATISATION qui donnent beaucoup plus d'occurences dans google.
 
Voir par exemple ce lien :
 
http://www.guichetdusavoir.org/ipb [...] entry21360
 
En espérant que cela améliore votre recherche

n°1800440
rufo
Pas me confondre avec Lycos!
Posté le 15-10-2008 à 13:27:51  profilanswer
 

comme dit précédemment, j'ai carrément trouvé une "BD" de la langue française avec tout ce que je voulais donc, plus besoin d'un algo.
Cette BD donne le lemme de chaque mot, son découpage en syllabes ou consonnes/voyelles, des fréquences d'apparitions suivant des contextes (films, livres), fonction grammaticale, genre, singulier/pluriel... Bref, bien plus que mon besoin initial ;)


---------------
Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta
n°1975281
startx25
Posté le 19-03-2010 à 16:23:05  profilanswer
 

bonjour,
 
peux tu me fournir cet BD ?
car je planche sur le même problème
 
Merci
 

rufo a écrit :

comme dit précédemment, j'ai carrément trouvé une "BD" de la langue française avec tout ce que je voulais donc, plus besoin d'un algo.
Cette BD donne le lemme de chaque mot, son découpage en syllabes ou consonnes/voyelles, des fréquences d'apparitions suivant des contextes (films, livres), fonction grammaticale, genre, singulier/pluriel... Bref, bien plus que mon besoin initial ;)


n°1975301
rufo
Pas me confondre avec Lycos!
Posté le 19-03-2010 à 16:51:05  profilanswer
 

Je t'ai donné le lien : http://www.lexique.org/telecharger.php. Après, y'a plus qu'à parser le fichier texte et de modéliser une BD (1 ou plusieurs tables). Moi, j'ai fait qu'une table, mais la modélisation va grandement dépendre du traitement que tu veux faire derrière, donc ça va influer sur le parser.
 
Edit : pas la peine de me contacter par mon site perso, ce topic convient très bien (ou éventuellement en MP). ;)


Message édité par rufo le 19-03-2010 à 16:55:26

---------------
Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta

Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  Algo

  Lib pour faire une lemnisation de textes en français

 

Sujets relatifs
Gérer des fichiers textesLib/appli d'exploitation de stats ?
Récupérer les données à partir des zones de textesProblème de date en francais
RLE et fichiers textesCutenews en francais?
Génération fichier textes formatés depuis VB Exceltextes soulignés sous IE7 et pas sous IE6 et FF2
besoin d'aide date phpTest de numéro de téléphone international et français
Plus de sujets relatifs à : Lib pour faire une lemnisation de textes en français


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR