Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2598 connectés 

  FORUM HardWare.fr
  Programmation
  PHP

  Cherche base de mots...

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Cherche base de mots...

n°923451
goodspirit
Posté le 15-12-2004 à 00:29:35  profilanswer
 

Salut a tous.
Je souhaite développer en php un dictionnaire de mots croisés
Voila, j'ai deux problèmes et espère votre aide.
Premièrement, je ne sais pas trop comment trouver une liste de mots : j'ai regardé vite fait les dico de brut force mais ceux sur lesquels je suis tombés me semblaient incomplets et inadaptés. Avez vous une méthode ou un conseil ou un lien a me fournir svp?
Deuxièment (qui est beaucoup plus d'ordre de programmation), c'est a votre avis, comment dois-je enregistrer les mots dans ma base de donnée mysql? J'avais penser a mettre par lettre dans des tables différentes selon leur longueur, mais il me semble que php/mysql serait assez bien exploité des mots en vrac et en entier dans une simple table, et les trier selon les opérateurs "?","*",etc. Ais raison, cela vous semble t-il faisable et idéal?
Merci d'avance...

mood
Publicité
Posté le 15-12-2004 à 00:29:35  profilanswer
 

n°924489
goodspirit
Posté le 15-12-2004 à 21:23:43  profilanswer
 

beu !!! :'(, peronne ne me répond, personne ne m'aime !!!

n°925886
nagadoudi
T nagadoudi, rentre ta finette
Posté le 17-12-2004 à 11:58:27  profilanswer
 

Le dictionnaire d'OpenOffice.org est pas mal.

n°925898
sircam
I Like Trains
Posté le 17-12-2004 à 12:15:34  profilanswer
 

Ton problème n'est manifestement pas propre à PHP. [:kiki].
 
Tu aurais sans doute une meilleure audience et, partant, plus de chance de succès en postant dans la bonne cat.


---------------
Now Playing: {SYNTAX ERROR AT LINE 1210}
n°926485
ACut
Posté le 17-12-2004 à 21:30:55  profilanswer
 

goodspirit a écrit :

Salut a tous.
Je souhaite développer en php un dictionnaire de mots croisés
(...)
Premièrement, je ne sais pas trop comment trouver une liste de mots
 
Deuxièment (qui est beaucoup plus d'ordre de programmation), c'est a votre avis, comment dois-je enregistrer les mots dans ma base de donnée mysql? (...)
Merci d'avance...


 
1) Récupérer la base "Graphèmes" de http://www.lexique.org/
Pour une base de noms propres, chercher dans les sites spécialisés en astrologie (!!), qui font le profil des personnages célèbres. Avec un bon suceur PHP on récupère de vrais trésors lexicaux... Pour les toponymes, je sèche.
Traitement, tri, épluchage des bases de mots: awk, indispensable pour faire du boulot efficace.
 
2) Les structures arborescentes sont souvent optimales pour les applications de mots croisés, mais je sais pas comment ça s'implémenterait proprement en DB...


---------------
NOUVEAU! Le guide de l'édition en version ebook : http://marcautret.free.fr/autret/150q-ebook/
n°926762
the real m​oins moins
Posté le 18-12-2004 à 03:38:11  profilanswer
 

ACut a écrit :

1) Récupérer la base "Graphèmes" de http://www.lexique.org/


Citation :

Lexique est une base de données qui fournit pour 130000 mots du français

houlà, c'est mal barré au niveau du français :/


---------------
Hey toi, tu veux acheter des minifigurines Lego, non ?
n°926763
naceroth
Posté le 18-12-2004 à 04:01:38  profilanswer
 

the real moins moins a écrit :

Citation :

Lexique est une base de données qui fournit pour 130000 mots du français

houlà, c'est mal barré au niveau du français :/


 
En prennant la phrase partiellement oui, parce que au complet, c'est correct :D

n°926764
the real m​oins moins
Posté le 18-12-2004 à 04:16:56  profilanswer
 

ha oui, je viens de relire, mais dans ce cas c'est la ponctuation qui est incorrecte :o
(il manque au minimum une virgule apres "fournit", et le double point me parait plus que douteux)


Message édité par the real moins moins le 18-12-2004 à 04:17:18

---------------
Hey toi, tu veux acheter des minifigurines Lego, non ?
n°926915
ACut
Posté le 18-12-2004 à 15:17:45  profilanswer
 

the real moins moins a écrit :

(...)
C'est la ponctuation qui est incorrecte :o
(il manque au minimum une virgule apres "fournit", et le double point me parait plus que douteux)


 
C'est probablement en raison du deux-points que les rédacteurs ont résisté à la virgule après fournit. En effet, l'énumération à suivre indique «ce que la base fournit»; il semblait donc préférable de ne pas segmenter davantage la structure de la phrase entre le mot fournit et le deux-points.
 
Cela reste bien sûr une cote mal taillée. Une solution optimale eût été: «Lexique est une base de données qui, pour 130000 mots du français, fournit: les représentations orthographiques et phonémiques, la syllabation, etc.»
 
L'autre objection faite par the real moins moins (caractère "douteux" du deux-points, sic) semble difficile à justifier puisque la fonction la plus répandue de ce signe de ponctuation est bel et bien d'introduire une énumération.


---------------
NOUVEAU! Le guide de l'édition en version ebook : http://marcautret.free.fr/autret/150q-ebook/
n°927005
the real m​oins moins
Posté le 18-12-2004 à 18:13:23  profilanswer
 

avec la phrase d'origine, le : semble innaproprié: il fait buter la lecture; sans les virgules le précédent, il ne m'est pas apparu comme introduisant une énumération, justement.
 
 
 
(vais me faire flinguer sur mon point virgule, moi [:chacal_one333])


Message édité par the real moins moins le 19-12-2004 à 16:21:53

---------------
Hey toi, tu veux acheter des minifigurines Lego, non ?
mood
Publicité
Posté le 18-12-2004 à 18:13:23  profilanswer
 

n°927403
pains-aux-​raisins
Fatal error
Posté le 19-12-2004 à 13:16:33  profilanswer
 

[:drapal]

n°927591
goodspirit
Posté le 19-12-2004 à 20:20:54  profilanswer
 

sircam a écrit :

Ton problème n'est manifestement pas propre à PHP. [:kiki].
 
Tu aurais sans doute une meilleure audience et, partant, plus de chance de succès en postant dans la bonne cat.


 
Exact et j'en suis conscient mais je savais pas du tout dans quelle catégorie poster..., désolé
 

ACut a écrit :


Traitement, tri, épluchage des bases de mots: awk, indispensable pour faire du boulot efficace.


awk ? kézako? je ne sais pas ce que c'est, si tu pouvais m'orienter un peu s'il te plait...
 
Qu'entend tu par structure récurrente ?
Je comprend (plus ou moins) ce que ca veut dire mais je ne vois pas comment les utiliser dans ce cas.
 
En tout cas, merci à tous...


Message édité par goodspirit le 19-12-2004 à 20:21:39
n°927681
Xav_
The only one...
Posté le 19-12-2004 à 23:03:57  profilanswer
 

http://www.shellunix.com/awk.html
1er résultat de la recherche "awk" sous google...
faudrait peur etre se donner les moyens de chercher quand on veut trouver ;)


---------------
- Xav - ...There are no crimes when there are no laws... -- Xav's World
n°927784
jagstang
Pa Capona ಠ_ಠ
Posté le 20-12-2004 à 09:53:33  profilanswer
 

J'ai 70 Mo de mots. PM stp

n°928674
ACut
Posté le 20-12-2004 à 23:40:35  profilanswer
 

goodspirit a écrit :

Exact et j'en suis conscient mais je savais pas du tout dans quelle catégorie poster..., désolé
 
 
awk ? kézako? je ne sais pas ce que c'est, si tu pouvais m'orienter un peu s'il te plait...
 
Qu'entend tu par structure récurrente ?
Je comprend (plus ou moins) ce que ca veut dire mais je ne vois pas comment les utiliser dans ce cas.
 
En tout cas, merci à tous...


 
awk est un simple langage de traitement orienté "fichiers texte". Basé sur les expressions régulières, il permet de récupérer, d'analyser et de reclasser des corpus de mots (ou de textes) à très grande vitesse, via des commandes (ou fichiers de commandes) rudimentaires. On peut le concevoir comme un outil "en amont" pour des applications linguistiques, lexicographiques, etc.
 
Un exemple concret d'utilisation dans ton cas: mettons que du disposes d'une base de 130.000 graphèmes -- c'est le cas de Lexique.org, qui procure un fichier de 16 Mo doté de nombreux champs documentaires. Ton objectif sera typiquement de récupérer et dipatcher tous ces graphèmes dans N fichiers DICO_01, DICO_02, ..., DICO_N de telle sorte que DICO_i rassemble les mots du corpus comptant i lettres. awk permet d'opérer vite et bien quand tu n'as pas 3h devant toi pour développer un programme ou une macro "ad hoc".
 
Concernant la structure "arborescente", c'est un mode de représentation qui paraît approprié pour les dictionnaires en général: une lettre = un noeud, 26 noeuds racine et le système de pointeurs habituel pour "progresser" dans les ruches de mots. Un application de mots croisés aura généralement besoin de mesurer très vite, à un point donné d'un embranchement genre A->P->O->..., quels sont les mots existant dans cette ruche, combien ils sont, et aussi comment passer à la ruche suivante (ce qui revient à remonter à A->P->... et à chercher le noeud cousin de O dans l'arbre). Voilà pourquoi j'évoquais cette structure, qui s'avère en outre particulièrement légère dans le cas de dictionnaires dont les mots sont à taille fixe (N-grammes).
 
Voilù.


Message édité par ACut le 20-12-2004 à 23:41:17

Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  PHP

  Cherche base de mots...

 

Sujets relatifs
MyODBC, acces a une base de données distanteune sorte de "panier commande" sans base de données
inserer un document dans une base de donnéeProblème d'insert d'une image dans une base Mysql
Théorie - Comment organiser une base de donnéesUtilisation d'une base de données avec VB 6.0
yatil un nom pour les menus types mappy.fr ?je cherche un codeDécaler les valeurs dans une base mySQL
[Oracle] Créer une base de données[SQL SERVER] Faire un dump de la base en SQL
Plus de sujets relatifs à : Cherche base de mots...


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR