salut,
Il est toujours difficile de commencer à manipuler les langues naturelles quand on n'y a jamais touché. En fait la plupart des problématiques ont déjà été traitées mais il est assez dur de trouver de la doc dessus (surtout en français).
Pour ton problème il faut savoir si tu stockes toutes les formes possibles d'un mot ou uniquement le radical. Dans le premier cas, les pluriel, féminins de poseront pas de problème. Dans le second cas il va falloir mettre en place un moteur d'extraction de radical, vérifier l'existence du radical et vérifier ensuite qu'il existe une dérivation syntaxique (ajout d'infixe, préfixe, circumfixe et suffixe) qui donne le mot trouvé.
Dans tous les cas, afin de minimiser l'occupation mémoire et maximiser la rapidité il faut utiliser un bloom filter qui permet de travailler avec des probabilités plus que correctes.
un ptit lien : http://www.nada.kth.se/theory/projects/swedish.html
si tu as d'autres questions n'hésites pas!