analyseur lexical en C

Recherche :

Mot : Pseudo : Filtrer
Bas de page
Auteur	Sujet : analyseur lexical en C

joy way

salut
je suis chargée de faire un analyseur lexical développé en langage C, j'arrive pas à faire un plan pour mon travail, les principaux structures que je dois créer. j'ai compris qu'il faut que je crée une structure de donnée qui contient deux champs:

Code :

struct res_retour
{
char unité;
char attribut;
}

Cependant y'en a pleins de questions qui se posent:
comment ferai-je la vérification, quelle est la variable qui contiendra les mots clés? doit-elle etre une structure de donnée? si oui quelles sont les champs? ou doit-elle etre une pile, tableau? et puis lors de traitement des différents cas {switch () case(nb): {...} break;case(id):{} break;...case(mot-clé) case (espace) ou doit-je stockés le résultat du case?

Il est demandé de:
*Construire un automate fini qui accepte l’ensemble suivant
des mots (unités lexicales ou jetons, terminaux d’une grammaire) { :, id, :=, ;, nb, ,, nbr, +, *, entier, réel, (, ), espace }
Où id représente les identificateurs alphanumériques qui commencent par un caractère alphabétique (l(l+c)*), nb représente les nombres entiers c+ et nbr est nombre réel c+.c+
espace représente une séquence d’espaces blancs ou de tabulations.
*Etendre l’automate pour pouvoir retourner à l’état final deux valeurs. La première est l’unité trouvée selon l’état final atteint et la deuxième est un attribut supplémentaire.
Si l’unité trouvée est un id qui n’est pas un mot clé alors la première valeur retournée est id et la deuxième est une entrée dans une table contenant les identificateurs.
Si l’unité trouvée est un mot clé (sachant que les mots clés sont : début, fin, program, var, entier, réel (Il faut sauvegarder quelque part cette liste de mots), alors, les valeurs retournées sont le mot clé et 0.
Si l’unité est nb alors la deuxième valeur est la valeur de ce nombre. L’automate doit pouvoir sauter les espaces, les retours à la ligne et les tabulations.

Je doit créer une fonction :RangerId() et UnilexId();

La fonction RangerId() a accès au tampon où l’unité lexicale identificateur a été localisée. On examine la table des symboles et si on trouve le lexème avec l’identificateur mot clé, RangerId() rend 0. Si on trouve le lexème comme variable du programme, RangerId() rend un pointeur vers une entrée dans la table des symboles. Si on ne trouve pas le lexème dans la table des symboles, il y est placé en tant que variable et un pointeur vers cette nouvelle entrée est retourné.
La fonction UnilexId() recherche le lexème dans la table des symboles. Si le lexème est un mot clé, l’unité lexicale correspondante est retournée; autrement, l’unité lexicale id est retournée.

Voilà tout me parait ambiguë, votre aide me sera très utile .
Merci d'avance

Publicité

kadreg

profil: Utilisateur

et utiliser un outil adapté, comme lex (ou flex) ?

---------------
brisez les rêves des gens, il en restera toujours quelque chose... -- laissez moi troller sur discu !

joy way

non je ne dois utiliser que le C.

gilou

Modérateur
Modzilla

Citation :

Construire un automate fini qui accepte l’ensemble suivant

Dessine le, ton automate, c'est pas dur.
une fois dessiné, tu peux assez facilement créer une table qui a pour lignes les états, pour colonne les symboles, et qui a pour valeur [e, s] l'état auquel fait passer le symbole s quand on est dans l'état e.

Et après, ça roule ou presque.

A+,

---------------
There's more than what can be linked! -- Iyashikei Anime Forever! -- AngularJS c'est un framework d'engulé! --

gilou

Modérateur
Modzilla

En fait dans ton cas, c'est encore plus simple (ce que je t'ai mis correspondait plus à la phase de l'analyseur lexical):

Tu peux faire un truc style (je garantis rien sur la qualité de ce qui suit, c'est juste pour te donner une idée de l'approche à suivre).

Code :

#define TOKEN_START 0
#define TOKEN_ASSIGN 1
...
#define TOKEN_END ...
#define TOKEN_ERROR ...
static int lexint;
static float lexreal;
static char *lexident[MAX_IDENT_SIZE];
static int identnum;
static char *lexkw[8] = { "début", "fin", "program", "var", "entier", "réel"}; // faudra faire gaffe aux accents
unsigned short next_token(FILE *f) {
static char current = EOF;
static char buffer[MAX_IDENT_SIZE+1]; // choisir une taille assez grande pour contenir un ident un int ou un reel
unsigned short token;
int i = 0;
if (current == EOF) {current = fgetc(f);}
switch (current) {
case EOF: token = TOKEN_END;
break;
case ':': current = fgetc(f);
if (current == '=') {
current = EOF;
token = TOKEN_ASSIGN;
}
else {
token = TOKEN_DDOT;
}
break;
case ' ': token = TOKEN_SPACE;
break;
case 'A': case 'B':
...
case 'Y': case 'Z':
...
case 'a': case 'b':
...
case 'y': case 'z': do {
buffer[i++] = current;
current = fgetc(f);
} while (((current >= 'A' && current <= 'Z') || (current >= 'a' && current <= 'z')) && (i < MAX_IDENT_SIZE));
buffer[i] = 0;
if (i == MAX_IDENT_SIZE) {
token = TOKEN_ERROR;
}
else {
current = EOF;
// faire d'abord une recherche dans la tables des mots clés et retourner un token spécifique si oui
addident(lexident, buffer); // ajouter l'identificateur à la table s'il n'y est pas, et positionner identnum
token = TOKEN_IDENT;
}
break;
...
default: token = TOKEN_ERROR;
break;
}
return token;
}

Et je suppose que tu as qque part un analyseur syntaxique comme indique dans mon post précédent qui va faire un

Code :

f = fopen(...);
e = STATE_START;
do {
t = next_token(f);
e = nextstate[e, t];
switch(e) {
// actions a faire pour l'état e s'il y en a
} while (e != STATE_END);
fclose(f);

A+,

Message édité par gilou le 13-04-2012 à 19:35:17

---------------
There's more than what can be linked! -- Iyashikei Anime Forever! -- AngularJS c'est un framework d'engulé! --

FORUM HardWare.fr

Programmation

analyseur lexical en C

Sujets relatifs
Compilateur C++ en java	LANCER C++ A PARTIR DE JAVA
problème de passage de C au C++	Triac et µC
[HELP] Analyseur de logs	[C# / LINQ to XML] Générer des balises contenant des ':'
Retour fonction C	Silverlight C# problème Wrappanel
[C#] REST, méthode POST, valeur du stream, doit il être encodé ?
Plus de sujets relatifs à : analyseur lexical en C

Page générée en 0.073 secondes