petit algo, pour avis

Recherche :

Mot : Pseudo : Filtrer
Bas de page
Auteur	Sujet : petit algo, pour avis

xilebo

noone

Bonjour,

je me permets de vous soumettre un petit code python que j'ai écrit, afin de parser un répertoire de façon récursive, de récupérer seulement les fichiers dont l'extension est xml et hex ( la racine est la même) et d'extraire dans l'un le checksum en texte, et l'autre en binaire à une adresse donnée. Le but est de ressortir les fichiers qui ont des checksums différents.

Voici le résultat :

Code :

import os
import xml.etree.ElementTree as ET
def r_parse_xml(e):
try:
tree = ET.parse( e['xml'])
root = tree.getroot()
except:
print("Echec de lecture de " , e['xml'])
else:
'''
<fichier.configuration>
<BlocPlugAndPlay>
<pnp_fin label="M9012"/>
<pnp_idcan hexa="100"/>
<pnp_ring hexa="0"/>
<pnp_revision label="01"/>
<pnp_checksum hexa="ADC7"/>
<pnp_brin value="0"/>
</BlocPlugAndPlay>
</fichier.configuration>
'''
for fin in root.iter("pnp_fin" ): #only once !
e['fin'] = fin.attrib['label']
for chk in root.iter("pnp_checksum" ): #only once !
e['chk_xml'] = chk.attrib['hexa'].rjust(4,'0')
return e
def r_parse_hex(e):
try:
f = open(e['hex'] , 'rb')
except:
print("Error opening " , e['hex'] )
else:
ret = f.read(0x400) # lire entete eeprom
e['chk_hex'] = ret[0x212:0x214][:-1].hex().upper()
finally:
f.close()
return e
def r_parse ( e , t ):
if t=="xml":
return r_parse_xml(e)
elif t=="hex":
return r_parse_hex(e)
return None
def r_insert( r , t , b , n ):
for elem in r:
if elem['base'] == b:
elem[t]=n
r_parse( elem , t )
return elem
new_elem = { 'base' : '' , 'fin' : '' , 'xml' : '' , 'hex' : '' , 'chk_xml' : '' , 'chk_hex' : '' }
new_elem['base'] = b
new_elem[t] = n
r_parse( new_elem , t )
r.append(new_elem)
return new_elem
if __name__ == '__main__':
result = []
for root,dirs,files in os.walk("." ):
for name in files:
fname = os.path.join(root, name)
base , ext = os.path.splitext( name)
if ext==".hex" or ext==".xml":
r_insert( result , ext[1:] , base , fname )
for elem in result:
if elem['chk_xml']==elem['chk_hex']:
print("GOOD \t" + elem['fin'].rjust(16,' ') + "\t(chk=" + elem['chk_xml']+" )" )
else:
print("BAD \t" + elem['fin'].rjust(16,' ') + "\t(chk_xml=" + elem['chk_xml']+",chk_hex="+elem['chk_hex']+" )" )

le code est bien entendu critiquable, je ne suis pas familier du python même si j'ai déjà écrit quelques programmes, j'essaie juste d'écrire à la "python" plutot qu'à la "C++" étant issu du C++.

Voici les choses que j'estime critiquables :
- mauvaise gestion des exceptions. Bien que ca existe en C++, je ne les ai jamais vraiment utilisées (on peut s'en passer ) sauf que c'est un peu obligatoire en python. Je ne sais pas quoi mettre dans try, except, else, et finally ( voir fonction r_parse_hex et r_parse_xml )
- j'ai un peu bidouillé pour formatter ma string venant du fichier xml correctement en hex : j'ai paddé avec des 0 pour être sur d'avoir 4 caractères ( e['chk_xml'] = chk.attrib['hexa'].rjust(4,'0') )
- j'ai encore plus bidouiller pour formater la string venant du fichier hex :

Code :

ret = f.read(0x400) # lire entete eeprom
e['chk_hex'] = ret[0x212:0x214][:-1].hex().upper()

* je lis 1024 octets ( c'est normalement sur mais j'ai pas géré si inférieur )
* mon checksum est à l'octet 0x212 + 0x213 mais à l'envers ( little endian ) , je l'inverse en rajoutant [:-1] puis transforme en string avec hex(), puis je passe en majuscule avec upper()
- mon parcours de fichier est comme ca :

Code :

for root,dirs,files in os.walk("." ):
for name in files:
fname = os.path.join(root, name)
base , ext = os.path.splitext( name)
if ext==".hex" or ext==".xml":
r_insert( result , ext[1:] , base , fname )

mais j'aurais préféré un truc du genre :

Code :

[ os.path.join(dp, f) for dp, dn, fn in os.walk(os.path.expanduser("." )) for f in fn]

sauf que je ne sais pas comment rajouter dans la ligne du code permettant de filtrer d'une part les hex/xml, et appeler une fonction d'autre part à chaque itération pour effectuer le traitement.

Bref, n'hésitez pas à faire vos commentaires si vous en avez envie, l'objectif pour moi est de m'améliorer et surtout d'écrire du code respectant la philosophie python :jap:

Message cité 1 fois

Publicité

masklinn

í dag viðrar vel til loftárása

xilebo a écrit :

- mauvaise gestion des exceptions. Bien que ca existe en C++, je ne les ai jamais vraiment utilisées (on peut s'en passer ) sauf que c'est un peu obligatoire en python. Je ne sais pas quoi mettre dans try, except, else, et finally ( voir fonction r_parse_hex et r_parse_xml )

Rien du tout, sauf si tu veux spécifiquement gérer les erreurs correspondantes. Ici au lieu du try/finally tu voudras utiliser un "context manager"(similaire mais pas identique au RAII de C++) géré via with, et à la limite un gros try/except autour du tout si tu veux planquer les erreurs sans spécialement les gérer mais aussi sans arrêter complètement le processing.

Le "else" est également assez peu utilisé, ici on mettrait plus tout dans le body, on bien on utiliserait un early return:

Code :

def r_parse_hex(e):
    try:
        with open(e['hex'], 'rb') as f:
            ret = f.read(0x400) # lire entete eeprom
            e['chk_hex'] = ret[0x212:0x214][:-1].hex().upper()    
    except:
        print("Error opening", e['hex'], file=sys.stderr)
    return e

Prendre un objet qu'on modifie en place et renvoie c'est aussi un peu étrange, il y a des contextes où ça se fait (builders) mais ici ça semble pas trop être le cas.

xilebo a écrit :

- j'ai un peu bidouillé pour formatter ma string venant du fichier xml correctement en hex : j'ai paddé avec des 0 pour être sur d'avoir 4 caractères ( e['chk_xml'] = chk.attrib['hexa'].rjust(4,'0') )

Bah si t'as besoin de 4 char et que ton entrée peut en avoir moins, faut padder. Tu pourrais le faire avec un format à la place mais tu gagnerais rien.

xilebo a écrit :

- j'ai encore plus bidouiller pour formater la string venant du fichier hex :

Code :

ret = f.read(0x400) # lire entete eeprom
e['chk_hex'] = ret[0x212:0x214][:-1].hex().upper()

Alternativement tu peux parser ton truc avec struct.unpack (genre <H) et le formatter comme nécessaire derrière. Ou bien pas le formatter et parser la sortie de ton fichier XML avec int(val, 16).

xilebo a écrit :

- mon parcours de fichier est comme ca :

Code :

for root,dirs,files in os.walk("." ):
for name in files:
fname = os.path.join(root, name)
base , ext = os.path.splitext( name)
if ext==".hex" or ext==".xml":
r_insert( result , ext[1:] , base , fname )

mais j'aurais préféré un truc du genre :

Code :

[ os.path.join(dp, f) for dp, dn, fn in os.walk(os.path.expanduser("." )) for f in fn]

sauf que je ne sais pas comment rajouter dans la ligne du code permettant de filtrer d'une part les hex/xml, et appeler une fonction d'autre part à chaque itération pour effectuer le traitement.

S'pas trop possible à cause de la manière dont t'as structuré ton processing: ton r_insert va pas nécessairement générer de nouveaux éléments, et va potentiellement aller altérer des trucs en place à la place.

Si tu veux faire un truc du style, je suggère d'itérer juste sur les bases et pour chaque base aller chercher les données dans le fichier hex et le fichier xml en parallèle, ça évite des bricolages genre aller faire des recherches linéaires dans une liste. Apprends aussi à utiliser les fonctions de formattage Python (%, format ou f-strings).

Pas testé, mais un truc genre:

Code :

def parse_xml(path):
    try:
        doc = ET.parse(path)
        return (
            doc.find('pnp_fin').attrib['label'],
            int(doc.find('pnp_checksum'].attrib['hexa'], 16)
        )
    except Exception as e:
        print(f"Failed to read {path}: {e}", file=sys.stderr)
        return None, -1
 
 
def parse_hex(path):
    try:
        with open(path, 'rb'):
            [result] = struct.unpack_from("<H", path.read(0x400), 0x212)
            return result
    except Exception as e:
        print(f"Failed to read {path}: {e}", file=sys.stderr)
 
if __name__ == '__main__':
    for root, _, files in os.walk('.'):
        for name in fnmatch.filter(files, '*.xml'):
            fbase, _ = os.path.splitext(os.path.join(root, files))
 
            label, checksum_xml = parse_xml(fbase + '.xml')
            checksum_hex = parse_hex(fbase + '.hex')
 
            if check_xml == check_hex:
                print(f"GOOD \t{label:>16}\t(chk={check_xml})" )
            else:
                print(f"BAD \t{label:>16}\t(xml={check_xml},hex={check_hex})" )

Si tu veux absolument un itérateur ou une listcomp c'est moyen pratique à cause des manipulations de path avant de parser les fichiers. Ça serait faisable avec un helper ou bien la technique de la liste unaire (for foo in [val] c'est comme faire foo = 1 au milieu de la listcomp) mais je recommande pas spécialement.

D'ailleurs en regardant ce code, je me dis que la gestion d'erreur devrait aller autour des appels à parse_xml et parse_hex, si l'un des deux foire l'autre est pas utile:

Code :

def parse_xml(path):
    doc = ET.parse(path)
    return (
        doc.find('pnp_fin').attrib['label'],
        int(doc.find('pnp_checksum'].attrib['hexa'], 16)
    )
 
def parse_hex(path):
    with open(path, 'rb'):
        [result] = struct.unpack_from("<H", path.read(0x400), 0x212)
        return result
 
if __name__ == '__main__':
    for root, _, files in os.walk('.'):
        for name in fnmatch.filter(files, '*.xml'):
            fbase, _ = os.path.splitext(os.path.join(root, files))
 
            try:
                label, checksum_xml = parse_xml(fbase + '.xml')
                checksum_hex = parse_hex(fbase + '.hex')
            except Exception as e:
                print(f"ERROR failed to load {fbase}: {e}" )
            else:
                if check_xml == check_hex:
                    print(f"GOOD \t{label:>16}\t(chk={check_xml})" )
                else:
                    print(f"BAD \t{label:>16}\t(xml={check_xml},hex={check_hex})" )

Les fonctions de parsing s'occupent que de leur "happy path", et c'est le driver qui gère les erreurs de parsing.

Message édité par masklinn le 10-10-2018 à 21:35:00

---------------
I mean, true, a cancer will probably destroy its host organism. But what about the cells whose mutations allow them to think outside the box by throwing away the limits imposed by overbearing genetic regulations? Isn't that a good thing?

xilebo

noone

Merci beaucoup pour ces précisions, je comprends mieux et je vois que je ne suis pas complètement dans le faux.

J'ai appliqué quelques correctifs suite aux conseils. L'objet retourné, c'est juste quand j'ai prototypé mes fonctions , elles étaient vides, j'ai tendance à retourner un truc plutot que de mettre pass, mais effectivement ici c'est pas super utile.

FORUM HardWare.fr

Programmation

Python

petit algo, pour avis

Sujets relatifs
petit site web de maintenance	Algo du Solitaire
Besoins de votre avis sur une application	Formation courte webdesigner , vos avis
créé un petit jeu de mime a la vendredi tout est permis	Petit programme pour scanner plusieurs pages à la suite.
Jeu et algo pour jouer et solver le jeu Absens	Opacité survol, petit coup de pouce html :)
Petit coup de pouce en html	Comment forcer l'onglet 'Avis' dans Woocommerce ?
Plus de sujets relatifs à : petit algo, pour avis

Page générée en 0.111 secondes