tu peux regarder du côté d'htmltidy ( http://www.w3.org/People/Raggett/tidy/ ). y'a également d'autres convertisseurs/cleaners html -> xhtml qui devraient faire ce genre de boulot.
enfin pour un gros job on ne fera jamais plus simple et plus puissant que d'écrire tout ça à la pogne ...
[edtdd]--Message édité par youdontcare--[/edtdd]