Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1272 connectés 

  FORUM HardWare.fr
  Programmation
  Python

  Obtenir TOUT le texte entre 2 balises via xml.etree.ElementTree

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Obtenir TOUT le texte entre 2 balises via xml.etree.ElementTree

n°2090115
NounouRs
Non parce que c pas mon pied !
Posté le 19-07-2011 à 10:31:22  profilanswer
 

Bonjour,
 
Je ne parviens pas à récupérer le contenu texte d'une balise <span> en python après navigation DOM et obtention d'un 'Element'. La méthode .text ne renvoit pas tout le contenu, elle semble perturbée par une syntaxe douteuse.
http://www.python.org/doc/current/ [...] ement.text
 
Texte traité :

Code :
  1. <span class="webkit-html-tag">
  2.   <td
  3.   <span class="webkit-html-attribute-name">style</span>
  4.   ="
  5.   <span class="webkit-html-attribute-value">border-left-style:solid; border-left-width:1px;</span>
  6.   ">
  7. </span>


 
dans la chaine final, je ne trouve que [<td]. Les contenus [="] et [">] sont passés à la trape.
 
Il y aurait un mode RAW qui laisserait passer tous les sous éléments ?
 
Sinon, pas besoin de faire la remarque, ceux qui ont écrit la page que je retraite ne savent visiblement pas faire de HTML... c'est le site de l'assemblée nationnale.

mood
Publicité
Posté le 19-07-2011 à 10:31:22  profilanswer
 

n°2090144
masklinn
í dag viðrar vel til loftárása
Posté le 19-07-2011 à 11:49:10  profilanswer
 

NounouRs a écrit :

Bonjour,
 
Je ne parviens pas à récupérer le contenu texte d'une balise <span> en python après navigation DOM et obtention d'un 'Element'. La méthode .text ne renvoit pas tout le contenu, elle semble perturbée par une syntaxe douteuse.
http://www.python.org/doc/current/ [...] ement.text
 
Texte traité :

Code :
  1. <span class="webkit-html-tag">
  2.   <td
  3.   <span class="webkit-html-attribute-name">style</span>
  4.   ="
  5.   <span class="webkit-html-attribute-value">border-left-style:solid; border-left-width:1px;</span>
  6.   ">
  7. </span>


 
dans la chaine final, je ne trouve que [<td]. Les contenus [="] et [">] sont passés à la trape.
 
Il y aurait un mode RAW qui laisserait passer tous les sous éléments ?
 
Sinon, pas besoin de faire la remarque, ceux qui ont écrit la page que je retraite ne savent visiblement pas faire de HTML... c'est le site de l'assemblée nationnale.


C'est pas du XML, elementtree peut pas parser un truc pareil, il est pas fait pour ça [:petrus75]


---------------
Stick a parrot in a Call of Duty lobby, and you're gonna get a racist parrot. — Cody

Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  Python

  Obtenir TOUT le texte entre 2 balises via xml.etree.ElementTree

 

Sujets relatifs
pb récupération du contenu d'un champs texte[Résolu] HTML::Parser, balises avec attribut
Générer aléatoirement du texte sur une imageObtenir la charge mémoire et CPU d'un Process Windows
ajouter un texte à une forme libreExtraction du contenu d'une TEXTAREA vers fichier texte
Ajout champ texte sur un formulaireprobleme editeur de texte "setTextFormat"
remplacer un texte dans un lien dans la bddExcel/VBA Ignorer texte commençant par
Plus de sujets relatifs à : Obtenir TOUT le texte entre 2 balises via xml.etree.ElementTree


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR