Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
646 connectés 

  FORUM HardWare.fr
  Programmation
  Java

  Récupérer un document HTLM à partir d'une URL et le parser

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Récupérer un document HTLM à partir d'une URL et le parser

n°1008136
metal_warr​ior
Posté le 10-03-2005 à 13:18:36  profilanswer
 

salut a tous!
 
voila je cherche comment récuperer le code source d'un document HTML a partir d'une URL, pour ensuite recuperer les valeurs comprises entre certaines balises.
j'ai cherché ds la javadoc mais j'ai rien trouvé de concluant :/
 
qq peut m'aider?  
 
merci bcp :)

mood
Publicité
Posté le 10-03-2005 à 13:18:36  profilanswer
 

n°1008137
nraynaud
lol
Posté le 10-03-2005 à 13:21:10  profilanswer
 

HttpUrlConnection.
ensuite, soit tu bidouilles à la main, soit tu bidouilles avec le parser de HtmlEditorKit.


---------------
trainoo.com, c'est fini
n°1008147
metal_warr​ior
Posté le 10-03-2005 à 13:31:24  profilanswer
 

merci mon poulet :)

n°1008484
benou
Posté le 10-03-2005 à 16:20:03  profilanswer
 

directement avec URL ca matche aussi. y a une méthode pour récupérer un InputStream directement

n°1008485
FlorentG
Unité de Masse
Posté le 10-03-2005 à 16:20:32  profilanswer
 

Et si le document est XHTML compliant, tu peux le parser tout facilement avec des fonctions DOM :)

n°1010562
metal_warr​ior
Posté le 12-03-2005 à 12:59:23  profilanswer
 

Hum ok j'ai reussi à recuperer le fichier html et a le copier en local.......
mais pour le parser.... prendre ce qu'il y a entre certaines balises..... je vois pas du tout!
le parser de HtmlEditorKit ok, mais qq pourrait me dire comment s'en servir? pcq je suis dans le flou total ... :/

n°1010752
EpoK
Let's burn
Posté le 12-03-2005 à 16:52:08  profilanswer
 

c'est du code propre le html ?

n°1010794
benou
Posté le 12-03-2005 à 17:56:30  profilanswer
 

S'il est pas propre, tu peux utiliser Tidy (enfin, JTidy en java) pour transformer le HTML crade en XHTML propre.
 
(Je précise que j'ai jamais essayé Tidy personellement)


Message édité par benou le 12-03-2005 à 17:57:18

---------------
ma vie, mon oeuvre - HomePlayer
n°1011718
metal_warr​ior
Posté le 14-03-2005 à 08:46:40  profilanswer
 

oui c'est du code propre HTML et je veux juste recuprer les valeurs entre certaines balises
genre <titre> mon titre </titre>
etc..
:(

n°1012048
the real m​oins moins
Posté le 14-03-2005 à 14:14:32  profilanswer
 

sitemesh à son propre parser, plutot efficace le bestiau.


---------------
Hey toi, tu veux acheter des minifigurines Lego, non ?

Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  Java

  Récupérer un document HTLM à partir d'une URL et le parser

 

Sujets relatifs
récuperer liens Internet explorer via vbsrécupérer une valeur
Recuperer la décimale d'une valeur ?Recuperer une donnée par rapport au dernier ID
Espaces dans URLconnaitre la liste des document word d'un repertoire ouvert
[html] créer un lien pour télécharger un document officerecuperer l'URL d une page en PHP?
Indexation de document .doc (word) 
Plus de sujets relatifs à : Récupérer un document HTLM à partir d'une URL et le parser


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR