Java

[java] ChangedCharSetException [RESOLU]

Recherche :

Sujet(s) à lire :
- HTMLEditorKit.Parser : ChangedCharSetException

Mot : Pseudo : Filtrer
Bas de page
Auteur	Sujet : [java] ChangedCharSetException [RESOLU]

patastronch

Bonsoir,

j'ai un petit probleme de ChangedCharSetException.

voila les lignes en questions :

Code :

Reader urlReader = new BufferedReader (
(new InputStreamReader (fileURL.openStream ())));
// Création d'une instance de parser
HTMLDocumentLinks doc = new HTMLDocumentLinks (fileURL,1);

En fait j'ouvre un document url, (qui est un document html), et je le parse avec un reader qui herite de HTMLEditorKit.ParserCallback.

Si le document html ouvert contiens la ligne :

<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" lang="fr">

j ai l'exception ChangedCharSetException qui se declenche.
par contre si la ligne est absente il n'y a aucun probleme.

J'aimerais savoir comment empecher ce zigoto de changer mon charset tout seul, et surtout savoir coment on empeche cette erreur de se déclencher.

Merci beaucoup de votre aide.

Message édité par patastronch le 24-09-2005 à 21:09:11

Publicité

nraynaud

lol

cher ami, j'ai une mauvaise nouvelle pour vous !
HTML/XML et leurs amis sont des formats binaires !

ils ne faut donc pas les prendre en format caratère (reader), mais en binaire (stream).

Plus particulièrement, si on présente un fichier html à un parser en prétenant qu'il a un certain encoding (par un reader), et qu'un encoding est spécifié dans le fichier, et qu'ils ne se correspondent pas, le parser doit envoyer une exception ... c'est ce qu'il fait.

La bonne nouvelle, c'est que votre parser respecte ce point de la norme.

patastronch

Ok je me serais bien passé de la bonne nouvelle

Donc en cllair (pour un débutant en java :s) je fais comment pour lire en binaire ? moi ja i rien choisi , j ai que la methde read() dans HTMLEditorKit.ParserCallback .

Si tu pouvais meclairer un peu plus sur la maniere de faire je t en serais reconnaissant car je vois pas du tout comment récuperer lexception pour qu'elle soit ignoré ...a moins qu on puisse dire a une méthode d'ignorer une exeption qu'elle peut envoyer ? ( j en doute mais sait on jamais )

nraynaud

lol

file-moi un peu plus de code stp, je connais pas le toolkit.

patastronch

Code :

import java.io.*;
import java.net.*;
import javax.swing.text.*;
import javax.swing.text.html.*;
// Classe dérivée de HTMLDocument pour permettre de spécifier
// un reader différent dans la méthode getReader ()
public class HTMLDocumentTable extends HTMLDocument
{
// variables pour trouver le n ieme tableau
int tableNum=1;
int numTableCherche;
// countTable permetra de s'assurer qu 'on est pas dans un tableau imbriqué dans un autre.
int countTable=0;
// les debloks vont permetre de metre des verrous sur les tableau imbriqué au tableau que l on parse.
// vrai si le tableau en cours est a parser.
boolean deblokTable=false;
// vrai si la ligne en cours est a parser
boolean deblokTr=false;
// vrai si la case en cours est a parser
boolean deblokTd=false;
// taille du tableau
int lig=0;
int col=0;
// case en cours d'analyse
int l=0;
int c=0;
// le tableau qui recupere les dnnées du tableau a parser
String [][] table;
// Constructeur
public HTMLDocumentTable (URL file,int tabNum)
{
// Mémorisation de la base du fichier HTML
setBase (file);
numTableCherche=tabNum;
table = new String[1][1];
}
// modifit la taille d'un tableau de ligMore ligne de plus et colMore colonne de plus
private String[][] majTab (int ligMore,int colMore)
{
String[][] temp;
if (lig+ligMore>=1) {
if (col+colMore>=1){
temp = new String[lig+ligMore][col+colMore];
}else{
temp = new String[lig+ligMore][1];
}
}else if (col+colMore>=1){
temp = new String[1][col+colMore];
System.out.println("\nMise A jour du tableau : lig = 1 / col = "+col+" + "+colMore+"\n" );
}else{
temp = new String[1][1];
}
for (int i=0;i<lig;i++){
for (int j=0;j<col;j++){
if (table[i][j]==null)
table[i][j]="";
temp[i][j]=table[i][j];
}
}
return temp;
}
// Méthode outrepassée pour fournir un reader différent
public HTMLEditorKit.ParserCallback getReader (int pos)
{
return new LinkReader ();
}
// Les méthodes de cette classe sont rappelées par
// le parser HTML suivant les différents tag HTML lus.
private class LinkReader extends HTMLEditorKit.ParserCallback
{
public void handleError(String errorMsg,int pos) {
System.out.println("fuck off !!! "+errorMsg);
}
// Méthode appelée quand un tag de début est rencontré
public void handleStartTag (HTML.Tag tag, MutableAttributeSet att, int pos)
{
if (tag.equals (HTML.Tag.TABLE) && !deblokTable) // Tags <TABLE>
{
if (tableNum == numTableCherche) {
deblokTable=true;
l=0;
c=0;
}else{
tableNum++;
}
}else if (tag.equals (HTML.Tag.TABLE) && deblokTable) {
countTable++;
}else if (tag.equals (HTML.Tag.TR) && deblokTable && countTable==0) // Tags <TR>
{
deblokTr=true;
table=majTab(1,0);
lig++;
l++;
c=0;
}else if ((tag.equals(HTML.Tag.TD) || tag.equals (HTML.Tag.TH)) && deblokTr && countTable==0) // Tags <TD>
{
deblokTd=true;
if (col==c){
table=majTab(0,1);
col++;
}
c++;
}
}
public void handleEndTag (HTML.Tag tag,int pos)
{
if ((tag.equals (HTML.Tag.TD) || tag.equals (HTML.Tag.TH)) && deblokTr && countTable==0) // Tags <TD>
deblokTd=false;
if (tag.equals (HTML.Tag.TR) && deblokTable && countTable==0)
deblokTr=false;
if (tag.equals (HTML.Tag.TABLE) && deblokTable && countTable==0)
deblokTable=false;
if (tag.equals (HTML.Tag.TABLE) && countTable>0)
countTable--;
}
public void handleText(char[] data,int pos)
{
if (deblokTd){
if (table[l-1][c-1]==null)
table[l-1][c-1]="";
for (int i=0;i<data.length;i++){
table[l-1][c-1]=table[l-1][c-1]+Character.toString(data[i]);
}
}
}
}
public static void main (String args [])
{
String ligne=""; // pour l affichage finale
try
{
URL fileURL = new URL ("file:C:/tip3.html" );
Reader urlReader = new BufferedReader (
new InputStreamReader (fileURL.openStream ()));
// Création d'une instance de parser
// le 1 signifie que le premier tableau seulement sera parsé
HTMLDocumentTable doc = new HTMLDocumentTable (fileURL,1);
// Parsing du fichier HTML avec Swing
new HTMLEditorKit ().read (urlReader, doc, 0);
urlReader.close ();
System.out.println ("\n\n\nTableau :\n\n" );
for (int i=0;i<doc.lig;i++){
for (int j=0;j<doc.col;j++){
ligne+="|"+doc.table[i][j];
}
System.out.println (ligne+"\n" );
ligne="";
}
}
catch (ChangedCharSetException e)
{
System.out.println ("ChangedCharSetException :"+((ChangedCharSetException)e).getCharSetSpec());
e.printStackTrace();
}
catch (BadLocationException e)
{
System.out.println ("cool top bad !" );
}
catch (IOException e)
{
System.out.println ("IO exeption:"+e);
}
}
}

Bon je sais je programme tres mal ...

Message édité par patastronch le 24-09-2005 à 20:43:59

patastronch

Bon j'ai trouvé une solution, je sais pas si c est du tres propre mais bon ca marche.

Je la met ici pour ceux qui tomberait sur ce probleme (je sais je sais, je programme tres mal) et qui serait interessé par comment faire :

Code :

import java.io.*;
import java.net.*;
import javax.swing.text.*;
import javax.swing.text.html.*;
// Classe dérivée de HTMLDocument pour permettre de spécifier
// un reader différent dans la méthode getReader ()
public class TableHTMLParser extends HTMLDocument
{
// variables pour trouver le n ieme tableau
int tableNum=1;
int numTableCherche;
//countTable permetra de s'assurer qu 'on est pas dans un tableau imbriqué dans un autre.
int countTable=0;
//les debloks vont permetre de metre des verrous sur les tableau imbriqué au tableau que l on parse.
boolean deblokTable=false;
boolean deblokTr=false;
boolean deblokTd=false;
// taille du tableau
int lig=0;
int col=0;
// case en cours d'analyse
int l=0;
int c=0;
// tableau
String [][] table;
// reader
LinkReader readeur = new LinkReader();
// Constructeur
public TableHTMLParser (URL file,int tabNum)
{
// Mémorisation de la base du fichier HTML
setBase (file);
numTableCherche=tabNum;
table = new String[1][1];
}
// permet de modifier la taille du tableau de ligMore ligne de plus et de colMore colonne de plus
private String[][] majTab (int ligMore,int colMore)
{
String[][] temp;
if (lig+ligMore>=1) {
if (col+colMore>=1){
temp = new String[lig+ligMore][col+colMore];
}else{
temp = new String[lig+ligMore][1];
}
}else if (col+colMore>=1){
temp = new String[1][col+colMore];
}else{
temp = new String[1][1];
}
for (int i=0;i<lig;i++){
for (int j=0;j<col;j++){
if (table[i][j]==null)
table[i][j]="";
temp[i][j]=table[i][j];
}
}
return temp;
}
// Méthode outrepassée pour fournir un reader différent
public HTMLEditorKit.ParserCallback getReader (int pos)
{
return new LinkReader ();
}
// Les méthodes de cette classe sont rappelées par
// le parser HTML suivant les différents tag HTML lus.
private class LinkReader extends HTMLEditorKit.ParserCallback
{
// Méthode appelée quand un tag de début est rencontré
public void handleStartTag (HTML.Tag tag, MutableAttributeSet att, int pos)
{
if (tag.equals (HTML.Tag.TABLE) && !deblokTable) // Tags <TABLE>
{
if (tableNum == numTableCherche) {
deblokTable=true;
l=0;
c=0;
}else{
tableNum++;
}
}else if (tag.equals (HTML.Tag.TABLE) && deblokTable) {
countTable++;
}else if (tag.equals (HTML.Tag.TR) && deblokTable && countTable==0) // Tags <TR>
{
deblokTr=true;
table=majTab(1,0);
lig++;
l++;
c=0;
}else if ((tag.equals(HTML.Tag.TD) || tag.equals (HTML.Tag.TH)) && deblokTr && countTable==0) // Tags <TD>
{
deblokTd=true;
if (col==c){
table=majTab(0,1);
col++;
}
c++;
}
}
public void handleEndTag (HTML.Tag tag,int pos)
{
if ((tag.equals (HTML.Tag.TD) || tag.equals (HTML.Tag.TH)) && deblokTr && countTable==0) // Tags <TD>
deblokTd=false;
if (tag.equals (HTML.Tag.TR) && deblokTable && countTable==0)
deblokTr=false;
if (tag.equals (HTML.Tag.TABLE) && deblokTable && countTable==0)
deblokTable=false;
if (tag.equals (HTML.Tag.TABLE) && countTable>0)
countTable--;
}
public void handleText(char[] data,int pos)
{
if (deblokTd){
if (table[l-1][c-1]==null)
table[l-1][c-1]="";
for (int i=0;i<data.length;i++){
table[l-1][c-1]=table[l-1][c-1]+Character.toString(data[i]);
}
}
}
public void handleEndOfLineString(String eol)
{
String ligne="";
for (int i=0;i<lig;i++){
for (int j=0;j<col;j++){
ligne+="|"+table[i][j];
}
System.out.println (ligne+"\n" );
ligne="";
}
}
}
private static void parse(URL url, String encoding) throws IOException {
ParserGetter kit = new ParserGetter();
HTMLEditorKit.Parser parser = kit.getParser();
InputStream in = url.openStream();
InputStreamReader r = new InputStreamReader(in, encoding);
TableHTMLParser doc = new TableHTMLParser(url,1);
parser.parse(r, (HTMLEditorKit.ParserCallback)doc.readeur, true);
}
public static void main(String[] args) {
ParserGetter kit = new ParserGetter();
HTMLEditorKit.Parser parser = kit.getParser();
String encoding = "ISO-8859-1";
URL url = null;
try {
url = new URL ("file:C:/tip3.html" );
InputStream in = url.openStream();
InputStreamReader r = new InputStreamReader(in,encoding);
// on parse une premiere fois pour connaitre l'encoding
HTMLEditorKit.ParserCallback doNothing = new HTMLEditorKit.ParserCallback();
parser.parse(r, doNothing, false);
}
catch (MalformedURLException ex) {
System.err.println(ex);
return;
}
catch (ChangedCharSetException ex) {
String mimeType = ex.getCharSetSpec();
encoding = mimeType.substring(mimeType.indexOf("=" ) + 1).trim();
}
catch (IOException ex) {
System.err.println(ex);
}
catch (ArrayIndexOutOfBoundsException ex) {
System.err.println(ex);
return;
}
try {
parse(url, encoding);
}
catch(IOException ex) {
System.err.println(ex);
}
}
}

FORUM HardWare.fr

Programmation

Java

[java] ChangedCharSetException [RESOLU]

Sujets relatifs
[Resolu] Plusieurs requetes MySQL > Syntaxe PHP ?	[Résolu] Migration VBA --> VB
[Résolu] Intégrer un include PHP	[résolu]dernière occurence dans une feuille
java.lang.reflect.UndeclaredThrowableException	[RESOLU]récupérer le nom d'un executable pour le lancer
[Résolu] Souci d'occupation mémoire	[resolu] passer un mot écrit en hébreu via méthode GET
[résolu]Passage de variable	mini base de données en java pur[resolu]
Plus de sujets relatifs à : [java] ChangedCharSetException [RESOLU]

Page générée en 0.141 secondes