Gérer les redirection de page Web en JAVA

 
Poster un nouveau sujet   Répondre au sujet    iprelax.fr Index du Forum -> Java
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
JD
dummy mioche
dummy mioche


Inscrit le: 21 Jan 2004
Messages: 3

MessagePosté le: Mer Jan 21, 2004 10:51 am    Sujet du message: Gérer les redirection de page Web en JAVA Répondre en citant

Bonjour,

Actuellement je développe un Crawler en JAVA.
A partir d'une URL donnée je parcours tout le site sous-jacent.
Cependant si je rentre http://www.yahoo.fr, la page est redirigée vers
http://fr.yahoo.com/. Je n'arrive pas a récupérer cette nouvelle adresse. Avez-vous une solution?

Merci
JD
Revenir en haut
Voir le profil de l'utilisateur Envoyer un message privé Envoyer un email
Salemioche
salemioche
salemioche


Inscrit le: 05 Avr 2002
Messages: 350
Localisation: FR- BIOT

MessagePosté le: Mer Jan 21, 2004 11:09 am    Sujet du message: Répondre en citant

il n'y a pas de page a parser dans ce cas, la redirection est présente dans l'entete HTTP (code different de 200)
_________________
Creer son site - Hebergement - Jumeaux
Revenir en haut
Voir le profil de l'utilisateur Envoyer un message privé Visiter le site web du posteur Yahoo Messenger MSN Messenger
JD
dummy mioche
dummy mioche


Inscrit le: 21 Jan 2004
Messages: 3

MessagePosté le: Jeu Jan 22, 2004 10:47 am    Sujet du message: Qu'est ce que fait réelement connection.getHeaderFields()? Répondre en citant

Bonjour

Code:

URL url = new URL("http://www.yahoo.fr");
HttpURLConnection connection = (HttpURLConnection)url.openConnection();
System.out.println(connection.getHeaderFields());
System.out.println(connection.getURL());


Résultat de l'exécution :
{Connection=[close],
null=[HTTP/1.1 200 OK],
Expires=[Thu, 22 Jan 2004 09:34:45 GMT],
Set-Cookie=[B=a9vllgh00v69l&b=2; expires=Thu, 15 Apr 2010 20:00:00 GMT; path=/; domain=.yahoo.com],
Date=[Thu, 22 Jan 2004 09:34:45 GMT],
Content-Type=[text/html],
P3P=[policyref="http://p3p.yahoo.com/w3c/p3p.xml",
CP="CAO DSP COR CUR ADM DEV TAI PSA PSD IVAi IVDi CONi TELo OTPi OUR DELi SAMi OTRi UNRi PUBi IND PHY ONL UNI PUR FIN COM NAV INT DEM CNT STA POL HEA PRE GOV"], Cache-Control=[private]
}
http://fr.yahoo.com/

Code:

URL url = new URL("http://www.yahoo.fr");
HttpURLConnection connection = (HttpURLConnection)url.openConnection();
//System.out.println(connection.getHeaderFields());
System.out.println(connection.getURL());



Résultat de l'exécution :
http://www.yahoo.fr

Je ne comprends pas le résultat de l'exécution.
Savez-vous pourquoi nous sommes obligés de faire connection.getHeaderFields() pour avoir l'URL redirigée?

Merci
JDTeam
Revenir en haut
Voir le profil de l'utilisateur Envoyer un message privé Envoyer un email
Salemioche
salemioche
salemioche


Inscrit le: 05 Avr 2002
Messages: 350
Localisation: FR- BIOT

MessagePosté le: Jeu Jan 22, 2004 10:52 am    Sujet du message: Répondre en citant

aucune idée, la doc ne dit rien sur ce point, sans doute un effet de bord non prevu
_________________
Creer son site - Hebergement - Jumeaux
Revenir en haut
Voir le profil de l'utilisateur Envoyer un message privé Visiter le site web du posteur Yahoo Messenger MSN Messenger
Montrer les messages depuis:   
Poster un nouveau sujet   Répondre au sujet    iprelax.fr Index du Forum -> Java Toutes les heures sont au format CET (Europe)
Page 1 sur 1

 
Sauter vers:  
Vous ne pouvez pas poster de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous ne pouvez pas voter dans les sondages de ce forum
Affilzen SARL : Mention légale