Voir le sujet précédent :: Voir le sujet suivant |
Auteur |
Message |
JD dummy mioche

Inscrit le: 21 Jan 2004 Messages: 3
|
Posté le: Mer Jan 21, 2004 10:51 am Sujet du message: Gérer les redirection de page Web en JAVA |
|
|
Bonjour,
Actuellement je développe un Crawler en JAVA.
A partir d'une URL donnée je parcours tout le site sous-jacent.
Cependant si je rentre http://www.yahoo.fr, la page est redirigée vers
http://fr.yahoo.com/. Je n'arrive pas a récupérer cette nouvelle adresse. Avez-vous une solution?
Merci
JD |
|
Revenir en haut |
|
 |
Salemioche salemioche


Inscrit le: 05 Avr 2002 Messages: 350 Localisation: FR- BIOT
|
Posté le: Mer Jan 21, 2004 11:09 am Sujet du message: |
|
|
il n'y a pas de page a parser dans ce cas, la redirection est présente dans l'entete HTTP (code different de 200) _________________ Creer son site - Hebergement - Jumeaux |
|
Revenir en haut |
|
 |
JD dummy mioche

Inscrit le: 21 Jan 2004 Messages: 3
|
Posté le: Jeu Jan 22, 2004 10:47 am Sujet du message: Qu'est ce que fait réelement connection.getHeaderFields()? |
|
|
Bonjour
Code: |
URL url = new URL("http://www.yahoo.fr");
HttpURLConnection connection = (HttpURLConnection)url.openConnection();
System.out.println(connection.getHeaderFields());
System.out.println(connection.getURL());
|
Résultat de l'exécution :
{Connection=[close],
null=[HTTP/1.1 200 OK],
Expires=[Thu, 22 Jan 2004 09:34:45 GMT],
Set-Cookie=[B=a9vllgh00v69l&b=2; expires=Thu, 15 Apr 2010 20:00:00 GMT; path=/; domain=.yahoo.com],
Date=[Thu, 22 Jan 2004 09:34:45 GMT],
Content-Type=[text/html],
P3P=[policyref="http://p3p.yahoo.com/w3c/p3p.xml",
CP="CAO DSP COR CUR ADM DEV TAI PSA PSD IVAi IVDi CONi TELo OTPi OUR DELi SAMi OTRi UNRi PUBi IND PHY ONL UNI PUR FIN COM NAV INT DEM CNT STA POL HEA PRE GOV"], Cache-Control=[private]
}
http://fr.yahoo.com/
Code: |
URL url = new URL("http://www.yahoo.fr");
HttpURLConnection connection = (HttpURLConnection)url.openConnection();
//System.out.println(connection.getHeaderFields());
System.out.println(connection.getURL());
|
Résultat de l'exécution :
http://www.yahoo.fr
Je ne comprends pas le résultat de l'exécution.
Savez-vous pourquoi nous sommes obligés de faire connection.getHeaderFields() pour avoir l'URL redirigée?
Merci
JDTeam |
|
Revenir en haut |
|
 |
Salemioche salemioche


Inscrit le: 05 Avr 2002 Messages: 350 Localisation: FR- BIOT
|
Posté le: Jeu Jan 22, 2004 10:52 am Sujet du message: |
|
|
aucune idée, la doc ne dit rien sur ce point, sans doute un effet de bord non prevu _________________ Creer son site - Hebergement - Jumeaux |
|
Revenir en haut |
|
 |
|
|
Vous ne pouvez pas poster de nouveaux sujets dans ce forum Vous ne pouvez pas répondre aux sujets dans ce forum Vous ne pouvez pas éditer vos messages dans ce forum Vous ne pouvez pas supprimer vos messages dans ce forum Vous ne pouvez pas voter dans les sondages de ce forum
|
|