Jump to content

[tutoriel] parsing html avec jsoup, ou comment travailler avec un site internet


Recommended Posts

Bonjour à vous, alors voila un petit tutoriel vous expliquant comment utiliser la librairie jsoup pour travailler avec des sites internet ou du contenu html en général (Le tutoriel n'est pas dans la section wiki, car apparemment c'est cassé xD )

S'il à des fautes, si vous me détesté, si vous êtes un rebelle, n'hésité pas à laisser un commentaire je ne vous lirez pas :lol:

1) Récupérer la librairie

Rendez vous ici récupérer "core library"

2) Ajout de cette librairie à votre projet

Pour cela, dans eclipse sur votre projet faîtes, clique droit, nouveau dossier ( ou new folder ) que vous nommez par exemple lib.

Vous copiez coller le fichier précédemment téléchargé dans ce dossier, un petit clique droit sur le dossier lib, raffraichir. Cela fait, clique droit sur le fichier "build path", et "add to build path"

( ici désolé je suis pas sur de la traduction en Français, si besoin appelé à l'aide, je donnerai un coup de pouce )

3) Utilisation de la librairie dans votre projet

Maintenant que avons intégrer la librairie au projet nous pouvons l'utilisez. Pour exemple, car je pense c'est cette partie qui vous intéresse, je vais utiliser le site du collégue Tecknologik's ;)

Dont l'adresse est https://sites.google.com/site/tecknologiks/Home. On commence donc par ce "connecter" au site avec :

Document doc = Jsoup.connect("https://sites.google.com/site/tecknologiks/Home").get();

Nous avons ainsi un document en quelques sorte, dans lequel nous allons pouvoir fouiller. Ici pour commencer je voudrais par exemple que mon application récupère le texte des <span>.

Pas très compliqué:

Elements spans = content.getElementsByTag("span");
for (Element span : spans) {
 String lesSpans = " "+span.text();
}

(Bon c'est un morceau de code fait à l'arrache donc s'il bug c'est normal :D )

Voila pour ce petit tuto, si le code ne vas pas où si vous aimeriez un exemple autre dîtes le je verrai s'que je peux faire! Un passage sur le site officiel devrait aidé, il fournis pas mal d'exemple.

Cordialement Letroll

Edited by letroll
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Unfortunately, your content contains terms that we do not allow. Please edit your content to remove the highlighted words below.
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...