Saturday, October 20, 2007

test navicrawler

Aujourd'hui 20 octobre 2007, je recommence un crawl à partir de bzhnetwork.com


  • Départ depuis bzhnetwork, connecté au site
profondeur 5
distance 4
un seul onglet.


J'ai essayé mardi dernier un premier test avec une profondeur de 1, résultat un belle boule avec pajek.

(je n'ai pas réussi à faire tourner Guess sur mon linux, un problème de java je pense...)

Sinon sur les premiers essais, un problème récurent est la navigation vers les doc apache et l'ensemble des protocoles et normes informatiques qui ne sont pas, je le pense très pertinente pour mon étude. il faut que j'arrive à les définir comme sites limites.

  • Autres test à partir de l'URL
http://www.viadeo.com/hub/affichehub/index.jsp?hubId=0021thsa1f27zj3x


Problème de navigation car navicrawler identifie viadéo et non le hub comme un site.
(le hub est une page du site...)

No comments: