Passer au contenu principal

Vérification des liens

La présence de liens morts dans un site web entraîne une expérience utilisateur dégradée, et impacte négativement le classement des sites de l'UNIL dans les moteurs de recherche.

Trouver ces liens morts est cependant un travail laborieux et répétitif. C'est pourquoi nous proposons un outil permettant de vérifier automatiquement leur présence au sein des sites UNIL.

Cet outil est limité aux sites hébergés sur www.unil.ch, wp.unil.ch, www.asso-unil.ch, people.unil.ch. Il est également possible de vérifier des pages individuelles sur wiki.unil.ch.

Interface

interface.png

  1. Entrez l'URL du site (unil.ch/exemple) ou de la page que vous souhaitez vérifier. Si votre site est utilise Wordpress, il est nécessaire d'indiquer le sous-domaine dans l'URL (wp.unil.ch/exemple, people.unil.ch/exemple, ou asso-unil.ch/exemple).
  2. Entrez votre adresse email UNIL. Ce champ est obligatoire. Les résultats vous seront envoyés à cette adresse sous la forme d'une feuille Excel.
  3. Définissez le "périmètre" de recherche: c'est-à-dire si l'outil va vérifier une page, une section, ou l'entièreté du site. La vérification par section cherchera dans toutes les pages du site dont l'URL commence par l'URL donné. (p.ex. si on donne l'URL "unil.ch/exemple/devoirs", la page "unil.ch/exemple/devoirs/exercice1" sera vérifiée, ainsi que toutes les autres pages d'exercices dans la section devoirs)
  4. Options avancées:
    1. Type de liens à vérifier: cette option permet sélectionner quel types de liens seront vérifiés par l'outil. Par défaut, seuls les liens externes sont vérifiés. Il est également possible de vérifier les liens qui mènent à des pages internes au site vérifié (liens internes). Cette option est utile pour vérifier les éléments de menus, les références internes à d'autres pages, et les médias hébergés directement sur ce site. Pour la plupart des cas, vérifier les liens internes est superflu, et ralentit significativement la vérification. Le cas le plus courant est la vérification des liens externes uniquement.
    2. Vérifier les médias: permet de vérifier les images et vidéos qui pourraient se trouver sur le site. Si vous souhaitez vérifier des médias qui seraient hébergés directement sur le site à vérifier, il faut également sélectionner la vérification des liens internes, sinon seulement les images externes seront vérifiées. Pour la plupart des cas, cette option est superflue, et ralentit significativement la vérification.
    3. Traiter les redirections comme des liens morts: cette option fait remonter les redirections (statuts HTTP 3XX) dans la liste des résultats. Les redirections ont un impact négatif sur le référencement des sites web. Il convient de les éviter le plus possible et de toujours utiliser l'URL final si c'est faisable.

Attention: l'utilisation des options avancées ralentit la recherche ! Ne les utilisez que si vous voulez spécifiquement vérifier ces éléments.

Lancez la vérification en cliquant sur le bouton "Vérifier".

La vérification se fait en trois phases:

  1. Tous les pages à vérifier sont collectées. L'application affiche une roue animée.
  2. Si le nombre de pages à vérifier est supérieur à 50, votre requête sera mise en queue et traitée pendant la nuit, afin d'éviter de surcharger les serveurs. Sinon, votre requête sera traitée à son tour (l'application ne traite qu'une seule requête à la fois)
  3. Les liens présents dans chaque page sont collectés. Cette opération peut prendre de quelques instants à plusieurs minutes, en fonction du nombre de pages. L'application affiche une roue animée.
  4. Les liens sont vérifiés un à un. Une barre de progression apparaît et l'avancement du processus est affiché. La durée dépend du nombre de liens à vérifier. Une estimation du temps restant est calculée et affichée, ainsi qu'une vue d'ensemble de la progression de la vérification.

Si le nombre de pages à vérifier excède 100 pages, votre requête est gardée en mémoire et sera traitée dans la nuit. Vous recevrez les résultats par email. Sinon, la vérification se poursuit en temps réel.

Résultats

resultats.png

Les résultats de la vérification se présente sous forme de table, où chaque ligne représente un lien mort.

  • Page: lien cliquable vers la page dans laquelle le lien mort se trouve.
  • Lien: lien mort tel qu'il apparaît dans la page. Vous pouvez afficher la page morte en cliquant sur ce lien.
  • URL: URL vers laquelle le lien mort renvoie.
  • Statut: le statut d'erreur associé avec le lien mort. Ces codes peuvent vous aider à déterminer la raison pour laquelle il ne fonctionne plus.

Ces résultats vous sont également automatiquement envoyés par email à l'adresse entrée dans le formulaire

Domaines ignorés

Pour des raisons de performance, certains liens sont ignorés par défaut. C'est notamment le cas des liens internes, qui ne sont vérifiés qu'en activant l'option avancée, des services dont on sait qu'ils sont toujours joignables, et de ceux qui bloquent systématiquement le vérificateur.

Domaines internes à l'UNIL:

  • agenda.unil.ch
  • applications.unil.ch
  • applicationsinter.unil.ch
  • applicationspub.unil.ch
  • av.unil.ch/hva
  • editjahia.unil.ch
  • fmpsrv01prd.unil.ch
  • fmpsrv02prd.unil.ch
  • fmpsrv03prd.unil.ch
  • github.unil.ch
  • ip.unil.ch
  • jabba.unil.ch
  • my.unil.ch
  • news.unil.ch/display
  • repopub.unil.ch
  • sapcent.unil.ch
  • serval.unil.ch
  • unilogo.unil.ch

Domaines externes à l'UNIL:

  • www.babla.fr
  • doi.org
  • nbn-resolving.org/urn:nbn:ch:serval
  • researchgate.net
  • linkedin.com
  • nytimes.com
  • www.cairn.info
  • www.pexels.com
  • pixabay.com
  • instagram.com
  • www.jstor.org
  • onlinelibrary.wiley.com
  • sagepub.com
  • tandfonline.com
  • sciencedirect.com
  • oup.com
  • dreamstime.com
  • www.science.org/doi
  • sciencemag.org
  • www.embopress.org/doi
  • journals.biologists.com
  • web.archive.org
  • maps.google.com

Les publications scientifiques en ligne disposent souvent de protections additionnelles contre les robots. En conséquence, il arrive fréquemment que les vérificateur soit bloqué par ces sites, signalant le lien comme brisé. De tels faux-positifs sont malheureusement inévitables, et il convient de toujours vérifier les résultats. Pour cette raison, certaines publications scientifiques ne sont jamais vérifiées.