Passer au contenu principal

Vérification des liens

La préprésence de liens morts dans un site web entraîentraîne une expéexpérience utilisateur dégradédégradée, et impacte gativement le classement des sites de l'UNIL dans les moteurs de recherche.

Trouver ces liens morts est cependant un travail laborieux et répérépétitif. C'est pourquoi nous proposons un outil permettant de rifier automatiquement leur préprésence au sein des sites UNIL.

Cet outil est limitélimité aux sites hébergéhébergés sur www.unil.ch, wp.unil.ch, www.asso-unil.ch, people.unil.ch. Il est éégalement possible de rifier des pages individuelles sur wiki.unil.ch.

AccéAccéder au rificateur de liens (seulement accessible depuis le seau UNIL ou avec le VPN)

Interface

interface.png

  1. Entrez l'URL du site (unil.ch/exemple) ou de la page que vous souhaitez rifier. Si votre site est utilise Wordpress, il est cessaire d'indiquer le sous-domaine dans l'URL (wp.unil.ch/exemple, people.unil.ch/exemple, ou asso-unil.ch/exemple).
  2. Entrez votre adresse email UNIL. Ce champ est obligatoire. Les sultats vous seront envoyéenvoyés àà cette adresse sous la forme d'une feuille Excel.
  3. finissez le "périmèpérimètre" de recherche: c'est-àà-dire si l'outil va rifier une page, une section, ou l'entièretéentièreté du site. La rification par section cherchera dans toutes les pages du site dont l'URL commence par l'URL donnédonné. (p.ex. si on donne l'URL "unil.ch/exemple/devoirs", la page "unil.ch/exemple/devoirs/exercice1" sera vérifiévérifiée, ainsi que toutes les autres pages d'exercices dans la section devoirs)
  4. Options avancéavancées:
    1. Type de liens àà rifier: cette option permet lectionner quel types de liens seront vérifiévérifiés par l'outil. Par faut, seuls les liens externes sont vérifiévérifiés. Il est éégalement possible de rifier les liens qui nent àà des pages internes au site vérifiévérifié (liens internes). Cette option est utile pour rifier les élééléments de menus, les référéférences internes àà d'autres pages, et les dias hébergéhébergés directement sur ce site. Pour la plupart des cas, rifier les liens internes est superflu, et ralentit significativement la rification. Le cas le plus courant est la rification des liens externes uniquement.
    2. rifier les dias: permet de rifier les images et vidévidéos qui pourraient se trouver sur le site. Si vous souhaitez rifier des dias qui seraient hébergéhébergés directement sur le site àà rifier, il faut éégalement lectionner la rification des liens internes, sinon seulement les images externes seront vérifiévérifiées. Pour la plupart des cas, cette option est superflue, et ralentit significativement la rification.
    3. Traiter les redirections comme des liens morts: cette option fait remonter les redirections (statuts HTTP 3XX) dans la liste des sultats. Les redirections ont un impact gatif sur le référéférencement des sites web. Il convient de les ééviter le plus possible et de toujours utiliser l'URL final si c'est faisable.
    4. rifier les pages orphelines (expéexpérimental): cette option, qui ne fonctionne qu'avec la rification complècomplète ou d'une section d'un site, permet d'obtenir un rapport des pages orphelines de votre site web. Les pages orphelines sont des pages qui existent dans le site, mais qui n'est liéliée nulle part dans le site. Attention: cette option est expéexpérimentale, et ne fonctionne pas pour l'heure avec les sites Jahia.

Attention: l'utilisation des options avancéavancées ralentit la recherche ! Ne les utilisez que si vous voulez spéspécifiquement rifier ces élééléments.

Lancez la rification en cliquant sur le bouton "rifier".

La rification se fait en trois phases:

  1. Tous les pages àà rifier sont collectécollectées. L'application affiche une roue animéanimée.
  2. Si le nombre de pages àà rifier est supésupérieur àà 50, votre requêrequête sera mise en queue et traitétraitée pendant la nuit, afin d'ééviter de surcharger les serveurs. Sinon, votre requêrequête sera traitétraitée àà son tour (l'application ne traite qu'une seule requêrequête àà la fois)
  3. Les liens préprésents dans chaque page sont collectécollectés. Cette opéopération peut prendre de quelques instants àà plusieurs minutes, en fonction du nombre de pages. L'application affiche une roue animéanimée.
  4. Les liens sont vérifiévérifiés un àà un. Une barre de progression apparaîapparaît et l'avancement du processus est affichéaffiché. La durédurée pend du nombre de liens àà rifier. Une estimation du temps restant est calculécalculée et affichéaffichée, ainsi qu'une vue d'ensemble de la progression de la rification.

Si le nombre de pages àà rifier excèexcède 100 pages, votre requêrequête est gardégardée en moire et sera traitétraitée dans la nuit. Vous recevrez les sultats par email. Sinon, la rification se poursuit en temps el.

sultats

resultats.png

Les sultats de la rification se préprésente sous forme de table, chaque ligne repréreprésente un lien mort.

  • Page: lien cliquable vers la page dans laquelle le lien mort se trouve.
  • Lien: lien mort tel qu'il apparaîapparaît dans la page. Vous pouvez afficher la page morte en cliquant sur ce lien.
  • URL: URL vers laquelle le lien mort renvoie.
  • Statut: le statut d'erreur associéassocié avec le lien mort. Ces codes peuvent vous aider àà terminer la raison pour laquelle il ne fonctionne plus.

Ces sultats vous sont éégalement automatiquement envoyéenvoyés par email àà l'adresse entréentrée dans le formulaire

Domaines ignoréignorés

Pour des raisons de performance, certains liens sont ignoréignorés par faut. C'est notamment le cas des liens internes, qui ne sont vérifiévérifiés qu'en activant l'option avancéavancée, des services dont on sait qu'ils sont toujours joignables, et de ceux qui bloquent systésystématiquement le rificateur.

Domaines internes àà l'UNIL:

  • agenda.unil.ch
  • applications.unil.ch
  • applicationsinter.unil.ch
  • applicationspub.unil.ch
  • av.unil.ch/hva
  • editjahia.unil.ch
  • fmpsrv01prd.unil.ch
  • fmpsrv02prd.unil.ch
  • fmpsrv03prd.unil.ch
  • github.unil.ch
  • ip.unil.ch
  • jabba.unil.ch
  • my.unil.ch
  • news.unil.ch/display
  • repopub.unil.ch
  • sapcent.unil.ch
  • serval.unil.ch
  • unilogo.unil.ch

Domaines externes àà l'UNIL:

  • www.babla.fr
  • doi.org
  • nbn-resolving.org/urn:nbn:ch:serval
  • researchgate.net
  • linkedin.com
  • nytimes.com
  • www.cairn.info
  • www.pexels.com
  • pixabay.com
  • instagram.com
  • www.jstor.org
  • onlinelibrary.wiley.com
  • sagepub.com
  • tandfonline.com
  • sciencedirect.com
  • oup.com
  • dreamstime.com
  • www.science.org/doi
  • sciencemag.org
  • www.embopress.org/doi
  • journals.biologists.com
  • web.archive.org
  • maps.google.com

Les publications scientifiques en ligne disposent souvent de protections additionnelles contre les robots. En conséconséquence, il arrive fréfréquemment que lesle rificateur soit bloquébloqué par ces sites, signalant le lien comme brisébrisé. De tels faux-positifs sont malheureusement inéinévitables, et il convient de toujours rifier les sultats. Pour cette raison, certaines publications scientifiques ne sont jamais vérifiévérifiées.