Identité(s) numérique(s) et archives ouvertes

Pour faire suite à la matinée organisée par la Maison de l’Orient consacrée à l’identité numérique et la visibilité du chercheur sur le web, voici en quelques lignes les éléments de la présentation consacrée à HAL.

identitenumerique-e9106Bien avant que l’on ne parle de numérique et d’internet, la publication est un élément essentiel de l’identité du chercheur. Il est donc naturel de s’y intéresser lorsque l’on aborde la visibilité du chercheur.

Les « traces » numériques des publications sont présentes sur de multiples sites : ceux des éditeurs des libraires, les catalogues de bibliothèques, les bases de données bibliographiques. Les ouvrages et les articles de revues cumulent généralement plus de traces que les rapports ou les chapitres d’ouvrages (les sommaires ou tables de matières ne sont pas forcément accessibles).

De l’identité numérique du chercheur …

Si le chercheur est rattaché à un laboratoire ou une équipe d’accueil, le site internet propose en général une liste des publications des membres de l’unité, ainsi que, le plus souvent, une page par chercheur sur laquelle sont rassemblées ses publications. Le tout avec des mises à jour des listes effectuées avec plus ou moins de bonheur. Il arrive aussi que le chercheur gère son propre site internet sur lequel, là aussi, il présente une liste de ses travaux.

Une archive ouverte telle que HAL offre l’avantage au chercheur de stocker dans un lieu unique toutes ses publications. Bien sûr, il faut au moins les saisir, mais une fois suffit ! En utilisant les fonctions d’export ou de création d’url, il peut rapatrier sur son site ou sa page personnelle, comme sur le site de son labo, tout ce qui a été saisi. Avec la fonction de création d’url, tout ajout sur HAL met automatiquement à jour la liste des publications.

Vous êtes plus nombreux à utiliser ces fonctions avec des références bibliographiques simples qu’avec des références accompagnées de texte intégral. Cependant, si l’on raisonne en terme d’identité numérique et de visibilité, diffuser ses recherches en libre accès (publier dans une revue en libre accès ou déposer le texte intégral  dans une archive ouverte) est une façon de consolider/de travailler sa présence numérique :

  • d’une part les moteurs de recherche indexent plus de données : vous leur fournissez plus qu’un titre, un résumé et/ou des mots-clés,
  • d’autre part, le lecteur ayant un accès immédiat et sans contrainte à vos textes, vous augmentez les chances d’être lu, et, peut-être, d’être cité (une citation dans une bibliographie=une trace de plus).

Une caractéristique essentielle de toute trace numérique étant sa persistance, n’oubliez pas qu’une url stable est attribuée à chaque dépôt dans HAL (pas d’erreur 404 en vue !) et que des procédures d’archivage pérenne sont mises en place avec le CINES.

Coming soon. La v3 de HAL proposera au chercheur un nouveau service : la génération du CV. Celui-ci sera basé à la fois sur des informations saisies spécifiquement par le chercheur (éléments classiques d’un CV, ses axes de recherche, etc) et sur les publications saisies dans HAL (affichage bien sûr  des publications, des mots-clés associés, de la liste des co-auteurs et des disciplines). Cette page  CV sera dotée d’une url de type http://cv.archives-ouvertes.fr/prénom-nom (prenom-nom pouvant être modifié, on en reparlera dans un autre billet).

… à celle de son institution

L’appartenance institutionnelle du chercheur est aussi un élément constituant l’identité du chercheur, numérique ou non. Les problématiques de visibilité et d’identité sur internet ne sont pas réservées aux seules personnes physiques. Un organisme comme un laboratoire, une équipe d’accueil, une université y sont aussi confrontés. Tous travaillent leur site web, planchent sur la façon de les organiser, de les mettre à jour.

Pour une unité de recherche, présenter la liste des publications de ses membres semble être incontournable. Beaucoup ont d’ailleurs choisi de créer une collection dans HAL pour le faire  et encouragent au dépôt pour proposer des listes à jour.

Sur un site web d’université, on constate que les productions des enseignants-chercheurs sont beaucoup moins évidentes à trouver. Une archive ouverte est un excellent moyen pour les rendre visibles : par exemple, sur 66 sites web d’universités françaises consultés, on n’en compte que 19 qui proposent d’accéder aux publications à partir de l’onglet « recherche », dont 13 qui les valorisent via un portail ou une collection HAL. Sinon, au mieux, le site présente les derniers ouvrages publiés. Les archives institutionnelles que sont les collections et les portails constituent ainsi autant de points d’entrée pour accéder aux publications.

Les « traces » laissées ainsi sur la toile participent à la fois à l’identité numérique du chercheur et à celle de son/ses institution(s), ces dernières étant plutôt mal servies par les réseaux sociaux.

7 réflexions au sujet de « Identité(s) numérique(s) et archives ouvertes »

  1. Bonjour,
    je reviens sur ce passage de votre note:
    « d’autre part, le lecteur ayant un accès immédiat et sans contrainte à vos textes, vous augmentez les chances d’être lu, et, peut-être, d’être cité (une citation dans une bibliographie=une trace de plus). »
    Elle me paraît reposer sur un présupposé erroné selon lequel toute citation serait bonne à prendre. Mais ce n’est pas le cas : ce qui est important, c’est d’être cité précisément pour une publication définitive si possible dans une revue réputée (à comité de lecture). Or, il ne vous aura pas échappé qu’il n’est pas possible , pour des raisons juridiques (protection du copyright) d’archiver le pdf final d’une telle publication. Par conséquent, le document archivé sera au mieux la version finale avant correction d’épreuves d’un article, càd un document provisoire , dont la mise en forme, la pagination et parfois le contenu, diffèrent de la version finalement publiée . Quel intérêt avons-nous à être cité à travers ce qui n’est en définitive qu’un brouillon ? Est-ce là la « trace » que nous souhaitons laisser ?
    Autant il est légitime pour l’institution qui nous emploie de vouloir conserver une archive aussi complète que possible de notre activité, si possible en temps réel, autant il est illusoire de vouloir combiner cette préoccupation avec la question de l’open access. Si l’archive en question était fermée et à destination purement interne, le problème du copyright ne se poserait pas et nous pourrions alors y déposer sans crainte les pdf de nos publications.

    1. Bonjour, il me semble que ce que vous dites : « Par conséquent, le document archivé sera au mieux la version finale avant correction d’épreuves d’un article, càd un document provisoire, dont la mise en forme, la pagination et parfois le contenu, diffèrent de la version finalement publiée » est en partie erroné. Certains journaux, listés sur le site Sherpa/Romeo [1] qui détaille les différentes politiques de droits d’auteurs, permettent l’archivage de la version finale de l’article, après correction d’épreuve. Ils s’agit des journaux dits « verts ». Le contenu sera donc identique à la version « officielle et publiée » de l’article mais la mise en page sera légèrement différente.

      [1] http://www.sherpa.ac.uk/romeo/

  2. Bonjour
    j’entends autour de moi, dans mon équipe, une insatisfaction à l’égard du mode de saisie dans Hal. Les collègues déplorent que l’on ne puisse pas remplir automatiquement les métadonnées HAL. Ils disent : Hal c’est le système de trop où il faut tout remplir à la main…
    En espérant que la V3 permettra une autosaisie, sinon la perte de substance vers Académia et autres va continuer…

    1. J’ai entendu, par une source proche du dossier, que HAL pourrait bientôt (dans la v3 ?) extraire les métadonnées contenues dans le fichier PDF, comme Mendeley ou Zotero. Est-ce que l’équipe du CCSD peut confirmer ?

    2. A propos d’Academia et autres, lors de cette matinée sur l’identité numérique, Christophe Benech s’est attardé sur les conditions générales d’utilisation de ces réseaux sociaux en encourageant chacun à se poser la question de l’utilisation ultérieure des données qu’ils y déposent, y compris en cas de suppression de compte.
      Pour ce qui est de « l’auto-saisie », la v3 utilisera le même utilitaire que Researchgate and C°qui extrait les données présentes sur la 1ère page du pdf (titre, auteur, rattachement, résumé, mots-clé). Il faudra donc que ces informations soient présentes sur la première page (ce qui est loin d’être toujours le cas). Il faudra bien entendu vérifier – et éventuellement corriger ce qui a été récupéré. Nous tenons beaucoup à la qualité des métadonnées dans HAL.

Les commentaires sont fermés.