HAL en 2015 : quelques chiffres

Quelques chiffres en guise de bilan de l’activité dans HAL pour 2015 :

On compte 46 205 dépôts avec texte intégral, tous types de publications confondus.

nb_depots_2015

  • 21 9281 documents ont été produits ou publiés en 2015
  • 14 338 articles publiés dans des revues
  • 9 738 communications dans des colloques
  • 7 831 thèses, dont 5752 ont été déposées via STAR
  • 284 HDR
  • 1 494 chapitres d’ouvrages et 132 ouvrages
  • 3 334 images
  • 478 posters
  • nombre de transferts vers ArXiv : 4392
  • nombre de transferts vers PubMed Central : 17
  • nombre de dépôt mis à disposition de RePec : 5001
  • Nombre total d’IdHAL créés : 7144
  • Nombre total de CV configurés : 2901

 

 

 

Sciencesconf.org : le tutoriel

Le tutoriel Sciencesconf.org a été mis à jour  :


 

En janvier 2016, on comptait 2566 conférences gérées via la plateforme :

  • 834 ne l’utilisent que pour le site web
  • 1328 utilisent le module de gestion éditoriale, ce qui représente plus de 18 000 communications
  • 1414 utilisent le module d’inscription, soit près de 100 000 inscrits.

Les prochaines formations URFIST auront lieu le 21 avril à Bordeaux et le 19 mai à Toulouse.

 

Les 10 ans de HAL-SHS : les interventions du CCSD

Le 18 décembre dernier, HAL-SHS était à l’honneur lors d’une journée organisée conjointement par l’INSHS et le CCSD. L’objectif de la journée était de dresser un bilan après 10 ans d’usage de HAL-SHS, mais aussi de prendre le temps d’interroger les pratiques contemporaines d’archivage des publications en SHS et de se tourner vers l’avenir alors que HAL est devenu une archive d’envergure nationale.

Vous pouvez consulter le programme et les vidéos des interventions.

Un peu d’histoire

Christine Berthaud, directrice du CCSD, était la mieux placée pour retracer les débuts de HAL-SHS puisqu’elle a fait partie du groupe de travail à l’origine de sa création.

C’est en effet suite à des contacts entre l’Institut des Sciences de l’Homme (ISH) où elle travaillait et le CCSD, alors dirigé par Franck Laloë et Daniel Charnay, qu’un groupe de travail a été mis en place en septembre 2004. Il réunissait, en plus des initiateurs, Lorette Mordin de l’université Rennes 2 et était soutenu par le Département SHS du CNRS (futur INSHS) représenté par Christian Henriot.

Au menu des réflexions et des travaux du groupe : l’élaboration d’une nomenclature des disciplines inspirée du projet européen MORESS (Mapping of Research in the European Social Sciences and Humanities), une typologie des types de publications, la réalisation d’un guide « étape par étape » ainsi que l’organisation de la modération, prise en charge par l’équipe du service d’ingénierie documentaire de l’ISH (3 personnes).

Le CCSD a réalisé le portail HAL-SHS dont l’ouverture officielle à la communauté date de janvier 2005. La page d’accueil ressemblait à ça :

10ansHALSHS_page_ecran

Pour son intervention, Christine Berthaud a réutilisé un diaporama présenté en juin 2006, dans lequel figuraient les statistiques de dépôts en 2005 :

10ansHALSHS_stats2005.De quoi réaliser le chemin parcouru : 1514 dépôts pour l’année 2005. 10 ans plus tard, ce chiffre est atteint dès le 16 février 2015 (total pour 2015 : 12913).

On parle aussi de la modération

Agnès Magron présente pour sa part le travail de modération qu’elle effectue pour HAL-SHS, lorsqu’elle a rejoint l’équipe du service d’ingénierie documentaire de l’ISH dans un premier temps, puis au CCSD.

Les principes qui régissent ce contrôle qualité (validation technique avant mise en ligne) sont les mêmes que pour tout HAL et ne concernent que les dépôts avec fichier, les références bibliographiques étant mises en ligne sans vérification.

  • Pour le fichier, on s’assure d’une part que c’est le bon fichier, qu’il a été téléchargé correctement et est lisible, et, d’autre part, qu’il contient bien le texte intégral du document décrit dans les métadonnées . Lorsque le fichier déposé est un fichier produit par l’éditeur, on vérifie que le dépôt se fait en accord avec sa politique, notamment grâce aux sites Sherpa/Romeo ou Héloïse. Sont signalés au déposant toute absence de mention du nom de l’auteur dans le fichier, voire parfois du titre du document. Il est difficile de vérifier en effet si les métadonnées sont correctes en l’absence de ces informations. La mention du nom de l’auteur est par ailleurs indispensable pour celui-ci pour protéger son travail.
  • Les métadonnées doivent décrire le document : on s’assure donc qu’il n’y a pas d’incohérences et qu’elles respectent au minimum les normes bibliographiques.
  • Enfin, pour ce qui concerne les contenus, notamment pour les documents qui n’ont pas passé le filtre du peer reviewing, le terme de vigilance est le terme qui convient le mieux pour décrire le travail de la modération. Depuis 2006, un groupe de chercheurs apportent leur expertise en soutien. Ils ont beaucoup été sollicités les premières années de HAL-SHS. Mais c’est grâce à leurs réponses que l’équipe de modération a pu appréhender la diversité des formats et canaux de diffusion propres à chaque discipline.

Les deux erreurs les plus courantes qui font l’objet d’une demande de modification portent sur :

  • l’information juridique du fichier non renseignée à l’étape du transfert de fichier : oubli, méconnaissance, difficulté d’interpréter les conditions pas forcément très claires des éditeurs. Les raisons sont multiples.

transfertfichier

  • l’oubli du ou des co-auteurs dans les métadonnées (où l’on est surpris parfois de se voir répondre que l’oubli est volontaire puisque l’auteur en question est – au choix – mort, à la retraite ou devenue femme au foyer).

Ce travail de modération est souvent critiqué, du principe même du contrôle à son organisation. Il constitue cependant un accompagnement au dépôt (apprentissage par l’erreur), un ‘filet de sécurité’ pour le déposant sur les questions juridiques. Il n’en reste pas moins que dans leur grande majorité les dépôts sont tout à fait corrects et ne nécessitent aucune modification.

Enfin, pour compléter le retour d’expérience, Agnès Magron relève que la modération constitue un excellent poste d’observation sur les pratiques des chercheurs. Que ce soit pour HAL comme pour HAL-SHS, pas de week end ou jour férié pour les déposants : les chercheurs utilisent aussi leur temps libre pour auto-archiver leurs publications.

Les stratégies du réseau académique Researchgate pour s’imposer dans le circuit de la publication académique est aussi à noter : on peut ainsi voir des dépôts de documents non publiés avec un DOI (attribué par Researchgate) ou des fichiers avec une page de garde avec le logo du réseau.

Plus spécifique à HAL-SHS, Agnès Magron relève la diversité des formats d’écriture comme des supports de diffusion, ainsi que des langues. Elle se demande enfin si des sujets d’actualité ne motivent pas parfois le dépôt de publications, pas forcément récentes, parce que le contenu peut alimenter le débat.

HAL-SHS au service de l’identité numérique du chercheur

Le programme de la journée a consacré une partie de l’après midi à l’identité numérique et Agnès Magron a rapidement présenté l’IdHAL et le CV, deux fonctionnalités que tout auteur d’au moins une publication dans HAL ou HAL-SHS peut utiliser, dès lors qu’il y a un compte.

10ansHALSHS_id

Le chercheur peut avec l’IdHAL gérer et unifier les différentes formes avec lesquelles son nom d’auteur est entré dans la base de données  et, avec la fonctionnalité CV, se créer une page chercheur pour afficher toutes les publications présentes dans HAL-SHS et les métadonnées qui y sont associées. Il peut y ajouter des élements biographiques (en français et/ou en anglais), afficher sa photo et des liens vers son blog, son identifiant ORCID, ses profils Twitter ou LinkedIn.

Le CV est doté d’une adresse url pérenne.

Il est intéressant de noter que l’IdHAL est utilisé par d’autres plateformes : c’est le cas par exemple de RIBAC, WordPress avec le plugin HAL, ou le site web de l’Université de Lille 3 pour ses propres pages chercheurs.

En guise de conclusion à la présentation, une illustration qui suggère de copier l’adresse url de votre CV afin de mieux le référencer et ainsi, consolider votre identité numérique.

10ansHALSHS_referencement

Lors de cette journée a été dévoilé le nouveau logo de HAL-SHS. Le CCSD a, pour l’occasion, relooké la page d’accueil. Vous pouvez les découvrir ici.

Très belle année à tous.

2014-2015 : retour sur deux années riches en évolutions pour le CCSD et HAL

Les 6èmes journées open access organisées par le consortium Couperin en octobre dernier ont été l’occasion pour Christine Berthaud de faire un retour sur les évolutions du CCSD et de HAL.

Evolutions du CCSD

En avril 2013, une convention de partenariat sur les archives ouvertes plaçait HAL au cœur d’une politique de mutualisation des établissements d’enseignement et de recherche.

Pour rappel, 25 établissements et organismes ont signé ce texte : l’AMUE, l’ANDRA, l’ANR, la BNF,  le BRGM, la CDEFI, le CEA, le CEE, la CGE, le CIRAD, le CNRS, la CPU, le CSTB, l’IFPEN, l’IFREMER, l’IFSTTAR, l’INERIS, l’INRA, l’INRIA, l’INSERM, l’InVS , l’IRD, l’IRSN, l’IRSTEA et l’Institut Pasteur.

Les modalités de pilotage et de gouvernance prévues dans le texte de la convention ont été mise en œuvre en 2014 :

  •   le CCSD est devenue une Unité Mixte de Service (UMS) avec comme tutelles en plus du CNRS, INRIA et l’Université de Lyon. Cette dernière représente l’ensemble des universités.
  •  le comité de pilotage est composé d’un représentant de chacune des tutelles, du MENESR, de BSN ainsi que du CCSD.
  • et le comité scientifique et technique (CST) a été créé. Il s’est déjà réuni 3 fois depuis sa création. La prochaine réunion aura lieu le 4 décembre.

L’année 2015 a apporté au CCSD une visibilité à plus long terme de ses moyens : le MENESR a  quadruplé sa subvention et l’équipe est renforcée, depuis septembre, avec un poste INRIA de responsable de plateforme. En juin, un partenariat avec l’INIST a été conclu qui porte notamment sur le contrôle qualité des dépôts avant leur mise en ligne. Ces différentes actions faisaient partie des recommandations de la feuille de route de S. Bauin.

Mutualisation

L’objectif du texte de la convention est « le développement coordonné des archives ouvertes sur la base du développement de HAL et de son interconnexion avec les archives institutionnelles des établissements partenaires ». Il prévoit 2 modes de mutualisation : utiliser un portail HAL ou reverser le contenu d’une archive locale dans HAL.

Fin 2015, on compte 116 portails. Depuis 2013, 25 portails institutionnels ont été créés.

HAL_portails_institutionnels_repartition

Ce mode de mutualisation constitue une solution économique comparée à une archive gérée en local. Et elle offre l’avantage de contenir, dès sa création, tous les dépôts de HAL déjà associés à l’institution.

Pour ce qui concerne le second mode de mutualisation, 7 archives institutionnelles reversent actuellement dans HAL une partie ou tout leur contenu. Avec plus de 11 000 dépôts en texte intégral, cela représente environ 3% de HAL. SciencePo, avec son archive SPIRE, est le plus gros contributeur.

3 900 collections

Une équipe ou un laboratoire de recherche peut, à son niveau, lister et valoriser les publications de ses auteurs en utilisant une collection. Cette fonctionnalité est très utilisée puisqu’on recense 1700 collections de laboratoire. Une équipe qui gère un congrès, un projet ANR ou européen peut également valoriser ses publications à travers une collection.

Formations

Avec la mise en production de la nouvelle version de HAL en octobre 2014, le CCSD a mis un accent particulier sur les formations utilisateurs, destinées plus particulièrement aux gestionnaires de collection et administrateurs de portail. Deux séances ont ainsi été organisées dans les locaux du CCSD à l’automne 2014 qui ont réuni plus de 100 personnes. En partenariat avec les URFIST, plus de 120 personnes ont également été formées en 2015. Et avec le réseau des informaticiens ARAMIS, deux séances de formation ont été consacrées aux API.

Christine Berthaud a conclu sa présentation sur l’importance des relations avec les différents utilisateurs, notamment les administrateurs de portail, et souligné que le CCSD est à l’écoute des initiatives permettant une meilleure fluidité des échanges.

Utilisez votre IdHAL pour ajouter vos publications dans RIBAC

RIBAC est le Recueil d’Informations pour un oBservatoire des Activités de reCherche en SHS. C’est l’outil que les chercheurs CNRS de l’Institut des Sciences Humaines et Sociales utilisent pour leur compte rendu d’activité annuel.

Les informations recueillies permettent la production et la publication d’indicateurs synthétiques qui valorisent et rendent visibles la diversité des activités des chercheurs et des disciplines SHS. Les résultats et analyses sont publiés sur le site web de l’InSHS, dans les lettres de l’INSHS et dans le rapport d’activité du CNRS.

Parmi les informations à compléter, les publications du chercheur figurent évidemment en bonne place. Il existe depuis longtemps une passerelle entre RIBAC et HAL/HAL-SHS : le chercheur saisit un identifiant HAL et l’application récupère automatiquement la publication correspondante.

RIBAC prend en compte maintenant l’IdHAL créé par le chercheur pour simplifier la procédure.

Comment faire si vous avez déjà un IdHAL  

La première étape est de fournir votre IdHAL à l’assistance RIBAC en envoyant un mail à : inshs.ribac-assistance@cnrs.fr.

Une fois votre IdHAL enregistré, lorsque vous cliquerez sur Import de HAL, toutes vos publications HAL de l’année courante et l’année N-1 s’afficheront.

Il vous faudra ensuite sélectionner puis ajouter celles que vous souhaitez importer.

RIBAC_page_ecran

Vous n’avez pas encore d’IdHAL

Vous pouvez toujours bien entendu ajouter vos publications en saisissant l’identifiant des dépôts dans RIBAC. Mais si vous souhaitez vous créer un IdHAL, vous trouverez la fonctionnalité dans le menu Mon espace/Mon IdHAL.

En savoir plus en consultant le billet consacré à l’IdHAL et la documentation en ligne.

Afficher une liste de publications avec WordPress

wordpress-logo-stacked-rgbVous avez un carnet de recherche sur Hypotheses.org ? Vous gérez un site web sous WordPress ? Savez-vous que vous pouvez afficher très simplement une liste des publications déposées dans HAL en installant un plugin ?

Les publications peuvent être celles d’un auteur, d’une structure de recherche, d’un projet ANR ou européen, ou d’une collection.

Deux modes d’affichage sont proposés :

  • afficher les 5 dernières publications déposées sous la forme d’un widget : voir l’exemple sur ce blog, à droite de l’écran : pavé intitulé « Exemple d’utilisation du plugin HAL ». C’est l’équivalent d’un fil rss.
  • créer une page qui listera toutes les publications. En fonction du paramétrage, un menu Métadonnées peut proposer en plus une synthèse par date de publication, mots-clé, titre de revue ou auteurs.

Pour en savoir plus, la documentation est disponible là.

Nous avons relevé deux questions que peut se poser un utilisateur WordPress à propos de cette fonctionnalité :

La première concerne le CV dans HAL vs une page WordPress : le principe des deux fonctionnalités repose sur les mêmes éléments (liste de publications avec choix de métadonnées à afficher ou non). En fonction de sa stratégie de présence sur le web, un auteur peut choisir d’utiliser les deux. L’adresse url du CV, construite à partir de l’IdHAL qui est le plus souvent prénom-nom, est une composante robuste de l’identité numérique de l’auteur. Sa pérennité est une garantie apportée par HAL. De plus, la racine de l’url cv.archives-ouvertes inscrit d’emblée le contenu de la page dans le mouvement du libre accès. Le titre de la page WordPress que vous choisirez sera visible dans l’adresse url : il est donc important de bien le choisir. L’affichage de la liste des publications s’adaptera au thème (couleurs, etc.) choisi pour le site.

La seconde question concerne une collection de laboratoire dans HAL vs une page WordPress : si le site de votre unité de recherche est géré avec WordPress, vous pouvez vous demander s’il est vraiment utile de créer une collection pour afficher la liste des publications des membres de l’unité. Une page WordPress sera forcément intégrée dans le site, ce qui ne sera pas le cas d’une collection. Un seul identifiant de structure de recherche peut être choisi pour une page WordPress alors qu’une collection peut être paramétrée à partir de requêtes plus élaborées, regroupant par exemple plusieurs identifiants correspondant à une seule structure (évolution de la structure dans le temps : changement de nom le plus souvent). Les statistiques, de dépôts comme de consultations, sont disponibles pour chaque collection.

Si vous avez créé une page avec ce plugin, n’hésitez pas à partager vos liens en postant un commentaire sur ce billet.

A noter que l’équipe d’Hypothèses.org procède à des tests avant de l’implémenter sur la plate-forme.

HAL : un état des lieux des récentes évolutions

Avant la pause estivale, profitons d’un billet pour recenser les dernières évolutions ou fonctionnalités mises en production ces derniers mois.

A comme Arxiv : les disciplines d’Arxiv sont affichées en correspondance avec les domaines HAL : elles apparaissent entre crochets au dépôt, à la consultation et dans AuréHAL.

D comme Détamponnage par lot : un gestionnaire de collection peut désormais détamponner plusieurs dépôts à la fois. Cette action se fait dans la recherche : après avoir sélectionné les documents que vous ne souhaitez plus voir apparaître dans la collection, cliquez sur Outils/Détamponner.

E comme export : après une recherche, le choix des métadonnées à exporter est disponible pour les formats d’exports csv, json et xml. Cette action se fait dans la recherche  après avoir sélectionné les documents que vous souhaitez exporter : cliquez sur Outils/Export avancé. page_ecran_export_avance

P comme Projets :

  • mise à jour du référentiel des projets ANR avec l’intégralité des projets ANR de 2005 à 2014. Cela représente 12 892 projets.
  • mise à jour du référentiel des projets européens avec les liste complète des projets présents dans OpenAIRE, soient 45 394 projets.

S comme Serveur ftp pour SWORD : il est désormais possible de faire référence à un fichier disponible sur son espace ftp du CCSD dans le fichier XML-TEI de l’import via SWORD.

S comme Statistiques d’auto-archivage : utile pour un administrateur de portail qui souhaite connaître la proportion de dépôts réalisés par les auteurs eux-même, la métadonnée Dépôt en auto-archivage a été ajoutée à la liste des champs disponibles pour les statistiques. page_ecran_statistiques_auto_archivage

S comme Structures de recherche : dans le référentiel des structures de recherche des métadonnées ont été ajoutées :

  • dates de création et de fermeture ou fusion de la structure,
  • identifiants externes :
    • IdRef : référentiel des autorités Sudoc
    • ISNI : International Standard Name Identifier
    • RSNR : Répertoire National des Structures de Recherche

W comme WordPress : le plugin wordpress a été mis à jour. Il permet d’afficher de façon dynamique la liste de ses derniers dépôts dans un site géré avec WordPress.

Toute l’équipe du CCSD vous souhaite un très bel été.