Quelques nouvelles de HAL v3

Tous les dépôts actuellement dans la base de production ont été intégrés dans la base test de HAL v3 disponible à l’adresse http://halv3-preprod.archives-ouvertes.fr.Le problème est ainsi résolu pour tous ceux qui ne retrouvaient pas tous leurs dépôts ou tout simplement leur compte en faisant des tests.

HALv3-testHAL v3-preprod  est à l’image de la base actuellement en production en juin 2014, y compris les données des référentiels (auteurs, structures de recherche, projets, etc.). Nous vous encourageons à vous familiariser avec les nouveautés des modules de dépôt, de recherche et de gestion des collections et portails (pour une synthèse des nouveautés, voir le billet précédent).  Testez tant que vous voulez : toutes les modifications que vous effectuerez ne seront pas conservées lors de la mise en production définitive.

Les établissements qui utilisent le Web Service SOAP et ne peuvent développer l’import SWORD d’ici la mise en production cet automne pourront continuer d’utiliser ce service jusqu’à juin 2015 sans autre modification que l’url du WSDL. Ils pourront utiliser les référentiels de HAL v3 mais ne disposeront pas des nouvelles métadonnées disponibles dans la future version (notamment les champs multivalués de la notice d’un dépôt). Pour les autres, le dépôt via le protocole SWORD est pleinement opérationnel, pensez à vos tests.

Si vous le souhaitez, vous pouvez continuer à  nous faire part de vos commentaires et ils sont toujours les bienvenus  à remarques-halv3@ccsd.cnrs.fr.

Bon été à tous et rendez-vous au congrès de l’IFLA en août (poster Episciences.org).

 

Bookmark and Share

Les nouveautés de HAL v3

Organisées par les URFIST, 3 séances de formation autour des nouveautés de HAL v3 ont récemment eu lieu à Rennes, Lyon et Toulouse.
Voici la présentation élaborée par Bénédicte Kuntziger, responsable des formations au CCSD.
Plan de la présentation :

  • Authentification CAS centralisée.
  • Mon espace :
    • Mes dépôts, Mes partages de propriété , Mon profil, Mon idHAL (menu de gestion de son idHAL via le CV), Mon CV / mes publications.
  • Dépôt :
    • Nouveautés, Types de données, Dépôt du fichier, Licences dans HAL et CC, Métadonnées, Auteur, Affiliation.
  • Moteur de recherche SOLR et API recherche (interrogation base et référentiels).
  • Consultation
  • Recherche :
    • Enregistrement de ma recherche et abonnement, Exports et constitution d’une bibliothèque, Visualisation du dépôt : données et fonctionnalités offertes.
  • Les collections :
    • Gestionnaire de collection : tamponnage et paramétrage(site Web), (Administrateur : création des collections).
  • Privilèges :
    • Collections, Statistiques (statistiques sur les dépôts), Sites Web, Administrer (Utilisateurs).

A noter que tous les écrans ne sont pas finalisés.


Télécharger la présentation en format pdf : HALv3 presentation(juin 2014)

 

Bookmark and Share

La première réunion du Comité Scientifique et Technique

Le Comité Scientifique et Technique (CST) s’est réuni pour la première fois le 10 avril dernier. Cette première réunion a surtout été une prise de contact de ses membres et a donné l’occasion à la direction du CCSD d’exprimer ses attentes.

Composé pour au moins un tiers de chercheurs et enseignants-chercheurs, le rôle du CST est de conseiller, fixer et planifier les évolutions de HAL et des plates-formes du CCSD. Il contribue à établir les cahiers des charges et suit les évolutions des protocoles internationaux en matière d’archives ouvertes.

Les discussions et échanges qui ont traversé la journée ont permis de déterminer les points forts suivants :

Garantir le développement de la plateforme HAL. Il s’agit de finaliser les phases de test et de lancement de la nouvelle version à l’automne, d’où la nécessité de renforcer l’équipe actuelle du CCSD par des emplois stabilisés qui permettraient de garder les compétences développées par les personnes embauchées pour des contrats à durée déterminée.

Des interventions ont, à ce propos, attiré l’attention sur la fragilité des plateformes qui dépendent des métiers de l’informatique et de l’IST et souligné l’erreur profonde, sur un plan stratégique, de ne pas pouvoir garder et pérenniser le personnel qui en a la charge.

L’urgence de trouver des solutions durables pour renforcer l’équipe du CCSD en vue de la rentrée 2015 a été clairement réaffirmée. Proposition a été faite d’un courrier émanant du CNRS à destination du MESR, faisant état d’une demande de moyens humains supplémentaires.

Préciser une stratégie de communication sur une offre globale de services (HAL, Episciences.org, SciencesConf.org) qui touche à la fois les institutions et le chercheur individuel. Cela participerait à la fois de la mise en visibilité des services et des retours de ces derniers en termes d’alimentation sur les plateformes, prise en compte de l’open process.

Pour HAL, associer la qualité des documents diffusés (sélection/modération), élargir la typologie tout en respectant les principes de l’open access en matière d’archives ouvertes et d’archives institutionnelles. Christine Berthaud, directrice du CCSD, a insisté sur l’importance de la question qui est au cœur même de la qualité d’une Archive ouverte au service de la recherche.

Les échanges ont également fait ressortir que la diffusion se dissocie de la certification, mais que cette dernière garde toute son importance. Dans ce domaine, les communautés de chercheurs jouent un rôle central dans l’appui pour l’évaluation et la sélection des contenus. La prise en compte des nouvelles modalités d’évaluation a été envisagée comme une question scientifique primordiale à débattre et à préciser lors des chantiers.

A l’issue de la réunion, et à partir des échanges qui ont pu se tenir, les chantiers identifiés sont les suivants, classés par priorité :

  • Chantier 1 : Modération scientifique

Ce chantier abordera pour HAL la question de contrôle de dépôts et leur modération ; il se penchera sur la question de la typologie des documents que HAL pourra être à même d’accepter. Il répondra à la question de savoir à quel élargissement cette typologie peut s’étendre et définira ainsi le périmètre de l’archive ouverte.

  •  Chantier 2 : Articulation HAL et portails institutionnels

Ce chantier abordera la question des embargos à prendre en compte selon que la demande concerne des dépôts dans HAL ou dans les portails institutionnels développés dans HAL. Ce sera l’occasion d’aborder le cas des embargos indéfinis et donc des documents qui ne pourraient jamais être mis en ligne. Ce type de documents est déjà géré dans certains portails, comme HAL-Inserm. Le chantier abordera également la question des données de la recherche déjà présentes dans l’archive et qui peuvent être amenées à se développer.

  • Chantier 3 : Ergonomie

Chantier important mais moins prioritaire que les deux précédents, il fera l’objet d’une discussion lors des prochains CST.


Les membres du CST

  • Raymond Bérard ( CNRS – INIST)
  • Christine Berthaud (CNRS – CCSD)
  • Claire Blin (UPMC)
  • Marc Bonnet (ENSTA – Mathématiques appliquées et sciences de l’ingénieur)
  • Chérifa Boukacem-Zeghmouri (Lyon 1, Elico, URFIST de Lyon)
  • Marin Dacos (Open Edition)
  • Thierry Dauxois (Laboratoire de physique, ENS de Lyon)
  • Frank Debouck (Ecole Centrale de Lyon)
  • Renaud Fabre (CNRS – DIST)
  • Martine Garnier Rizet (ANR – Contenus numériques et actions)
  • Odile Hoffmann (IRD)
  • Odile Hologne (INRA)
  • Jean – Yves Lemeur (CERN)
  • Marie Anne Leriche (CEA)
  • Marie Pascale Lizée (MESR)
  • Sandrine Malotaux (INP-Toulouse)
  • Michel Marian (MESR)
  • Jacques Millet (INRIA)
  • Didier Pelaprat (INSERM)
  • Laurent Romary (INRIA)
  • François Joseph Ruggiu (CNRS – INSHS)
Bookmark and Share

Le CCSD devient unité mixte de service

Depuis sa création en 2000, le CCSD est une unité propre de service, ce qui signifie qu’il relève uniquement du CNRS.

Impression

La convention de partenariat en faveur des archives ouvertes signée en avril 2013 prévoit que le CCSD devienne une unité mixte de service afin qu’il y ait une meilleure représentation de tous les établissements qui utilisent ses services.

Voilà chose faite : depuis cette année, l’UMS 3368 est officiellement créée avec pour tutelles le CNRS, INRIA qui représente les EPST et l’Université de Lyon au titre des universités françaises.

Le comité scientifique et technique, que prévoit aussi le texte de la convention, a été constitué. Il permet « d’associer l’ensemble des partenaires signataires ». Il s’est réuni pour la première fois le 10 avril dernier.

Bookmark and Share

HAL v3 : à vous de tester !

Dès lundi 31 mars, nous vous proposons l’accès à HAL v3 en version de test à l’adresse http://halv3-preprod.archives-ouvertes.fr.

HALv3-testToutes les fonctionnalités ne sont pas encore disponibles mais vous pourrez y tester le dépôt, la recherche, les alertes, la gestion de votre bibliothèque et  la création d’un CV. C’est une version « bac à sable » sur une base test : n’hésitez pas à créer, déposer tout ce que vous voulez. Ce ne sera jamais visible dans la base de production actuelle.

Tous les comptes existants sur HAL ont été migrés sur cette base test, vous n’aurez donc pas besoin de vous créer à nouveau un compte.

Par contre, pour des raisons pratiques, toute la base actuelle de production n’a pas été transférée.  Il est donc possible que vos dépôts ne fassent pas partie des lots transférés. Si c’est le cas, ne vous étonnez pas si vous ne les retrouvez pas  dans votre espace.

Les gestionnaires de portail qui souhaiteraient tester les fonctionnalités spécifiques doivent en faire la demande au support (hal.support@ccsd.cnrs.fr).

Si vous le souhaitez, vous pouvez nous faire part de vos commentaires et ils sont les bienvenus  à remarques-halv3@ccsd.cnrs.fr.

Bookmark and Share

HALv3 : forme auteur, idHAL et CV

Aujourd’hui : On recense plus de 850 000 auteurs sur HAL mais une bonne proportion sont des doublons, hors homonymies. La saisie des auteurs n’est pas contrôlée et un auteur peut apparaître sous plusieurs formes : prénom en entier ou non, ordre prénom-nom inversé, changement d’affiliation, de mail, mariage. Comment s’assurer dès lors, après une requête sur un  nom d’auteur, que l’on obtient bien toutes ses publications déposées ?

Ce qui change : la v3 offre la possibilité d’associer toutes les formes sous lesquelles peut apparaître un auteur au gré des saisies. Cette association porte un identifiant unique, l’idHAL. Les formes auteurs ne sont pas fusionnées.

CaptureCette association de formes auteur peut être enrichie par la création d’un CV. C’est une nouveauté de la v3 : le formulaire du  CV comporte un champ libre vous permettant d’ajouter les éléments classiques d’un CV, différents champs pour d’autres identifiants (ArxivID, ResearcherID, ORCID, idRef), les comptes sur les réseaux sociaux (twitter, facebook), l’adresse d’un blog.

Doté d’une url propre(sous la forme http://cv.archives-ouvertes.fr/idHAL), le CV affichera au minimum vos publications et ce qui est saisi dans le champ libre. En fonction de vos choix, tout usager pourra visualiser les mots clés de vos publications, vos co-auteurs, votre photo, etc.

Passage à la v3 : La création de l’idHAL ne peut se faire sans intervention humaine : une fonctionnalité spécifique est proposée. Après une requête sur un nom, le système propose toutes les formes qu’il connait : à vous de sélectionner et associer celles qui vous correspondent. Par contre, comme le mode de saisie d’un auteur lors d’un dépôt ne change pas, vous n’êtes pas à l’abri d’une erreur éventuelle d’un de vos co-auteurs par ex. Pensez dès lors à vérifier de temps en temps si votre idHAL comprend bien toutes les formes.

Votre nom a été saisi de façon unique, tout va bien mais si vous souhaitez utiliser la fonctionnalité CV, vous devez créer un idHAL.

La création d’un CV avec son url propre peut avantageusement remplacer l’url obtenue par la fonction actuelle « créer sa page web ».

Lorsqu’il fera une requête sur un nom d’auteur, tout utilisateur de HAL aura accès à cet idHAL et pourra visualiser le CV du chercheur s’il l’a créé.

Vous pourrez tester cette fonctionnalité dès lundi 31 mars.

Bookmark and Share

Comptes et profils : ce qui change avec HAL v3

Pour la gestion des comptes, la nouvelle version de HAL utilise un service central d’authentification (CAS), qui est un système d’identification unique. En s’authentifiant sur ce service du CCSD, on pourra être authentifié sur tous les sites qui utilisent le même serveur CAS. Il évite de se ré-authentifier à chaque fois qu’on accède à une application.

Le CCSD gère son propre serveur CAS. Une évolution envisagée est l’intégration du service de Fédération d’Identités Éducation Recherche.
HAL et Episciences.org utilisent ce service, et dans un second temps, Sciencesconf.org et l’interface pour le support l’utiliseront aussi.

Le compte

Le compte comporte un login, un mot de passe, vos nom et prénom et votre adresse mail.

Le profil

Le profil dans HAL comprend des informations supplémentaires que vous connaissez déjà : votre laboratoire d’appartenance, la langue par défaut de l’interface, si vous êtes auteur par défaut. En option, une url personnelle, une photo.

2 nouveautés à relever :

  • la possibilité de choisir plusieurs disciplines : elles apparaitront par défaut lors de la saisie de chaque dépôt mais vous pourrez en modifier l’ordre, en supprimer ou en ajouter pour qualifier au mieux votre document. La première choisie, dans votre profil comme dans un dépôt, est considérée comme la discipline principale et c’est elle qui est utilisée pour le calcul des statistiques.
  • le nom d’affichage : c’est le nom qui s’affiche lorsque vous vous connectez et qui sera repris dans les mails. Par défaut ce sont vos prénom et nom donc vous n’aurez pas à remplir ce champ. Cet ordre peut cependant ne pas vous convenir : choisir la façon dont cette information apparaît permettra de respecter les usages de certains pays (noms chinois notamment) et résoudra les problèmes d’affichage des noms à particule. Ce champ est conforme aux bonnes pratiques édictées par le W3C sur les noms de famille. Il peut être utilisé aussi pour afficher une fonction que vous avez dans HAL : référent labo par ex.

Si vous utilisez ce champ pour caractériser une fonction dans HAL, vous pourrez en choisir une autre dans Episciences.org. La langue par défaut de l’interface pourra être modifiée sur chacune des plates-formes.

Passage à la v3 :

Si vous avez déjà un compte dans HAL : vous n’avez rien à faire, les comptes sont automatiquement migrés sur le service central d’authentification. Libre à vous de modifier votre profil dans HAL si vous voulez ajouter des disciplines.


Bookmark and Share

HAL en 2013 : quelques chiffres

Que s’est-il passé sur HAL en 2013 ? Un bilan avec quelques chiffres :

43426 dépôts en texte intégral. Ce chiffre comprend les dépôts de versions ainsi que les documents spécifiques à certains portails.

nbdepots2013

  • 52% des dépôts sont effectués par les auteurs (auto-archivage)
  • date de publication 2013 : 15705 (les dépôts de versions ne sont pas comptabilisées)
  • répartition par types de publication : 3869 preprint, 10699 articles dans des revues avec comité de lecture, 1295 chapitres d’ouvrages, 124 ouvrages et 7113 communications avec actes
  • 6989 thèses déposées :  3494 en auto-archivage et  3495 par STAR (hasard des chiffres, ils sont quasi identiques !)
  • 3541 images déposées sur MediHal
  • nombre de transferts vers ArXiv : 2744
  • liens vers ArXiv : 2961
  • nombre de transferts vers RePec : 1798
  • nombre de transferts vers Pubmed Central : 523
  • Liens avec Europe PubMed Central : depuis décembre 2013, Europe Pubmed Central signale les dépôts HAL en fulltext contenant un PMID (identifiant PubMed). 8000 publications sont concernées pour l’instant. Les publications sont repérables dans la recherche détaillée d’Europe PMC : external links=HAL.
PMC

Exemple de résultat

 

 

 

 

 

 

 

Les portails et collections :

Les statistiques de consultations ne sont délibérément pas fournies dans ce billet : la mise en service du nouveau moteur de recherche Solr nous permettra d’obtenir des chiffres plus exploitables.

Merci à toutes et à tous et très belle année 2014.

Bookmark and Share

Identité(s) numérique(s) et archives ouvertes

Pour faire suite à la matinée organisée par la Maison de l’Orient consacrée à l’identité numérique et la visibilité du chercheur sur le web, voici en quelques lignes les éléments de la présentation consacrée à HAL.

identitenumerique-e9106Bien avant que l’on ne parle de numérique et d’internet, la publication est un élément essentiel de l’identité du chercheur. Il est donc naturel de s’y intéresser lorsque l’on aborde la visibilité du chercheur.

Les « traces » numériques des publications sont présentes sur de multiples sites : ceux des éditeurs des libraires, les catalogues de bibliothèques, les bases de données bibliographiques. Les ouvrages et les articles de revues cumulent généralement plus de traces que les rapports ou les chapitres d’ouvrages (les sommaires ou tables de matières ne sont pas forcément accessibles).

De l’identité numérique du chercheur …

Si le chercheur est rattaché à un laboratoire ou une équipe d’accueil, le site internet propose en général une liste des publications des membres de l’unité, ainsi que, le plus souvent, une page par chercheur sur laquelle sont rassemblées ses publications. Le tout avec des mises à jour des listes effectuées avec plus ou moins de bonheur. Il arrive aussi que le chercheur gère son propre site internet sur lequel, là aussi, il présente une liste de ses travaux.

Une archive ouverte telle que HAL offre l’avantage au chercheur de stocker dans un lieu unique toutes ses publications. Bien sûr, il faut au moins les saisir, mais une fois suffit ! En utilisant les fonctions d’export ou de création d’url, il peut rapatrier sur son site ou sa page personnelle, comme sur le site de son labo, tout ce qui a été saisi. Avec la fonction de création d’url, tout ajout sur HAL met automatiquement à jour la liste des publications.

Vous êtes plus nombreux à utiliser ces fonctions avec des références bibliographiques simples qu’avec des références accompagnées de texte intégral. Cependant, si l’on raisonne en terme d’identité numérique et de visibilité, diffuser ses recherches en libre accès (publier dans une revue en libre accès ou déposer le texte intégral  dans une archive ouverte) est une façon de consolider/de travailler sa présence numérique :

  • d’une part les moteurs de recherche indexent plus de données : vous leur fournissez plus qu’un titre, un résumé et/ou des mots-clés,
  • d’autre part, le lecteur ayant un accès immédiat et sans contrainte à vos textes, vous augmentez les chances d’être lu, et, peut-être, d’être cité (une citation dans une bibliographie=une trace de plus).

Une caractéristique essentielle de toute trace numérique étant sa persistance, n’oubliez pas qu’une url stable est attribuée à chaque dépôt dans HAL (pas d’erreur 404 en vue !) et que des procédures d’archivage pérenne sont mises en place avec le CINES.

Coming soon. La v3 de HAL proposera au chercheur un nouveau service : la génération du CV. Celui-ci sera basé à la fois sur des informations saisies spécifiquement par le chercheur (éléments classiques d’un CV, ses axes de recherche, etc) et sur les publications saisies dans HAL (affichage bien sûr  des publications, des mots-clés associés, de la liste des co-auteurs et des disciplines). Cette page  CV sera dotée d’une url de type http://cv.archives-ouvertes.fr/prénom-nom (prenom-nom pouvant être modifié, on en reparlera dans un autre billet).

… à celle de son institution

L’appartenance institutionnelle du chercheur est aussi un élément constituant l’identité du chercheur, numérique ou non. Les problématiques de visibilité et d’identité sur internet ne sont pas réservées aux seules personnes physiques. Un organisme comme un laboratoire, une équipe d’accueil, une université y sont aussi confrontés. Tous travaillent leur site web, planchent sur la façon de les organiser, de les mettre à jour.

Pour une unité de recherche, présenter la liste des publications de ses membres semble être incontournable. Beaucoup ont d’ailleurs choisi de créer une collection dans HAL pour le faire  et encouragent au dépôt pour proposer des listes à jour.

Sur un site web d’université, on constate que les productions des enseignants-chercheurs sont beaucoup moins évidentes à trouver. Une archive ouverte est un excellent moyen pour les rendre visibles : par exemple, sur 66 sites web d’universités françaises consultés, on n’en compte que 19 qui proposent d’accéder aux publications à partir de l’onglet « recherche », dont 13 qui les valorisent via un portail ou une collection HAL. Sinon, au mieux, le site présente les derniers ouvrages publiés. Les archives institutionnelles que sont les collections et les portails constituent ainsi autant de points d’entrée pour accéder aux publications.

Les « traces » laissées ainsi sur la toile participent à la fois à l’identité numérique du chercheur et à celle de son/ses institution(s), ces dernières étant plutôt mal servies par les réseaux sociaux.

Bookmark and Share

Les API dans HAL v3

Vous utilisez les webservices SOAP de HAL pour importer des dépôts ? Pour consulter les référentiels ? Rechercher des articles ? Alors ce billet vous concerne.

Vous disposez de plusieurs mois pour modifier et adapter vos scripts à HAL v3.0 qui sera livrée mi-mars 2014. La documentation des API de HAL v3.

Parmi les choses à retenir :

  • Notez que nous avons choisi le protocole SWORD (Simple Web-service Offering Repository Deposit), standard d’échanges international fondé par le JISC (Joint Information Systems Committee) pour les imports.

CaptureswordSource : SWORD, « DataFlowDepositRequirements », [En ligne]. http://swordapp.org/2012/12/swordv2-compliance-how-to-achieve-it/dataflowdepositrequirements/ . Page consultée le 04 décembre 2013.

Il vous faudra donc soit adapter votre client SOAP, soit utiliser SWORD.

  • Les API s’appuyant sur les fonctionnalités du moteur de recherche Solr seront plus puissantes et permettront d’interroger plus finement les documents déposés et  les référentiels.
  • Le référentiel sur les structures de recherche a été repensé pour être plus souple et s’adapter aussi bien à l’organisation française qu’à d’autres plus simples.
  • Un certain nombre de champs sont multivalués et/ou multilangues : vous pourrez renseigner les champs titre, sous-titre, résumé et mot-clé en plusieurs langues et, par exemple, identifier plusieurs projets ANR.
  • Vous pourrez aussi ajouter des fonctions aux auteurs : illustrateur, collaborateur, etc

A bientôt pour d’autres billets qui présenteront les évolutions.

Bookmark and Share