Foire Aux Questions
Retrouvez ci-après les réponses aux questions les plus fréquentes sur l’utilisation de l’entrepôt data.InDoRES, depuis la création de son compte sur l'entrepôt jusqu’à la diffusion du jeu de données : droits d’accès, licences, formats acceptés, gestion des métadonnées, et bonnes pratiques pour partager ses données en toute sérénité.
Les questions marquées d’un astérisque (*) sont destinées spécifiquement aux référents OpenDoRES qui accompagnent la gestion des dépôts et des droits dans data.InDoRES.
Un doute persiste ? N'hésitez pas à nous contactez !
Gestion des accès et des droits utilisateurs
- J’ai perdu mon mot de passe, pouvez-vous m’aider ?
Notre entrepôt est sécurisé et nous n’avons pas accès aux mots de passe. Si vos identifiants de connexion sont gérés via Edugain, comme préconisé, contactez les administrateurs de votre institution pour qu’ils réinitialisent votre mot de passe.
- J’ai créé mon compte sur l’entrepôt mais je ne peux pas créer de jeux de données, est-ce normal ?
Oui. Un administrateur doit vous donner des droits de contribution. Pour ce faire, vous pouvez contacter votre référent via le bouton de contact sur l’entrepôt (capture d’écran), contacter le référent OpenDoRES de votre unité (lien vers liste référents) ou, le cas échéant, l’équipe InDoRES.
- Je quitte mon établissement, vais-je perdre l’accès à mes jeux de données ?
Oui. Dès lors que votre adresse institutionnelle ne sera plus effective, il ne vous sera plus possible de vous connecter avec vos identifiants. Néanmoins, un administrateur peut, à votre demande, effectuer des corrections.
- Je change d’établissement et donc d’adresse institutionnelle, comment faire pour rester la personne contact ?
Afin de rester personne contact vous devez ajouter une ligne dans la rubrique “personne ressource” et indiquer une adresse mail supplémentaire.
- Les jeux de données restent-ils accessibles si « plus personne ne s’en occupe » (départ à la retraite, décès, etc.) ?
L’accessibilité des jeux de données ne change pas grâce au DOI. Toutefois, il est nécessaire de maintenir une personne contact aux jeux de données (administrateur, référent, etc.) pour modifier, au besoin, le jeu de données et pour toutes questions éventuelles des utilisateurs.
- Peut-on modifier les droits d’un utilisateur ?
Non, seul l’administrateur de la collection (référent de votre unité ou administrateur data.InDoRES) est habilité à modifier les droits d’un utilisateur. Selon le paramétrage du dataverse dans laquelle le jeu de données est créé, le créateur du jeu de données ne pourra donc assigner un rôle à un utilisateur ou à un groupe que s’il est curateur de son jeu de données.
- Peut-on donner des droits à des personnes extérieures à son institution ?
Oui, si cette personne a un compte d’ouvert dans data.InDoRES.
- Pour un dataverse d’unité, faut-il créer des droits pour tous les agents de l’unité * ?
Non, seuls les agents qui ont à contribuer à l’alimentation du dataverse (dépôt, validation des dépôts, administration de sous-collections, etc.) pourront avoir des droits ouverts.
"Conditions générales”
- Quelle(s) licence(s) dans l’entrepôt ?
Conformément à la politique de Science Ouverte, data.InDoRES utilise, par défaut, la licence CC-BY 4.0.
- Les données dans data.InDoRES sont-elles manipulables ?
Les données entreposées dans data.InDoRES correspondent à des jeux de données, notamment extraits d'une base de données. Elles sont consultables et téléchargeables mais les jeux de données étant publiés et ayant un DOI attribué, ils sont figés. Elles peuvent néanmoins être moissonnées (manipulables) via API pour les mobiliser dans des systèmes extérieurs.
- Quelles sont les modalités de stockage sur data.InDoRES ?
Data.InDoRES n’est pas un lieu de stockage des données vivantes mais bel et bien un entrepôt pour la publication des données. Ces dernières ne pourront être supprimées et ont vocation à rester disponibles.
Jeu de Données
- Quelles données peut-on déposer dans data.InDoRES ?
Hormis les données personnelles (RGPD), tous types de données peuvent être déposés dans data.InDoRES à condition qu’il s’agisse de données de la recherche en rapport avec les thématiques du CNRS Ecologie et Environnement : Environnement, Ecologie, Biodiversité, Bioarchéologie.
- Puis-je déposer des données dans Data.InDoRES si je ne suis pas agent du MNHN ? / UMR en relation avec le CNRS E&E ?
Oui ! L’entrée est thématique.
- Est-il possible de publier d'autres données que des données tableurs ?
Oui, il n’y a pas de restrictions sur le type ou la nature des données. Pour rappel, les données de recherche se définissent comme des “enregistrements factuels (chiffres, textes, images, sons, etc.), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche” (OCDE).
- Peut-on déposer un jeu de données sans l’associer à un sous-dataverse (=collection) ?
Non, un jeu de données est toujours créé dans le dataverse lié à une unité ou à projet.
- Déposer un jeu de données engendre-t-il automatiquement l’attribution d’un DOI ?
Oui, chaque jeu de données se voit automatiquement attribuer un identifiant d’objet numérique (DOI) par DataCite France lors de sa création. Celui-ci sera réservé jusqu’au moment de la publication effective du jeu de données (cas des URL privées pour la relecture d’article par exemple).
- Est-il possible de limiter l’accès ou de mettre un embargo sur un jeu de données ?
Oui, vous pouvez appliquer un accès restreint à votre jeu de données, si et seulement si, celui-ci n’est pas encore publié. Ce sera alors, à vous, de modérer les demandes d’accès au jeu de données et d’enlever la restriction le moment venu. Ces restrictions doivent néanmoins être motivées par un argument justifié (données sous embargo dans le cadre d’une publication par exemple).
Attention : Cette fonctionnalité ne doit être utilisée que de manière exceptionnelle puisque non conforme aux principes de la Science ouverte.
- Est-il possible de supprimer un jeu de données ?
Il est possible de supprimer un jeu de données lorsqu’il est en version brouillon.
Une fois publié et rendu public (avec activation du DOI), il ne pourra être supprimé qu’en cas de force majeur et sous condition de justification (raison légale par exemple). Les métadonnées de citation, ainsi que le contact du jeu de données, resteront néanmoins accessibles même si les données ne le sont plus.
Sous-collection
- Est-il possible de déplacer une collection * ?
Non, il est ainsi conseillé de bien réfléchir à l’emplacement d’une collection avant sa création.
Oui, c’est tout à fait possible. Pour cela utiliser la commande « Link Dataset »
- Est-il possible de supprimer une (sous-)collection * ?
Une (sous-)collection dataverse peut être supprimée, si et seulement si, elle ne contient pas de jeu de données.
- Peut-on lier un jeu de données à deux sous-dataverse ?
Oui, pour se faire, utiliser la commande « Link Dataset ». Attention, cette action s’effectue sur un jeu de données déjà publié.
Environnements de « bac-à-sable » et de production
- Existe-t-il un environnement sur lequel s’entraîner avant de publier un jeu de données ou une collection dans data.InDoRES ?
Oui, un « bac-à-sable » est à votre disposition pour les phases de test : https://dataverse-test.in2p3.fr/dataverse/root
Une fois votre compte créé sur ce bac à sable, demandez à avoir des droits de publication en écrivant un message à notre adresse de contact.
- Peut-on directement importer sur l’environnement de production le jeu de données créé dans le bac à sable ?
Non, ces environnements étant indépendants vous devez de nouveau saisir votre jeu de données.
Documentation des données
- Est-il possible d’inclure le plan de gestion des données associé à un jeu de données ?
Les PGD n’étant pas des données de la recherche ils n’ont pas vocation à être diffusés via l’entrepôt. Néanmoins, nous vous encourageons à les diffuser sur DMP Opidor (ou autre plateforme) et si vous le souhaitez d’indiquer son emplacement dans le champ “Documents connexes”.
- Peut-on enrichir les métadonnées après publication du jeu de données ?
Il est tout à fait possible de compléter les métadonnées supplémentaires d’un jeu de données après sa publication. Une nouvelle version (mineure ou majeure) est alors créée, qui doit être publiée à son tour.
Fichiers
- Quelle est la volumétrie de stockage maximal possible pour un jeu de données ?
Les jeux de données sont à déposer sous forme de fichier ou dossier .zip dans la limite de 4Go par fichier. Vous pouvez néanmoins déposer jusqu'à 100 fichiers par jeu de données. Si vos fichiers dépassent cette limite, contactez-nous !
- Dans quels formats puis-je déposer les fichiers ?
Nous privilégions les formats ouverts et non-propriétaires : formats recommandés
- Les fichiers « tabulaires » peuvent-ils être ingérés avec plusieurs feuilles ?
Si vous souhaitez déposer des données tabulaires préférez le format. scv au format .xlsx
Il peut y avoir plusieurs pages. Par contre, dans ce cas, il faut zipper le fichier pour que cela n’engendre pas de bug lors de la prévisualisation.
- Peut-on mettre à jour un fichier ?
Le contenu d’un fichier ne peut pas être modifié une fois en ligne. Pour le mettre à jour, il doit impérativement être remplacé.
- Que faire lorsque l’on s’aperçoit qu’un fichier a été mal ingéré ?
Si l’erreur d’ingestion est détectée lorsque le jeu de données est encore en mode brouillon, il faut supprimer le fichier, chercher d’où provient l’erreur d’ingestion, puis téléverser le fichier corrigé.
- Y a-t-il un standard à suivre pour le nommage des fichiers /des jeux de données que l’on dépose dans data.InDoRES?
Hormis des recommandations spécifiques pouvant être proposées par l’administrateur d’un dataverse, il n’existe pas de standards auxquels se conformer pour le nommage des fichiers / jeux de données dans data.InDoRES. Quelques règles sont néanmoins à respecter pour que les dénominations soient compréhensibles par les humains et interprétables par les machines :
- unique, court et descriptif
- sans caractères accentués ou spéciaux tels que / : * ? ̎ < >
- sans espace mais en utilisant « _ » ou une majuscule en début de mot (camelCase)
- sans mots vides : le, la, les, une…
- avec l’acronyme du projet (le cas échéant)
- en versionnant avec date (AAAA-MM-JJ) et numéro de version (_v01, _v01-01)
-> Pour aller plus loin, n’hésitez pas à consulter la page dédiée sur DORANum
Peer-review
- Le jeu de données doit-il être publié avant la soumission d’un article scientifique ou d’un data paper?
Non, il n’est pas nécessaire de rendre public votre jeu de données avant soumission. Lorsque vous souhaitez associer un jeu de données à un article dans une revue avec comité de lecture en tant que « Supplementary data », vous pouvez demander à un administrateur référent de générer une URL privée de votre jeu de données que vous enverrez pour la relecture de votre article.
- Si on transmet une URL privée à un reviewer, aura-t-il un accès aux données avec restriction ?
Oui, l'URL privée permet d’accéder aux fichiers d’un jeu de données non encore publié (statut draft), même si ces fichiers sont en accès restreint.
- Mon jeu de données bénéficie actuellement d’une url privée et a comme statut “draft” (brouillon), est-ce normal ?
Oui, l'URL privée ne peut être créée que sur un jeu de données non publié.
Curation
- Lors de la soumission d’un jeu de données pour révision, l’auteur peut-il intervenir dessus ?
Non, aucune action n’est possible durant cette phase de révision.
- Les référents OpenDoRES font-ils de la curation lors de la soumission pour publication ?
Non, seulement des vérifications.
Sécurité des données
- Où sont hébergées les données ?
L’entrepôt data.InDoRES est hébergé au Centre de Calcul de l’IN2P3 (CC-In2P3), infrastructure nationale de recherche du CNRS.
- Comment sont sauvegardés/sécurisés les données & métadonnées ?
De manière optimale par une équipe spécifique avec un système de redondance dans des lieux différents.
- Et si data.InDoRES devait fermer ?
Etant donné que data.InDoRES est soutenu par deux tutelles (MNHN & CNRS) et compte tenu de la présence d’agents pérennes, l’entrepôt a vocation à perdurer.