Aide et soutien

Les services de gestion des données de recherche à votre bibliothèque

Vous avez besoin d’aide pour gérer vos données de recherche? La bibliothèque de votre institution offre peut-être des services tout au long du cycle de vie des données comme :

  • la création de plans de gestion des données
  • la documentation des données de recherche
  • le partage et la préservation à long terme des données
  • l’utilisation de dépôts de données de recherche en ligne (dont le Dataverse de Scholars Portal)
  • les options de publication
  • les droits d’auteur

Veuillez sélectionner votre affiliation ci-dessous pour communiquer avec les services en données de recherche de votre institution.

Ontario

Québec

Offert bientôt !

Ouest du Canada

Offert bientôt !

Terminologie

Cas – Ce sont les unités d’analyse, qui comportent certaines caractéristiques ou propriétés. Par exemple, les cas peuvent être des individus dans une classe statistique, tous les résidents de Chicago, des hamburgers, des villes, des pays, des organisations ou des lacs. L’objectif est de tirer des conclusions de leurs caractéristiques.

Données fait référence aux données quantitatives *et* aux fichiers de recherche de manière globale (c’est-à-dire des notes de terrain, des textes de descriptions ethnographiques, des images, etc.). Dataverse accepte tous ces types de données et de fichiers.

  • Données tabulaires fait référence aux données quantitatives (nombres) organisées en tableaux. Dataverse ne permet les analyses statistiques que sur les fichiers de données tabulaires. Les formats pris en charge comprennent : SPSS/POR, SPSS/SAV, Strata, CSV (avec carte SPSS) et TAB (avec DDI). Dataverse préserve l’accessibilité des fichiers de données tabulaires pour utilisation future. Par exemple, si un fichier .sav devient obsolète, Dataverse republiera les données déposées dans un nouveau format utilisable.
  • Les données en réseau sont représentées en fichiers XML. Ces fichiers contiennent de l’information concernant les propriétés du réseau (nœuds, sommets). Les données en réseau sont utilisées pour l’analyse des réseaux (c’est-à-dire l’analyse des réseaux sociaux). Dataverse peut visualiser les données en réseau au moyen de fichiers GraphML.

    data sketch

Fréquence – La fréquence d’une valeur est le nombre de cas correspondant à une catégorie, que l’on appelle également « l’effectif ».

Métadonnées – texte décrivant l’étude de recherche. Les champs de métadonnées comprennent le résumé, les mots-clés et le mode de collecte des données (entre autres). Tous les champs de métadonnées dans Dataverse sont définis sur le site et se conforment aux normes du schéma DDI, 2e version. Pour en savoir davantage sur les normes DDI, visitez ddialliance.org. Pour une liste complète des champs DDI dans Dataverse, consultez ce document (PDF).

Valeurs – Il s’agit des instances possibles pour une variable. Ces instances seront différentes en fonction des cas. Les valeurs peuvent être des nombres ou des noms de catégories. Par exemple, la variable GENRE comporte traditionnellement deux valeurs, soit « homme » et « femme ». Certaines personnes (cas) sont des hommes et certaines personnes sont des femmes.

Variables – Il s’agit de la caractéristique ou de la propriété qui nous intéresse. C’est une caractéristique qui se rapporte aux cas. Une variable doit être assortie de différentes valeurs pour différents cas. Les variables comprennent des caractéristiques comme le GENRE des personnes, la TAILLE des personnes, la PROFONDEUR des lacs, la TEMPÉRATURE des lacs, le REVENU des organisations ou encore si la CUISSON d’un hamburger est saignante, moyenne ou bien cuite. Souvent, on regarde deux ou plusieurs variables en même temps en se demandant s’il existe une relation entre elles pour un ensemble de cas. Par exemple, nous pourrions vouloir savoir si le GENRE est lié à la TAILLE des humains ou si la TEMPÉRATURE est liée à la PROFONDEUR des lacs.

Variables : caractère – À ce niveau de mesure, les valeurs des variables sont des « qualités » ou des catégories qui peuvent ou non être triables. Ces valeurs de catégories peuvent se voir assigner un code numérique, mais ces nombres ne correspondent pas à une échelle d’intervalle égale ou à des quantités réelles. Généralement, le calcul d’une moyenne ou d’une autre mesure sommaire quantitative n’est pas possible pour ces variables. La liste de catégories devrait être exhaustive et disjointe.

Variables continues – Ce niveau de mesure est analogue à une échelle d’intervalle égale. Les valeurs des variables sont des nombres quantitatifs, définis et significatifs sur une échelle. De plus, elles peuvent correspondre à des points dispersés sur une liste et pouvant être subdivisés à l’infini. Mesurer la longueur ou la distance avec une règle est un exemple simple de collecte de données continues. La plupart des chercheurs traitent les pourcentages et autres types de proportions comme étant des données continues. Le calcul d’une moyenne ou d’une autre mesure sommaire quantitative est logique pour ce type de variable.

Variables discrètes – Les valeurs de ces variables quantitatives sont dispersées sur une échelle, comportent un zéro réel, mais ne sont pas continues. Les unités de mesure sont des nombres entiers et il n’est pas logique de les subdiviser à l’infini. Seul un nombre entier a un sens pour cette valeur. Par exemple, on ne parle généralement pas de fractions de personnes ou d’une fraction de perçages corporels. Ces données sont discrètes, mais les nombres correspondent à une échelle (il ne s’agit pas de codes numériques) et la plupart des chercheurs les traitent comme des données continues. Le calcul d’une moyenne (ou d’une autre mesure sommaire quantitative) est logique pour ce type de variable. Par exemple, nous pouvons calculer « le nombre moyen d’enfants nés de femmes au Yukon » et le représenter en fraction, même si chaque femme a un nombre entier d’enfants.

D’après Garner, R. (2005). The joy of stats: A short guide to introductory statistics in the social sciences. Peterborough, Ont: Broadview Press.

Autres guides

Scholars Portal : <odesi> (en anglais seulement)

Harvard Dataverse Project : Guide d’utilisation avancée (en anglais seulement)

Ressources pour statistiques et données

Introduction :

Garner, R. (2010). The joy of stats: A short guide to introductory statistics in the social sciences. Toronto, Ont: University of Toronto Press.

Rowntree, D. (2000). Statistics without tears: A primer for non-mathematicians. London: Penguin.

Intermédiaire :

Blaikie, N. W. H. (2003). Analyzing quantitative data: From description to explanation. London: Sage Publications.

Erickson, B. H., & Nosanchuk, T. A. (1992). Understanding data (2nd ed). Toronto, ON: University of Toronto Press.