Vous voulez extraire et sauvegarder l'ensemble des articles d'une revue ou encore extraire des jeux de données?
Contactez votre bibliothécaire disciplinaire pour en savoir plus sur les droits d'accès et les modalités d'utilisation, qui varient selon les différents éditeurs et bases de données.
Voici quelques trucs pour vous aider à moissonner des données, à numériser des documents ou encore stocker les items de votre corpus de travail.
“Le moissonnage du Web est un processus par lequel des renseignements sont recueillis et copiés à partir du Web à l'aide de robots ou de scripts automatisés, aux fins d'extraction et d'analyse ultérieure.” (Statistique Canada)
Il importe de respecter les droits d'utilisation des sources de données et documents qu'on veut extraire à l'aide d'outils de moissonnage automatisés. Les bases de données de publication qui permettent le moissonnage sont identifiés par l'icône de pelle ( ) dans la liste des bases de données de l'UQAM.
Des outils de moissonnage (ou scraping en anglais) sont utiles notamment dans le cas où vous voulez extraire une quantité importante de documents à partir, par exemple, d’un site d’un éditeur pour constituer un corpus de toutes les publications d’une revue en format PDF afin d’en faire l’analyse à l’aide de logiciels de fouille de textes. Des applications programmées avec langage de programmation Python sont souvent utilisées pour l'extraction de données dans le contexte des sciences humaines.
Vous travaillez à partir d’archives textuelles ou de photographies en format papier ou encore à partir d’objets (sculpture, édifices, etc.)? Ces documents ou objets peuvent être numérisés afin de faciliter leur manipulation, leur analyse ou leur diffusion. Certaines institutions offrent des services de numérisation, le plus souvent payants. Si vous désirez numériser par vous-mêmes des documents ou objets, la section suivante s'adresse à vous.
Que ce soit pour la numérisation de quelques items ou pour un projet plus important en comportant des centaines voire des milliers, voici quelques ressources utiles pour vous aider à mener à bien un projet de numérisation :
1. Circonscrire et organiser l’ensemble des documents ou objets à numériser.
2. Déterminer les besoins
3. Déterminer les outils nécessaires
4. Réaliser le projet
L'archivage de l'entièreté des données, informations et documents produits lors d'un projet de recherche sert à éviter des pertes de travail et de temps tout en le pérennisant pour consultation ou partage ultérieurs. Voici quelques points à considérer lorsque vient le temps d'aborder la question de l'archivage d'un projet :