Une extension pour extraire et télécharger des posts Reddit à des fins de fouille textuelle.
Citer ce programme
Si vous utilisez cette extension pour votre recherche, veuillez la référencer comme suit :
Moncomble, F. (2024). RedditScraper (Version 0.2) [JavaScript]. Arras, France : Université d’Artois. Disponible à l’adresse : https://fmoncomble.github.io/redditscraper/
Installation
Firefox
Chrome/Edge
N’oubliez pas d’épingler l’extension à la barre d’outils.
Mode d’emploi
- Cliquez sur l’icône de l’extension dans la barre d’outils.
- Lors de la première utilisation, suivez la procédure d’authentification pour autoriser l’application sur Reddit. Tous les identifiants sont stockés en local sur votre ordinateur, pas sur un serveur distant.
- Construisez votre requête avec au moins un mot clef, puis cliquez sur
Search
. - Choisissez le format de sortie désiré :
XML/XTZ
pour un fichier XML à importer dans TXM en utilisant le moduleXML/TEI-Zero
.- Lors de l’import, ouvrez la section “Plans textuels” et entrez
ref
dans le champ « Hors texte à éditer »
- Lors de l’import, ouvrez la section “Plans textuels” et entrez
TXT
pour du texte brutCSV
XLSX
(tableau Excel)JSON
- (Facultatif) Entrez un nombre maximum de posts à récupérer.
- Vous pouvez arrêter l’extraction à tout moment en cliquant sur
Abort
. - Cliquez sur
Download
pour collecter le résultat, ouReset
pour reprendre au début.
Limites connues
L’API de recherche Reddit ne renvoie qu’une sélection de résultats.