Une extension pour extraire et télécharger des tweets à des fins de fouille textuelle.
Citer ce programme
Si vous utilisez cette extension pour vos travaux de recherche, veuillez la référencer comme suit :
Moncomble, F. (2024). 𝕏-Scraper (Version 0.4) [JavaScript]. Arras, France : Université d’Artois. Disponible à l’adresse : https://fmoncomble.github.io/X-scraper/
Installation
Firefox
Chrome/Edge
Pensez à épingler l’extension à la barre d’outils.
Mode d’emploi
- Ouvrez 𝕏/Twitter et effectuez une recherche (simple ou avancée)
- Il est conseillé de créer un compte spécifique pour la récupération automatique de contenu
- Cliquez sur l’icône de l’extension dans la barre d’outils
- Cliquez sur
Start scraping
- L’interface apparait par-dessus la page web :
- (Facultatif) Définissez le nombre maximum de tweets à récupérer
- Choisissez le format de sortie souhaité :
XML/XTZ
pour un fichier XML à importer dans TXM en utilisant le moduleXML/TEI-Zero
- Lors de l’import, ouvrez la section « Plans textuels » et entrez
ref
dans le champ « Hors texte à éditer »
- Lors de l’import, ouvrez la section « Plans textuels » et entrez
TXT
pour du texte brutCSV
XLSX
(tableau Excel)JSON
- Vous pouvez arrêter l’extraction à tout moment
- Cliquez sur
Download
pour collecter le résultat
Limites et problèmes connus
Nombre excessif de requêtes
L’extension collecte les tweets en faisant défiler automatiquement la page des résultats de la recherche. Cela envoie des appels répétés au serveur 𝕏/Twitter, qui finit par ne plus régénérer la page avec une réponse 429 (nombre excessif de requêtes). Lorsque cela se produit (généralement après avoir collecté ~900 tweets), téléchargez le fichier, réinitialisez (bouton Reset
), patientez quelques minutes, puis ajustez vos paramètres de recherche pour éviter de collecter des doublons et reprenez la collecte.
Refonte de l’interface
⚠️ Important! Dans la v0.2, la fenêtre popup de l’extension doit rester ouverte pour que l’extension se comporte correctement. Cliquer en dehors de la fenêtre, passer à un autre onglet/fenêtre ou à une autre application entraine sa fermeture, empêchant ainsi l’utilisateur d’interagir avec l’extension pendant ou après le processus de scraping.
Ce problème a été résolu dans la version 0.3 grâce à une interface remaniée: assurez-vous de disposer de la dernière version.
Créer un compte 𝕏/Twitter dédié
Bien qu’Elon Musk ait exprimé à plusieurs reprises son opposition au scraping des données de 𝕏/Twitter, la collecte de données publiques à des fins de recherche est légale dans la plupart des pays. Toutefois, par précaution, il est conseillé de créer un compte ad hoc pour récupérer du contenu.
Leave a Reply