(English version)

Une extension pour extraire et télécharger des tweets à des fins de fouille textuelle.

Citer ce programme

Si vous utilisez cette extension pour vos travaux de recherche, veuillez la référencer comme suit :

Moncomble, F. (2024). 𝕏-Scraper (Version 0.4) [JavaScript]. Arras, France : Université d’Artois. Disponible à l’adresse : https://fmoncomble.github.io/X-scraper/

Installation

Firefox

Chrome/Edge

Pensez à épingler l’extension à la barre d’outils.

Mode d’emploi

  • Ouvrez 𝕏/Twitter et effectuez une recherche (simple ou avancée)
    • Il est conseillé de créer un compte spécifique pour la récupération automatique de contenu
  • Cliquez sur l’icône de l’extension dans la barre d’outils
  • Cliquez sur Start scraping
  • L’interface apparait par-dessus la page web :
    • (Facultatif) Définissez le nombre maximum de tweets à récupérer
    • Choisissez le format de sortie souhaité :
      • XML/XTZ pour un fichier XML à importer dans TXM en utilisant le module XML/TEI-Zero
        • Lors de l’import, ouvrez la section « Plans textuels » et entrez ref dans le champ « Hors texte à éditer »
      • TXT pour du texte brut
      • CSV
      • XLSX (tableau Excel)
      • JSON
  • Vous pouvez arrêter l’extraction à tout moment
  • Cliquez sur Download pour collecter le résultat

Limites et problèmes connus

Nombre excessif de requêtes

L’extension collecte les tweets en faisant défiler automatiquement la page des résultats de la recherche. Cela envoie des appels répétés au serveur 𝕏/Twitter, qui finit par ne plus régénérer la page avec une réponse 429 (nombre excessif de requêtes). Lorsque cela se produit (généralement après avoir collecté ~900 tweets), téléchargez le fichier, réinitialisez (bouton Reset), patientez quelques minutes, puis ajustez vos paramètres de recherche pour éviter de collecter des doublons et reprenez la collecte.

Refonte de l’interface

⚠️ Important! Dans la v0.2, la fenêtre popup de l’extension doit rester ouverte pour que l’extension se comporte correctement. Cliquer en dehors de la fenêtre, passer à un autre onglet/fenêtre ou à une autre application entraine sa fermeture, empêchant ainsi l’utilisateur d’interagir avec l’extension pendant ou après le processus de scraping.

Ce problème a été résolu dans la version 0.3 grâce à une interface remaniée: assurez-vous de disposer de la dernière version.

Créer un compte 𝕏/Twitter dédié

Bien qu’Elon Musk ait exprimé à plusieurs reprises son opposition au scraping des données de 𝕏/Twitter, la collecte de données publiques à des fins de recherche est légale dans la plupart des pays. Toutefois, par précaution, il est conseillé de créer un compte ad hoc pour récupérer du contenu.