(English version)

Une extension pour extraire et télécharger des tweets à des fins de fouille textuelle.

Citer ce programme

Si vous utilisez cette extension pour vos travaux de recherche, veuillez la rĂ©fĂ©rencer comme suit :

Moncomble, F. (2024). 𝕏-Scraper (Version 0.4) [JavaScript]. Arras, France : UniversitĂ© d’Artois. Disponible Ă  l’adresse : https://fmoncomble.github.io/X-scraper/

Installation

Firefox

Chrome/Edge

Pensez Ă  Ă©pingler l’extension Ă  la barre d’outils.

Mode d’emploi

  • Ouvrez 𝕏/Twitter et effectuez une recherche (simple ou avancĂ©e)
    • Il est conseillĂ© de crĂ©er un compte spĂ©cifique pour la rĂ©cupĂ©ration automatique de contenu
  • Cliquez sur l’icĂŽne de l’extension dans la barre d’outils
  • Cliquez sur Start scraping
  • L’interface apparait par-dessus la page web :
    • (Facultatif) DĂ©finissez le nombre maximum de tweets Ă  rĂ©cupĂ©rer
    • Choisissez le format de sortie souhaitĂ© :
      • XML/XTZ pour un fichier XML Ă  importer dans TXM en utilisant le module XML/TEI-Zero
        • Lors de l’import, ouvrez la section « Plans textuels Â» et entrez ref dans le champ « Hors texte Ă  Ă©diter Â»
      • TXT pour du texte brut
      • CSV
      • XLSX (tableau Excel)
      • JSON
  • Vous pouvez arrĂȘter l’extraction Ă  tout moment
  • Cliquez sur Download pour collecter le rĂ©sultat

Limites et problĂšmes connus

Nombre excessif de requĂȘtes

L’extension collecte les tweets en faisant dĂ©filer automatiquement la page des rĂ©sultats de la recherche. Cela envoie des appels rĂ©pĂ©tĂ©s au serveur 𝕏/Twitter, qui finit par ne plus rĂ©gĂ©nĂ©rer la page avec une rĂ©ponse 429 (nombre excessif de requĂȘtes). Lorsque cela se produit (gĂ©nĂ©ralement aprĂšs avoir collectĂ© ~900 tweets), tĂ©lĂ©chargez le fichier, rĂ©initialisez (bouton Reset), patientez quelques minutes, puis ajustez vos paramĂštres de recherche pour Ă©viter de collecter des doublons et reprenez la collecte.

Refonte de l’interface

⚠ Important! Dans la v0.2, la fenĂȘtre popup de l’extension doit rester ouverte pour que l’extension se comporte correctement. Cliquer en dehors de la fenĂȘtre, passer Ă  un autre onglet/fenĂȘtre ou Ă  une autre application entraine sa fermeture, empĂȘchant ainsi l’utilisateur d’interagir avec l’extension pendant ou aprĂšs le processus de scraping.

Ce problÚme a été résolu dans la version 0.3 grùce à une interface remaniée: assurez-vous de disposer de la derniÚre version.

CrĂ©er un compte 𝕏/Twitter dĂ©diĂ©

Bien qu’Elon Musk ait exprimĂ© Ă  plusieurs reprises son opposition au scraping des donnĂ©es de 𝕏/Twitter, la collecte de donnĂ©es publiques Ă  des fins de recherche est lĂ©gale dans la plupart des pays. Toutefois, par prĂ©caution, il est conseillĂ© de crĂ©er un compte ad hoc pour rĂ©cupĂ©rer du contenu.