Devoir : test de quelques outils en ligne d’analyse de texte

L’exercice

Choisir un article en français, de préférence en histoire, sur un sujet qui vous intéresse, sur votre sujet de mémoire ou pas, et le soumettre à quelques outils en ligne.

Les outils à tester

  1. Wordle (http://www.wordle.net/) : tester l’outil sur le texte entier (copier coller). Essayer plusieurs représentations.
  2. Ngram viewer (https://books.google.com/ngrams) : Essayer avec quelques mots intéressants (mots-clés ou mots du titre) de l’article choisi.
  3. Text Arc (http://www.textarc.org) Ne fonctionne qu’avec le texte de Hamlet et non pas un texte qu’on puisse uploader….
  4. Voyant Tool (http://voyant-tools.org). Faire plusieurs essais pour affiner peu à peu votre « stop list »
  5. TextAlyser (http://textalyser.net)
  6. DocuBurst (http://vialab.science.uoit.ca/docuburst/welcome.php)

Où trouver un article ?

Par exemple sur le moteur de recherche Isidore (http://www.rechercheisidore.fr/)

Devoir à rendre pour le 17 février 2015

Présenter sous le format suivant : une « fiche » par outil. (Sauter la page dans un fichier de traitement de texte, par exemple). Envoyer par mail, un document au format PDF.

Pour chaque outil,

  • Nom complet, lien vers l’outil
  • Dire en 2-3 lignes sur quel principe l’outil fonctionne (dans quel corpus le mot est recherché, quelle « analyse » l’outil en propose, etc.)
  • dire en 2-3 lignes comment l’outil fonctionne en pratique
  • Dire quel test exactement vous avez fait (quel texte, quels mots, etc.)
  • Montrer le résultat par des captures d’écran
  • Analyser le résultat obtenu avec le test que vous avez fait : qu’avez-vous appris sur votre texte ? Dans quelle situation cette analyse pourrait être utile ? Critiques et limites.
  • Énoncer une conclusion de quelques lignes sur la comparaison des outils.

Bravo, vous venez de faire un « benchmark ». En français, on devrait dire « parangonnage » mais personne ne l’utilise. Savez-vous comment on dit en allemand ? En luxemburgeois ? En flamand ? En portugais ? En italien ? En arabe ?

Liens utiles

Vous pouvez vous inspirer du travail préliminaire présenté ici (mais vous devez aller plus loin) :

https://docs.google.com/document/d/1oQVt1w0OEHdBAMkvhW0lj-7opDGCnFi5xVB88-lGRaA/edit?usp=sharing

N’hésitez pas à vous inspirer également de l’article How to evaluate a #dh tool?

Au cours n°8 (3 mars 2015), nous allons tirer des points communs de vos analyses des outils, et un binome sera chargé d’en faire un article pour le blog h-europe.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *