Consignes pour les projets :

Numérique et sciences informatiques

start up

Projet 9 : Nuage de mots

Description du mini projet

Les nuages de mots sont apparus récemment pour représenter les mots-clés les plus importants sur une page, un ensemble de pages internet : Nuage de mots-clés.

En utilisant les connaissances acquises jusqu'à présent, vous allez écrire un programme qui permettra de construire tel nuage de mots à partir d'un fichier texte (au format .txt Plain Text UTF-8) téléchargé dans la bibliothèque du projet Gutemberg.

Cahier des charges

Pour cet exemple, on utilisera le roman de Jules Verne Cinq Semaines En Ballon ; il faut télécharger ce fichier texte et le placer dans le même répertoire que votre programme.

Ce programme devra proposer demander à l'utilisateur de saisir le nom du fichier texte à analyser :

*

Saisir le nom du fichier à analyser :

Le programme devra alors :

  • Transformer le fichier texte en une liste de mots

  • Extraire les 50 mots les plus importants et les afficher à l'écran

Pour déterminer l'importance des termes, les premiers essais pourront être faits en fonction de la fréquence de chaque mot bien que cette méthode a tendance à favoriser les petits mots.

On pourra ensuite utiliser des critères plus complexes comme celles suggérées sur la page Tag Cloud.

Complément : Palier 4 : Une fois le palier 3 franchi

Le rendu graphique peut être réalisé simplement à partir du langage HTML (voir l'exemple suivant) : votre programme devra donc créer un fichier HTML suivant le modèle donné en exemple.