Consignes pour les projets :
Numérique et sciences informatiques
Projet 9 : Nuage de mots
Description du mini projet
Les nuages de mots sont apparus récemment pour représenter les mots-clés les plus importants sur une page, un ensemble de pages internet : Nuage de mots-clés.
En utilisant les connaissances acquises jusqu'à présent, vous allez écrire un programme qui permettra de construire tel nuage de mots à partir d'un fichier texte (au format .txt Plain Text UTF-8) téléchargé dans la bibliothèque du projet Gutemberg.
Cahier des charges
Pour cet exemple, on utilisera le roman de Jules Verne Cinq Semaines En Ballon ; il faut télécharger ce fichier texte et le placer dans le même répertoire que votre programme.
Ce programme devra proposer demander à l'utilisateur de saisir le nom du fichier texte à analyser :
*Saisir le nom du fichier à analyser :
Le programme devra alors :
-
Transformer le fichier texte en une liste de mots
-
Extraire les 50 mots les plus importants et les afficher à l'écran
Pour déterminer l'importance des termes, les premiers essais pourront être faits en fonction de la fréquence de chaque mot bien que cette méthode a tendance à favoriser les petits mots.
On pourra ensuite utiliser des critères plus complexes comme celles suggérées sur la page Tag Cloud.
Complément : Palier 4 : Une fois le palier 3 franchi
Le rendu graphique peut être réalisé simplement à partir du langage HTML (voir l'exemple suivant) : votre programme devra donc créer un fichier HTML suivant le modèle donné en exemple.