Qu'est-ce qu'un thème?

Nous nous arrêtons ici sur le concept même de thème, et nous essayons d'expliquer comment nous avons interprété les résultats bruts de l'analyse statistique. Cette analyse est plus précisément décrite dans cette autre section du site.

D'une liste de mots à un thème identifié

Le premier résultat qui sort de l'analyse statistique est une liste de 120 listes de mots, chaque mot ayant une importance, mesurée par un nombre entre 0 et 1. Par exemple, une des listes est la suivante (nous montrons les mots les plus importants) :

patria (patrie) (poids : 0.04),  fede (foi) (poids : 0.01),  cuore (coeur) (poids : 0.01),  sacrificio (sacrifice) (poids : 0.01),  gloria (gloire) (poids : 0.01),  sangue (sang) (poids : 0.01),  giovane (jeune) (poids : 0.01),  madre (mère) (poids : 0.01),  dovere (devoir) (peso : 0.01),  caduto (tombé) (poids : 0.01),  grande (grand) (poids : 0.01),  morto (mort) (poids : 0.01),  figlio (fils) (poids : 0.01),  bandiera (drapeau) (poids : 0.01),  nome (nom) (poids : 0.01),  grandezza (grandeur) (poids : 0.01),  amore (amour) (poids : 0.01),  glorioso (glorieux) (poids : 0.01)

Rappelons que cette liste de mot a été construite par une méthode statistique qui ne prend en compte que les occurences des différents mots dans les différents textes. En particulier la sémantique est complètement cachée à cette analyse. Il est donc frappant de voir l'homogénéité sémantique de cette liste de mot.

Cette homogénéité est suffisament grande pour pouvoir identifier ce liste de mot comme un thème de l'Oeuvre Complète. La liste précédente est assez facilement identifiable comme un thème relevant du patriotisme, et plus particulièrement du sacrifice patriotique. Nous l'avons donc identifié comme Patria e sacrificio (Patrie et sacrifice).

Une autre information : l'évolution chronologique

Une information cruciale fournie par l'analyse statistique est l'évolution de la prégnance du thème à l'étude dans le corpus. Plus concrètement, cet analyse accompagne la liste de mot précédente du graphique suivant:

Evolution de la prégnance du thème "Patria e Sacrificio"

Que voit-on dans ce graphique ? Nous voyons l'évolution temporelle (entre 1900 et 1945) de l'importance de la liste de mots ci-dessus dans les Oeuvres Complètes. Cette importance est mesurée comme un pourcentage (0.1 représente 10%). Rappelons qu'il y a 120 thèmes, et que donc que l'importance "moyenne" est d'environ 0,8%. Ainsi des pics d'importance à 3 ou 4%, comme on en voit sur ce graphique, sont le signe d'une période où le thème est particulièrement prégnant dans la production de Mussolini.

Ces graphiques sont particulièrement utiles pour comprendre les évolutions et les stabilités à l'oeuvre dans les écrits de Mussolini. Mentionnons qu'il sont aussi utiles pour identifier les thèmes en permettant de déceler les périodes où ces thèmes apparaissent, ce qui donne un indice sur leur signification.

 

Concluons en précisant bien que cette étape d'identification est une démarche des chercheurs. Elle est donc bien sûr discutable. C'est une des raisons pour lesquelles nous avons choisi de présenter exhaustivement l'analyse faite (dans la partie Résultats de ce site), pour permettre à la discussion sur cette identification d'avoir lieu.

 

Une vue d'ensemble : organisation des thèmes

Une dernière étape de cette analyse est d'organiser les thèmes en thématiques proches. Nous avons choisi de le faire en deux niveaux.

Nous appelons donc les listes de mots, une fois identifiées, des "sous-thèmes". Ce sont les briques de bases de notre analyse. Nous les avons répartis en 24 "thèmes". A ce niveau, nous conservons une assez bonne précision de l'analyse, tout en permettant une vision plus gobale. Pour une vue d'ensemble vraiment lisible, nous avons de nouveau répartis ces 24 "thèmes" en 8 "super-thèmes".

Nous présentons cette répartition, avec les évolutions chronologiques, dans la partie Résultats de ce site.

En cours de chargement...

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer