Les élections régionales, on fait le point

Les 20 et 27 juin, les Français seront appelés aux urnes pour voter lors des élections régionales. Depuis plusieurs semaines, la campagne bat son plein avec de vifs échanges partisans mais aussi des tractations en PACA et dans les Hauts de France, ainsi qu’en Bretagne.

En Île-de-France, la campagne est particulièrement intense, avec des candidats qui ont une notoriété nationale et une ambition assumée : Valérie Pécresse (Libres !), Julien Bayou (Europe Ecologie Les Verts), Audrey Pulvar (Parti socialiste), Jordan Bardella (Rassemblement National), Laurent Saint-Martin (La République En Marche), Clémentine Autain (France Insoumise), Nathalie Arthaud (Lutte Ouvrière). Debout la France a finalement renoncé à présenter une liste.

Contexte du projet

Depuis 2014, nous menons à CY Cergy Paris Université des projets sur l’analyse du discours numérique en contexte électoral, dans le but de mieux comprendre l’argumentation politique, de caractériser linguistiquement les idéologies et d’offrir aux citoyens des outils et moyens de mieux appréhender les discours.

Le projet Polititweets en 2014 a permis, autour des élections municipales, de constituer un corpus de tweets issus de comptes influents, et d’élaborer une méthodologie d’extraction et d’analyse linguistique.

Dans un deuxième temps, le projet #Idéo2017 pour les élections présidentielles 2017 a permis la mise en ligne d’une plate-forme d’analyse, en temps réel, des tweets des candidats, avec plusieurs types de métriques et visualisations de leurs corpus.

Enfin, pour les élections européennes 2019, le projet #Cicero a étendu le spectre des analyses aux contenus vidéos, en incluant un moteur de recherche vidéo innovant, et un croisement des sources textuelles et vidéo.

Dans ce cadre du projet PolitiQuiz, nous souhaitons contribuer à la compréhension des élections régionales 2021 en Île-de-France. Ce choix nous permet de conserver un nombre de candidats raisonnable pour cette phase de développement, tout en travaillant sur des discours qui peuvent avoir une portée nationale, du fait des personnalités politiques présentes dans ce scrutin. Ce projet propose donc des questions et analyses permettant de mieux connaître les discours des candidates, leur style, leurs thèmes, et leurs programmes.

Mais au-delà du simple quiz, PolitiQuiz offre aux utilisateurs l’accès aux technologies développées au sein de notre laboratoire Institut des Humanités Numériques.

Des questions pour mieux comprendre la pensée des candidats

Sur l’application, il y a trois grandes thématiques : les connaissances politiques, l’attribution d’auteur, et les grandes thématiques de campagnes (sécurité, santé, etc.). Les questions ont été générées à partir de l’analyse des tweets des huit principaux candidats à l’élection. Pour cela, nous avons utilisé différents outils, logiciels (comme Iramuteq ou Tropes) et méthodes d’analyses afin de pouvoir créer de nouvelles questions. Il s’agit en effet d’extraire du corpus des caractéristiques thématiques, sémantiques, du corpus de référence initialement constitué, pour produire des questions adaptées à l’élection en cours. Twitter a été utilisé pour analyser la communication de ces différents candidats, car il fait suite aux différents travaux que nous avons réalisés au laboratoire IDHN, et est représentatif du discours politique en contexte électoral.

Par exemple, en utilisant le « calcul de spécificité » du logiciel Iramuteq, nous avons mis en valeur les mots sur et sous-employés par tel ou tel candidat.

 

 

 

À partir de ces résultats, nous avons généré des questions, qui permettront aux utilisateurs de tester leurs connaissances sur les mots les plus utilisés par les différents candidats.

L’application possède un algorithme auto-adaptatif, qui va adapter les questions en fonction des réponses et proposera ensuite des questions plus ou moins complexes. En fonction des questions, nous avons attribué à chacune d’elle un niveau de difficulté sur une échelle de un à trois. En fonction de la progression de l’utilisateur, l’outil proposera une pause d’un ou deux jours pour faire travailler votre mémoire, puis de nouvelles questions inédites apparaîtront à nouveau sur l’application.

Innovations scientifiques

L’IDHN a ces dernières années développé de nombreuses expertises dans les domaines de l’attribution d’auteur, de l’analyse linguistique de corpus numériques, et plus généralement dans de l’analyse textuelle alliée à du traitement automatique des langues ou de l’intelligence artificielle. Ces expertises, qui sont mises à profit dans des travaux avec la gendarmerie, sur l’analyse des discours institutionnels, ou encore sur les interactions en ligne à propos du sport (projet #Locomotive), sont ici réinvesties dans un jeu. Le site s’appuie sur ces innovations scientifiques, en les rendant accessibles, et ludiques, par exemple :

  • pour les questions de la catégorie « attribution d’auteur », l’algorithme d’attribution d’auteur développé dans le cadre de projets de recherche, a été combiné à un processus de génération de texte par l’usage de l’intelligence artificielle, avec le modèle GPT-Neo ;
  • pour les questions liées aux thématiques politiques, nous avons préalablement eu recours aux classifications statistiques des corpus. En effet, un traitement d’un large corpus de tweets des candidats a été établi avec le logiciel de statistique textuelle Iramuteq, afin de caractériser les mondes lexicaux (classes) qui rendent compte des grandes thématiques : éducation, sécurité, etc.

Impliquer les électeurs

PolitiQuiz est issu d’un projet Open Source d’une start-up d’État : Pix.fr. Nous avons re-développé en partie le code de Pix, en ajoutant nos propres questions, un classement et une interface aux couleurs du PolitiQuiz. L’application avec ces modifications permet d’offrir une interface intuitive et facile à prendre en main, qui embarque les technologies évoquées précédemment.

Il met donc au service du grand public les moyens d’analyse que les chercheurs utilisent dans leur travail d’analyse, en utilisant les résultats de la recherche (calculs de thématiques, calculs de spécificités, stylométrie) pour la production de questions, et la visualisation des résultats et des tutoriels.

Une page de classement est également accessible, permettant de comparer ses résultats avec ceux des autres utilisateurs de l’application. En utilisant le principe du jeu, du classement, voire du concours, nous espérons sensibiliser les électeurs aux différents enjeux du scrutin, tout en leur offrant des connaissances et informations, de manière interactive et ludique.

L’application PolitiQuiz constitue un premier test public pour les élections régionales en Île-de-France. Dans moins d’un an, l’application pourra être déclinée aux élections présidentielles de 2022, avec probablement de nouvelles fonctionnalités, enrichies par les avancées de la recherche.

La Région Île-de-France finance des projets de recherche relevant de Domaines d’intérêt majeur et s’engage à travers le dispositif Paris Région Phd pour le développement du doctorat et de la formation par la recherche en cofinançant 100 contrats doctoraux d’ici 2022. Pour en savoir plus, visitez iledefrance.fr/education-recherche.

Les autres infos
Les autres infos