Pluralisme.fr est un site Internet de suivi des citations des hommes et femmes politiques et de suivi des temps de parole dans les médias français (télévision, radio et Internet).
Il s’adresse aussi bien aux professionnels (médias, sondeurs, journalistes, partis politiques, affaires publiques, etc.) qu’aux citoyens qui cherchent de l’information fiable et transparente sur les sujets traités par les personnalités politiques. Ce site permet, d’une part, d’avoir avoir accès à leurs discours des personnalités d’influence par écrit et par audio et, d’autre part, de suivre les temps de parole, dans leurs grandes lignes, par partis politiques, par personnalités politiques suivies ou par thèmes.
L’Arcom est l’Autorité de régulation de la communication audiovisuelle et numérique qui garantit le pluralisme sur les antennes. A ce titre, les recommandations adoptées par l’Arcom et les tableaux de relevés de temps de parole qu’elle publie sont les seuls qui font foi et qui ont valeur d’autorité.
L’Arcom a développé au fil des années une expertise sur le suivi de ces temps de parole, avec une granularité et une exigence unique au sein des pays démocratiques.
De fait, en France, les deux piliers garantissant le pluralisme politique sont le contrôle des comptes de campagnes et son corolaire, et le contrôle du pluralisme politique dans les médias. En effet, le financement et l’accès aux médias sont les deux vecteurs clés de diffusion des idées.
S’agissant plus particulièrement du suivi du temps de parole des hommes et femmes politiques, les règles édictées par l’Arcom se sont étoffées au fil des années avec, notamment, les principales dispositions suivantes en période électorales :
En pratique, ces temps de parole sont aujourd’hui saisis manuellement par des observateurs au sein des différents médias. Les médias transmettent leur déclaration périodiquement à l’Arcom. L’Arcom effectue ensuite un contrôle, puis publie les données consolidées sur son site Internet.
Pour ce faire, la plupart des médias utilisent, d’une part, le logiciel de saisi et de contrôle des temps de parole « Pluralis.me », produit de la société Pluralisme et, d’autre part, le référentiel des personnalités politiques géré et mis à jour par l’Arcom via un Intranet dédié. Ce référentiel contient plus de 1500 personnalités à suivre.
Le site Pluralisme ou pluralisme.fr n’a pas l’ambition de suivre automatiquement les temps de parole des hommes et femmes politiques avec le degré d’exigence et de précision demandé par l’Arcom. En effet, Pluralisme suit via des algorithmes les temps de parole et retranscrit les discours vidéos en texte et en audio et ce, en temps quasi réel (délai de latence entre 1h et 4h suite à la diffusion du discours dans les médias).
Concrètement, les temps suivis par Pluralisme sont les suivants :
L’objectif est d’augmenter le périmètre de suivi au fil des mois (diversité des médias suivis avec des chaines Youtube et Twitch notamment).
Pluralisme ou pluralisme.fr permet néanmoins d’enrichir les informations relatives au temps de parole en fournissant une transcription – quasi-fidèle - de l’intervention orale de la personnalité. Cette retranscription est ensuite classée par thèmes et accessible via un moteur de recherche. Ce qui en fait la première base de données exhaustive des discours de personnalités politiques et ce qui permet de poser des veilles / alertes sur des personnalités et/ou des mots clés.
En l’état, Pluralisme.fr a fait le pari d’une saisie 100% automatisée qui, par nature, est moins précise que la saisie manuelle. Des écarts peuvent apparaître avec les saisies manuelles, principalement pour 2 raisons :
Nos algorithmes d’intelligence artificielle de speech to text permettent de retranscrire une interview, une citation ou un débat. Le nom des personnalités politiques est conservé dans la retranscription. Le nom des journalistes intervenants est, quant à lui, anonymisé avec la mention « Autre intervenant ».
Toutes les citations sont sourcées avec précision, de sorte, qu’en plus du transcript écrit et audio fournit sur Pluralisme.fr, l’utilisateur pourra aller consulter sur la chaine elle-même la vidéo en question pour vérifier ladite citation.
La qualité de la retranscription fait l’objet d’améliorations constantes. Cette retranscription se fait en temps réel et peut parfois comporter quelques erreurs de sémantique, de ponctuation, etc. que nous tentons de corriger.
Une fois la retranscription de la citation obtenue, nous faisons tourner des algorithmes de classification sémantique pour classer les citations par thèmes.
A ce stade, pour identifier les thèmes choisis en vue de classer les citations, ont été étudiés les programmes des candidats de l’élection 2017 et ceux disponibles au 15 janvier 2022 pour l’élection 2022. Il s’agit donc d’une liste limitative.
L’ensemble de ces algorithmes est utilisé par le groupe Lexbase depuis plusieurs années (le speech to text pour les podcasts de Lexradio, la 1ère radio juridique - la correction sémantique et la classification en NLP et NLU pour notre base de 5 M+ décisions de justice, etc.).