La représentativité dans les médias vue par les étudiant.es de Dauphine 

La représentativité dans les médias vue par les étudiant.es de Dauphine  937 842 DEMAIN

La représentativité dans les médias vue par les étudiant.es de Dauphine

Comment pouvons-nous (ou pas) mesurer la représentativité des diversités de la société française dans les médias historiques ? C’est la question à laquelle les étudiant·es du Master Marketing & Stratégie – Chef de produit & Etudes marketing (204) à l’Université Paris-Dauphine ont tenté de répondre lors d’un hackathon de deux jours la semaine dernière.


A l’origine de ce projet co-piloté par Demain, Pierre Volle, directeur du Master en Marketing & Stratégie – Chef de produit & Etudes marketing (204) de l’université Paris-Dauphine

En prenant la tête d’un des Master Marketing de Dauphine, Pierre Volle, spécialiste du marketing client, se redirige depuis 2020 sur les thématiques de marketing durable qu’il traite davantage sur le fond (business model, offre etc…) que sous les aspects communication. Cette transformation s’est notamment concrétisée au travers d’un cours dédié intégrant les enjeux RSE. Ce sont les 21 étudiant.es de ce cours que nous avons eu la chance de rencontrer et de pouvoir briefer sur une problématique de mesure de la représentativité des diversités de la société française dans les médias historiques.

Leur objectif : en 2 jours de hackathon, définir un cadre théorique et identifier des premières pistes pour concrétiser cette mesure dans une approche data science.


Un cadre de travail précisé en amont du hackathon

En amont du hackathon, les 21 étudiant.es du Master Marketing & Stratégie – Chef de produit & Etudes marketing (204) à l’Université Paris-Dauphine, ont été divisés en 6 groupes. Chaque groupe a été coaché par un.e consultant.e Demain pour préciser le brief et définir le scope de l’étude : choix des diversités (ex. âge, genre, handicap, origine et niveau d’études…) et des médias (3 médias par groupe, qu’ils soient TV, presse ou radio : ex. TF1, Arte, CNews, RTL, NRJ, France Culture, L’Equipe, Le Figaro Sport, l’Auto Hebdo…).

Sur la notion de représentativité des médias, le périmètre a été défini comme suit :

  • analyse derrière et devant l’écran
  • analyse de la production et de la réalisation
  • analyse des différents supports de mise en avant : liens, textes, vidéos, images

Par ailleurs, et toujours dans une logique d’opérationnalité via de la data science, au-delà de définir l’indicateur de mesure et son mode de calcul, les étudiant.es devaient s’assurer que les données soient disponibles et répondent bien au cadre légal. Ainsi, s’il peut être facile d’automatiser la collecte de l’âge via la disponibilité des données sur LinkedIn ou Wikipedia, d’autres données comme l’origine sociale ou ethnique pouvaient apparaître comme non automatisables, les étudiant.es ont été amené.es à reconnaître tous les biais des solutions avec une richesse de données suffisante pour être traitée par un algorithme. En parallèle, les étudiant·es ont été invité·es à dresser un panorama des programmes aux heures de pointe/grands carrefours d’audience, pour être en mesure, le jour du hackathon, d’être certain·es de sélectionner des programmes.


6 groupes d’étudiant·es, 6 coach·es Demain et un hackathon de 2 jours

Nos groupes d’étudiant·es et leurs coach·es de consultant·es Demain se sont donc retrouvé·es les 16 et 17 février derniers pour un hackathon dans nos locaux de la rue de Palestro.

Pendant une journée et demie, les différents groupes ont déterminé les KPIs à regarder par diversité et par média choisi, par exemple :

  • pour les médias L’Equipe, Le Figaro Sport, l’Auto Hebdo, le pourcentage d’articles 100% dédiés aux femmes/aux personnes handicapé.es/aux femmes handicapées sur les articles de la semaines, le pourcentage d’autrices ayant écrit seule les articles…et la mise en place d’un score en fonction de ces pourcentages pour pouvoir comparer les médias entre eux;

  • pour Le Monde, L’Humanité, Le Point, création d’indicateurs selon l’établissement de formation (ratio nombre d’établissements différents/nombre de journalistes) et selon la ville où les études sont réalisées (journalistes issus d’une formation à Paris/nombre de journalistes), création d’un indicateur pour mesurer la diversité d’âge des journalistes (Indicateur = Q3-Q1 avec Q1 : Âge en dessous duquel se trouvent les 25% des journalistes les plus jeunes et Q3 : Âge à partir duquel se trouvent les 25% des journalistes les plus âgés) au global par titre de presse mais également avec une granularité à la thématique des sujets couverts (politique, économie, société, culture).

Ils ont dû ensuite démontrer la méthode utilisée pour calculer ces KPIs et son opérationnalité par rapport aux données disponibles et à leur collecte, afin que ce soit automatisable par un algorithme.

Sur la demi-journée restante, chaque groupe a restitué pendant 15 minutes les résultats de ses recherches et réflexions. Cette restitution a été suivie de 10 minutes de questions réponses pour permettre notamment de clarifier les méthodes de calcul, soulever des biais éventuels et préciser la collecte des données.


Un grand merci aux étudiant·es qui ont proposé des angles d’attaque intéressants pour mesurer des diversités comme l’âge, le genre mais aussi le handicap, l’origine et le niveau d’études sur les médias presse, radio et tv, devant et derrière l’écran.
Et merci à Pierre Volle qui a permis d’organiser ce hackathon avec nous.

Du côté de Demain, nous allons travailler sur l’exploitation de ce premier travail des étudiants pour construire un algorithme capable de mesurer automatiquement la représentativité des diversités dans les médias.