Sondages, statistiques, graphiques… en toute objectivité ?

Un dossier préparé par François Piret, animateur scientifique
Paru dans Ébullisciences (bimestriel des Jeunesses scientifiques) n°344, octobre-novembre 2012

Relève le défi de l’Ébullisondage !

Huit questions au sujet de ta revue préférée, réponds-y vite et découvre ensuite les résultats de ton test !

1. Trouves-tu que l’Ébullisciences est une revue :

a. très bonne
b. bonne
c. moyennement bonne

2. 82% des personnes interrogées pensent que l’Encyclo-zapping est la meilleure rubrique de l’Ébullisciences. Es-tu d’accord avec eux ?

a. oui
b. non

3. Dirais-tu que le cours de sciences à l’école est un cours difficile ?

a. oui
b. non

4. Sur base du graphique 1 (ci-dessous), comment qualifierais-tu l’évolution du nombre de lecteurs de l’Ébullisciences ces dernières années ?

a. en augmentation
b. globalement constante
c. en diminution

P1_Graph1

5. Même question sur base du graphique 2 (ci-dessous) ?

a. en augmentation
b. globalement constante
c. en diminution

P1_graph2

6. Sur base du graphique 3 (ci-dessous), dirais-tu que la qualité des articles de l’Ébullisciences a plutôt augmenté ou diminué ?

a. augmenté
b. diminué
c. pas de réponse

P1_graph3

7. Une étude a montré que la croissance du nombre de lecteurs de l’Ébullisciences a diminué de 5% à 3% en un an. Penses-tu que cette diminution pourrait entraîner à terme une disparition complète du nombre de lecteurs ?

a. oui
b. non
c. ne sait pas

8. Dirais-tu que le cours de sciences à l’école n’est pas un cours facile ?

a. oui
b. non

Résultats :

Un dossier sur les sondages et les statistiques ne pouvait que commencer par un petit questionnaire… rempli de questions tronquées !

Grâce à la question 1, en effet, je peux être sûr que 100% des personnes ayant répondu trouvent la qualité de l’Ébullisciences « moyennement bonne ou bonne » ! À la question 2, tu as peut-être suivi les « 82% » de personnes trouvant que l’Encyclozapping est la meilleure rubrique de l’Ébulli. Choisir les réponses aux questions, citer des pourcentages et utiliser des expressions synonymes (as-tu répondu pareillement aux questions 3 et 8 ?) sont des techniques permettant de manipuler les résultats d’un sondage.

Pour ne pas te faire avoir, tu pourras les comprendre et en trouver d’autres ci-après.

As-tu donné la même réponse aux questions 4 et 5 ? Non ? Pourtant tu aurais dû : ce sont exactement les mêmes chiffres qui sont présentés aux graphiques 1 et 2, seule l’échelle de l’axe vertical change.
Quant au graphique 3, il n’a pas d’échelle verticale et ne donne aucune information sur ce qui y est présenté : impossible donc de répondre à une question sur base de celui-ci ! Tu trouveras d’autres infos sur les graphiques en pages 12 et 13.

Enfin, la question 7 est un exemple de manipulation statistique des chiffres. Ce procédé est décrit à la page 16 de ce dossier, pour que tu saches pourquoi répondre « non » à cette question emberlificotée…

Ce dossier a pour but de te montrer combien il est plus difficile qu’il n’y paraît de correctement interpréter des chiffres, des sondages et des graphiques et donc de te donner des clefs pour le faire et pour bien les utiliser. Il est, en effet, assez simple de manipuler ces outils si c’est l’intention de la personne qui les utilise. Un dossier qui mettra donc à rude épreuve ton esprit critique pour t’éviter de tomber dans les pièges. En effet, les décisions que nous prenons sont bien moins rationnelles qu’on ne le pense.

Comment prenons-nous des décisions ?

Notre cerveau nous guide…

Le processus de décision implique plusieurs aires du cerveau et est tellement complexe qu’il n’est pas encore élucidé. Alors que nous avons tendance à nous penser raisonnés et rationnels, plusieurs études ont déjà montré que nos choix et nos jugements moraux sont en fait facilement influençables, que ce soit par des facteurs internes ou externes.

pub_metro couleursPUB

Inconsciemment, nous associons des valeurs aux couleurs : jaune pour la joie, rouge pour la force.
La publicité utilise largement ce levier.

Le dossier « 10 expériences de psycho-sociales » de l’Ébullisciences n°340 t’avait déjà montré à quel point nous sommes influençables, que ce soit par des effets de conformité sociale ou par des personnes possédant un certain pouvoir ou autorité. Il y a même des facteurs tout à fait internes qui influencent nos prises de décisions. Par exemple, une étude s’est intéressée aux décisions de juges israéliens devant décider des remises en liberté conditionnelles. Elle a montré que ceux-ci accordaient toujours beaucoup plus facilement la remise en liberté après… leur pause déjeuner ! Lorsque la fatigue et la faim étaient présentes, les juges prenaient le choix le plus facile : le refus de la remise en liberté [1]). Quant à nos choix politiques, ils sont également bien moins raisonnés qu’on ne le pense : nous assimilons et retenons mieux les faits qui confirment ce que nous croyons déjà, même si ces faits sont faux et que nous le savons [2].

Bref, notre cerveau, siège de nos décisions, est très influençable.

… Certains cherchent donc à le guider !

Certains outils de communication nous influencent particulièrement : les chiffres et les pourcentages (nous leur accordons inconsciemment une crédibilité), les images (même fausses) et les graphiques (de par leur lisibilité très rapide).

En ayant conscience du pouvoir de ces outils, il est donc facile d’influencer les décisions d’un groupe de personnes et c’est d’ailleurs le métier des publicitaires qui cherchent à nous convaincre d’acheter un produit. Pour cela, ils disposent d’une foule d’outils. Par exemple, sur un site internet commercial, en fonction de l’image qui veut être donnée au produit, le publicitaire choisira une couleur plutôt qu’une autre car nous associons inconsciemment des caractéristiques « humaines » aux couleurs, par exemple « la force » au rouge ou « l’équilibre » au vert (voir image ci-dessous).[3]

Un exemple parmi tant d’autres… Notre cerveau est influençable et les chiffres, les statistiques et les graphiques sont des outils très puissants pour le faire : exerce donc ton esprit critique grâce aux informations qui suivent !


87% des personnes interrogées pensent qu’il est facile de manipuler des graphiques

Les graphiques sont omniprésents dans nos vies quotidiennes : dans les journaux, dans les revues, à la télévision ; nous apprenons même à en faire à l’école. En effet, ce sont des outils d’informations très puissants car ils sont facilement lisibles et compréhensibles. Cependant, on va le voir, il est très aisé d’influencer leur lecture… (Toutes les données présentées dans cette partie consacrée aux graphiques sont fictives et ont pour seul but l’illustration des effets expliqués).

L’influence des axes

Un graphique a au moins deux axes : l’axe vertical, dit axe des Y ou des ordonnées, et l’axe horizontal, appelé axe des X ou des abscisses. Ceux-ci se caractérisent par leur échelle, c’est-à-dire les intervalles qu’ils représentent. Jouer avec ces échelles constitue le premier moyen très simple d’influencer la lecture d’un graphe.

Les graphiques 1 et 2 (ci-dessous) présentent les mêmes données (le nombre de paquets de frites vendus en Belgique chaque année) et montrent qu’en choisissant de présenter une échelle complète ou incomplète de l’axe des Y, la lecture de ces deux graphiques est très différente. Si on ne regarde que le graphique 1, on a l’impression que le nombre de paquets de frites vendus est globalement constant depuis 2003. Mais en fait, comme le montre le graphique 2, il y a eu augmentation du nombre de paquets vendus (+ 15% entre 2003 et 2010) ! Le fait de présenter toute l’échelle va avoir un effet d’écrasement des données les rendant plus difficiles à interpréter.

P3_graph1 P3_graph2

Le choix des données à présenter à l’axe des X a également une réelle influence. Les données du graphique 1 ont été couplées avec celles des années précédentes : la lecture du graphique 3 montre alors une toute autre tendance, puisqu’on constate grâce à ce nouveau graphique une baisse significative du nombre de frites consommées depuis 1997.

P3_graph3

Évidemment, la tentation est grande de choisir un des graphiques en fonction du message que l’on désire faire passer : pour montrer une consommation constante, en hausse ou en baisse, on choisira de présenter le graphique 1, 2 ou 3.
Ce qui signifie que toi, lecteur de graphiques dans les journaux ou sur internet, tu dois avoir conscience de l’influence du choix des axes.

Il existe une échelle des X particulière, que l’on utilise en sciences fréquemment, c’est l’échelle logarithmique, qui permet de présenter dans un même graphique des données très différentes. Elle est pratique mais il faut bien savoir l’interpréter. Imaginons qu’on ait demandé à 250 personnes combien de frites ils mangent par mois, et qu’ils doivent choisir entre 1, 10, 100, 1000 et 10 000. Le tableau ci-après présente les résultats obtenus : 32 personnes, par exemple, déclarent manger 100 frites par mois. Si on porte ces résultats en graphique, on obtient le graphique 4, qui est illisible : il ne donne aucune information sur les personnes qui mangent peu de frites car le graphique est écrasé à gauche par la valeur « 10.000 ». On utilise alors l’échelle logarithmique, où il y a un rapport de 10 entre chaque intervalle constant, pour représenter ce genre de données de manière bien plus lisible (graphique 5).

tableauP3_graph4 P3_graph5

Le graphique 6 présente l’évolution de deux données : le nombre de friteries en Belgique et le nombre de manchots en Antarctique. Comme tu peux le constater, il y a clairement une évolution parallèle des deux données.
Peut-on en conclure que le nombre de friteries en Belgique a une influence sur la reproduction des manchots ou que la reproduction des manchots influence la création et la disparition des friteries en Belgique, c’est-à-dire de créer une corrélation entre les deux évolutions ? Bien sûr, dans notre exemple, cela semble évident que ce lien ne peut pas être fait… mais ce n’est pas toujours si clair. Donc, prudence et attention : ce n’est pas parce que deux courbes évoluent de la même manière qu’il y a un lien entre les données qu’elles représentent !

P3_graph6

Le graphique 7 doit être interprété avec soin. Dans ce type de graphique, il y a deux axes verticaux qui se rapportent chacun à une donnée présentée, en l’occurence l’évolution du nombre de pots de sauce andalouse vendus par an (histogramme rouge) et la même évolution pour les pots de sauce ketchup (ligne bleue). De prime abord, on a l’impression que les ventes de ketchup ont beaucoup plus fortement diminué que celles d’andalouse. Attention, danger ! En effet, les échelles ne sont pas les mêmes : l’axe vertical de gauche se rapportant aux pots d’andalouse couvre la gamme 0 – 2100 tandis que celui de droite, représentant les pots de ketchup, couvre les valeurs 1300 – 2700. L’évolution du nombre de pots de ketchup vendus est donc exagérée. Le graphique 8 présente les mêmes données de manière plus juste, puisque les deux axes partent de 0. Cependant, ce type de graphique n’est jamais idéal car il n’est pas facilement lisible. Garde ça en tête pour la prochaine fois que tu en verras un !

P3_graph7 P3_graph8

Enfin, le type de graphique a son importance. En particulier, les graphiques 3D sont des graphiques trompeurs par excellence. Le graphique 9 présente l’évolution du nombre de caries par an en Belgique (données utilisées : année/caries : 2004/989, 2005/2005, 2006/3005, 2007/3250). Le graphique 10 présente exactement les mêmes données. Pourtant, il donne l’impression qu’aucune barre n’atteint les 3000 ! Cela est dû à l’angle de vue du graphique : attention donc à la lecture des graphes en 3D !

p3_graph9p3_graph10

Comment bien présenter un graphique ?

Il n’y a pas une seule bonne manière de le faire ; le principal étant d’abord d’avoir le souci de l’honnêteté par rapport à la manière de présenter des données en graphique, ensuite de faciliter sa compréhension par le lecteur.

Quelques bonnes pratiques que tu peux néanmoins retenir :

  • toujours nommer ce que les axes représentent (année, nombre de paquets de frites, etc.),
  • toujours indiquer les chiffres des échelles, donner un titre au graphique,
  • mettre une légende si plusieurs données sont présentées sur le même graphique
  • éviter les artifices de présentation (graphiques à doubles axes, graphique 3D, etc.).

99,9% des internautes interrogés pensent que les sondages sont fiables à plus de 50%

Êtes-vous pour ou contre les sondages ? Nous avons posé la question à quelques personnes et 100% des personnes de notre échantillon étaient favorables aux sondages* ! Nous ne pouvions donc pas passer le sujet sous silence…

Un sondage est censé présenter une photographie de l’opinion d’un groupe de personnes à un moment donné et au sujet d’une thématique précise. Pourtant, tu vas le constater, les résultats d’un sondage doivent être pris avec prudence…

(* les personnes qui étaient contre les sondages n’ont pas été prises en compte).

Manipuler un sondage, c’est vraiment facile…
… en choisissant l’échantillon des sondés

1 :  Sélectionner les sondés

Imaginons que tu sois directeur d’entreprise et tu sortes un nouveau produit : le jus à l’herbe jaune du Liban. Tu aimerais en faire une sacrée pub et tu as l’idée de publier un sondage sur son goût pour montrer à quel point les gens l’aiment ! Comment faire pour que le résultat de ton sondage soit très favorable ? C’est facile : il suffit de ne sonder que des personnes qui aiment déjà le yaourt à l’herbe jaune du Liban que tu vends depuis plus d’un an… Il n’y a pas beaucoup de risque qu’ils n’aiment pas le jus du même goût !

2 : Avoir un petit échantillon

Un sondage montre que 20% des ­schtroumpfs aiment bien lire l’Ébullisciences. Cela fait peu ! Sauf qu’en fait, on n’a posé la question qu’à 5 schtroumpfs, dont le Grand schtroumpf qui est le seul à savoir lire !

Conclusions : le choix et le nombre des sondés ont donc leur importance. Si les sondés sont sélectionnés et non choisis au hasard ou si leur nombre est trop petit, on ne peut en tirer aucune conclusion valable sur l’opinion de la population qu’est censée représenter l’échantillon.

… en choisissant ses questions

3 : Utiliser la synonymie

À la question « Vous sentez-vous en sécurité dans votre vie quotidienne ? », 19% des personnes interrogées ont répondu non. À la question « Vous sentez-vous en insécurité dans votre vie quotidienne ? », 28% ont répondu positivement. Il n’y a donc pas d’équivalence, pour les sondés, entre « être en insécurité » et « ne pas être en sécurité ». (Ref : [4])

Explication : nous avons une tendance psychologique à répondre plus facilement oui que non.
Le choix du mot utilisé dans la question est donc important (et la manière de formuler une question dans un référendum a donc aussi son importance !)

4 : Utiliser la conformité sociale

À la question « Êtes-vous d’accord, comme 82% des belges, que la voiture est dangereuse ? », plus de gens répondent positivement que si la question avait été posée sans citer de pourcentages.

Explication : il y a un effet de ralliement de l’opinion personnelle à la majorité. Bien sûr, personne ne nous dit comment le chiffre cité dans la question a été déterminé, et surtout pourquoi on refait un sondage alors qu’il en existe visiblement déjà un ! Prudence donc.


… en choisissant les réponses proposées

5 : Donner des propositions

Ce sondage pose la question de désigner la catégorie de population pour laquelle « on dépense le plus » d’aides sociales en France. La question était présentée de façon ouverte (sans proposition) en 1985, puis fermée l’année suivante. En 1985, 5% des sondés ont cité « les étrangers ou les immigrés ». L’année suivante, lorsque la catégorie est proposée en question fermée, elle est sélectionnée par 28% de la population (Ref : [4])

Explication : interrogé de façon ouverte, le sondé hésite à donner spontanément à l’enquêteur une réponse pouvant montrer une forme de xénophobie. Mais dès que la figure de « l’immigré » est évoquée par l’enquêteur, cette réponse n’est plus taboue.

6 : Proposer une « non-réponse »

À la question, « Êtes-vous d’accord avec l’affirmation suivante : la voiture électrique est un moyen efficace pour lutter contre la dégradation de l’environnement », 16% répondent « ne sait pas », lorsque la réponse leur est proposée.

À la même question, quand la possibilité de s’abstenir n’est pas clairement indiquée, seulement 1% des enquêtés déclarent « ne pas savoir ». (Ref : [4])

Explication : quand la réponse « ne sait pas » est proposée, le sondé considère comme davantage normal de n’avoir pas d’opinion à ce sujet et ose choisir cette option.

7 : Réduire sciemment les propositions

En mars dernier (2012, ndlr), deux instituts de sondage français présentent, à quelques jours d’intervalle, leurs estimations de vote pour le 1er tour des présidentielles françaises : leurs résultats absolus sont très différents.

À y regarder de plus près, cette différence s’explique par une simple manipulation délibérée. Le premier institut de sondage a demandé aux sondés pour qui ils comptaient voter parmi les 11 candidats au 1er tour des présidentielles. Le deuxième institut a fait pareil parmi 7 candidats ! Il a délibérément choisi de ne pas proposer aux sondés la possibilité de voter pour 4 candidats à la présidentielle. La différence ? Découper le gâteau (100%) en 7 parts permet d’en donner un peu plus à chacun que s’ils sont 11. Les scores des candidats choisis par le 2e institut de sondage étaient donc artificiellement gonflés… (Ref : [5])

8 : proposer ou pas une réponse médiane

La comparaison de deux questions provenant de l’enquête annuelle réalisée pour la « Commission nationale consultative des droits de l’homme sur le racisme » donne une illustration de l’influence d’une réponse moyenne dans les propositions. (Ref : [6])

Première question : « D’une manière générale, diriez-vous qu’en France aujourd’hui, il y a a. trop / b. pas trop
de personnes d’origine étrangère ? » Résultats : Trop : 60%, Pas trop : 30%, Ne sait pas : 10%.

Deuxième question : « D’une manière générale, diriez-vous qu’en France aujourd’hui, il y a a. trop / b. Juste assez / c. Pas assez … de personnes d’origine étrangère ? » Résultats : Trop : 48%, Juste assez : 43%, Pas assez : 1%, Ne sait pas : 8%.

La présence de la réponse médiane « Juste assez » modifie fondamentalement la répartition des réponses. Inutile de dire qu’en fonction du message politique que l’on tente de faire passer, on choisira de vanter l’un ou l’autre des sondages.

Pour une étude complète de l’influence de la question sur les réponses au sondage, tu peux consulter l’excellente référence [4].

… en choisissant un mode de sondage

Le choix du mode de sondage n’a rien d’anodin. Fréquemment, les sondages sont réalisés par téléphone qui est une méthode relativement fiable. Bien plus controversés, les sondages sur internet occupent une place croissante. Dans ceux-ci, les personnes qui répondent au sondage sont rémunérées, ce qui accroît le risque de ne pas avoir un échantillon représentatif. D’autre part, le risque est réel de voir ces personnes répondre n’importe quoi simplement pour gagner de l’argent. Une étude d’Esomar de 2006 avait établi que 54% des sondés par Internet admettaient mentir pour gagner une gratification
(Ref : [7]). Et pourtant, des sondages rémunérés, c’est très facile d’en trouver (par exemple sur www.sondagescompares.be).

Deux paramètres à garder à l’oeil: la marge d’erreur et l’intervalle de confiance

Les sondages ne produisent que des valeurs approchées et non des chiffres absolus car ils ne font qu’extrapoler à une grande population les résultats obtenus sur un petit échantillon. Pour lire un sondage, il faut tenir compte de la « marge d’erreur » qui estime la distorsion qu’il pourrait exister entre le résultat de l’enquête auprès d’un échantillon d’une population et celui de l’interview systématique de la totalité des individus de cette même population.

De plus, la marge d’erreur est toujours analysée en fonction d’un seuil de confiance qui est un paramètre statistique. Il représente le niveau de probabilité que le résultat trouvé (plus ou moins la marge d’erreur) soit exact. Plus il est élevé, plus le résultat est fiable. Il est d’usage pour les professionnels d’utiliser un intervalle de confiance de 95 %, ce qui signifie que l’on estime, avec 95 % de chances de ne pas se tromper, que le résultat constaté au terme de l’enquête (plus ou moins la marge d’erreur) correspond à la proportion valable pour l’ensemble de la population.

Exemple : si tu entends à la radio qu’« un candidat électoral recueillerait 27,1% des votes selon un sondage », tu sais maintenant que tu dois prendre ce résultat avec des pincettes. D’abord, tu dois te renseigner sur la marge d’erreur. Imaginons-là de 3%. Tu dois donc traduire ce que tu entends : il y a en réalité 95% de chances que ce candidat recueille entre 24 et 30%. Ce qui est très différent !

Les sondages politiques

Les sondages politiques constituent des sondages particuliers de par l’importance qu’ils peuvent prendre dans les médias mais aussi dans leur forme. Quelques mots à leur sujet donc.

Les ajustements par la méthode des quotas

Dans les sondages relatifs aux élections présidentielles françaises, les ajustements par la méthode des quotas constitue une facette méconnue et pourtant très importante. Elle a pour but de tenir compte d’une pression sociale s’appliquant sur les sondés qui va les inciter à ne pas avouer voter pour certains candidats « sensibles ». C’est le cas pour l’ancien président du Front National français Jean-Marie Le Pen : 7,5% des sondés déclarent, en 2002, avoir voté pour lui à la présidentielle de 1995, alors que l’on sait que ce candidat a, en réalité, obtenu 15% des suffrages à cette époque ! étant donné qu’avouer voter pour ce candidat peut être considéré comme gênant pour les sondés, ceux-ci vont avoir tendance à mentir. En conséquence, les prévisions de vote à son égard seront sous-estimées et c’est précisément cette sous-estimation que la méthode des quotas entend diminuer. Le score de certains candidats recueilli par le sondage est donc multiplié. Le problème, c’est que les instituts de sondage gardent secrètes les méthodes appliquées au sujet de ces quotas. Un manque de transparence qui incite à la plus grande prudence quant à leur interprétation.

L’indépendance des instituts de sondage

Les instituts réalisant les sondages sont dirigés par des personnes parfois proches des dirigeants politiques qui commandent les sondages. Il n’est pas inutile d’en être conscient quand on sait que l’ex-Président français Nicolas Sarkozy a commandé en 2008 pour plus de 3 millions d’euros de sondages. Certains ont été publiés dans la presse ; tous se montraient élogieux envers le président
(Ref : [8]).


Quand chiffres et statistiques nous trompent

Prenons pour exemple les données du tableau ci-dessous : les deux premières colonnes présentent l’évolution annuelle du nombre moyen de frites dans les paquets vendus en Belgique. à première vue, rien à dire, ça augmente (yeah !). Je te parie pourtant mes chaussettes que j’arrive à te montrer une tendance à la baisse sur base de ces chiffres avant la fin de la page !

Ici, on va explorer quelques techniques souvent utilisées pour analyser des données chiffrées. Comme tu vas pouvoir le constater par toi-même, elles peuvent vraiment prêter à confusion.

tableau2

Manipuler des chiffres, c’est facile

Prenons donc notre tableau du nombre de frites par paquet entre 2005 et 2009 (données fictives). Tu peux calculer l’augmentation du nombre de frites, en pourcentage, par rapport à l’année précédente.

Par exemple, pour 2006 : (360-300)/300 x 100%= 20,0%. 

Une fois que tu as calculé ces données, tu peux aussi calculer la variation de celle-ci : c’est la 4e colonne. Par exemple, pour 2008, l’augmentation est passée de (+11,1%) en 2007 à (+5,0%) en 2008, soit une baisse de 6,1 % en 2008. Grâce à ces deux manipulations, tu arrives donc à montrer que la croissance du nombre de frites dans les paquets diminue énormément, puisqu’elle est passée de 20% à 2,4% entre 2006 et 2009 (3e colonne). Tu peux même dire que la variation de la croissance du nombre de frites dans les paquets est négative depuis 2007 (4e colonne) !

Dans un journal, si tu croises un graphique tel que le graphique 1 ci-dessous, qui représente la 3e colonne du tableau, fais donc bien attention à ne pas te faire avoir par ces manipulations mathématiques.

P7_graph1

Les statistiques : des outils puissants qui ont leurs limites

Les statistiques constituent un domaine des mathématiques qui servent à analyser des données. Elles sont très présentes en sciences car elles servent aux chercheurs à interpréter leurs résultats expérimentaux. Elles regroupent une foule de notions et de tests qui servent à analyser et à produire des conclusions avec un certain degré de confiance (par exemple, « il y a 95% de chances que l’hypothèse de notre étude soit bonne »). La thématique des statistiques est tellement grande qu’elle pourrait justifier un dossier à elle toute seule .

Parmi toutes les notions de statistiques, il y en a une très simple, c’est la moyenne, que tu apprends à l’école. On t’a appris que la moyenne d’un ensemble de chiffres est égale à la somme de ces chiffres divisée par leur nombre. La moyenne te donne donc une information sur l’échantillon des données.
Vraiment ?

Dans le tableau ci-dessous, tu as plusieurs échantillons constitués de 15 chiffres compris entre 0 et 30. Les 4 échantillons ont tous la même moyenne, et pourtant ils sont très différents. Un exemple pour te montrer de bien faire attention à considérer la moyenne comme une information qui ne te donne qu’une information partielle sur les chiffres réels de ton échantillon.

tableau3


Pris en flagrants délits !

Tu penses peut-être, arrivé/ée à la fin de ce dossier, que ça ne doit pas arriver souvent les manipulations de chiffres ou la présentation de graphiques incompréhensibles ou faux dans la presse ou à la télévision. Eh bien, détrompe-toi : voici trois exemples de l’actualité récente qui parlent d’eux-mêmes.

Le graphique sans axe de Brice Hortefeux

Le 20 janvier 2011, l’ex-Ministre français de l’Intérieur Brice Hortefeux était l’invité du journal de TF1. Il y parle de la politique sécuritaire du gouvernement et montre à la caméra un graphique des « chiffres de la délinquance » depuis 1997 jusque 2010 (voir image ci-dessous).

hortefeux

Sans rentrer dans l’analyse politique, examinons de plus près ce graphique. Outre une utilisation explicite des couleurs (rouge lors de l’augmentation de la délinquance, verte lors de sa baisse), on constate surtout l’absence totale d’axe des ordonnées (vertical) : pas de chiffre, pas de légende, pas d’échelle. Impossible donc de savoir ce qui est réellement représenté dans ce graphique, exactement comme la question 6 de l’Ébullisondage en début du dossier. Ce graphique n’est donc pas informatif. L’extrait vidéo peut être entièrement visionné ici

Les cercles du journal « Le Monde »

Le 12 juin 2012, peu de temps avant le 1er tour des élections législatives françaises, le journal « Le Monde » publie un sondage dont il montre les résultats sous forme de cercles (voir image ci-dessus). La superficie des cercles est censée représenter le pourcentage obtenu par chaque parti
Sauf que le graphique est faux. Prenons pour exemple le cercle rose, représentant 34,43 % des intentions de vote, et le rouge, représentant 6,94%. Le cercle rouge devrait donc être 5 fois plus petit que le rose (5 x 7% = 35%). Or ce n’est pas du tout le cas : le cercle rouge est environ 34 fois plus petit ! Mesure avec ta latte et constate par toi-même… pour rappel, la superficie d’un cercle = (rayon)² x π.

lemonde

Des histogrammes qui ne veulent rien dire

Le 12 janvier 2012, le journaliste économique de l’émission « Des paroles et des actes » sur France 2 présente aux téléspectateurs le graphique ci-dessous. Celui-ci montre 4 barres, correspondant à un pourcentage, pour 4 zones géographiques différentes. Sans s’intéresser à la signification économique de celui-ci, regarde de plus près les chiffres au-dessus des histogrammes et la taille de ceux-ci. Par exemple, regarde les différences de hauteur entre les deux histogrammes de gauche et entre les deux de droite : la différence de hauteur est similaire voire plus importante entre les états-Unis et l’Allemagne qu’entre la Zone Euro et la France. Pourtant, il y a une différence de 56,2 – 48,8 = 7,4% entre ces deux dernières zones, alors qu’il y a une différence de seulement 45,5 – 41,9 = 3,6% entre les états-Unis et l’Allemagne ! Le graphique est tout simplement faux. Malheureusement, c’était très difficile à constater pour les téléspectateurs, qui ne l’ont vu que pendant 3 secondes à l’écran. Ils en auront peut-être donc tiré des conclusions erronées. Tu trouveras une analyse plus complète de ce graphique ici.

depenses


Références

[1] S. Danzer et al., PNAS, 108 (17) 6889-6892 (http://www.pnas.org/content/108/17/6889)

[2] http://www.lemonde.fr/week-end/article/2011/05/13/comment-prenons-nous-nos-decisions_1521812_1477893.html, consulté en juin 2012

[3] http://trinity-advise.com/choix-de-couleurs-pour-mieux-vendre-et-communiquer-sur-le-web/

[4] « Quelques expériences sur la formulation des questions d’enquête », CRéDOC, C. Piau, 2004, http://www.credoc.fr

[5] Les échos, http://lecercle.lesechos.fr/presidentielle-2012/221144536/sondages-comment-manipuler-resultats-sans-manipuler-chiffres

[6] G. Grunberg, N.Mayer, P. M. Sniderman (dir.), La démocratie à l’épreuve, une nouvelle approche de l’opinion des français, Paris, Presses de la Fondation Nationale des Sciences Politiques, 2002, p. 298.

[7] http://www.observatoire-des-sondages.org/L-artefact-Marine-Le-Pen-la.html

[8] http://www.agoravox.tv/tribune-libre/article/zapping-sondages-et-manipulations-34559