Que seraient les journaux si on n’y retrouvait pas quelques chiffres
provocateurs? En feuilletant ce matin notre gazette favorite, nous
avons été fortement impressionnés par les titres suivants : le 35e
meurtre de l’année (ils sont tous numérotés) sur le territoire de
la Capitale nationale; le Conseil du Trésor annonce des coupures de plus de 100 000 $; Elvis Gratton a perdu 10 kilos; enfin, ce qui porte notre angoisse
à son comble, le ministre Untel prévoit qu’un Québec indépendant
perdra 2 millions d’emplois.
Réflexion faite, ces chiffres tout nus ne nous disent pas grand-chose.
Combien de meurtres y avait-il eu l’an dernier à pareille date? Quelles
sont les dépenses totales du Conseil du Trésor? Combien pesait
Elvis avant sa dépression? Combien y a-t-il de Québécois et de Québécoises
au travail? Nous ne pouvons pas vraiment comprendre toute cette soi-disant
information sans utiliser des points de repère. Après avoir constaté,
par exemple que le déficit du gouvernement était de 35 milliards de
dollars, nous pouvons relativiser la nouvelle des coupures : 100 000 $, c’est moins qu’une goutte d’eau dans la mer des dépenses publiques.
Quant au ministre Untel, le voilà complètement discrédité à nos yeux,
car à ce rythme-là il y aura bientôt plus de chômeurs que d’habitants
au Québec.
Au chapitre 1, nous nous sommes limités aux chiffres bruts, c’est-à-dire des chiffres qui n’avaient subi aucun traitement. Avec ce chapitre, nous commencerons
à faire travailler les chiffres. Nous verrons toute l’information
supplémentaire que nous pouvons tirer d’une donnée brute
en la mettant en rapport avec une autre ou, tout simplement, en divisant
une donnée par une autre.
Au terme de ce chapitre, vous devriez être en mesure de répondre aux questions suivantes :
Comment les rapports peuvent-ils nous être utiles à mieux comprendre
le sens des données brutes?
Quels sont les principaux types de rapports que l’on utilise?
Quelles sont les différentes formes sous lesquelles les rapports sont présentés?
1. QU’EST-CE QU’UNE PROPORTION?
En 2013, au Canada, 22 % des travailleurs ne détenaient aucun diplôme et 29 % d’entre eux étaient syndiqués; le taux de chômage des femmes atteignait de 6,7 % et celui des jeunes de 15 à 24 dépassait les 13 %; un tiers des voitures particulières vendues provenaient de l’extérieur de l’Amérique du Nord, tandis que la part de marché de Toyota était de 10 %.
Malgré la diversité des formulations utilisées dans la phrase précédente, toutes les données chiffrées citées possèdent un point commun. Ce sont toutes des proportions. Mais qu’est-ce qu’une proportion, exactement?
1.1. Un petit se faufile entre les géants
Nous sommes en 1992, une année cruciale pour les producteurs de microordinateurs.
Dix ans après le lancement du premier PC, la compagnie IBM, qui n’a
cessé de céder du terrain à ses imitateurs (les fabricants de « compatibles »),
voit sa première place menacée. Une nouvelle stratégie est alors mise
en place sous l’égide d’un nouveau président. Si, en 1992, IBM ne
vend plus que 10 % des microordinateurs dans le monde, sa part de
marché remonte à 10,8 % dès l’année suivante. C’est suffisant pour
garder quelques distances avec l’ennemi de toujours (aux yeux du public) :
Apple. Ce dernier réduit cependant
légèrement son écart en passant de 8,5 % à 9,5 % du marché pendant
la même période.
Qui va l’emporter : IBM ou Apple? Aucun des deux, car un troisième
larron va venir se faufiler entre les géants. Compaq, qui était devenu
le premier parmi les imitateurs d’IBM dans les années 1980 grâce à
ses innovations audacieuses, traine de la patte. Lui aussi est en
perte de vitesse, après des années de prospérité, et sa part de marché
n’est plus que de 4,8 % en 1992, loin derrière les grands. Les autres
compagnies américaines (Dell, Packard-Bell, HP), les
Japonais (Nec, Toshiba) et les Taiwanais (AST, Acer) se rapprochent
dangereusement. Qu’importe, car Compaq vient de se dénicher un nouveau
président en Europe : Eckhard Pfeiffer. Ce dernier établit une stratégie
très ambitieuse.
Deux ans plus tard, en 1994, sur les 48 millions de microordinateurs
vendus* dans le monde au cours de l’année, 4,8 millions ont été fabriqués
par Compaq. De l’autre côté, après une légère remontée en 1993, les ventes d’IBM
et d’Apple sont retombées à 4 millions chacune pour 1994. Apple peut
se consoler en constatant qu’elle a maintenant « rattrapé » IBM en reculant
moins vite qu’elle.
La question qu’il faut se poser est la suivante : Compaq a-t-il augmenté
sa part de marché en 1994? Nous ne pouvons y répondre sans effectuer
un petit calcul. Il est clair que Compaq détient 1/10 du marché (4,8/48). On peut dire aussi que la proportion du marché détenue par
Compaq est de 10/100 ou 10 %. Ce simple calcul nous permet de mieux
situer cette entreprise dans le temps (elle a doublé sa part de marché
en deux ans) et dans l’espace (elle a rattrapé les autres grands).
La proportion est égale à la partie divisée par le tout.
Pour comparer l’évolution des trois compagnies, nous avons utilisé
un type de rapport très répandu : la proportion, c’est-à-dire la partie
rapportée au tout. Même si la proportion se cache parfois sous un
autre nom (ici, elle s’appelle « part de marché »), il faut savoir la
reconnaître. Il faut aussi être en mesure d’identifier ses deux composantes :
de quelle partie et de quel tout est-il question? Dans
notre exemple, le tout représente la valeur des ventes totales de
microordinateurs et la partie représente les ventes de Compaq. Cette
compagnie a accaparé 10 % du gâteau.
1.2. Une seule vérité, plusieurs visages
Il n’y a qu’une proportion (c’est toujours la partie divisée par le
tout), mais il y a plusieurs manières de la présenter. Calculons la
proportion occupée par IBM tout en gardant à l’esprit que la manière
de présenter ou de nommer des chiffres dépend de l’utilisation que
l’on veut en faire.
La part de marché détenue par IBM est de 4 millions par rapport à
un total de 48 millions d’ordinateurs vendus dans le monde en 1994.
Proportion = Partie/Tout
On peut présenter cette proportion sous forme de :
nombre décimal : 4/48 = 0,083
pourcentage : (4/48) × 100 % = 8,3 %
fraction : 4/48 = 1/12
Pourquoi utiliser une forme ou l’autre?
Le nombre décimal, résultat brut de l’opération effectuée (4
/ 48), risque de semer la confusion chez le lecteur ou l’interlocuteur,
du moins dans ce contexte. Il est cependant bien commode : nous aurons
l’occasion de nous en apercevoir à maintes reprises. D’ailleurs, pour
transformer ce résultat en pourcentage, nous n’avons qu’à déplacer
la virgule de deux crans vers la droite.
Le pourcentage est particulièrement approprié pour présenter
de façon éloquente le poids d’IBM sur le marché : on peut dire que
8,3 % des microordinateurs vendus en 1994 dans le monde ont été fabriqués
par IBM.
La fraction peut présenter des avantages et des inconvénients.
La phrase « un microordinateur sur douze est fabriqué par IBM » sonne
bien. On peut facilement « voir » la proportion en pensant à une douzaine
d’œufs, une douzaine de bouteilles de bière, ou une douzaine d’apôtres.
Mais ici, nous avons eu doublement de la chance : le numérateur ne peut
pas être plus simple et le dénominateur est un beau chiffre rond.
Cela n’arrive pas toujours (et pourtant nos chiffres sont authentiques!).
D’autre part, la fraction n’est pas très commode pour faire des comparaisons.
Compaq obtient 1/10 et IBM 1/12. Qui est le meilleur et quel est l’écart
qui les sépare? Pas évident pour tout le monde. Il est certainement plus simple de comprendre
que Compaq vaut 10 (pour cent) et IBM, 8,3 (pour cent).
Notons également que, contrairement à un mythe très répandu, la fraction,
le pourcentage et le nombre décimal ne sont pas ici trois concepts
différents, mais bien trois manières de présenter un même concept :
la proportion.
La proportion est toujours comprise entre 0 et 1.
Supposons qu’en faisant des crêpes, nous laissions échapper sur le
plancher la douzaine d’œufs dont nous parlions tantôt. Dans le pire
des cas, la proportion d’œufs encore entiers est de 0/12. Dans
le meilleur des cas, cette proportion est de 12/12. La proportion
est donc toujours comprise entre 0 et 1 (ou 0 % et 100 %). De même,
la part de marché d’un fabricant de microordinateurs est théoriquement
comprise entre 0 (le fabricant ne vend rien) et 1 (il détient un monopole).
1.3. Obtenir un chiffre brut à partir d’une proportion
Sachant qu’IBM contrôle 8,3 % d’un marché de 48 millions de microordinateurs,
on devrait être en mesure de retrouver le nombre total d’appareils
vendus par cette firme.
8,3/100 × 48 millions = 3, 984 millions, soit approximativement 4 millions d’unités.
Comme nous avions arrondi notre pourcentage (de 8,3 %), nous pouvons
bien arrondir notre chiffre de vente (à 4 millions).
Partie = Proportion × Tout
Sachant que 8,3 % = 8,3/100 = 0,083, nous pouvons accélérer le calcul
en multipliant directement 48 millions par 0,083.
De façon similaire, si une proportion nous était présentée sous forme
de fraction, nous pourrions quand même reconstituer la donnée correspondante.
Lorsqu’on dit, par exemple, que 4 microordinateurs sur 15 sont produits
par les trois « grands » (sur un total de 48 millions), cela fait combien
d’ordinateurs en tout?
Ici encore, nous n’avons fait que multiplier la proportion
(4/15) par le tout (48 millions) pour obtenir la partie
(12,8 millions). Cette manière de présenter les choses n’est autre
que la célèbre règle de trois.
Un dernier mot sur la proportion que nous venons d’utiliser : 4/15
= 0,266 = 26,6 %. C’est la part combinée des trois grands : Compaq
(10 %), IBM (8,3 %) et Apple (8,3 %). En effet : 10 % + 8,3 % + 8,3 % = 26,6 %.
EXERCICES 1
1. La proportion, à l’endroit, à l’envers
a) En 1990, la consommation de pétrole dans le monde est de 2,8 milliards
de tonnes sur une consommation totale d’énergie de 8,7 milliards de
tonnes (mesurées en équivalent-pétrole). Quelle est la proportion
de pétrole dans la consommation d’énergie?
b) En 1990, le bois représentait 10 % de la consommation totale d’énergie
dans le monde. Le total s’élevait à 8,7 milliards de tonnes d’équivalents
pétrole (TEP). Quelle était alors la quantité de bois consommée (en
TEP)?
c) En 1993-94, le nombre d’entrées au cinéma au Canada était de 78,8
millions. Sachant que 2,3 millions de spectateurs ont fréquenté les
cinémas en plein air, quelle est leur proportion par rapport à tous
ceux qui sont allés au cinéma?
d) En 1985, 97,8 % de la population mondiale vivait dans son pays
natal. Le reste, soit 105,5 millions de personnes vivait dans un autre
pays. Quelle était la population mondiale en 1985?
e) En 1995, la population active chinoise était composée de 406,660
millions d’hommes et 316,623 millions de femmes. Les chiffres pour
le Canada étaient respectivement de 8,353 et 5,607 millions. Quelle
était la proportion de femmes dans la population active de chaque
pays?
Sources : Natur Munich cité dans le Courrier international du 22 septembre 1994
(a et b). Statistique Canada, no 87-211 (c). Banque mondiale 1995
(d et e).
2. La proportion et ses formes
Relevez dans le texte suivant (tiré de la revue Un coup d’œil
sur l’agriculture canadienne d’octobre 1994) les chiffres qui sont
des proportions. Pour chacune des proportions, indiquez sous quelle
forme elle se présente (nombre décimal, pourcentage ou fraction) et
identifiez la partie et le tout qui la constituent.
« Selon la base de données sur la population agricole du recensement
de 1991, parmi les 391 000 exploitants agricoles au Canada 241 000,
ou 62 %, étaient des agriculteurs principaux (ceux dont l’emploi principal
est l’agriculture par opposition aux agriculteurs secondaires). Le
quart des exploitants étaient des femmes. L’Ontario comptait 30 %
des agriculteurs secondaires du Canada. 43 % des agriculteurs secondaires
avaient obtenu un grade ou un diplôme supérieur à un diplôme d’études
secondaires, comparativement à un quart des agriculteurs principaux.
Le tiers des agriculteurs principaux ayant terminé leurs études postsecondaires
ont étudié dans un domaine relié à l’agriculture. Les trois légumes
les plus cultivés (maïs sucré, pois verts, tomates) représentaient
55 % de la superficie consacrée à la culture maraîchère. En 1990,
près de 13 % du produit intérieur brut de la Saskatchewan provenait
de l’agriculture. »
3. Le bien-portant imaginaire
En 1995, quelques jours après la mort de François Mitterrand, son médecin
personnel publiait un livre (aussitôt interdit) décrivant les cachotteries
du président français sur son état de santé. Ce dernier, qui avait
le cancer de la prostate depuis une douzaine d’années, prétendait
être en parfaite santé pour assumer les devoirs de sa charge. La censure,
cette fois, ne fut pas assez rapide : le jour même de l’interdiction
du livre, une copie numérisée de ce dernier avait quitté la France
pour les États-Unis, via l’Écosse. Par la magie du réseau internet, qui prenait alors son essor,
le livre secret était diffusé dans le monde entier.
Complétez les cases vides du tableau 2.1.
4. Le déclin relatif des ordinateurs personnels
Au début de cette section, il était question des parts de marché des principaux fabricants d’ordinateurs au début des années 1990. Comme on peut s’en douter, les ventes totales de microordinateurs (48 millions d’unités en 1994) n’ont cessé de progresser par la suite, pour atteindre un premier plafond en 2011 (avec 355,2 millions d’unités).
Bon nombre des protagonistes des années 1990 sont encore présents en 2011. Parmi les principaux fabricants, on retrouve HP (fusionné avec Compaq depuis 2002, avec 17,2 % du marché), Dell (12,1 %), Acer (11,2 %), Apple (10,7 %) et Lenovo (successeur d’IBM PC, avec 9,3 % du marché). (Source : Gartner.)
Quel était le nombre total de microordinateurs vendus respectivement par HP et par Apple en 2001?
2. LA PROPORTION SOUS TOUTES SES FORMES
Les proportions sont souvent utiles pour traiter les données en sciences
humaines. C’est ce que nous voulons illustrer en vous présentant diverses
situations. Mais avant d’aller plus loin, rappelez-vous qu’il n’y
a qu’une seule proportion (c’est la partie divisée par le tout), même
s’il y a plusieurs manières de l’habiller.
2.1. Où sont passés les soldats?
Après la fin de la Guerre froide, l’armée allemande (la Bundeswehr) se cherche un nouveau rôle (les missions
internationales). Mais voilà, les jeunes Allemands ont, quant à eux,
perdu la vocation. Bien que le service militaire soit obligatoire,
seulement 38 % d’entre eux finissent par le faire. Parmi ceux qui
ne le font pas, il y a d’abord les pacifistes (28 %) qui, pour des
raisons de conscience, refusent d’entrer dans quelque armée que ce
soit. Viennent ensuite les soutiens de familles et autres exemptés
pour raisons personnelles (30 %). Il ne reste déjà plus que 42 % du
contingent. Sur 42 soldats qui se rendent effectivement dans les casernes,
4 sont rejetés pour inaptitude (voir la figure 2.1). On notera que
tous les rapports qui viennent d’être mentionnés sont des proportions.
Voici que deux députés se disputent à coups de proportions dans
l’enceinte du parlement (le Bundestag*). Pour le premier, il y a 4 % d’inaptes (sur 100 appelés, 4 sont jugés inaptes). Pour le second, il y a près
de 10 % d’inaptes (sur 42 jeunes qui se rendent jusqu’à la caserne,
4 sont jugés inaptes). Pour nous, le désaccord n’a rien de mystérieux :
les deux députés comparent la partie (les inaptes) à deux touts
différents. Lorsqu’on a une idée claire de ce qu’est une proportion,
on est déjà moins vulnérable aux trafiquants de chiffres.
Il y a d’ailleurs une bonne façon de réconcilier les députés, c’est
de leur donner tort à tous les deux. La proportion totale de personnes
réellement inaptes au service (parmi tous les jeunes appelés) dépasse
sans doute 4 %, car l’armée n’a pas eu l’occasion de tester les objecteurs
et les exemptés.
2.2. Personne au bout du fil
Les données brutes.
Un bureau d’étude des Pays-Bas* a essayé de rejoindre par téléphone
divers services publics et privés. Sur 750 000 appels effectués par
le biais d’un standardiste, 210 000 se sont avérés infructueux, c’est-à-dire
qu’il a été impossible de rejoindre l’interlocuteur désiré. On peut
déduire de ces données brutes que la proportion d’appels infructueux
(que nous pourrions baptiser taux d’échec) est de 28 % (210/750). La figure 2.2 donne plus de détails.
En passant, pourquoi croyez-vous qu’on a choisi de représenter ces
données avec un diagramme en bâton plutôt qu’avec un diagramme circulaire
comme dans le cas précédent (figure 2.1)?
Quelques nuances s’imposent.
Même si le problème est généralisé (aucun secteur n’y échappe), le
taux d’échec varie en fonction du secteur appelé. Il est presque deux
fois plus grand dans l’administration publique que dans le secteur
des banques et assurances.
Pourquoi est-ce un problème?
Un appel infructueux coûte du temps et mobilise du matériel sans rien
rapporter. Avec un taux d’échec aussi élevé, les pertes sont considérables.
Le Nederlands Economisch Instituut évalue ces pertes à 500 millions
de florins (450 millions de $ CAN). De plus, la personne dont on ne
prend pas en compte la demande se sent frustrée et développe, à la
longue, une aversion face au pourvoyeur de service impliqué.
Comment s’y prendre?
Le problème est généralisé, mais il prend des proportions alarmantes
dans le secteur public. C’est sans doute par là qu’il faudrait commencer.
En fait, il doit y avoir des solutions générales pour l’ensemble du
pays et des solutions particulières à chaque secteur.
Vive les proportions!
Chacun des chiffres de la figure 2.2 est une proportion indépendante.
Nous ne connaissons, par exemple, ni le nombre d’échecs ni le
nombre de tentatives dans le secteur de l’Administration publique.
Nous ne voulons d’ailleurs pas les connaître : seul le rapport
entre ces deux chiffres nous intéresse ici.
2.3. La pauvreté aux États-Unis
La figure 2.3 présente la proportion de familles vivant sous
le seuil de la pauvreté aux États-Unis pour chacune des neuf divisions de recensement. Étant donné que la population varie d’une division à l’autre, il
aurait été difficile de se contenter de simples données brutes (le
nombre de pauvres) pour faire des comparaisons. La carte peut être
une façon originale et très « parlante » de représenter des proportions.
Il est peut-être étonnant de constater que la plus grande proportion
de familles vivant sous le seuil de la pauvreté se trouve sur la côte ouest
du pays en 1992. On aurait pu penser que le Sud serait plus gravement touché
(on y trouve quand même 12,6 % de pauvres). C’est que les chercheurs
qui ont produit cette carte ne se sont pas bornés à comparer le niveau
de revenu des familles : ils ont apporté une correction à ces données
en tenant compte du coût de la vie. C’est peut-être cet ajustement
au coût de la vie qui fait grimper la proportion de familles vivant
sous le seuil de la pauvreté dans la région ouest du pays. Par ailleurs, un État riche et tempéré tel que la Californie est plus susceptible d’attirer les pauvres chez lui que des régions moins favorisées.
Vingt ans plus tard, qu’en est-il de la pauvreté dans le plus riche des grands pays du monde? Au lieu de s’améliorer, la situation n’a fait qu’empirer, à l’exception notable du nord-est du pays, et, dans une moindre mesure, de la côte Pacifique.
EXERCICES 2
1. Le pétrole, nerf de la guerre
Le 2 août 1990, l’Irak envahit le Koweït, qu’il annexe quelques jours plus tard. Le 16 janvier 1991, les États-Unis entrent en guerre contre l’Irak. Pour comprendre le nœud du conflit, quelques données sur les réserves pétrolières pourraient s’avérer plus utiles que des dissertations sur les valeurs démocratiques.
a) Vérifiez que les chiffres présentés dans la figure ci-dessous
représentent bien des proportions.
b) Personnellement, quel type de graphique auriez-vous choisi pour
représenter les données? Justifiez votre réponse.
c) Quelle est la proportion des réserves mondiales de pétrole situées
dans les pays riverains du Golfe Persique?
d) Évaluez le poids qu’aurait eu l’Irak dans le domaine pétrolier
s’il avait annexé le Koweït. Commentez brièvement.
2. Le spectre de Tchernobyl
En 1995, 10 ans après la catastrophe de Tchernobyl, 40,5 % de l’électricité
produite en Ukraine provenait encore de l’énergie nucléaire (4,5 %
pour les deux réacteurs encore en activité à Tchernobyl et 36 %, soit
71 TWH, pour les 14 autres réacteurs). À titre de comparaison,
la proportion d’électricité produite par des centrales nucléaires
représentait alors 0 % en Biélorussie (la région la plus affectée
par la catastrophe), 20 % en République tchèque, 75 % en France (soit 358,6
TWH) et 2 % aux Pays-Bas.
a) Tracez un diagramme en bâton illustrant les proportions dont il
est question dans le texte.
b) Calculez la production totale d’électricité en Ukraine et en France.
c) Recherche : quelles sont les proportions correspondantes pour le
Québec et l’Ontario?
Note : Un TWH (térawatt/heure) = 1 milliard de KWH (kilowattheure).
3. Recherche : La carte électorale
Trouvez ou construisez une carte qui illustre les différentes valeurs
que prend une proportion à travers un territoire (suggestions : la
proportion de votes obtenus par un parti, la proportion de personnes
parlant une langue particulière).
3. LES FRÉQUENCES RELATIVES
Nous avons déjà discuté des fréquences dans le chapitre précédent. Nous
disions par exemple qu’on dénombrait 1 630 000 Musulmans en Bosnie
lors du dernier recensement effectué dans la défunte Yougoslavie.
Ce chiffre est une fréquence (nombre d’individus possédant une caractéristique
donnée), c’est-à-dire une simple donnée brute. Il serait intéressant
de relativiser cette fréquence brute, en comparant le
nombre de Musulmans (la partie) à la population totale (le tout) de
la Bosnie. On obtiendrait alors une fréquence relative.
La fréquence relative est donc une proportion comme une autre, si
ce n’est qu’elle est appliquée systématiquement à chacune des catégories
d’une variable qualitative. Nous reviendrons bientôt sur la Bosnie,
après avoir fait un petit crochet du côté du Québec.
3.1. La famille « monoparentale sans enfant »
Qui sait, ce terme (en instance de brevet) est peut-être destiné à
remplacer un jour le mot « célibataire » dans le dictionnaire de la rectitude politique. Selon le tableau 2.2, on dénombrait, à Montréal, 255 485 ménages
qui répondaient à ce critère en 1993. Nous avons déjà
présenté ces chiffres au chapitre précédent, mais cette fois, nous
avons ajouté deux autres régions pour procéder à des comparaisons.
La fréquence relative mesure la proportion occupée par
chaque catégorie d’une variable.
Réflexion faite, il n’est pas très facile de comparer directement
ces données brutes. C’est pourquoi nous allons calculer la proportion,
ou fréquence relative, de chaque catégorie de ménage. Nous ferons
successivement ces calculs pour chacune des régions.
Fréquence relative d’une catégorie = Fréquence de la catégorie/Fréquence totale
Fréquence relative de ménages d’une personne à Montréal = 255 485/757 525 = 0,337 = 33,7 %
Nous retrouvons ce chiffre dans le tableau 2.3 ci-dessous, ainsi que
toutes les autres fréquences relatives. Sous cette forme, les données
sont plus intéressantes. Elles « parlent » plus. En effet, on se rend
compte, par exemple, que dans la région de Montréal, la proportion
de ménages occupée par la catégorie une personne est plus élevée
que dans l’Outaouais. Inversement, on compte un nombre relativement
plus élevé de « grosses » familles dans l’Outaouais qu’à Montréal. La
région de Québec, quant à elle, se situe entre ces deux extrêmes.
La fréquence cumulée d’une catégorie est égale à la somme
des fréquences de cette catégorie et des catégories précédentes.
Étant donné que la variable nombre de membres du ménage appartient
à une échelle ordinale, nous pouvons grouper des données successives.
Cela nous permettra de tirer encore plus d’information du tableau.
On pourra se demander par exemple si les ménages de 2 personnes ou
moins représentent la majorité. C’est ce que nous avons fait dans
le tableau 2.4 ci-dessous, où nous nous sommes limités à une seule
région. On y verra notamment que Montréal compte 498 805 ménages de
2 personnes ou moins (dans la colonne 2 qui représente les fréquences
cumulées. En termes relatifs, les ménages de 2 personnes ou moins
sont nettement en majorité, puisqu’ils représentent 65,8 % du total
(c’est la fréquence relative cumulée : colonne 4). Ce dernier
chiffre peut être obtenu de deux façons différentes :
1) on divise la fréquence cumulée par la fréquence totale : 498 805
/ 757 525 = 0,658 = 65,8 %;
2) on additionne les fréquences relatives des deux premières
catégories : 33,7 % = 32,1 % = 65,8 %.
Est-ce à dire que la plupart des Montréalais vivent dans des ménages de deux personnes ou moins? Loin de là! Le chiffre de 65,8 %, cité au paragraphe précédent, représente la proportion des ménages, et non celle des individus. On compte en réalité 742 125 individus dans les ménages de deux personnes ou moins (car [255 485 × 1] + [243 320 × 2] = 742 125). Pour les ménages de plus de deux personnes, le calcul est plus approximatif, à cause d’une moins grande précision sur le découpage des classes, mais on peut estimer le nombre total d’individus à au moins 1 000 000.
3.2. La mosaïque des peuples : un tableau à double entrée
Nous vous présentions dans le dernier chapitre un tableau sur la répartition
des différentes nationalités en Bosnie. Nous ajoutons maintenant une
seconde dimension à ce tableau en l’élargissant à l’ensemble des républiques
de l’ex-Fédération de Yougoslavie.
Dans un tableau de fréquences à double entrée,
les colonnes représentent les catégories d’une première variable et
les lignes représentent les catégories d’une seconde variable.
Le tableau 2.5 ci-dessous indique le nombre d’individus (la fréquence)
en fonction de la nationalité à laquelle ils s’identifient et de la
république où ils demeurent au moment du recensement. Il s’agit donc
d’un tableau à deux dimensions ou à double entrée. La variable
Nationalité est divisée en quatre catégories mutuellement exclusives
(les quatre lignes du tableau). Nous avons regroupé dans la dernière
catégorie les autres Slaves (ceux qui se considèrent comme Yougoslaves
tout court, les Slovènes, les Macédoniens, les Bulgares et les Slovaques)
et les non-Slaves (Hongrois, Roumains, Albanais et Turcs). Nous avons
également découpé la variable république en quatre catégories
(les quatre colonnes du tableau). Le tableau 2.5 compte donc 16 cases
(4 lignes × 4 colonnes) en plus des totaux. Comme on le voit, il s’agit
d’une véritable « macédoine » de peuples.
Pour mieux comprendre la situation, il vaut mieux transformer ces
données en fréquences relatives. C’est ce que nous avons fait de deux
façons différentes. Dans le premier cas (tableau 2.6), nous avons
indiqué pour chaque république (chaque colonne) la proportion occupée
par les différentes nationalités. Ainsi, la Croatie compte, à l’époque
du recensement, 12 % de Serbes (car 532/4440 = 0,12 = 12 %) et
77,8 % de Croates (3455/4440 = 0,778 = 77,8 %). On remarque aussi
que les Serbes sont deux fois plus nombreux que les Croates dans l’ensemble
de la Yougoslavie (40,8 % contre 20,7 % dans la colonne Total Yougoslavie).
Le total de chaque colonne donne évidemment 100 %.
Dans le tableau 2.7, nous avons voulu mettre en évidence la répartition des communautés à travers le territoire. Ainsi, on
peut voir à la deuxième ligne du tableau que 78,4 % des Croates habitent
en Croatie proprement dite et que 17,2 % d’entre eux vivent en Bosnie.
D’une façon générale, les deux tableaux de fréquence relative (en
colonnes ou en lignes) illustrent le fait que nationalité et territoire
étaient loin de coïncider dans l’ex-Yougoslavie. On peut, par exemple,
affirmer que 32,7 % des Bosniaques sont des Serbes (tableau 2.6) ou
encore que 23,3 % des Serbes vivent à l’extérieur de la Serbie (tableau
2.7). Tout dépend du point de vue. Et il ne s’agit là que d’un exemple :
les tableaux de fréquences relatives donnent un éclairage particulièrement
riche à la situation.
EXERCICES 3
1. Québec, juste milieu entre deux extrêmes
a) Calculez les fréquences relatives cumulées pour la région de Québec
en vous servant uniquement des données du tableau 2.2.
b) Calculez les fréquences relatives cumulées pour la région de l’Outaouais
vous servant uniquement des données du tableau 2.3.
c) Tracez un histogramme pour la région de Québec en vous servant
des proportions comme unité de mesure sur l’axe vertical.
d) Commentaire : comparez les trois régions.
e) Recherche : mettez les données à jour pour les trois régions.
2. Tableau à double entrée
a) À partir des données du tableau 2.8, construisez deux autres
tableaux contenant les fréquences relatives selon le sexe (en ligne)
et selon la situation sur le marché du travail (en colonne).
b) Corrigez les mensonges suivants : 38,9 % des femmes sont au
chômage et les hommes monopolisent 86,2 % des emplois.
3. Des preuves SVP
On affirme un peu plus haut, dans les commentaires des tableaux 2.6
et 2.7, que 32,7 % des Bosniaques sont des Serbes et que 23,3 % des
Serbes vivent à l’extérieur de la Serbie. Prouvez-le en montrant comment
ces proportions ont été obtenues.
4. D’AUTRES RAPPORTS : LES COMPARAISONS
Les proportions, que nous venons d’observer sous différentes coutures,
sont un type de rapport particulier. Nous allons maintenant examiner
les autres types de rapports.
4.1. Des rats et des hommes
À Cheremietievo (Russie), un avion a été dans l’impossibilité
de décoller (en 1994). Motif : les rats avaient dévoré les fils de
la cabine de pilotage. Le rat a été le compagnon (et l’ennemi) de
l’être humain depuis plusieurs siècles, grâce à ses stupéfiantes capacités
d’adaptation. Il survit par -40° aussi bien que par +40°.
Ses dents peuvent exercer une pression de 1700 kg/cm², ce qui
est suffisant pour percer des blocs de béton ou des tuyaux de plomb.
En un an, une femelle adulte a entre 2 et 8 portées de 8 à 12 petits
capables de se reproduire dès l’âge de trois mois.
Alors que la proportion représente la partie divisée par
le tout, d’autres rapports sont du type variable 1/variable 2.
Il y a dans le monde environ un rat par habitant. À Moscou, ce
taux a nettement augmenté, après l’effondrement du régime communiste :
on comptait, en 1994, cinq rats pour un Moscovite. Ces chiffres représentent
un rapport : de même que l’on disait qu’un microordinateur
sur douze était vendu par IBM, on peut affirmer que Moscou comptait cinq
rats par habitant. Il y a cependant une différence notable entre ces
deux rapports. Alors que le premier est une proportion (les ordinateurs
IBM font partie de l’ensemble des ordinateurs vendus), le deuxième
met en relation deux variables différentes : l’effectif des rats et
l’effectif des humains (les rats ne font pas partie de la population
moscovite!). Il existe ainsi de nombreux rapports qui permettent de
relier des variables différentes (la pression de 1700 kg/cm²
en était un exemple). Pour bien les interpréter, il convient de les
distinguer des proportions, même s’ils se cachent souvent sous le
même déguisement.
Saviez-vous que les rats adorent les câbles électriques (et particulièrement
les câbles d’ordinateur)? Aux États-Unis, on a estimé que 20 % des
incendies étaient provoqués par des rats qui avaient rongé les gaines
des câbles électriques*.
4.2. Comparer deux variables apparemment bien distinctes
Lorsqu’il existe une relation entre deux variables, il peut être intéressant
d’établir un rapport. On parlera ainsi d’habitants au km²
(c’est le territoire qui permet à l’être humain de vivre), de lignes
téléphoniques par habitant (ce sont les gens qui utilisent le téléphone),
de quintaux de blé à l’hectare (c’est la terre qui fait pousser le
blé).
Le coût horaire du travail est un bon exemple de rapport mettant en
jeu deux variables différentes : d’une part les dépenses effectuées
par l’entreprise pour utiliser un travailleur et, d’autre part, le
temps travaillé. On estime qu’en Allemagne (patrie de Mercedes, Volkswagen
et Audi), le coût horaire du travail est de 38,22 $US (en 1994).
Ce coût n’est que de 18, 06 $ en Grande-Bretagne (patrie de... Toyota
et Honda, les fleurons de l’industrie automobile anglaise ayant été
sacrifiés sur l’autel du néolibéralisme thatchérien).
Les travailleurs allemands de l’automobile gagneraient plus
du double de leurs collègues britannique?
Il y a toutefois une différence importante entre le coût payé par
l’entreprise et le salaire reçu par l’ouvrier. L’entreprise doit aussi
tenir compte, dans ses coûts horaires, des congés payés, des cotisations
à l’assurance chômage et à l’assurance maladie, des avantages marginaux,
des primes, etc. On ne peut donc se fier au seul coût horaire pour
déduire le salaire réellement reçu par l’employé.
Par ailleurs, il est possible que les travailleurs allemands méritent
de meilleurs salaires parce qu’ils sont plus productifs que les Anglais.
La productivité est aussi un rapport entre deux variables,
puisqu’elle représente ici la valeur de la production (en dollars) divisée
par la quantité de travail (en heures). Comment les Allemands pourraient-ils
être plus productifs? Les hypothèses sont légion : ils pourraient être
mieux équipés, mieux formés, mieux encadrés, plus motivés, plus vaillants
que leurs collègues britanniques. Mais il s’agit là d’un autre sujet
d’étude.
4.3. Comparer deux variables qui n’en font qu’une
Lorsqu’une variable comporte exactement deux catégories on
utilise souvent le rapport Catégorie 1/Catégorie 2.
Sur mille naissances au Québec, on compte, bon an mal an, 513 garçons pour 487 filles,
ce qui donne en gros 105 garçons pour 100 filles. Si on veut vraiment
être précis (pourquoi pas?), on peut affirmer que pour chaque petite
Québécoise, il naît 1,053 (513/487) petit Québécois. Curieuse façon
de présenter les choses, n’est-ce pas? Mais somme toute, l’information
est passée. On désigne ce rapport par l’expression ratio de masculinité.
Dans cet exemple, on ne peut pas parler de proportion : les 513 garçons
ne font pas partie des 487 filles. Ces garçons et ces filles ne sont
que les deux catégories d’une même variable : les bébés mis au monde.
Nous aurions pu utiliser ici une proportion : 51,3 % des naissances sont
masculines (car 513/ (513 + 487) = 0,513 = 51,3 %). Nous avons pourtant
préféré présenter les choses sous un jour différent. Le ratio de masculinité
(1,053 ou 105,3 pour 100) met mieux en évidence l’écart entre garçons
et filles.
Le tableau 2.9 illustre ce genre de rapport.
Dans la première partie du tableau (colonnes 1 et 2), nous avons choisi de diviser le nombre de filles par le nombre de garçons pour mieux mettre en évidence l’écart entre
les deux seules catégories que compte la variable (car on s’attend
à des écarts, du moins pour certains pays). Par contre, dans la deuxième partie du tableau (colonnes 3 et 4), nous nous sommes contentés d’une simple proportion : dans ce cas-ci,
on se préoccupe moins de mesurer l’écart que de déterminer la distance
qui reste à parcourir pour atteindre le seuil de 50 %.
Comme toujours, il faut interpréter les chiffres avec précaution.
Il se pourrait, par exemple, que beaucoup de femmes adultes
suivent des études secondaires, ou que la différence de taux d’activité
entre sexes ne concerne que la génération la plus âgée.
4.4. Des petites boutiques aux grandes surfaces
On sait que le développement des commerces à grande surface a bouleversé
les habitudes de consommation et entraîné la disparition de nombreux
petits détaillants. Le tableau 2.10 montre que ce phénomène n’a
pas touché tous les membres de l’Union européenne (en 1994) de la
même façon. Les pays les moins avancés (Portugal, Grèce) conservent
relativement plus de détaillants que les pays où le développement
des grandes surfaces est plus ancien.
Est-ce vraiment le seul facteur qui permette d’expliquer l’évolution du phénomène?
On y retrouve aussi une dimension culturelle. La Belgique, dont le
niveau de vie est semblable à celui des Pays-Bas, a tenu à garder
ses petits commerces. Les chiffres du tableau représentent le rapport
entre deux variables (le nombre de magasins et le nombre d’habitants).
Pour rendre les données plus lisibles, et compte tenu du fait qu’il
y a beaucoup plus de clients que de commerçants (merci pour le commerce!),
on a choisi de calculer les magasins par tranche de 10 000 habitants.
On obtient ainsi un éventail de chiffres ni trop gros ni trop petits.
Cela dit, on aurait pu utiliser une autre unité et dire par exemple
que l’Allemagne compte 7 magasins pour 1000 habitants, ce qui est
pareil à 70 magasins pour 10 000 habitants.
4.5. Une forme et un nom adaptés au sujet étudié
Nous vous proposons, pour conclure, une série de rapports entre deux
variables. Nous verrons que les noms et les formes donnés à ces rapports
varient en fonction de l’usage qu’on en fait et de certaines traditions.
On ne peut donc pas se fier uniquement au nom pour comprendre
la nature d’un rapport et on doit être en mesure de
passer d’une forme à l’autre. Le tableau 2.11 permet de
comparer, à travers quelques rapports, le Canada à divers pays.
Les rapports qui mettent en relation deux variables, ou
deux catégories d’une même variable sont souvent appelés ratios,
taux ou même coefficients, mais il s’agit d’une simple
question d’usage. Fiez-vous au concept et non aux mots.
Dans la première colonne de chiffres (taux de natalité), on note que
le rapport concerne deux variables différentes : les naissances ne
constituent pas une des catégories de la population*. Les
deux variables sont néanmoins reliées, car les naissances alimentent
la population et une partie de cette dernière (les parents) est à
l’origine des naissances. L’unité choisie est le nombre de naissances
pour 1000 habitants, ce qui permet de présenter des chiffres ni trop
gros ni trop petits. Le rapport naissance/population a été
baptisé taux, comme beaucoup de rapports qui ne sont pas des
proportions. Cependant, il ne faut pas se laisser impressionner par
cette appellation. Dans des cas plus ou moins similaires, on entendra
parler de coefficients ou de ratios. Parfois même,
le mot taux sera employé pour une proportion (par exemple pour
le taux de chômage qui est la proportion de personnes actives sans emploi).
On observe dans la deuxième colonne du tableau (habitants par médecins)
de grands écarts entre les chiffres, surtout si on compare ces rapports
à ceux de la colonne précédente. Cela ne signifie pas nécessairement
que la disparité soit plus marquée pour ce deuxième rapport. S’il est
vrai que l’accès à un médecin peut être très inégal d’un pays à l’autre
(le rapport est 57 fois plus élevé au Niger qu’au Japon), il faut
reconnaître que les taux de natalité eux aussi sont aussi très éloignés
les uns des autres (au Niger, il est proche du maximum physiologique,
et au Japon, il est proche du minimum).
La colonne 3 illustre ce que l’on a nommé le « taux de pénétration
du téléphone ». Il ne s’agit évidemment pas de la profondeur à laquelle
on peut enfoncer les poteaux téléphonique selon les pays.
On parle plutôt de lignes téléphoniques par habitant (par 1000 habitants
en fait). Selon ce tableau, on trouverait, au Canada, moins de deux
habitants par ligne (1000/577 = 1,73). Serait-ce à cause de la proportion
élevée de « familles monoparentales sans enfants »MD dans la région
montréalaise? Il ne faut pas oublier non plus que certaines personnes
possèdent plusieurs lignes de téléphone alors que, dans le même temps
certaines lignes appartiennent plutôt à des institutions qu’à des
individus.
La colonne 4 illustre ce qu’on a désigné comme étant le taux de couverture
des importations de biens. Dans la mesure où les recettes provenant
des exportations peuvent servir à financer les importations, il est intéressant
d’associer les deux variables dans un tel rapport. Ainsi, l’Égypte,
avec un taux inférieur à 100 %, doit sans doute faire appel à d’autres
sources de financement (tourisme, emprunts) pour payer ses importations,
tandis que le Japon, de son côté, ne sait plus quoi faire de ses devises
étrangères. Que pensez-vous de la position du Canada : le surplus est-il
suffisant pour payer les voyages en Floride et les intérêts sur la
dette extérieure?
a) Quel est le nombre de magasins pour 1000 habitants au Portugal
et aux Pays-Bas?
b) Quel est le nombre de naissances pour 100 habitants en Égypte?
c) Quel est le nombre de médecins pour 10 000 habitants au Canada?
d) Quel est le nombre de médecins pour 1000 habitants au Canada?
e) Montrez que les rapports figurants dans les deux tableaux ne sont
pas des proportions.
2. La bataille d’Angleterre
a) Complétez les cases vides du tableau 2.12 figurant ci-après.
b) Toyota et Ford-Mazda viennent d’annoncer de nouveaux investissements
en Grande-Bretagne. Justifiez leur décision en utilisant les données
du tableau.
c) Avec ou sans l’aide d’un tableur, représentez les salaires sous
forme d’un graphe qui vous semble approprié pour illustrer les différents
coûts horaires dans l’industrie de l’automobile.
EXERCICES SUPPLÉMENTAIRES
1. 1. Les formes de la proportion
a) Dans le texte suivant, identifiez les chiffres qui sont des proportions,
indiquez sous quelle forme (nombre décimal, pourcentage, fraction) ces proportions
se présentent et convertissez-les dans une des autres formes.
« Dans une expérience* menée en collaboration avec une station de
télévision, des personnes ayant regardé un film de 12 secondes relatant
une attaque à main armée, présentée durant le bulletin de nouvelles,
ont eu l’occasion d’identifier l’assaillant sur une rangée de 6 suspects.
Des 2000 spectateurs qui ont appelé après l’émission, seulement 15
% ont été capables d’identifier la bonne personne, un résultat semblable
à ce qu’aurait prédit le simple hasard (1 chance sur 6 = 0,166 = 16,6%). »
b) Recherche : trouvez un texte où les rapports sont présentés sous
leurs différentes formes.
2. Des taux : en veux-tu? En voilà!
Pour chacun des exemples suivants, dites s’il s’agit d’une donnée
brute, d’une proportion ou d’un rapport entre deux variables.
Dans ce dernier cas, identifiez les deux variables concernées. (Note : toutes les données sont authentiques.)
a) Le taux d’abstention au référendum de 1980 au Québec était de 16,0 %.
b) Le taux d’imposition provincial au Québec est de 23 % pour la tranche
de revenu comprise entre 28 900 $ et 31 770 $ (pour l’année fiscale
1994).
c) Il y a une salle de cinéma aux États-Unis pour 10 000 habitants
en 1993.
d) La radio internationale la plus écoutée dans le monde est la BBC
avec un taux d’écoute de 130 millions d’auditeurs réguliers de ses
programmes diffusés en 39 langues en 1993.
e) Le taux de suicide au Sri Lanka est un des plus élevés au monde :
il est de 47 pour 100 000 habitants en 1991.
f) Avant son éclatement, l’Union soviétique avait un taux de nuptialité
de 9,8 pour mille (en 1987).
g) En 1941, les Québécois constituaient 29 % de la population canadienne.
h) Le taux d’élucidation des crimes a été de 36,75 % en France en
1992.
i) En 1971, la ville de Montréal comptait 6,5 % de citoyens ayant
l’italien pour langue d’usage.
j) Selon l’association allemande des propriétaires de chiens, l’Allemagne
ne compte que 5,5 chiens pour 100 habitants contre 21,6 pour les États-Unis,
16,9 pour la France et 13 pour le Canada (en 1993).
k) Entre 1978 et 1992, 13,4 % des bébés-éprouvettes (fécondation in
vitro) sont nés en France, 11,2 % aux États-Unis et 2 % en Allemagne.
l) Au Canada, les exploitants agricoles de sexe masculin sont proportionnellement
à peu près 4 fois plus nombreux que les exploitants de sexe féminin
à avoir fait des études en agronomie (en 1991).
3. Quelques petits calculs peut-être?
a) Calculez le nombre de crimes avec violence au Canada en 1987 et
1992, sachant que le Canada avait un taux de 856 crimes avec violence
pour 100 000 habitants en 1987 et de 1081 pour 100 000 en 1992, et
que la population du pays est passée de 26 549,7 milliers d’habitants
en 1987 à 28,542 en 1992.
b) Calculez le nombre de quotidiens pour 100 000 habitants aux États-Unis
en 1910 et 1989, sachant que les États-Unis comptaient 2202 quotidiens
en 1910 pour une population de 81,7 millions d’habitants et 1642 quotidiens
en 1989 pour une population de 248,8 millions d’habitants.
b) En Chine, le taux de natalité est de 19 pour mille et la population
s’élève à 1 178,4 millions d’habitants (en 1993). Quel est le nombre
de naissances à l’heure? Quel intervalle de temps moyen sépare deux
naissances?
4. Le sirop d’érable, caviar du Québec
Les producteurs de sirop d’érable québécois ont recueilli 54,5 millions
de livres de cet élixir en 1994, ce qui représente 61,3 % de la production
mondiale. La majeure partie la production (70 %) a été vendue à l’extérieur
de la province (voir également le tableau 2.13 figurant ci-après).
a) Quelle est la production mondiale de sirop d’érable en 1994?
b) Quelle est la quantité de sirop d’érable vendue hors du Québec
en 1994?
c) Quelle est la proportion de sirop d’érable exportée (à l’extérieur
du Canada) qui est achetée par le Japon? Par les États-Unis?
d)
Autrefois, la feuille de l’érable à sucre était le symbole des Québécois. Il pourrait d’ailleurs sembler étonnant, en examinant la partie B du tableau 2.13, de voir ce symbole figurer aujourd’hui sur le drapeau du Canada. Commentez ce point de vue, en vous appuyant sur des chiffres dérivés du tableau.
[Réutiliser tous ces chiffres pour un exercice au chapitre 4 : Taux de croissance annuel moyen entre 1994 et 2013. À mettre en parallèle avec le taux de croissance du PIB et le taux d’inflation.
5. Plus de jugements, autant d’exécutions
a) À partir des données du tableau 2.14, calculez les fréquences
relatives pour chacune des catégories de sentences en 1936. Faites
le même exercice pour l’année 1954.
b) Pourquoi est-il impossible ici de calculer des fréquences cumulées?
Pourquoi est-il impossible de tracer un histogramme?
6. La fréquentation des écoles
Le tableau 2.15 indique la répartition des effectifs scolaires au Québec entre 2000 et 2010.
a) Calculez les fréquences relatives pour chaque niveau.
b) Calculez les fréquences relatives cumulées.
7. Le roi de l’aloyau
Le tableau 2.16 nous révèle quelques petits secrets sur les mangeurs.
a) Calculez la proportion de chaque catégorie en 1981 et en 1991.
b) Tracez un diagramme circulaire pour chaque année (suggestion : la
surface de chaque « tarte » pourrait être proportionnelle au total de
chaque année)
c) Faites un commentaire du tableau sans citer aucun chiffre. En quelques
mots, qu’est-ce qu’on observe en 1991? Quels sont les changements par rapport à 1981?