Jump to a key chapter
En général, c'est là qu'interviennent les graphiques et les diagrammes, comme les histogrammes ou les diagrammes de dispersion. Ils sont un excellent moyen de te faire savoir ce qu'un ensemble de données essaie de te dire.
Certains graphiques et diagrammes sont parfaits pour les grands ensembles de données, lorsque tu cherches simplement à dégager des tendances. Mais parfois, pour un ensemble de données plus petit, tu peux vouloir voir ces tendances tout en continuant à voir tous les points de données. Les diagrammes en points sont parfaits pour ce type de données.
Définition d'un diagramme en points
Un diagramme en points est l'option la plus appropriée pour représenter des données lorsque tu travailles avec des ensembles de points de données plus petits. Nous le définissons ci-dessous.
Un diagramme en points est une représentation graphique de la distribution d'un ensemble de données, en utilisant des points pour chaque point de données et des axes pour les valeurs des données.
Comme premier exemple, prenons le diagramme de points suivant qui montre les résultats d'une enquête demandant à chaque élève combien de temps il passe à étudier pour un examen.
Comme tu peux le voir, les diagrammes en points sont généralement organisés avec l'axe \(x) indiquant la plage de valeurs et l'axe \(y) indiquant le nombre de points de données pour chaque valeur ou catégorie.
L'axe des fréquences, généralement l'axe \(y\), n'est pas toujours indiqué car les points représentent les données. Ainsi, un diagramme en points ressemble généralement à une droite numérique montrant les valeurs des données avec, au-dessus, des points représentant chaque point de données. Ici, chaque point représente un élève de la classe.
La hauteur de chaque pile de points représente le nombre de points de données dans cette catégorie. Tu peux voir que le temps d'étude le plus courant est de 2 heures, puisque 6 élèves ont étudié 2 heures, et qu'un élève est une valeur aberrante puisque le temps consacré à l'étude était de 9 heures.
Tu peux également voir que le graphique est, dans l'ensemble, biaisé vers la gauche en faveur des valeurs les plus petites.
Les diagrammes en points peuvent sembler encombrés s'il y a trop de points ou de valeurs. C'est pourquoi les diagrammes en points conviennent mieux aux ensembles de données de petite taille qu'aux ensembles de données de grande taille comportant de nombreux points de données.
Exemples de diagrammes en points
Examinons un exemple de données qui conviendrait à un diagramme en points et voyons comment construire un diagramme en points à partir d'un ensemble de données.
Ton professeur de mathématiques demande aux élèves de mesurer leur taille en pouces et de l'inscrire sur une liste de classe. Elle écrit ensuite la liste des tailles au tableau comme suit ,
\60, 66, 64, 63, 65, 66, 75, 63, 67, 65, 61, 59, 68, &61,\N- 60, 66, 64, 63, 65, 66, 75, 63, 67, 65, 61, 59, 68.
Solution :
Commence par fabriquer ton axe horizontal pour tes données. Trouve la valeur la plus basse, ici, 58 pouces, et la valeur la plus haute, 75 pouces, dans ta liste de données.
Trace une ligne de nombres qui couvre au moins cette plage de nombres, et dépasse peut-être un peu les deux extrémités pour que ton graphique soit agréable à regarder.
Commence ensuite à placer des points au-dessus de ta ligne numérique pour chaque point de données, en plaçant un point par point de données au-dessus de la valeur de ce point de données. Au fur et à mesure que tu places un point sur la ligne des nombres, barre-le sur ta liste pour que tu te souviennes que tu l'as déjà tracé.
\60, 66, 64, 63, 65, 66, 75, 63, 67, 65, 61, 59, 68].
Continue à remplir ton graphique en points jusqu'à ce que tu aies barré tous les points de données de ta liste.
Comme tu peux le voir, le diagramme en points organise tous les points de données. Tu peux voir combien d'élèves ont la même taille, quelle taille est la plus fréquente. Cela te donne une assez bonne vue d'ensemble de la liste que l'enseignant a recueillie.
L'étendue d'un graphique en pointillés
Nous nous souvenons que l'étendue d'un ensemble de données est la différence entre la valeur la plus élevée et la valeur la plus basse. Cela s'applique également à l'étendue d'un graphique en pointillés.
L'étendue sur un graphique en points est la différence entre la valeur la plus élevée et la valeur la plus basse des données.
Reprenons l'exemple précédent de notre ensemble de données et de notre graphique en points,
\[61, 58, 62, 63, 70, 68, 63, 59, 61, 60, 66, 64, 63, 65, 66, 75, 63, 67, 65, 61, 59, 68.\]
Trouver les valeurs les plus élevées et les plus basses dans la liste de données n'est pas forcément rapide. Mais sur un graphique en pointillés, c'est beaucoup plus facile !
- Pour trouver la valeur la plus basse, concentre-toi sur la valeur la plus à gauche sur un graphique horizontal, ici, 58 pouces.
- Pour trouver la valeur la plus élevée, concentre-toi sur l'extrémité droite d'un graphique horizontal, ici, 75 pouces.
- Maintenant, pour trouver l'étendue, soustrais les deux valeurs ci-dessus pour obtenir [75-58=17].
Comment trouver la moyenne, la médiane et le mode des diagrammes à points ?
Pour obtenir des définitions, des formules et des exemples sur la moyenne, la médiane et le mode, reporte-toi à Moyenne, médiane et mode.
Moyenne
Pour trouver la moyenne de l'ensemble des données du diagramme à points, tu peux toujours énumérer les points de données, les additionner et les diviser par le nombre de points du diagramme. Mais tu peux aussi gagner un peu de temps grâce à un petit raccourci expliqué ci-après.
Reprenons notre exemple précédent pour voir comment procéder.
En prenant le même exemple que ci-dessus, trouve la moyenne à partir du diagramme à points correspondant.
Solution :
Étape 1.
Multiplie le nombre de points de données, c'est-à-dire les points, dans une catégorie de valeur particulière par la valeur.
1ère valeur. \(58\cdot 1=58\).
Répète cette étape pour chaque valeur de ton axe.
2e valeur. \(59\cdot 2=118\).
3e valeur. \N(60\Ncdot 1=60\N).
4e valeur. \N(61\Ncdot 3=183\N).
5ème valeur. \(62 \cdot 1=62 \c).
6ème valeur. \(63 \cdot 4=252 \c).
7ème valeur. \(64 \cdot 1=64 \c).
8ème valeur. \(65 \cdot 2=130\c).
9ème valeur. \(66 \cdot 2=132 \c).
10ème valeur. \(67 \cdot 1=67 \c).
11ème valeur. \(68) 2=136).
12ème valeur. \(70 \cdot 1=70 \c).
13ème valeur. \(75 \cdot 1=75 \c).
Étape 2.
Additionne les produits que tu viens de trouver, tu obtiendras ainsi la somme totale des données,
\[\begin{align}&58+118+60+183+62+252+\\&64+130+132+67+136+70+75=1407.\end{align}\]
Étape 3.
Divise la somme obtenue à l'étape 1 par le nombre de points de données de ton graphique trouvé à l'étape 2, c'est la moyenne de tes données,
\[\frac{\text{Nombre total de données}}{\text{Nombre d'élèves}}=\frac{1407}{22}=63,95 \quad \text{pouces}.\N]
Médiane
Comme pour la moyenne, tu peux toujours énumérer les points de données et trouver la valeur centrale lorsque tu cherches la médiane. Mais le diagramme en points devrait déjà contenir des données classées de la plus petite à la plus grande, ce qui ne devrait donc pas être très différent de la recherche de la médiane à partir du diagramme lui-même. Encore une fois, nous allons utiliser l'exemple ci-dessus pour trouver la médiane.
En prenant le même exemple que ci-dessus, trouve la médiane à partir du diagramme en points correspondant.
Solution :
Étape 1.
Détermine si l'ensemble de données a un nombre pair ou impair de points de données.
- Les ensembles avec un nombre impair de points de données ont une valeur de l'ensemble comme médiane.
- Les ensembles ayant un nombre pair de points de données ont deux valeurs au milieu parce que l'ensemble peut être divisé en deux parties égales. La médiane est la moyenne de ces deux valeurs.
Ici, le diagramme en points de la taille des élèves comporte 22 points de données.
Étape 2.
Divise le nombre de points de données par 2, pour obtenir [22\div2=11.\N].
Étape 3.
Commence par le point de données le plus petit et barre chaque point au fur et à mesure que tu comptes.
- Si tu as un nombre impair de points de données et que tu obtiens une décimale, arrondis à l'unité supérieure. C'est le numéro du point de données jusqu'auquel tu dois compter pour trouver ta médiane.
- Si tu as un nombre pair de points de données et que tu obtiens un nombre entier, compte jusqu'à ce nombre de points de données, en commençant par le plus petit point de données. Utilise ce point et le suivant dans la liste pour trouver la médiane en faisant la moyenne des deux valeurs.
Pour cet ensemble de 22 points de données, la médiane sera la moyenne des 11e et 12e points de données.
Le 11e point de données est 63 pouces, et le 12e point de données est 63 pouces. La moyenne de 63 et 63 est 63. La médiane de cet ensemble de données est donc 63 pouces.
Mode
Les diagrammes en points sont parfaits pour identifier facilement le mode d'un ensemble de données. Cherche simplement la colonne de points la plus haute, ou la plus longue si ton graphique est horizontal. La valeur associée à cette colonne est le mode.
Nous allons prendre le même exemple, pour voir comment cela peut se faire.
Nous remarquons que la colonne de points la plus haute est 63, et que le mode est donc 63 pouces.
Rappelle-toi qu'il est possible d'avoir plusieurs modes ou pas de mode du tout. Bien que s'il n'y a pas de mode, un diagramme en points ne serait probablement pas la meilleure représentation de cet ensemble de données.
Comparaison des diagrammes en pointillés
Comme les diagrammes en points donnent une bonne vue d'ensemble d'un ensemble de données, ils peuvent également être utiles pour comparer deux ensembles de données différents sur des sujets connexes.
En fait, en regardant les diagrammes en points, tu peux trouver les modes et les comparer.
Bien que tu ne puisses pas trouver la moyenne et la médiane simplement en regardant, l'asymétrie des tracés peut te permettre de savoir quel ensemble aura une moyenne ou une médiane plus élevée.
Nous rappelons les définitions ci-dessous avant de prendre un exemple sur la façon de comparer des diagrammes à points.
Les données sont asymétriques lorsque la majorité d'entre elles sont situées à l'extrémité gauche ou à l'extrémité droite du graphique. On a l'impression que le graphique "penche" vers une direction plutôt que d'être symétrique.
Un graphique incliné vers la gauche aura une moyenne et une médiane plus faibles qu'un graphique incliné vers la droite.
Pour identifier les valeurs aberrantes et les grappes et pour faire des déductions sur les raisons qui sous-tendent les données, nous rappelons ce qui suit.
Une valeur aberrante est un point de données qui est beaucoup plus élevé ou beaucoup plus bas que la majorité des données. Il s'agit généralement d'un point unique qui se trouve très loin à une extrémité du graphique, avec généralement un écart considérable entre lui et le reste des données.
On parle de grappe lorsqu'il y a un regroupement de plusieurs points de données sur un petit intervalle. Une grappe peut parfois faire pencher un graphique vers la gauche ou vers la droite.
Nous prenons l'exemple ci-dessous, pour voir comment les choses se passent.
Examinons deux diagrammes en points pour faire quelques comparaisons.
Tu trouveras ci-dessous les diagrammes de points montrant les points par match d'une équipe de softball sur deux saisons consécutives. Voyons ce que nous pouvons déduire de ces données.
- Tout d'abord, examinons le mode. Au cours de la saison 2020, le score de jeu le plus courant était de 3 points, tandis qu'au cours de la saison 2021, il était de 5 points.
- Ensuite, examinons l'écart et l'asymétrie. L'écart, ou l'étendue, des deux ensembles de données est proche. En fait, l'étendue du premier tracé est de 11 et l'étendue du second tracé est de 12. Mais les données de la saison 2020 sont légèrement inclinées vers la gauche, en direction des plus petits nombres, et les données de la saison 2021 sont légèrement plus symétriques ou centrées. Cela suggère que la moyenne et la médiane des scores seront un peu plus élevées au cours de la saison 2021.
- Tu peux également examiner les valeurs aberrantes et les grappes. Pour la saison 2020, le match au score le plus élevé de 11 points est un peu aberrant. Au cours de la saison 2021, il y a un cluster de matchs à score élevé de 10 à 12 points, ce qui montre que les matchs à score élevé étaient plus fréquents au cours de cette saison.
Si tu cherchais à analyser les progrès de cette équipe au cours des deux saisons, ces comparaisons pourraient être très utiles. Les graphiques montrent que l'équipe a connu une meilleure saison en 2021, ce qui pourrait t'inciter à en chercher les raisons. L'équipe a-t-elle commis moins d'erreurs cette saison-là ? L'équipe est-elle restée la même, les joueurs étant plus matures et plus expérimentés ? Y a-t-il eu plus de home runs ou de RBI, ce qui a contribué aux scores élevés des matchs ?
Il existe en fait deux types de diagrammes en points.
- Les diagrammes à points les plus courants, illustrés ci-dessus, sont appelés diagrammes à points de Wilkinson, du nom de Leland Wilkinson, un statisticien américain.
- Le deuxième type de diagramme à points est appelé diagramme à points de Cleveland, du nom de William S. Cleveland, un informaticien américain. Un diagramme à points de Cleveland utilise un seul point dans chaque catégorie pour indiquer la fréquence de cette catégorie. Les diagrammes de Cleveland sont également plus susceptibles d'être affichés horizontalement.
Tu trouveras ci-dessous un point plot de Cleveland des données de l'exemple précédent, à savoir les scores des matchs de la saison 2020 d'une équipe de softball.
Le principal avantage ici est que le tracé est beaucoup moins encombré, ce qui le rend utile pour les ensembles de données plus importants. Il permet également d'afficher plusieurs ensembles de données sur un même graphique, en différenciant les ensembles en changeant la forme ou la couleur des points.
Tu trouveras ci-dessous un graphique des deux saisons de scores de l'équipe de softball.
Avantages et inconvénients des diagrammes à points
Nous nous souvenons que les histogrammes utilisent des barres pour représenter des groupes de données, ce qui peut être très utile pour les grands ensembles de données ainsi que pour les ensembles plus petits. Étant donné qu'un diagramme en points est similaire à un histogramme, tu te demandes peut-être : "en quoi les dot plots sont-ils différents ou meilleurs que les histogrammes ?".
Nous énumérons ici quelques avantages des diagrammes en points.
- Les diagrammes en points montrent chaque point de données de l'ensemble.
- Ils constituent également une représentation simple des données, qui te donne cet "instantané" que tu cherches peut-être pour tes données. Grâce au diagramme en points de tes données, tu peux voir à quel point les données sont dispersées et si elles sont inclinées vers une extrémité de la droite numérique ou vers l'autre. Il est également facile d'identifier les grappes, les valeurs aberrantes et les écarts dans les valeurs de tes données.
- Tu peux aussi te faire une idée des mesures de tendance centrale (moyenne, médiane et mode), même si tu ne peux pas les identifier exactement.
- Les diagrammes en points peuvent également être utilisés pour des données quantitatives ou catégorielles.
En ce qui concerne les inconvénients, nous les énumérons ci-dessous,
- Le principal inconvénient des diagrammes en points est qu'ils ne conviennent pas aux grands ensembles de données. Le graphique deviendrait rapidement encombré et confus. La construction du diagramme en points peut aussi prendre un peu de temps, selon le nombre de points de données de ton ensemble et la façon dont tes données sont présentées.
- La moyenne et la médiane peuvent aussi être quelque peu difficiles à trouver à partir du diagramme en points. Il n'est pas beaucoup plus facile de calculer ces valeurs à partir du graphique que de les calculer simplement à partir de la liste de données. De plus, s'il n'y a qu'un seul point de données pour chaque valeur, les données doivent être regroupées en intervalles de classe (ou bacs), ce qui conviendrait mieux à un histogramme.
Diagramme en points - Points clés à retenir
- Un diagramme en points est une représentation graphique des points d'une liste de données à l'aide de points sur un axe horizontal ou une ligne numérique.
- Les diagrammes en points conviennent mieux aux petits ensembles de données.
- Les diagrammes en points te permettent de voir facilement de nombreuses caractéristiques d'un ensemble de données, telles que la dispersion, l'asymétrie, la forme, les grappes, les écarts et les valeurs aberrantes.
Apprends avec 4 fiches de Diagramme en points dans l'application gratuite StudySmarter
Nous avons 14,000 fiches sur les paysages dynamiques.
Tu as déjà un compte ? Connecte-toi
Questions fréquemment posées en Diagramme en points
À propos de StudySmarter
StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.
En savoir plus