Sauter à un chapitre clé
Définition d'un quartile
Supposons que tu disposes d'un ensemble d'observations et que tu veuilles en trouver les quartiles. Tu pourrais penser qu'étant donné que les quartiles et les quarts partagent la même racine (quart, qui signifie un quart), le quartile est juste un quart de tes données. Pas tout à fait, mais presque !
Un quartile est une division des observations en quatre intervalles définis en fonction des valeurs des observations et de leur comparaison avec le reste de l'ensemble des observations.
Cela semble beaucoup plus compliqué que ça ne l'est. Pour simplifier, les quartiles délimitent \(25\%\) des données, c'est pourquoi les quartiles sont souvent nommés d'après les pourcentages :
le premier quartile, \(Q_1\), est le \(25^{\text{th}}\) percentile ;
le deuxième quartile, \(Q_2\), est le \(50^{\text{th}}\) percentile ; et
le troisième quartile, \(Q_3\), est le \(75^{\text{th}}\) percentile.
Le deuxième quartile est toujours la médiane de ton ensemble de données.
Si tu as un nombre impair d'observations dans ton ensemble de données, exclue la médiane lorsque tu trouves les quartiles !
Prenons un exemple rapide.
Supposons que tu disposes de l'ensemble de données \(\N{43, 52, 68, 79, 94, 100, 113\}\). Trouve le premier, le deuxième et le troisième quartile.
Solution :
Les observations de l'ensemble de données sont déjà ordonnées, ce qui est pratique ! Il y a \(n=7\) observations, ce qui est un nombre impair, tu devras donc exclure la médiane de l'ensemble lorsque tu calculeras les quartiles. Dans ce cas, la médiane est \(79\), c'est donc elle que tu dois exclure.
La moitié inférieure de l'ensemble de données serait \N(\N{43, 52, 68\N}), et la médiane de cet ensemble de données est \N(52\N), donc le premier quartile est \N(Q_1 = 52\N).
Le deuxième quartile est la médiane (qui est le point que tu as exclu puisqu'il y a un nombre impair de points de données), donc le deuxième quartile est \(Q_2 = 79\).
La moitié supérieure de l'ensemble de données serait \N(\N{94, 100, 113\N}), et la médiane de cet ensemble de données est \N(100\N), donc le troisième quartile est \N(Q_3 = 100\N).
Voyons d'autres exemples de la façon dont les graphiques, les médianes et les quartiles sont liés.
Médiane et quartiles
Si tu as une distribution normale, la moyenne et la médiane sont identiques. Comme le graphique de la distribution normale est symétrique, le deuxième quartile se trouve au centre du graphique. Les distributions normales ont également les propriétés suivantes pour la moyenne \(\mu\) et l'écart type \(\sigma\) :
\(Q_1 = \mu - 0,675 \sigma \) ;
\N(Q_2 = \Nmu\N) ; et
\N(Q_3 = \Nmu + 0,675 \Nsigma \N).
Tu peux te demander comment quelqu'un a pu trouver cette formule. Rappelle-toi que la distribution normale standard a \(\mu=0\) et \(\sigma = 1\). De plus, le score \N(z\N) qui te donne \N(25\N%) de l'aire sous la courbe entre \N(0\N) et \N(z\N) est \N(z=0,675\N). Ainsi, tout ce que font les formules ci-dessus, c'est déplacer les informations de la distribution normale standard vers une distribution normale qui a une moyenne et un écart type différents.
Fig. 1 - Quartiles d'un graphique de distribution normale.
Si tu regardes un diagramme en boîte, il est relativement facile de voir où se trouvent les quartiles en regardant le diagramme. Un diagramme en boîte est conçu pour te montrer exactement où se trouvent les quartiles.
Que faire si les données sont asymétriques ? Dans le graphique ci-dessous, les données sont asymétriques à gauche. Tu peux quand même marquer les quartiles, et ils correspondront à la médiane des données, et non à la moyenne.
Types de quartiles
Il existe deux types principaux de quartiles, le quartile supérieur et le quartile inférieur. Tous deux dépendent de l'existence d'un ensemble ordonné d'observations.
Le quartile supérieur est la médiane de la moitié supérieure de l'ensemble des données.
Le quartile inférieur est la médiane de la moitié inférieure de l'ensemble de données.
Si \(n\) est impair, la médiane de l'ensemble des données est exclue lors du calcul des quartiles supérieur et inférieur.
N'oublie pas que la médiane résiste mieux aux valeurs aberrantes ou à l'asymétrie de tes données. C'est pourquoi les quartiles supérieur et inférieur utilisent la médiane et non la moyenne dans leurs calculs.
Prenons un exemple rapide.
Suppose que tu aies l'ensemble de données de l'exemple précédent, \N(\N{43, 52, 68, 79, 94, 100, 113\}\N). Trouve les quartiles supérieur et inférieur.
Solution :
La moitié inférieure de l'ensemble de données serait \N(\N{43, 52, 68 \N}), et la médiane est \N(52 \N), donc le quartile inférieur serait \N(52 \N). Remarque qu'il s'agit de la même chose que le \N(Q_1\N).
La moitié supérieure de l'ensemble de données serait \N(\N{94, 100, 113\N}), et la médiane est 100, donc le quartile supérieur est \N(100\N), ce qui est identique à \N(Q_3\N).
Le quartile supérieur sera-t-il toujours identique à \N(Q_3\N) et le quartile inférieur à \N(Q_1\N) ? Oui, car c'est ainsi qu'ils sont définis ! Pour t'en assurer, regarde un autre exemple.
Prenons l'ensemble de données \(\{6, 8, 15, 36, 40, 41, 41, 43, 43, 48\}\). Trouve \(Q_1\), \(Q_2\), et \(Q_3\), ainsi que les quartiles supérieur et inférieur.
Solution :
Pour cet ensemble de données, il y a un nombre pair de points, donc aucun ne devra être mis de côté pour trouver les quartiles. Les points sont déjà ordonnés et la médiane de l'ensemble est la suivante
\[\text{médiane} = \frac{40+41}{2} = 40,5 = Q_2.\]
La moitié inférieure de l'ensemble de données est \N (\N{6, 8, 15, 36, 40\N}\N), et la médiane de cet ensemble est \N(15\N). Ainsi
\[\texte{quartile inférieur} = 15 = Q_1.\]
La moitié supérieure de l'ensemble de données est \N(\N{41, 41, 43, 43, 48\N}), et la médiane de cet ensemble est \N(43\N). Donc
\N-[\N-texte{quartile supérieur} = 43 = Q_3.\N]
L'étendue des quartiles
L'étendue de ton ensemble de données est relativement simple à trouver.
L'étendue de l'ensemble de données est la valeur la plus élevée moins la valeur la plus basse.
L'écart interquartile est un autre terme que tu peux rencontrer.
L'écart interquartile, souvent abrégé IQR, est la différence entre le quartile supérieur et le quartile inférieur.
IQR = quartile supérieur - quartile inférieur.
Rappelle-toi que l'écart type est une mesure de la dispersion des données d'un ensemble ; en d'autres termes, il mesure la distance entre les observations et le centre de l'ensemble de données (la moyenne).
L'écart interquartile est également une mesure de la dispersion des données d'un ensemble en examinant la moitié centrale des données :
si l'écart interquartile est petit, la moitié centrale des données est étroitement groupée, ce qui indique une faible variabilité ; mais
si l'écart interquartile est grand, la moitié centrale des données est plus étalée, ce qui indique une plus grande variabilité.
En examinant la moitié centrale des données, l'écart interquartile évite d'être influencé par des valeurs aberrantes ou extrêmes.
Tu peux aussi voir une référence à l'écart semi-interquartile.
L'écart semi-interquartile correspond à la moitié de l'écart interquartile.
Voyons un exemple de recherche de ces éléments pour un ensemble de données.
Revenons à l'ensemble de données \N(\N{43, 52, 68, 79, 94, 100, 113\N}\N). Tu sais déjà que \(Q_1 = 52\N), \N(Q_2 = 79\N) et \N(Q_3 = 100\N). Trouve l'intervalle, l'intervalle interquartile et l'intervalle semi-interquartile.
Solution :
L'étendue est la valeur la plus élevée de l'ensemble moins la valeur la plus basse de l'ensemble, donc
\[\text{range} = 113-43 = 70.\]
L'intervalle interquartile est
\[\begin{align}\text{IQR} &= Q_3 - Q_1 \\ &= 100-52\\ &=48. \N-[\N-]Fin{align}\N-[\N-]
L'intervalle semi-interquartile est la moitié de l'IQR, donc
\[\text{semi-interquartile range} = \frac{48}{2}=24.\N]
D'autres exemples sont toujours les bienvenus !
Exemples de quartiles
Voyons d'autres exemples impliquant les quartiles.
Supposons que ton ensemble de données soit \N(\N{0,0,0,0,0,0,0,0,1,1,1,3, 17, 300\}\N). Trouve les premier, deuxième et troisième quartiles, ainsi que l'étendue et l'écart interquartile.
Solution :
Cet ensemble de données est un peu inhabituel puisque \(0\N) est répété \N(10\N) fois ! L'étendue est la plus grande valeur moins la plus grande valeur, donc
\N-[\N-text{range} = 100 - 0 = 100.\N]
Il y a \(16\) observations dans l'ensemble de données, et la médiane est \(0\). Donc \N(Q_2 = 0\N). En fait, la moitié inférieure de l'ensemble de données est entièrement constituée de zéros, donc \(Q_1=0\) également.
Pour la moitié supérieure de l'ensemble de données, tu as \N(\N{0,0,1,1,1,3, 17, 300\N}), et la médiane de cet ensemble est \N(1\N), donc \N(Q_3=1\N). En trouvant l'IQR, tu obtiens
\[\text{IQR} = Q_3-Q_1 = 1-0=1.\]
La faible valeur de l'IQR indique que la moitié centrale des données n'a pas beaucoup de variabilité. Tu peux dresser la liste des quartiles des données :
- quartile le plus bas (25%) des observations : \(\{0,0,0,0\}\) ;
- quartile le plus élevé (25 %) d'observations : \N(1, 3, 17, 300}\N) ; et
- moyenne (50 %) des observations : \(\{0, 0, 0, 0,0,0, 1, 1\}\).
Comme tu peux le voir, la moitié (50 %) des observations sont regroupées autour de zéro, ce qui explique pourquoi l'IQR est si petit. Il n'est pas affecté par les valeurs extrêmes de la partie la plus élevée (25 %) des observations.
L'exemple suivant montre comment tu peux utiliser les diagrammes en boîte pour déterminer les quartiles et calculer les intervalles interquartiles et semi-interquartiles.
Le diagramme en boîte ci-dessous montre la distribution des âges des animaux de compagnie dans une garderie pour chiens où l'âge est mesuré en années. À l'aide des informations présentées sur le diagramme en boîte, calcule l'écart interquartile ainsi que l'écart semi-interquartile.
Solution :
Tout d'abord, tu dois trouver les valeurs de \(Q_1\) et \(Q_3\). Tu peux le faire en les lisant sur le diagramme en boîte :
- \N(Q_1 = 5,5\N) ; et
- \(Q_3 = 10\).
Ensuite, calcule l'écart interquartile à l'aide de la formule :
\[ \begin{align} IQR & = Q_3 - Q_1 \N- &= 10-5.5 \N- &= 4.5. \ND{align}\N- \N- \N- \N- \N]
Enfin, calcule l'intervalle semi-interquartile :
\[ \begin{align} \text{semi-interquartile range} &= \frac{IQR}{2} \\N&= \frac{4,5}{2} \N&= 2,25.\Nend{align}\N]
Les unités de chacune des réponses sont des années.
Quartiles - Points clés
- Chaque quartile représente \(25\%\) des valeurs d'un ensemble de données ordonnées.
- Le quartile inférieur est désigné par \(Q_1\) et le quartile supérieur par \(Q_3\). Le deuxième quartile est désigné par \(Q_2\).
- Pour calculer \(Q_2\), calcule la médiane de l'ensemble des données.
- Les quartiles supérieur et inférieur sont calculés en déterminant respectivement les médianes des moitiés supérieure et inférieure de l'ensemble de données. S'il y a un nombre impair de valeurs dans l'ensemble de données, la médiane est exclue du calcul des quartiles supérieur et inférieur.
- L'écart interquartile est égal à \(Q_3 - Q_1\) et l'écart semi-interquartile est égal à la moitié de l'écart interquartile.
Apprends plus vite avec les 11 fiches sur Quartiles
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Quartiles
À propos de StudySmarter
StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.
En savoir plus