Sauter à un chapitre clé
Signification de l'intervalle de confiance pour une proportion de population
Tout d'abord, voyons la définition d'un intervalle de confiance pour une proportion de population.
Un intervalle de confiance pour une proportion de la population peut être décrit comme le niveau de certitude que la proportion réelle ou effective de la population se situe dans une fourchette de valeurs estimée.
Pour un rappel sur la recherche de ces intervalles, et le niveau de confiance, jette un coup d'œil à l'article Intervalles de confiance.
Reprenons l'exemple du cacao.
Il y a eu \(20\) cabosses de cacao échantillonnées et \(8\) d'entre elles étaient malades. Cela te donne une proportion de population de 40 %.
Cela signifie-t-il que \N(40\N%) de toutes les cabosses de cacao sont malades ?- Non ! Ce que cela signifie, c'est qu'environ 40 % d'entre elles sont malades.
Alors, que signifie "environ" en termes techniques ?
Eh bien, cela dépend du degré de confiance que tu veux avoir.
- L'intervalle de confiance pour la proportion de la population te donne une fourchette de valeurs proches de \(40\%\) dans laquelle tu peux dire que le pourcentage réel de gousses malades se trouve.
- La taille de l'intervalle sera plus petite si tu veux être plus confiant, et elle sera plus grande si tu veux être moins confiant.
Comment déterminer l'intervalle de confiance pour une proportion de la population ? Tout d'abord, tu dois examiner certains termes que tu vas utiliser.
Proportion de la population
Lorsqu'il s'agit d'estimer une caractéristique de la population - comme la proportion de la population \( (p) \) - la première étape consiste à choisir une statistique d'échantillon appropriée. Qu'est-ce qu'une statistique d'échantillon appropriée pour estimer une proportion de la population ? Eh bien, le choix habituel est uneproportion de la population , \( \hat{p} \). Elle est définie par :
Laproportion de lapopulation est :
\[ \hat{p} = \frac{\text{nombre de succès}}{\text{taille de l'échantillon}}.\]
Voyons cela à l'aide d'un exemple.
Dans l'exemple du cacao au début de l'article, \(20\) cabosses de cacao ont été échantillonnées et \(8\) d'entre elles étaient malades.
Dans le contexte de cet exemple, un succès est une cabosse malade. Donc,
\[ \begin{align}\hat{p} &= \frac{\text{number of successes}}{\text{sample size}} \\N-&= \frac{8}{20} \N- &= 0.4.\N- [end{align}\N]
Remarque que ce chiffre est identique à la proportion de gousses malades, ce qui correspond à ce à quoi tu t'attendais.
Erreur standard
La distribution d'échantillonnage d'une statistique a son propre écart type qui décrit à quel point les valeurs de la statistique varient entre les échantillons.
Si une distribution d'échantillonnage est étroitement centrée sur la valeur réelle de la population, un petit écart type garantit que les valeurs de la statistique seront étroitement groupées autour de la valeur réelle de la population.
Cela signifie que la valeur de la statistique aura tendance à être proche de la valeur de la population, et tu peux considérer la statistique comme un estimateur sans biais de cette caractéristique.
Pour plus d'informations sur les biais, voir Sources de biais dans les enquêtes, Sources de biais dans les expériences et Estimations ponctuelles biaisées et non biaisées.
Parce que l'écart-type d'une distribution d'échantillonnage est si important pour déterminer l'exactitude d'une estimation, il porte un nom spécial : l'erreur-type. Elle est définie comme suit :
L'erreur standard, \( \sigma \), d'une proportion de la population, \( \hat{p} \), décrit l'étendue de ses valeurs autour de la valeur réelle de la proportion de la population. Si la taille de l'échantillon est importante, l'erreur standard a tendance à être faible.
La formule de l'erreur standard d'une proportion de la population est la suivante :
\[ \sigma_{\hat{p}} = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\]
où,
\N(n\N) est la taille de l'échantillon et
\( \hat{p} \) est la proportion de la population.
En bref, une statistique sans biais avec une petite erreur type est susceptible de donner lieu à une estimation proche de la valeur réelle de la caractéristique de la population.
Dans l'exemple du cacao au début de l'article, \(20\) cabosses de cacao ont été échantillonnées et \(8\) d'entre elles étaient malades. Quelle est l'erreur standard de la proportion de la population ?
Solution :
Pour cet exemple, \(n = 20\) et tu as déjà calculé que \(\hat{p} = 0,4\). En utilisant la formule,
\[\begin{align}\sigma_{\hat{p}} & = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \\N-&= \sqrt{\frac{0,4(1-0,4)}{20}} \N-&= \sqrt{0.12} \N-&= 0.1095\N- [end{align}\N]
arrondi à \(4\) décimales.
Niveau de confiance
Qu'est-ce que le niveau de confiance?
Le niveau de confiance est une mesure du taux de réussite de la méthode de construction de l'intervalle, et non un commentaire sur la population. Il est associé à l'intervalle de confiance.
Le niveau de confiance que tu utilises peut varier, les choix les plus courants étant \N(90\N%), \N(95\N%), et \N(99\N%). Le niveau de confiance \(95\%\) est le plus populaire parmi les statisticiens car il offre un compromis raisonnable entre la confiance et la précision.
Tu seras peut-être amené à travailler avec des niveaux de confiance de \(90%\) ou de \(99%\). Ce n'est pas une épreuve puisqu'il suffit d'entrer les bonnes valeurs critiques. Tu trouveras ci-dessous un tableau des valeurs pour les niveaux de confiance \N(90%%), \N(95%%) et \N(99%%).
Niveau de confiance | Valeur critique |
\(90\%\) | \(1.645\) |
\(95\%\) | \(1.96\) |
\(99\%\) | \(2.58\) |
Attention : tu ne peux pas utiliser \(0,95\) comme valeur critique pour un niveau de confiance de \(95\%\) ! C'est une erreur courante.
Remarque que plus le niveau de confiance augmente, plus la valeur critique augmente. Cela signifie que plus le niveau de confiance que tu choisis est élevé, plus ton intervalle de confiance sera large. En revanche, plus tu choisis un niveau de confiance faible, plus tu cours le risque de te tromper.
Marge d'erreur
Dans l'exemple de l'article de presse ci-dessus, les résultats du sondage sont donnés comme suit : \(65\% \pm 3.2\%\). Qu'est-ce que c'est que ce \(\pm 3.2\%\) ? C'est la marge d'erreur.
La marge d'erreur mesure le degré de précision d'un résultat estimé par rapport à la valeur réelle, avec un certain niveau de confiance.
La marge d'erreur dépend de ton niveau de confiance et équivaut également à la moitié de la largeur de l'intervalle de confiance !
La marge d'erreur est également liée à l'erreur standard et équivaut au produit de la valeur critique et de l'erreur standard. Elle s'exprime donc comme suit :
\[\text{marge d'erreur } = (\text{valeur critique})(\text{erreur standard}).\]
Revenons à l'exemple du cacao.
Dans l'exemple du cacao au début de l'article, \(20\) cabosses de cacao ont été échantillonnées et \(8\) d'entre elles étaient malades. Dans l'exemple de la section "Erreur standard", tu as trouvé que \( \hat{p} = 0,4 \N) et l'erreur standard est d'environ \( 0,1095 \N). Trouve la marge d'erreur pour le
- \(90\%\),
- \N(95\N%), et
- \N(99\N%).
Solution :
Utilise les valeurs critiques pour les niveaux de confiance \N(90%), \N(95%) et \N(99%) indiqués dans le tableau ci-dessus.
- For the \(90\%\) confidence level, the critical value is \(1.645\), so\[\begin{align}\text{margin of error for } 90\% &= (\text{valeur critique})(\text{erreur standard}) \\N&= (1,645)(0,1095) \N&\Napprox 0,18.\Nend{align}\N]
- De même, pour le niveau de confiance \N(95\N%), la valeur critique est \N(1,96\N), donc\N[\Nbegin{align}\Ntext{marge d'erreur pour \N-95\N% &= (1,645)(0,1095) \N(1,645)(0,1095)]. 95\% &= (\text{valeur critique})(\text{erreur standard}) \\N&= (1,96)(0,1095) \N&\Napprox 0,21.\Nend{align}\N]
- Finally, for the \(99\%\)confidence level, the critical value is \(1.96\), so\[\begin{align}\text{margin of error for } 99\% &= (\text{valeur critique})(\text{erreur standard}) \\N&= (2,58)(0,1095) \N&\Napprox 0,54.\Nend{align}\N]
Exprimons les résultats du niveau de confiance de 95 % en quelques mots.
- Rappelle-toi que \(40\%) des gousses se sont révélées malades. Ce que la marge d'erreur t'indique, c'est qu'au niveau de confiance de 95 %, tu peux être sûr que pour tout échantillon aléatoire de cabosses de cacao, le pourcentage de cabosses malades sera de 40 % avec une marge d'erreur de 21 %.
En comparant les résultats des trois niveaux de confiance, tu remarqueras que la marge d'erreur augmente avec le niveau de confiance ! En d'autres termes, plus tu veux être sûr du résultat, plus ton erreur risque d'être importante.
Attention, la marge d'erreur peut ne pas être exacte si la taille de l'échantillon n'est pas assez grande ! Lis la suite pour comprendre pourquoi.
Trouver les intervalles de confiance d'une proportion de la population
Avant de déterminer l'intervalle de confiance d'une proportion de population, deux conditions doivent être remplies par l'élément d'information donné :
Les données doivent être représentatives.
La taille de l'échantillon doit être suffisamment grande.
Examinons chacune de ces conditions un peu plus en détail.
Données représentatives
Pour déterminer l'intervalle de confiance, tu dois t'assurer que les données de l'échantillon sont vraiment représentatives de l'ensemble de la population. Si c'est le cas, cela est généralement mentionné dans l'énoncé du problème. Cependant, si cela est explicitement indiqué, tu devras alors le mentionner tout en communiquant tes résultats.
Dans l'exemple sur les cabosses de cacao, tu ne sais pas comment les données sont recueillies. Tu ne peux donc pas dire si les données sont représentatives ou non. Si tu fais une analyse statistique basée sur ces données, tu devras dire quelque chose comme :
Aucune information n'est donnée sur la façon dont l'échantillon a été sélectionné. Par conséquent, les résultats ne sont valables que si l'échantillon sélectionné était représentatif de l'ensemble de la population.
Lorsque l'échantillonnage est aléatoire, les échantillons peuvent être considérés comme représentatifs de la population totale.
Taille de l'échantillon requise
La taille de l'échantillon doit être suffisamment importante. C'est ainsi que tu peux utiliser le théorème de la limite centrale pour faire l'hypothèse que la distribution est approximativement normale. Mais comment sais-tu quelle doit être la taille de ton échantillon ? Il y a une vérification standard que tu peux faire. Tu as besoin que les deux :
\[n\hat{p}\ge 10\]
et
\N-[n(1-\hat{p})\Nsoit 10.\N].
Cette condition implique qu'il y ait au moins \(10\) résultats positifs, ainsi qu'un minimum de \(10\) résultats négatifs.
Tu peux aussi voir les termes "succès" et "échecs" au lieu de "positifs" et "négatifs".
Tout comme la plupart des statisticiens utilisent le niveau de confiance \(95\%\), la plupart d'entre eux utilisent également \(10\) pour le nombre de résultats positifs et négatifs. Tu espères obtenir un nombre beaucoup plus grand que \(10\) !
Dans l'exemple précédent avec les cabosses de cacao, la taille de l'échantillon est-elle suffisante ?
Dans une exploitation de cacao, Indodo, le propriétaire de l'exploitation, a prélevé un échantillon de \(20\) cabosses de cacao et s'est rendu compte que \(8\) d'entre elles étaient malades. Détermine si la taille de l'échantillon est suffisante pour trouver un intervalle de confiance approprié.
Solution :
Rappelle-toi que la proportion de la population est \( \hat{p} = 0,4 \r). Par conséquent ,
\[ n \hat{p} = (20)(0,4) = 8 \]
et
\N- n (1 - \Nhat{p}) = (20)(0,6) = 12 \N]
Puisque \( n \hat{p} < 10 \r}), ces données ne remplissent pas les conditions requises pour déterminer un intervalle de confiance approprié. C'est pourquoi la marge d'erreur dans l'exemple précédent était si importante !
Examinons la question sous un angle différent.
En supposant qu'Indodo réalise un échantillon aléatoire, et qu'il trouve que \( \hat{p} = 0.4 \r}) à chaque fois, quelle taille doit avoir son échantillon pour que l'on puisse dire que l'échantillon est suffisamment grand ?
Solution :
- Tu essaies de trouver la taille de l'échantillon \(n\N) qui te donne à la fois\N[ n \hat{p} \geq 10 \N]et\N[ n (1 - \hat{p}) \Ngeq 10. \N].
- En utilisant \N( \Nhat{p} = 0.4 \N), cela signifie que tu as besoin de\N[ \Nbegin{align}0.4 n &\Ngeq 10 \N{n &\Ngeq \Nfrac{10}{0.4}]. \N-n &\Ngeq 25.\N- \Nend{align} \N-et\N[ \N-n (1 - 0.4) &\N- 10 \N-n (0.6) &\N- 10 \N-n &\N- \N- 10}{0.6} \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- _COPY1 \N-n &\N- 17.\N- End{align} \]
En choisissant la plus grande des deux valeurs pour \N(n\N), Indodo doit échantillonner au moins \N(25\N) cabosses pour s'assurer que l'échantillon est suffisamment grand pour trouver un intervalle de confiance approprié.
Maintenant que tu sais quand tu peux trouver un intervalle de confiance pour une proportion de population de manière appropriée, voyons comment le faire réellement.
La formule des intervalles de confiance pour une proportion de population
Pour déterminer l'intervalle de confiance d'une population, utilise la formule :
\[ \hat{p} \pm (\text{valeur critique}) \sqrt{ \frac{ \hat{p} (1 - \hat{p}) }{n} } \]
où,
\( \hat{p} \) est la proportion de la population,
\( \text{critical value} \) est la valeur critique du niveau de confiance, et
\N(n\N) est la taille de l'échantillon.
Remarque qu'il s'agit de la même chose que :
\[ \text{proportion de la population} \pm \text{marge d'erreur}.\]
Plutôt que d'utiliser la formule tout de suite, voyons les étapes à suivre pour calculer l'intervalle de confiance.
Étapes du calcul de l'intervalle de confiance pour une proportion de la population
Lorsque tu veux trouver l'intervalle de confiance d'une proportion de la population, tu suis le processus de \(5\) étape pour les problèmes d'estimation, connu sous l'acronyme EMC3. Ces étapes sont résumées comme suit :
E: Estimation - Explique quelle caractéristique de la population tu as l'intention d'estimer.
M: Méthode - Décide de la méthode d'inférence statistique que tu veux utiliser.
Pour utiliser les intervalles de confiance pour une méthode de proportion de population, ton problème doit répondre à ces exigences :
La question te demande une estimation.
La situation implique l'utilisation de données d'échantillon.
Le type de données impliquées est une variable catégorielle.
Il n'y a qu'un seul échantillon.
C: Vérifier - Il y a \Ndes conditions qui doivent être remplies afin d'utiliser l'intervalle de confiance d'une proportion de la population :
Les données doivent être vraiment représentatives de la population et
La taille de l'échantillon doit être suffisamment grande.
C: Calculer - Utilise la formule pour calculer l'intervalle de confiance.
C: Communiquer - Réponds à la question posée dans le problème, en indiquant ce que tu as appris des données et en abordant les risques ou les lacunes éventuelles.
Continue avec l'exemple de la ferme de cacao :
Indodo a décidé de procéder à un nouvel échantillonnage des cabosses de cacao de sa ferme. Il en échantillonne \(100\) et constate que \(25\) d'entre elles sont malades. En te basant sur ces données, que peux-tu apprendre sur la proportion de cabosses de cacao qui sont malades dans l'ensemble de la ferme ?
Solution :
- E: Estimation -Explique quelle caractéristique de la population tu as l'intention d'estimer.
- Tu vas estimer la valeur de \( \hat{p} \), la proportion de cabosses de cacao de la ferme qui sont malades.
M: Méthode - Décide de la méthode d'inférence statistique que tu veux utiliser.
Parce que :
la question te demande une estimation,
la situation implique l'utilisation de données d'échantillon,
le type de données impliquées est une variable catégorielle, et
il n'y a qu'un seul échantillon,
tu peux utiliser la méthode des intervalles de confiance pour une proportion de population.
Comme un niveau de confiance est associé à l'intervalle de confiance, tu dois spécifier un niveau de confiance pour le problème. Un niveau de confiance n'est pas donné, alors utilise un niveau de confiance de \(95\%\).
C: Vérifier - Il y a \(2\) conditions qui doivent être remplies pour utiliser l'intervalle de confiance d'une proportion de la population :
Les données doivent être vraiment représentatives de la population.
- Il n'est pas précisé comment Indodo a choisi les gousses pour l'échantillon, donc tu ne sais pas si les données sont représentatives.
- Cela signifie que tu devras supposer que les données sont représentatives de la population et inclure une déclaration indiquant que tu ne disposes pas de cette information lorsque tu présenteras les résultats.
- Il n'est pas précisé comment Indodo a choisi les gousses pour l'échantillon, donc tu ne sais pas si les données sont représentatives.
La taille de l'échantillon doit être suffisamment grande.Pour cet exemple, un succès est défini comme la découverte d'une gousse malade. Puisqu'il a échantillonné \(100\) gousses, \( n = 100\N) et\N[ \Nbegin{align}\Nhat{p} &= \Nfrac{ \Ntext{nombre de réussites} }{ \text{taille de l'échantillon} } \\N-&= \frac{25}{100} = 0.25.\N- end{align} \]So,\[ \begin{align}n \hat{p} &= (100)(0.25) \\&= 25 \geq 10\end{align} \]and\[ \begin{align}n (1 - \hat{p}) &= 100 (1 - 0.25) \\&= 100 (0.75) \\&= 75 \geq 10.\end{align} \] Comme les deux vérifications de la taille de l'échantillon requise sont supérieures ou égales à \(10\), la taille de l'échantillon est suffisamment grande.
- C: Calculer -Utilise la formule pour calculer l'intervalle de confiance.
- La taille de l'échantillon est \N( n = 100 \N).
- La proportion de la population est \N( \hat{p} = 0,25 \N).
- Le niveau de confiance est de 95 %, donc la valeur critique du niveau de confiance est de 1,96.
- Trouve l'erreur standard.\[ \begin{align}\text{standard error } &= \sqrt{ \frac{ \hat{p} (1 - \hat{p}) }{n} } \N-&= \sqrt{ \frac{0.25 (1 - 0.25)}{100} } \N-&= \sqrt{0.001875} \\N-&\N-approx 0.0433\N-end{align} \]
- Find the margin of error.Using the critical value for the \(95\%\) confidence level, the margin of error is:\[ \begin{align}\text{margin of error for } 95\% &= (\text{valeur critique})(\text{erreur standard}) \\N-&= (1.96) (0.0433) \N-&\N-approx 0.084.\N- end{align} \]
- Trouve l'intervalle de confiance.Tu peux maintenant construire l'intervalle de confiance en utilisant :\[ \hat{p} \pm \text{marge d'erreur} = 0.25 \pm 0.085, \]donc l'intervalle est :\[ (0.25 - 0.085, 0.25 + 0.085 ) = (0.165, 0.335). \]
- C: Communiquer - Réponds à la question posée dans le problème, en indiquant ce que tu as appris des données et en abordant les risques ou les lacunes potentielles.
- Tout d'abord, une déclaration sur le niveau de confiance.
- La méthode utilisée pour construire l'intervalle de confiance garantit que la proportion réelle de la population est contenue dans l'intervalle de confiance dans environ \(95\%\) des cas.
- Aucune information n'est donnée sur la façon dont l'échantillon a été sélectionné. Par conséquent, les résultats ne sont valables que si l'échantillon sélectionné était représentatif de l'ensemble de la population.
- Ensuite, une déclaration sur les résultats par rapport au problème réel.
- Si l'échantillon a été sélectionné de manière raisonnable, tu peux être certain que la proportion réelle de cabosses de cacao malades se situe entre 0,165 et 0,335.
- En termes de pourcentage, tu peux être certain que le pourcentage réel de cabosses de cacao malades se situe entre 16,5 et 33,5 %.
- Tout d'abord, une déclaration sur le niveau de confiance.
Il est toujours bon d'avoir plus d'exemples !
Exemples d'intervalles de confiance pour une proportion de la population
Il est toujours utile de voir les étapes utilisées, alors voyons quelques exemples de calcul d'intervalles de confiance et discutons des résultats.
Tu étudies les habitudes de déménagement des adultes américains âgés de 21 ans ou plus qui ont déménagé chez eux ou chez des amis au cours de l'année précédente. Tu as mené une enquête auprès de 843 adultes américains âgés de 21 ans ou plus, et 62 d'entre eux ont déclaré avoir emménagé chez des amis ou des parents au cours de l'année précédente. Sur la base de ces données, que peux-tu apprendre sur la proportion de tous les adultes américains âgés de 21 ans ou plus qui ont emménagé chez des amis ou des parents au cours de l'année précédente ?
Solution :
E: Estimation - Explique quelle caractéristique de la population tu as l'intention d'estimer.
Tu es en train d'estimer la valeur de \( \hat{p} \), la proportion d'adultes américains âgés de \(21\) ans ou plus qui ont emménagé chez des amis ou des parents au cours de l'année écoulée.
M: Méthode - Décide de la méthode d'inférence statistique que tu veux utiliser.
Parce que :
la question te demande une estimation,
la situation implique l'utilisation d'un échantillon de données,
le type de données impliquées est une variable catégorielle, et
il n'y a qu'un seul échantillon,tu peux utiliser la méthode des intervalles de confiance pour une proportion de population.
Comme un niveau de confiance est associé à l'intervalle de confiance, tu dois spécifier un niveau de confiance pour le problème. Un niveau de confiance n'est pas donné, alors utilise un niveau de confiance de \(95\%\).
C: Vérifier - Il y a \(2\) conditions qui doivent être remplies pour utiliser l'intervalle de confiance d'une proportion de la population :
Les données doivent être vraiment représentatives de la population.
- Il n'est pas précisé comment l'échantillon a été sélectionné, tu ne sais donc pas si les données sont représentatives.
- Cela signifie que tu devras supposer que les données sont représentatives de la population et inclure une déclaration indiquant que tu ne disposes pas de cette information lorsque tu présentes les résultats.
- Il n'est pas précisé comment l'échantillon a été sélectionné, tu ne sais donc pas si les données sont représentatives.
La taille de l'échantillon doit être suffisamment grande.
Pour cet exemple, un succès est défini comme un adulte qui emménage avec des amis ou des parents. Étant donné que l'échantillon comprenait 843 adultes, \N( n = 843 \N) et\N[ \Nbut{alignement}\Nhat{p} &= \Nfrac{ \Ntext{nombre de réussites} }{ \text{taille de l'échantillon} } \\N-&= \Nfrac{62}{843} \Napprox 0.0735.\Nend{align} \N-Donc,\N[ \N-n \hat{p} &= (843)(0.0735) \N-&= 62 \N-geq 10\N- end{align} \N-et[\N-n (1 - \Nhat{p}) &= 843 (1 - 0.0735) \N-&= 843 (0.9265) \N-&= 781.0395 \N-geq 10.\N-end{align} \] Comme les deux vérifications de la taille de l'échantillon requise sont supérieures ou égales à \(10\), la taille de l'échantillon est suffisamment grande.
C: Calculer - Utilise la formule pour calculer l'intervalle de confiance.
- La taille de l'échantillon est de \( n = 843 \N).
- La proportion de la population est \N( \hat{p} = 0,0735 \N).
- Le niveau de confiance est de 95 %, donc la valeur critique du niveau de confiance est de 1,96.
- L'intervalle de confiance est le suivant :\[ \bgin{align}\hat{p} &\pm (\text{critical value}) \sqrt{ \frac{ \hat{p} (1 - \hat{p}) }{n}]. } \\N-0.0735 &\N-pm 1.96 \sqrt{ \frac{(0.0735) (1 - 0.0735)}{843} } \N-0,0735 &\Npm 1,96 \Nsqrt{0,00008078} \N-0.0735 &\Npm 0.0176\Nend{align} \] Written in interval notation, you have:\[ \begin{align}\text{confidence interval} &= (0.0735 - 0.0176, 0.0735 + 0.0176) \\&= (0.0559, 0.0911)\end{align} \]
C: Communiquer - Réponds à la question posée dans le problème, en indiquant ce que tu as appris des données et en abordant les risques ou les lacunes éventuelles.
Intervalle de confiance :Si l'échantillon a été sélectionné de manière à représenter véritablement la population, tu peux être certain que la proportion réelle d'adultes américains âgés de 21 ans ou plus qui sont retournés vivre chez eux ou chez des amis au cours de l'année précédente se situe entre 0,0559 et 0,0911.
Niveau de confiance :La méthode que tu as utilisée pour déterminer l'estimation de l'intervalle réussit à capturer la valeur réelle de la proportion de la population environ \(95\%\) du temps.Aucune information n'est donnée sur la façon dont l'échantillon a été sélectionné. Par conséquent, les résultats ne sont valables que si l'échantillon sélectionné était représentatif de l'ensemble de la population.
Examine ta réponse et l'énoncé de cet exemple que tu viens de conclure. Tu peux faire des comparaisons avec les conclusions de ton prochain exemple.
Dans une étude portant sur 10 000 parents, 40 % des parents âgés de 18 à 34 ans ont créé un compte sur les médias sociaux pour leur bébé. En supposant que cette population est représentative, détermine les intervalles de confiance pour une proportion de la population avec des niveaux de confiance de \(90\%\), \(95\%\) et \(99\%\).
Solution :
E: Estimation - Explique quelle caractéristique de la population tu as l'intention d'estimer.
Tu es en train d'estimer la valeur de \( \hat{p} \), la proportion de parents âgés de \(18\) à \(34\) ans qui ont créé un compte de média social pour leurs bébés.
M: Méthode - Décide de la méthode d'inférence statistique que tu veux utiliser.
Parce que :
la question te demande une estimation,
la situation implique l'utilisation d'un échantillon de données,
le type de données impliquées est une variable catégorielle, et
il n'y a qu'un seul échantillon,tu peux utiliser la méthode des intervalles de confiance pour une proportion de population.
Des niveaux de confiance de \(90\%\), \(95\%\), et \(99\%\) ont été spécifiés.
C: Vérification - Certaines conditions doivent être remplies pour pouvoir utiliser l'intervalle de confiance d'une proportion de population :
Les données doivent être vraiment représentatives de la population.
- On t'a dit de supposer que la population de l'échantillon est représentative.
- Cela signifie que tu devras inclure une déclaration sur le fait que les résultats ne sont valables que si l'échantillon sélectionné était représentatif de l'ensemble de la population lorsque tu présenteras les résultats.
- On t'a dit de supposer que la population de l'échantillon est représentative.
La taille de l'échantillon doit être suffisamment importante.
Pour cet exemple, un succès est défini comme un parent qui crée un profil de média social pour son bébé. Puisque l'échantillon comprenait \(10000\N) parents, \N( n = 10000\N) et\N[ \Nbegin{align}\Nhat{p} &= \Nfrac{ \Ntext{nombre de réussites} }{ \text{taille de l'échantillon} } \\N-&= \frac{(10000)(0.40)}{10000} = 0.4.\N- end{align} \N-Donc,\N[ \N-n \hat{p} &= (10000)(0.4) \N-&= 4000 \N-geq 10\N- end{align} \N-et[\N-n (1 - \Nhat{p}) &= 10000 (1 - 0.4) \N-&= 10000 (0.6) \N-&= 6000 \N-geq 10.\N-end{align} \] Comme les deux vérifications de la taille de l'échantillon requise sont supérieures ou égales à \(10\), la taille de l'échantillon est suffisamment grande.
C: Calculer - Utilise la formule pour calculer l'intervalle de confiance.
- La taille de l'échantillon est de \( n = 10000 \).
- La proportion de la population est \N( \hat{p} = 0,4 \N).
- Les niveaux de confiance sont :
- \N- 90 \N% \N- et la valeur critique de \N- 90 \N% \N- est \N- \N- ( \N-text{valeur critique} = 1,645 \N-).
- \( 95\% \), and the critical value of \( 95\% \) is \( \text{critical value} = 1.96 \).
- \( 99\% \), and the critical value of \( 99\% \) is \( \text{critical value} = 2.58 \).
- Les intervalles de confiance sont :
- Pour un niveau de confiance de \( 90\% \N) :\[ \Nbegin{align}\Nhat{p} &\Npm (\Ntext{valeur critique}) \Nsqrt{ \Nfrac{ \Nhat{p} (1 - \Nhat{p}) }{n} } \\N-0.4 &\Npm 1.645 \sqrt{ \frac{(0.4) (1 - 0.4)}{10000} } \N-0.4 &\Npm 1.645 \Nsqrt{0.000024} \N-0.4 &\Npm 0.008\N-end{align} \] Ecrit en notation d'intervalle, tu as :\N[ \Nbegin{align}\Ntext{confidence interval} &= (0.4 - 0.008, 0.4 + 0.008) \N&= (0.392, 0.408)\Nend{align} \]
- Pour un niveau de confiance de \( 95\% \) :\[ \begin{align}\hat{p} &\pm (\text{critical value}) \sqrt{ \frac{ \hat{p} (1 - \hat{p}) }{n} } \\N-0.4 &\Npm 1.96 \sqrt{ \frac{(0.4) (1 - 0.4)}{10000} } \N-0.4 &\Npm 1.96 \Nsqrt{0.000024} \\N-0.4 &\Npm 0.0096\N- end{align} \] Ecrit en notation d'intervalle, tu as :\N[ \Nbegin{align}\Ntext{confidence interval} &= (0.4 - 0.0096, 0.4 + 0.0096) \N&= (0.3904, 0.4096)\Nend{align} \]
- Pour un niveau de confiance de \( 99\% \) :\[ \begin{align}\hat{p} &\pm (\text{critical value}) \sqrt{ \frac{ \hat{p} (1 - \hat{p}) }{n} } \\N-0.4 &\Npm 2.58 \sqrt{ \frac{(0.4) (1 - 0.4)}{10000} } \N-0.4 &\Npm 2.58 \Nsqrt{0.000024} \N-0.4 &\Npm 0.0126\N-end{align} \] Ecrit en notation d'intervalle, tu as :\N[ \Nbegin{align}\Ntext{confidence interval} &= (0.4 - 0.0126, 0.4 + 0.0126) \N&= (0.3874, 0.4126)\Nend{align} \]
C: Communiquer - Réponds à la question posée dans le problème, en indiquant ce que tu as appris à partir des données et en abordant les risques potentiels ou les lacunes.
Intervalle de confiance :En supposant que l'échantillon soit vraiment représentatif de la population, pour un niveau de confiance de 90 %, la valeur réelle devrait se situer entre 39,2 % et 40,8 %. Pour un niveau de confiance de 95 %, la valeur réelle doit être comprise entre 39,04 % et 40,96 %. En revanche, pour un niveau de confiance de 99 %, la valeur réelle devrait se situer entre 38,74 % et 41,26 %.Que peux-tu déduire du résultat ci-dessus, qui applique trois niveaux de confiance ?
Tu peux dire que le niveau de confiance de 90 % a le plus petit intervalle de 1,6 % (de 40,8 % à 39,2 %), suivi de 95 % avec un intervalle de 2 % et enfin de 99 % avec un intervalle de 2,6 %.
Une taille d'intervalle plus petite signifie que tu es plus proche de la valeur réelle ; cependant, un niveau de confiance plus faible signifie une assurance réduite de l'exactitude ou de la précision que la valeur réelle se trouve là. Tu vois maintenant que si tu souhaites avoir plus d'assurance (comme le montre le niveau de confiance de \(99\%)), tu préfères que l'intervalle soit aussi petit que possible pour le rapprocher de la valeur réelle (comme le montre le niveau de confiance de \(90\%)). Par conséquent, il est raisonnablement sûr de s'appuyer sur le niveau de confiance \(95\%\).
Niveau de confiance :La méthode que tu as utilisée pour déterminer l'estimation de l'intervalle réussit à capturer la valeur réelle de la proportion de la population environ \(90\%), \(95\%), ou \(99\%) du temps, selon l'intervalle que tu choisis de considérer.On t'a dit de supposer que l'échantillon était vraiment représentatif de la population. Par conséquent, les résultats ne sont valables que si l'échantillon sélectionné est réellement représentatif de l'ensemble de la population.
Plus tôt, on t'a demandé de faire des comparaisons entre les résultats des deux exemples.
La principale comparaison à faire est la taille de l'intervalle, même avec le même niveau de confiance (\(95\%)).
La réponse du premier exemple a une taille d'intervalle de \(3,52\\N), tandis que celle du deuxième exemple a une taille d'intervalle de \N(2\N).
À ton avis, qu'est-ce qui explique cette différence de taille d'intervalle, bien que le niveau de confiance soit le même, à savoir 95 % ?
Tu remarqueras que la taille de l'échantillon du premier exemple est de \(843\) alors que celle du second est de \(10000\). Cela signifie simplement que plus la taille de l'échantillon est grande, plus la valeur réelle est précise.
Voici un autre exemple pour plus de clarté.
Mary et sa sœur jumelle Elizabeth se sont lancées séparément dans une enquête aléatoire dans la même région impliquant le soutien à la construction d'une école pilote. Les intervalles de confiance de Mary pour la proportion de la population sont \N((0,34, 0,41)\N), et ceux d'Elizabeth sont \N((0,37, 0,39)\N).
- Comment expliquer la différence entre les intervalles de confiance, même à l'intérieur d'une même zone ?
- Quel intervalle de confiance est le plus précis ?
- En supposant que les deux ont un niveau de confiance de \(95\%\), détermine quel résultat a été obtenu à partir d'un échantillon de plus petite taille, en expliquant pourquoi.
- En supposant que les deux aient utilisé la même taille d'échantillon, détermine qui aurait utilisé un niveau de confiance plus élevé et donne ta justification.
Solution :
- Bien que les deux personnes aient travaillé dans la même zone d'échantillonnage, plusieurs facteurs peuvent affecter l'uniformité de leurs résultats.
- Tout d'abord, ils auraient pu travailler avec des échantillons de taille différente. Rappelle-toi qu'une taille d'échantillon plus importante signifie une marge d'erreur plus faible. Par conséquent, la différence d'intervalle serait plus petite.
- Un autre facteur est le niveau de confiance. Si un niveau de confiance plus élevé est utilisé, même avec la même taille de population, la limite entre les intervalles sera plus large, ce qui signifie moins de précision. Par contre, un niveau de confiance plus bas donnera une frontière plus petite entre les intervalles, ce qui signifie plus de précision, mais au détriment du niveau d'assurance.
- À partir des intervalles, la taille de la limite serait calculée pour déterminer le degré de précision.Dans le cas de Mary :\[ 0,41 - 0,34 = 0,07 \]Dans le cas d'Elizabeth :\[ 0,39 - 0,37 = 0,02 \]
- Sachant qu'une taille de frontière plus petite signifie une plus grande précision, tu peux dire que le résultat d'Elizabeth est plus précis.
- Si les deux ont mené leur enquête avec un niveau de confiance de \(95\%\), la taille de l'échantillon devient alors la seule base sur laquelle la précision est déterminée. Une taille d'échantillon plus importante signifierait une plus grande précision en raison d'une marge d'erreur plus petite. Comme le résultat d'Elizabeth est plus précis, cela signifie qu'elle a travaillé avec un échantillon plus grand que celui de Mary.
- Par conséquent, la taille de l'échantillon de Marie était plus petite.
- Si les deux ont mené leur enquête avec la même taille d'échantillon, le niveau de confiance devient la seule base pour déterminer la précision. Le résultat d'Elizabeth étant plus précis, cela signifie qu'une limite de confiance inférieure a été utilisée.
- Par conséquent, Marie aurait utilisé un niveau de confiance plus élevé.
Par conséquent, "plus la taille de ton échantillon est grande, plus tu es précis".
Intervalles de confiance pour une proportion de la population - Principaux enseignements
- Un intervalle de confiance pour une proportion de la population peut être décrit comme le niveau de certitude que la proportion réelle ou effective de la population se situe dans une fourchette de valeurs estimée.
- \Des conditions majeures doivent être remplies avant de déterminer l'intervalle de confiance d'une proportion de la population :
- Les données doivent être réellement représentatives de la population et
- La taille de l'échantillon doit être suffisamment importante.
- La formule utilisée pour trouver l'intervalle de confiance d'une proportion de population est la suivante :
\[ \hat{p} ± (\text{valeur critique}) \sqrt{ \frac{ \hat{p} (1 - \hat{p}) }{n}]. } \]
où ,
\(\hat{p}\) est la proportion de la population,
\(\text{valeur critique}\) est la valeur critique du niveau de confiance, et
\N(n\N) est la taille de l'échantillon.
- Le niveau de confiance varie, mais le niveau de confiance \(95\%\) est plus populaire parmi les statisticiens.
- Les étapes à suivre pour trouver l'intervalle de confiance d'une proportion de la population suivent les étapes de l'EMC3:
- E: Estimation - Explique quelle caractéristique de la population tu as l'intention d'estimer.
M: Méthode - Décide de la méthode d'inférence statistique que tu veux utiliser.
Pour utiliser la méthode des intervalles de confiance pour une proportion de population, ton problème doit répondre aux exigences suivantes :
La question te demande une estimation.
La situation implique l'utilisation de données d'échantillon.
Le type de données impliquées est une variable catégorielle.
Il n'y a qu'un seul échantillon.
C: Vérifier - Il y a \Ndes conditions qui doivent être remplies afin d'utiliser l'intervalle de confiance d'une proportion de la population :
Les données doivent être vraiment représentatives de la population et
La taille de l'échantillon doit être suffisamment grande.
- C: Calculer - Utilise la formule pour calculer l'intervalle de confiance.
- C: Communiquer - Réponds à la question posée dans le problème, en indiquant ce que tu as appris des données et en abordant les risques ou les lacunes éventuelles.
Apprends plus vite avec les 15 fiches sur Intervalles de confiance pour une proportion de population
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Intervalles de confiance pour une proportion de population
À propos de StudySmarter
StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.
En savoir plus