Distribution en T: 'Statistiques', 'Tests'

Q: Quelle est la différence entre la distribution normale et la distribution en T?

La distribution en T a des queues plus épaisses que la distribution normale, ce qui la rend plus apte à estimer des échantillons petits.

Q: Comment calculer la valeur de T?

La valeur de T se calcule comme suit : t = (moyenne de l'échantillon - hypothèse de population) / (écart type de l'échantillon / racine carrée de la taille de l'échantillon).

Sauter à un chapitre clé

Distribution en T du grand et du petit chien montrant la variance de taille StudySmarter Fig. 1 - La taille des chiens varie beaucoup !

Définition de la distribution t

Tu connais peut-être la distribution normale comme une courbe en forme de cloche, mais ce n'est pas la seule distribution en forme de cloche qui existe !

Il existe de nombreuses autres distributions qui partagent cette forme, dont la distribution $t$. Bien que ces deux distributions soient très similaires, elles sont utilisées dans des situations différentes.

Tu utiliserais une distribution normale si tu faisais un intervalle de confiance ou un test d'hypothèse où:

les populations sont normalement distribuées et ont une variance égale ;
la variance de la population est connue ; ou
la taille de l'échantillon est importante.

En revanche, tu utiliserais une distribution $t$ si tu faisais un intervalle de confiance ou un test d'hypothèse dans les cas suivants : les populations sont normalement distribuées et tu ne connais pas la variance de la population ; ou la taille de l'échantillon est importante :

les populations sont normalement distribuées et tu ne connais pas les variances des populations ; ou
la population est normalement distribuée mais la taille de l'échantillon est petite.

Rappelle-toi que si tu connais la variance de la population, ou si tu as un échantillon suffisamment grand, pour une variable aléatoire normalement distribuée, $X$, où

\[\bar{X} \sim \text{N}\left(\mu, \dfrac{\sigma ^2}{n}\right)\]

tu peux construire un intervalle de confiance ou un test d'hypothèse.

En réalité, il est peu probable que tu connaisses la variance réelle de la population, tout comme tu ne connais généralement pas la moyenne de la population, qui est souvent ce que tu testes.

Lorsque la taille de l'échantillon $n$ est suffisamment grande, tu peux utiliser la variance de l'échantillon $S$ au lieu de la variance de la population $\sigma$. Dans ce cas, le théorème de la limite centrale te donne que

\[\dfrac{\bar{X}-\mu}{\dfrac{S}{\sqrt{n}}}\]

est approximativement normal, et

\[\frac{\bar{X}-\mu}{\dfrac{S}{\sqrt{n}}} \approx \text{N}(0,1^2).\]

Lorsque $n$ est petit, plutôt que d'utiliser la distribution normale, tu peux utiliser la distribution $t$. La valeur de $t$ est donnée par

\[t=\frac{\bar{X}-\mu}{\dfrac{S}{\sqrt{n}}}.\]

Tu peux voir ci-dessous le graphique de la distribution normale standard comparée à la distribution $t$ pour différentes valeurs de $n$.

$Distribution en T distribution normale standard et distribution en t représentées ensemble pour n=1, n=3, et n=10 montrant que lorsque n augmente la distribution en t se rapproche de la distribution normale standard StudySmarter$ Fig. 2 - Distribution normale standard comparée à la distribution $t$ pour différentes valeurs de $n$.

Comme tu peux le voir dans le graphique ci-dessus, la distribution $t$ se rapproche de la distribution normale standard à mesure que $n$ augmente. C'est l'une des raisons pour lesquelles les statisticiens disent qu'une taille d'échantillon de $20$ est souvent suffisante pour passer d'une distribution $t$ à une distribution normale.

Comme la taille de l'échantillon joue un rôle important dans les distributions $t$, on lui donne un nom spécial, comme tu le verras dans la section suivante.

Degrés de liberté dans la distribution t

Tout comme pour la distribution du chi-deux et la distribution$F$, la taille de l'échantillon $n$ détermine le nombre dedegrés de liberté . La taille de l'échantillon t'indique deux choses sur les degrés de liberté de la distribution $t$ :

Le nombre de degrés de liberté, $\upsilon$, est déterminé par la taille de l'échantillon moins $1$ : $\upsilon = n-1$.
Lorsque $\upsilon \à \infty$, la distribution $t$ se rapproche de $\text{N}(0,1^2)$.

En effet, la distribution normale et la distribution \N(t\N) sont assez similaires. Toutes deux sont symétriques et présentent une forme de courbe en cloche, et elles ont le même comportement final.

Pour indiquer que tu utilises un degré de liberté spécifique pour une distribution $t), tu peux écrire distribution \(t_\upsilon$.

La formule de la distribution t

Voici la formule dont tu auras besoin pour la distribution t.

Si un échantillon aléatoire $X_1,X_2,X_3, \dots,X_n$ est sélectionné à partir d'une distribution normale avec une variance inconnue $\sigma ^2$, alors

\[t=\dfrac{\bar{X}-\mu}{\dfrac{S}{\sqrt{n}}}\]

où \(t\N) est une distribution \N(t_{n-1}\N) et \N(S^2\N) est un estimateur sans biais de \N(\Nsigma^2\N).

Pour un rappel de ce que signifie être sans biais, voir l'article Biais de l'estimateur.

Tout comme pour la distribution normale standard, il existe des tableaux de valeurs que tu peux utiliser avec la distribution $t$.

Tableaux pour la distribution t

Le tableau ci-dessous est une section d'une table de probabilité de la distribution $t$.

Tableau 1. Tableau de probabilité de la distribution $t$

$\upsilon$	$0.100$	$0.050$	$0.025$
$1$	$3.0777$	$6.3138$	$12.7062$
$2$	$1.8856$	$2.9200$	$4.3027$
$3$	$1.6377$	$2.3534$	$3.1824$

Les valeurs du tableau sont celles qui dépassent la probabilité en haut du tableau pour un certain nombre de degrés de liberté.

Par exemple, supposons que $X$ a $3$ degrés de liberté. Le nombre $3.1824$ dans le coin inférieur droit du tableau ci-dessus signifie que :

\N(P(X>3,1824) = 0,025\N) ; et
\N(P(X<3,1824) = 1-0,025=0,975\N).

Puisque la distribution $t$ est symétrique pour tous les degrés de liberté, tu sais aussi que

\N(P(X<-3,1824) = 0,025\N) ; et
\N(P(X>-3,1824) = 1-0,025=0,975\N).

La zone $P(X>3,1824 )=0,025$ pour une courbe de distribution de $t$avec $3$ degrés de liberté est ombrée dans le graphique ci-dessous. Rappelle-toi que lorsque $\upsilon = 3$ la taille de l'échantillon est $n=4$.

$Distribution en T Une courbe de distribution en t avec 3 degrés de liberté et la zone de probabilité de 0,025 ou plus ombrée en bleu sur la queue droite de la courbe. StudySmarter$ Fig. 3 - Distribution de $t_3$ avec la zone ombrée égale à $0,025$.

Prenons un exemple.

Supposons que $X$ est une variable aléatoire avec des degrés de liberté $\upsilon$. Trouve la valeur de \(s\N) où \(P(|X|<s)=0.80\N) où \(\upsilon = 3\N).

Solution

Remarque que \ (P(|X|<s)=0,80\) est identique à $P(|X|>s)=0,20$ car la distribution de $t$ est symétrique. Cela semble un peu étrange, mais cela signifie simplement que $P(X<-s)=0,1$ et $P(X>s)=0,1$. Il est souvent utile de faire un dessin de ce que tu cherches.

$Distribution en T Graphique d'une courbe en cloche dont les zones gauche et droite 0,1 sont ombrées. StudySmarter$ Fig. 4 - La zone ombrée totale est \N(0,2\N).

Tu peux utiliser la table de distribution de $t$ ou une calculatrice pour trouver que la valeur de $s$ qui te donne \ (P(X>s)=0,1\) est $s=1,6377 $.

Valeurs critiques pour la distribution t

Les valeurs critiques sont utilisées pour construire les intervalles de confiance. Les intervalles de confiance dépendent du niveau de confiance que tu utilises. Rappelle-toi que les limites de confiance pour un $100(1-\alpha)\%$ ont toujours la forme suivante

statistique de test $\pm$ ($t$-valeur critique)(erreur standard).

Dans le cas des distributions $t$, l'erreur standard est donnée par

\[ \text{standard error} = \frac{s}{\sqrt{n}},\]

et la valeur critique de $t$est

\[ \text{valeur critique} =t^*= t_{n-1}\left(\frac{\alpha}{2}\right) .\]

Suppose que tu aies une distribution $t_2$. Trouve les valeurs critiques pour les niveaux de confiance \N(90\N%), \N(95\N%) et \N(99\N%).

Solution :

Pour le niveau de confiance $90\%), le premier objectif est de trouver \(\alpha$. Ici

\N- 90 % = 100 % (1-alpha) \N]

donc

\N- 0,9 = 1 - \Nalpha\N]

\[ \alpha = 0.1.\]

Alors pour la valeur critique de $t$-,

\[\begin{align} t^*& = t_{n-1}\left(\frac{\alpha}{2}\right) \\ & = t_2\left(\frac{0.10}{2}\right) \\ &= t_2(0.05) \\&= 2.92 . \N- [end{align}\N]

De même, pour le niveau de confiance $95\%$, la valeur critique $t$est la suivante

\[\begin{align} t^*& = t_{n-1}\left(\frac{\alpha}{2}\right) \\ & = t_2\left(\frac{0.05}{2}\right) \\ &= t_2(0.025) \\&= 4.3027, \end{align} \]

et pour le niveau de confiance $99\%$ la valeur critique $t$est

\[\begin{align} t^*& = t_{n-1}\left(\frac{\alpha}{2}\right) \\ & = t_2\left(\frac{0.01}{2}\right) \\ &= t_2(0.005) \\&= 9.925 . \N- [end{align}\N]

Remarque qu'à mesure que le niveau de confiance augmente, la valeur critique de $t$ augmente également, ce qui signifie que ton intervalle de confiance s'agrandit. C'est logique pour deux raisons principales :

plus tu es confiant dans une prédiction, plus il est difficile de garantir que tu as capturé le paramètre de la population dans l'intervalle de confiance ; et
la valeur critique $t$ est liée à l'aire sous la courbe de distribution $t$.

Par exemple, au niveau de confiance \(80\%), tu demandes en fait que \(80\%) de l'aire sous la courbe soit capturée dans la zone ombrée. Plus ton niveau de confiance est élevé, plus la zone ombrée est grande !

$La zone de distribution en T sous le centre de la courbe correspond au niveau de confiance StudySmarter$ Fig. 5 - Distribution de $t$montrant comment le niveau de confiance est lié à l'aire sous la courbe.

C'est l'une des raisons pour lesquelles il peut être utile de faire un dessin de ce que tu essaies de trouver avant de prendre une calculatrice ou une table de distribution en T !

Distribution en T - Principaux enseignements

Si l'échantillon aléatoire $X_1,X_2,X_3, \dots,X_n$ est normalement distribué avec une variance inconnue, $\sigma ^2$, on a alors \[t=\dfrac{\bar{X}-\mu}{\dfrac{S}{\sqrt{n}}}] où $t$ a une distribution $t_{n-1}$ et $S^2$ est un estimateur sans biais pour $\sigma ^2$.
Le nombre de degrés de liberté est déterminé par la taille de l'échantillon moins \N(1\N),\N(\Nupsilon = n-1\N).
À mesure que \(\upsilon \à \nfty\r), la distribution de \(t\r) se rapproche de \(\text{N}(0,1^2)\r).
La valeur critique, \N(t^*\N), pour le niveau de confiance \N(\Nalpha\N) peut être trouvée avec la formule \N[ t^*= t_{n-1}\Nà gauche(\Nfrac{\Nalpha}{2}\Nà droite). \N].

Fiches dans Distribution en T 11

Commence à apprendre

Si tu construis un intervalle de confiance et que tu disposes d'un échantillon de grande taille, quelle distribution utiliserais-tu ?

Distribution normale.

Si tu construis un intervalle de confiance et que tu as un petit échantillon, quelle distribution utiliserais-tu ?

$t$-distribution.

Si tu fais un test d'hypothèse impliquant deux populations qui sont normalement distribuées.

$t$-distribution.

Si tu fais un test d'hypothèse impliquant deux populations qui sont normalement distribuées et que les populations ont la même variance, quelle distribution utiliserais-tu ?

Distribution normale.

Si tu fais un test d'hypothèse impliquant deux populations qui sont normalement distribuées et que tu ne connais pas les variances des populations, quelle distribution utiliserais-tu ?

$t$-distribution.

Quelle est la formule pour trouver les degrés de liberté pour une distribution $t$ avec une taille d'échantillon $n$ ?

$\upsilon = n-1$.

S'inscrire avec un e-mail

Tu as déjà un compte ? Connecte-toi

Questions fréquemment posées en Distribution en T

Qu'est-ce que la distribution en T en statistiques?

La distribution en T de Student est utilisée pour estimer la moyenne d'une population lorsque l'échantillon est petit et que la variance populationnelle est inconnue.

Quand utilise-t-on la distribution en T?

On utilise la distribution en T principalement lorsque les échantillons sont petits (n < 30) et que la variance populationnelle est inconnue.

Quelle est la différence entre la distribution normale et la distribution en T?

La distribution en T a des queues plus épaisses que la distribution normale, ce qui la rend plus apte à estimer des échantillons petits.

Comment calculer la valeur de T?

La valeur de T se calcule comme suit : t = (moyenne de l'échantillon - hypothèse de population) / (écart type de l'échantillon / racine carrée de la taille de l'échantillon).

Sauvegarder l'explication

Teste tes connaissances avec des questions à choix multiples

De Score

Accède à plus de 700 millions de ressources d'apprentissage

Étudie plus efficacement avec des flashcards

Obtiens de meilleures notes grâce l'IA

Tu as déjà un compte ? Connecte-toi

Découvre des matériels d'apprentissage avec l'application gratuite StudySmarter

Lance-toi dans tes études

À propos de StudySmarter

StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.

Équipe éditoriale StudySmarter

Équipe enseignants Mathématiques

Temps de lecture: 10 minutes
Vérifié par l'équipe éditoriale StudySmarter

Sauvegarder l'explication

\(\upsilon\)	\(0.100\)	\(0.050\)	\(0.025\)
\(1\)	\(3.0777\)	\(6.3138\)	\(12.7062\)
\(2\)	\(1.8856\)	\(2.9200\)	\(4.3027\)
\(3\)	\(1.6377\)	\(2.3534\)	\(3.1824\)

Distribution en T

Équipe éditoriale StudySmarter

Définition de la distribution t

Degrés de liberté dans la distribution t

La formule de la distribution t

Tableaux pour la distribution t

Valeurs critiques pour la distribution t

Distribution en T - Principaux enseignements

Fiches dans Distribution en T 11

Apprends plus vite avec les 11 fiches sur Distribution en T

Questions fréquemment posées en Distribution en T

Teste tes connaissances avec des questions à choix multiples

Découvre des matériels d'apprentissage avec l'application gratuite StudySmarter

À propos de StudySmarter

Équipe éditoriale StudySmarter

Sauvegarder l'explication

Qui sommes nous ?

Ressources pour étudier

Pour les entreprises

Distribution en T

Équipe éditoriale StudySmarter

Définition de la distribution t

Degrés de liberté dans la distribution t

La formule de la distribution t

Tableaux pour la distribution t

Valeurs critiques pour la distribution t

Distribution en T - Principaux enseignements

Fiches dans Distribution en T 11

Apprends plus vite avec les 11 fiches sur Distribution en T

Questions fréquemment posées en Distribution en T

Teste tes connaissances avec des questions à choix multiples

Quel début fantastique!

Tu peux faire mieux

Inscris-toi pour créer tes propres flashcards

Découvre des matériels d'apprentissage avec l'application gratuite StudySmarter

À propos de StudySmarter

Équipe éditoriale StudySmarter

Sauvegarder l'explication

Créer un compte gratuit pour sauvegarder ce cours.

Rejoins plus de 22 millions d'étudiants qui apprennent avec notre appli StudySmarter !