Sauter à un chapitre clé
Combinaison et transformation de variables aléatoires
Comme tu l'as déjà vu, de nombreuses personnes inspectent des objets comme les voitures avant de les vendre. Chaque inspecteur individuel a un temps d'inspection moyen et une variance associée à son temps d'inspection. La variable aléatoire dans ce cas est l'inspecteur, et ce que tu cherches est la somme de leurs temps d'inspection prévus.
Si plusieurs événements aléatoires associés à un résultat se produisent, tu peux les ajouter pour former une nouvelle distribution. Dans l'exemple de la voiture, la nouvelle distribution serait la durée totale de l'inspection de la voiture.
Combiner des variables aléatoires signifie transformer deux ou plusieurs variables aléatoires en une seule.
D'autre part, transformer des variables aléatoires implique de les mettre à l'échelle et de les décaler. C'est ce qui se passerait si tu jouais plusieurs fois à un jeu et que tu essayais de calculer le total de tes gains et de tes pertes. Consulte l'article Transformer des variables aléatoires pour plus de détails et d'exemples à ce sujet.
Une chose très importante à vérifier avant de combiner des variables aléatoires est qu'elles sont indépendantes, ou du moins qu'il est raisonnable pour toi de supposer qu'elles sont indépendantes.
Réponse :
Comme aucun inspecteur n'interagit jamais avec un téléphone portable en même temps qu'un autre inspecteur, il est raisonnable de supposer que leurs inspections ne s'influencent pas mutuellement. Cela signifierait que leurs temps d'inspection sont indépendants et que tu peux combiner les variables aléatoires.
Qu'en est-il dans l'exemple suivant ?
Suppose que ta première variable aléatoire soit le nombre d'heures pendant lesquelles une personne choisie au hasard a dormi hier, et que ta deuxième variable aléatoire soit le nombre d'heures pendant lesquelles cette même personne était éveillée. Peux-tu combiner ces variables aléatoires ?
Réponse :
Non. Le nombre d'heures pendant lesquelles une personne est éveillée dépend du nombre d'heures pendant lesquelles elle a dormi, il ne s'agit donc pas de variables aléatoires indépendantes et elles ne peuvent pas être combinées.
La notation \(T = X + Y\) peut prêter à confusion. Es-tu vraiment en train d'additionner des choses ? Prenons un exemple.
Imaginons que deux personnes inspectent un téléphone portable et qu'elles fassent des inspections séparées. L'entreprise comptabilise le temps que chaque personne prend pour faire une inspection. Tu peux alors mettre en place :
- \(X\) est l'ensemble des temps nécessaires à la première personne pour inspecter un téléphone ; et
- \(Y\) est l'ensemble des temps nécessaires à la première personne pour inspecter un téléphone.
Plutôt que de considérer chaque personne inspectant un téléphone individuellement, l'entreprise veut avoir une idée du temps total nécessaire pour inspecter un téléphone. Dans cet exemple, combiner les variables aléatoires \N(X\N) et \N(Y\N) signifie créer une variable aléatoire \N(T\N) avec \N(T = X + Y\N) où tu additionnes en fait les temps de \N(X\N) aux temps de \N(Y\N) pour obtenir un temps total.
Il peut être utile d'examiner l'intervalle de temps de \(T\N). Si l'intervalle de temps de \(X\) est de \(6\) minutes à \(8\) minutes, et que l'intervalle de temps de \(Y\) est de \(4\) minutes à \(5\) minutes, alors l'intervalle de \(T = X + Y\) est de \(6+4 =10\) minutes à \(8+5=13\) minutes.
Supposons que l'entreprise ait pris \(20\) mesures de chaque inspecteur et les ait représentées dans les histogrammes ci-dessous.
La moyenne pour l'inspecteur n° 1 est de 7,1 minutes, et la moyenne pour l'inspecteur n° 2 est de 4,6 minutes. Ensuite, leurs temps sont combinés en une nouvelle distribution aléatoire, \(T\), et l'histogramme pour ces données est ci-dessus.
Remarque que la plage de temps de l'histogramme est comprise entre 10 et 13 minutes. La moyenne de l'histogramme combiné est de 11,7 minutes, ce qui correspond à peu près à ce à quoi tu t'attendais compte tenu des moyennes des inspections individuelles.
Comment la combinaison de variables aléatoires affecte-t-elle la moyenne ?
Combinaison de variables aléatoires, la moyenne
Bien que tu puisses combiner plus de deux variables aléatoires tant qu'elles sont indépendantes, pour des raisons de simplicité, le reste de cet article se concentre sur la combinaison de seulement deux d'entre elles.
Supposons que \(X\) et \(Y\) sont deux variables aléatoires indépendantes. Pour la moyenne de \(X\), écris \(\mu_X\), et pour la moyenne de \(Y\), écris \(\mu_Y\). Comment combiner leurs moyennes ?
La moyenne de la somme de deux variables aléatoires est la somme de leurs moyennes. En d'autres termes, si \(T = X + Y\) alors\[ \mu_T = \mu_X + \mu_Y.\]
Si tu prends la différence de deux variables aléatoires, alors la moyenne de la différence est la différence de leurs moyennes. Donc si \(T = X - Y\), alors\[ \mu_T = \mu_X - \mu_Y.\]
Tout comme dans la soustraction classique, l'ordre fait une différence. Prenons quelques exemples.
Jake et Anna travaillent dans le même magasin, mais dans des rayons différents. Jake s'attend à vendre en moyenne \(5\) chemises par jour et Anna s'attend à vendre en moyenne \(3\). Quel est le nombre total moyen de chemises vendues dans le magasin par jour ?
Réponse :
Soit \(X\) la variable aléatoire représentant le nombre de chemises vendues par Jake, et \(Y\) la variable aléatoire représentant les ventes d'Anna. Tu espères qu'il s'agit de variables aléatoires indépendantes ! Appelons \(T\) la variable aléatoire des ventes totales du magasin, donc \(T = X + Y\).
D'après l'énoncé du problème,
\[ \mu_X = 5 \text{ et } \mu_Y = 3.\]
Par conséquent, ils peuvent s'attendre à vendre \[ \begin{align}] \mu_T &= \mu_X + \mu_Y \\n- &= 5 + 3 \n- &= 8, \n-end{align}\N]ou en d'autres termes, un total de \(8\) chemises.
Et si on te demandait combien de chemises supplémentaires Jake s'attendrait à vendre ?
Jake et Anna travaillent dans le même magasin, mais dans des rayons différents. Jake s'attend à vendre en moyenne 5 chemises par jour et Anna s'attend à vendre en moyenne 3 chemises par jour. Combien de chemises supplémentaires Jake peut-il s'attendre à vendre par jour ?
Solution :
Comme précédemment, appelle\(X\) la variable aléatoire représentant le nombre de chemises vendues par Jake, et \(Y\) la variable aléatoire représentant les ventes d'Anna, où tu peux raisonnablement supposer qu'elles sont indépendantes. Appelle \(T\) la variable aléatoire de la différence entre les ventes de Jake et d'Anna dans le magasin. Puisque \N(T = X - Y\N),
\[ \begin{align} \mu_T &= \mu_X - \mu_Y \mu_Y &= 5 - 3 \mu_Y &= 2. \N- [\N- ]
Jake peut donc s'attendre à vendre \(2\) plus de chemises qu'Anna.
Et si tu avais plutôt regardé la différence entre les ventes d'Anna et de Jake ? Tu aurais alors trouvé une moyenne de \(-2\) ! Cela peut arriver, et tu dois examiner la distribution combinée réelle pour comprendre ce qu'elle implique dans la vie réelle. Si tu trouves un nombre négatif lorsque tu regardes la différence entre les ventes, cela signifie simplement qu'en général, Anna vend moins de chemises que Jake.
Combinaison de variables aléatoires, écart type
Comme pour la moyenne, la combinaison de la variance de deux variables aléatoires indépendantes est une question d'addition. Supposons que \(X\) et \(Y\) sont deux variables aléatoires indépendantes. Pour l'écart-type de \(X\), écris \(\sigma_X\), et pour l'écart-type de \(Y\), écris \(\sigma_Y\). Alors :
La variance de la somme de deux variables aléatoires est la somme de leurs variances. En d'autres termes, si \N(T = X + Y) alors\N[ \Nsigma^2_T = \Nsigma^2_X + \Nsigma^2_Y.\N].
Si tu prends la différence de deux variables aléatoires, alors la variance de la différence est la somme de leurs variances. Donc si \(T = X - Y\), alors\[ \sigma^2_T = \sigma^2_X + \sigma^2_Y.\]
Attends un peu, cette deuxième partie n'a pas l'air correcte ! Comment se fait-il que lorsque tu soustrais deux distributions, tu ne soustrais pas leurs variances ? C'est parce que la variance est une mesure de l'écart entre les distributions. Ainsi, si tu combines deux distributions, la nouvelle aura un écart plus important que l'une ou l'autre des deux distributions initiales.
Cela signifie-t-il que tu peux également combiner l'écart-type de deux variables aléatoires indépendantes par addition ? Absolument pas ! Rappelle-toi que l'écart-type est la racine carrée de la variance et que
\[ \sqrt{a + b} \ne \sqrt{a} + \sqrt{b}.\]
Les écarts-types ne peuvent donc pas être additionnés de la même manière que la variance.
Prenons un exemple pour montrer comment cela fonctionne.
Jake et Anna travaillent dans le même magasin, mais dans des rayons différents. Jake s'attend à vendre en moyenne 5 chemises par jour et Anna s'attend à vendre en moyenne 3 chemises. Cependant, Jake a un écart-type dans ses ventes de \N(1) chemise, tandis qu'Anna a un écart-type de \N(4) chemises. L'écart-type de leurs totaux combinés de chemises est-il le même que la somme des écarts-types de leurs totaux individuels ?
Solution :
Établis quelques variables :
- \(X\) est la variable aléatoire du nombre de chemises vendues par Jake ;
- \(Y\) est la variable aléatoire du nombre de chemises vendues par Anna ; et
- \(T\) est la variable aléatoire du nombre de chemises qu'ils vendent ensemble.
Comme tu l'as déjà vu, \(\mu_T = 8\). Qu'en est-il de la variance et de l'écart-type ? D'après l'énoncé du problème, leurs écarts types individuels sont les suivants
\[ \sigma_X = 1 \mbox{ et } \sigma_Y = 4.\]
Alors pour la variance,
\[ \begin{align} \sigma^2_T &= \sigma^2_X + \sigma^2_Y \sigma^2 &= 1^2 + 4^2 \sigma^2 &= 17, \end{align} \]
mais
\[ \sigma_T = \sqrt{17} \approx 4.1\]]
ce qui n'est pas la même chose que
\[ \sigma_X + \sigma_Y = 1 + 4 = 5.\]
En effet ,
\[ \sigma_T < \sigma_X + \sigma_Y.\]
Ainsi, bien que le nombre moyen de chemises qu'ils vendent par jour reste le même s'ils travaillent ensemble, l'écart type du nombre de chemises qu'ils vendent ensemble est plus petit que s'ils restent séparés.
Combinaison de variables aléatoires normales
Dans les exemples que tu as étudiés jusqu'à présent, le fait que les variables aléatoires suivent une distribution normale ne fait aucune différence. La seule chose qui compte, c'est qu'il s'agisse de variables aléatoires indépendantes.
Lorsque tu as deux variables aléatoires indépendantes et continues, qui suivent toutes deux une distribution normale, leur somme ou leur différence suit la même loi.
Prenons un exemple pour illustrer cela.
Supposons que tu aies une entreprise où tu prépares et livres des pizzas, où la préparation et la livraison des pizzas sont des distributions normales, avec
- la préparation de la pizza dure en moyenne 18 minutes avec un écart type de 1,5 minutes ; et
- la livraison des pizzas dure en moyenne \(25\) minutes avec un écart type de \(8\) minutes.
(a) Quelle est la probabilité que la préparation et la livraison d'une pizza prennent plus d'une heure ?
(b) Quel est le pourcentage de pizzas qui prennent plus de temps à préparer qu'à livrer?
Solution :
(a) Dans cette partie de la question, tu cherches le temps total, c'est-à-dire la somme de deux variables aléatoires indépendantes normalement distribuées. Définissons d'abord les variables aléatoires :
- \(X\) est la variable aléatoire du temps nécessaire pour préparer une pizza ;
- \(Y\) est la variable aléatoire du temps nécessaire pour livrer une pizza ; et
- \(T\) est la variable aléatoire pour le temps total de préparation et de livraison d'une pizza.
On te dit que les deux variables aléatoires sont normales, et tu t'attends à ce que la préparation et la livraison de la pizza soient indépendantes l'une de l'autre. Ainsi, \N(T\N) est également normalement distribué, avec \N(T = X + Y\N).
Le temps moyen de préparation et de livraison d'une pizza est le suivant
\[ \begin{align} \mu_T &= \mu_X + \mu_Y \mu_T &= 18 + 25 \mu_T &= 43 \, min. \N- [Fin{align}\N-]
Puisque les temps sont indépendants,
\N-[ \N-{\N-{\N-{\N-{\N-{\N-{\N-{\N-{\N-{\N-{\N}}] \sigma^2_T &= \sigma^2_X + \sigma^2_Y \sigma^2_Y &= 1.5^2 + 8^2 \sigma^2_Y &= 66.25,\n- end{align}. \]
donc
\[ \sigma_T = \sqrt{66.25} \approx 8.1 \, min.\]
En d'autres termes, \N(T\N) est une distribution normale avec une moyenne \N(43\N) et un écart type \N(8,1\N).
Tu veux connaître la probabilité que la préparation et la livraison d'une pizza prennent plus d'une heure. Le graphique ci-dessous montre la distribution normale pour le temps total, et la région ombrée représente le temps sur \(60\) minutes.
Le score associé à 60 minutes est donc le suivant
\[z = \frac{60-43}{8.1} = 2.099\]
ce qui, en utilisant une table normale standard, te donne la probabilité de prendre plus de \(60\) minutes est
\[ P(T>60) = P(z>2.099) = 0.0179.\]
En d'autres termes, il n'y a qu'une probabilité de \N(1,79\N%) pour qu'une pizza prenne plus d'une heure à préparer et à livrer !
(b) Ensuite, tu veux connaître le pourcentage de pizzas qui prennent plus de temps à préparer qu'à livrer. Cette fois, tu veux connaître la différence entre \(X\) et \(Y\), tu as donc besoin d'une nouvelle variable aléatoire, appelée \(D\), pour la représenter. En d'autres termes, \N(D = X - Y\N). Il est toujours vrai que \N(X\N) et \N(Y\N) sont des variables aléatoires indépendantes qui suivent une distribution normale.
La différence de temps moyenne entre la préparation et la livraison d'une pizza serait la suivante
\[ \begin{align} \mu_D &= \mu_X - \mu_Y \mu_D &= 18 - 25 \mu_D &= -8 \, min. \N- [Fin{align}\N-]
Puisque les temps sont indépendants,
\N-[ \N- \N-{\N-{\N-{\N-{\N-{\N-{\N-{\N-{\N-{\N}}}] \sigma^2_D &= \sigma^2_X + \sigma^2_Y \sigma^2_Y &= 1.5^2 + 8^2 \sigma^2_Y &= 66.25,\send{align}} \]
donc
\N[ \Nsigma_D = \Nsqrt{66,25} \Napprox 8,1 \N, min.\N]
En d'autres termes, \(D\) est une distribution normale avec une moyenne de \(-8\) et un écart type de \(8,1\). Si une pizza prend plus de temps à préparer qu'à livrer, ce que tu veux trouver est \(P(D>0)\). Dans le graphique ci-dessous, la zone ombrée représente le moment où la pizza est plus longue à préparer qu'à livrer.
Le score de \(z\)associé à \(0\)minutes est donc le suivant
\[ z = \frac{0-(-8)}{8.1} = 0.988\]
ce qui, en utilisant une table normale standard, te donne la probabilité de prendre plus de \(60\) minutes est
\N[ P(D>0) = P(z>0.988) = 0.1611.\N]
En d'autres termes, environ \(16\%\) du temps, la pizza prendra plus de temps à préparer qu'à livrer.
Il est toujours bon d'avoir plus d'exemples !
Exemples de combinaison de variables aléatoires
Jetons un coup d'œil à d'autres exemples.
Supposons que deux inspecteurs travaillent pour toi. Si l'un d'eux inspecte un article, il lui faut en moyenne 5,8 minutes pour le faire, avec un écart type de 8 minutes. Cependant, s'ils travaillent tous les deux pour inspecter le même article, il leur faut en moyenne 11,6 minutes, avec un écart type de 17 minutes. Est-il préférable que les inspecteurs travaillent séparément ou ensemble ?
Solution :
Tout d'abord, donnons des noms aux variables :
- \(X\) est la variable de l'inspecteur A ;
- \(Y\) est la variable de l'inspecteur B ; et
- \(T\) est la variable pour leurs temps combinés.
Alors \N(T = X + Y\N), donc
\[ \begin{align} \mu_T &= \mu_X + \mu_Y \mu_T &= 5.8 + 5.8 \mu_T &= 11.6 \, min. \N- [end{align}\N]
Cela signifie que peu importe qu'ils travaillent ensemble ou séparément, dans tous les cas, leur temps moyen sera de \(11,6\) minutes.
Pour que tu puisses examiner leurs variances combinées, tu dois savoir qu'il s'agit de variables indépendantes. Pour la suite de cet exemple, tu devras donc supposer que deux personnes peuvent inspecter un article en même temps sans se gêner l'une l'autre, ce qui fait d'elles des variables indépendantes. La variance est alors
\N- [\N- Début{align} \sigma^2_T &= \sigma^2_X + \sigma^2_Y \sigma^2 &= 8^2 + 8^2 \sigma^2 &= 128, \end{align} \]
et l'écart-type est
\[ \begin{align} \sigma_T &= \sqrt{ \sigma^2_T} \\N- & = \sqrt{134.8} \N- Environ 11,3 \N, min. \Nend{align} \]
Ainsi, lorsque les deux inspecteurs travaillent séparément, la variation de leur temps d'inspection est beaucoup plus faible.
Qu'est-ce que cela signifie pour toi de les faire travailler ensemble ou séparément ? Étant donné que leur temps d'inspection moyen est le même dans les deux cas, tu as intérêt à choisir l'option qui te donne le moins de variation dans les temps d'inspection. Cela signifie que tu veux que les deux inspecteurs travaillent séparément car lorsqu'ils travaillent ensemble, leur écart-type est de \(17\) minutes plutôt que de \(11,3\) minutes lorsqu'ils travaillent séparément.
Examinons un exemple concernant les jouets.
Un magasin local vend des voitures jouets. La probabilité de vendre entre \(0\) et \(5\) voitures jouets est donnée dans le tableau ci-dessous.
Nombre de voitures | Probabilité |
\(0\) | \(0.03\) |
\(1\) | \(0.16\) |
\(2\) | \(0.30\) |
\(3\) | \(0.23\) |
\(4\) | \(0.17\) |
\(5\) | \(0.11\) |
Tableau 1. Probabilité de vente.
Suppose que la vente de voitures-jouets est indépendante.(a) Trouve la moyenne et l'écart-type du nombre de voitures-jouets vendues par le magasin en une journée.(b) Si le magasin est ouvert \(5\) jours par semaine, combien de voitures-jouets le magasin peut-il s'attendre à vendre, et quel est l'écart-type ?Solution :(a) Commençons par définir quelques variables. Ici, \(X\) est la variable aléatoire représentant le nombre de petites voitures vendues par le magasin en une journée, \(x_i\) étant le nombre de voitures vendues avec la probabilité \(p_i\). So\[ \begin{align} \mu_X &= \sum\limites_{i=0}^5 x_i p_i \nbsp;0(0.03) + 1(0.16) + 2(0.30) + 3(0.23) + 4(0.17) + 5(0.11) \nbsp;2.68. Il y a \N(6\N) entrées dans la table, donc la variance est donnée par\N[ \N- \N- \N{align}}]. \sigma^2_X &= \frac{ \sum\limites_{i=0}^5 (x_i - \mu_X)^2}{N} \N- &= \Nfrac{\Nsubstack{(0-2.68)^2+(1-2.68)^2+(2-2.68)^2\N+(3-2.68)^2+(4-2.68)^2+(5-2.68)^2 }}{6} \\N- & \N- environ 2,95, \Nend{align} \] and the standard deviation is given by\[ \begin{align} \sigma_X &= \sqrt{2.95} \N- & \N- environ 1,72. \N- \N- \N- \N- \N- \N- \N{align} \](b) Si l'on espère que les ventes de voitures-jouets un jour donné n'affectent pas les ventes de voitures un autre jour, tu peux donc supposer que le nombre quotidien de voitures-jouets vendues est indépendant. En outre, le nombre de voitures-jouets que le magasin s'attend à vendre ne change pas un jour donné. Then for a week, the shop can expect:\[\begin{align} \text{total des ventes de voitures prévues pour la semaine} &= 5(\text{total des ventes de voitures prévues pour la journée}) \\\N &= 5(2,68) \N &= 13,4, \Nend{align} \]donc environ \(13\) voitures jouets vendues en une semaine.N'oublie pas qu'il ne suffit pas d'additionner pour obtenir l'écart-type ! Tu dois plutôt trouver la variance pour la semaine, puis prendre la racine carrée. La variance des ventes hebdomadaires de voitures-jouets est additive, donc
\[ \begin{align} \text{variance des ventes hebdomadaires de voitures} &= 5(2,95) \\\N &= 14,75 \Nend{align}\N]
ce qui donne
\[ \begin{align} \text{écart-type des ventes hebdomadaires de voitures} &= \sqrt{14.75} \N- & \N- environ 3,84 . \N- [\N- \N- \N- \N- \N- \N]
Combinaison de variables aléatoires - Principaux enseignements
- Combiner des variables aléatoires signifie transformer deux ou plusieurs variables aléatoires en une seule.
- Ne combine que des variables aléatoires indépendantes !
- La moyenne de la somme de deux variables aléatoires est la somme de leurs moyennes. En d'autres termes, si \(T = X + Y\) alors\[ \mu_T = \mu_X + \mu_Y.\]
- Si tu prends la différence de deux variables aléatoires, alors la moyenne de la différence est la différence de leurs moyennes. Donc si \(T = X - Y\), alors\[ \mu_T = \mu_X - \mu_Y.\]
- La variance de la somme de deux variables aléatoires est la somme de leurs variances. En d'autres termes, si \(T = X + Y\) alors\[ \sigma^2_T = \sigma^2_X + \sigma^2_Y.\]
- Si tu prends la différence de deux variables aléatoires, alors la variance de la différence est la somme de leurs variances. Ainsi, si \(T = X - Y), alors\[ \sigma^2_T = \sigma^2_X + \sigma^2_Y.\]
- Les formules de somme et de différence ne fonctionnent pas pour l'écart-type !
Apprends plus vite avec les 7 fiches sur Combinaison des variables aléatoires
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Combinaison des variables aléatoires
À propos de StudySmarter
StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.
En savoir plus