Nous vous conseillons, si vous ne l'avez déjà fait, de lire en préambule, la page consacrée aux caractères sur une population.
Une 'variable aléatoire' sur un espace probabilisé, est tout simplement une fonction définie sur l'univers Ω des résultats d'une épreuve aléatoire.
Suivant la coutume nous utiliserons des majuscules d'imprimerie X, Y, etc. pour désigner de telles variables aléatoires, plutôt que des symboles comme f et g utilisés de préférence en théorie des fonctions.
Bien que des extensions soient possibles et pour raisons de simplicité dans cet exposé, nous ne considérerons que les v.a. sont des fonctions définies sur Ω et à valeurs dans ℝn.
Cependant quelques précautions supplémentaires doivent être prises.
En effet pour toute v.a. X et pour tout produit d'intervalles P, l'ensemble X-1(P) (voir images réciproques) doit être un évènement, donc un membre de la tribu intervenant dans l'axiomatique de définition des espaces probabilisés.
Ceci restreint donc les v.a. à l'ensemble des applications appelées 'mesurables ' en théorie de l'intégration.
En pratique, il convient de ne pas focaliser notre attention sur cet aspect des choses étant donné que, dans la pratique, les fonctions qui ne satisfont pas à cette propriété sont extrêmement rares et complexes. Le plus souvent il s'agit de fonctions fabriquées comme contre-exemples.
Il résulte immédiatement de cette définition que pour toute v.a., l'image réciproque d'un borélien quelconque B par une v.a. X : Ω → ℝ est un évènement en définissant la probabilité de B comme la probabilité de X-1(B), on transporte la probabilité de Ω à ℝn.
On construit ainsi un nouvel espace probabilisé pour lequel l'épreuve correspondante consiste à ne relever que la valeur de X(ω) en 'oubliant' l'évènement élémentaire ω.
Pour toute v.a. X sur un espace probabilisé (Ω ,P), on appelle 'loi de X' l'application B → P(X-1(B)), où B parcourt l'ensemble des boréliens de ℝn.
La loi de X n'est rien d'autre que la probabilité transportée sur les boréliens par images réciproques.

Un premier exemple simple mais important

Soit E un évènement et soit X la fonction caractéristique de E, alors X est une v.a. en effet soit I un intervalle quelconque de ℝ.
Alors il y a 4 possibilités :
  1. 0 ∈ I et 1 ∈ I
  2. 0 ∈ I et 1 ∉ I
  3. 0 ∉ I et 1 ∈ I
  4. 0 ∉ I et 1 ∉ I
On a alors suivant chacun de ces cas :
  1. X-1(I)=Ω
  2. X-1(I)=E
  3. X-1(I)=E
  4. X-1(I)=∅
Nous avons donc bien affaire à une v.a. au sens général puisque si E est un évènement, E, E, Ω ,∅ sont tous des évènements d'après les axiomes des tribus.
Dans ce cas précis, pour la loi de X nous avons, toujours suivant les cas si P(E)=p:
  1. P(I)=1
  2. P(I)=p
  3. P(I)=1-p
  4. P(I)=0
Cet exemple se généralise comme suit.
Si E1,E2, ... , En est une suite d'évènements deux à deux incompatibles et si k1, k2, ... , kn sont n constantes réelles, si nous désignons par X1 la fonction caractéristique de E1, X2 la fonction caractéristique de E2, ... , Xn la fonction caractéristique de En, alors si
X = i = 1 n k i X i
X est une v.a.

Cas des univers finis

Dans le cas des univers finis toute application de Ω dans ℝ est une v.a.
Considérons alors les valeurs distinctes x1, x2, ... , xp de X.
Posons pour chaque indice i
p i = P ( X = x i ) = P ( { ω Ω X ( ω ) = x i } )
Alors la loi de X est entièrement déterminée par la suite des pi.
En effet si I est un intervalle quelconque.
P ( X 1 ( I ) ) = x i I p i

Cas particulier traité

Considérons l'épreuve aléatoire qui consiste à jeter simultanément deux dés.
Un résultat peut donc se noter sous forme d'un couple ω=(d1,d2) où d1 et d2 sont deux entiers entre 1 et 6.
Posons alors X(ω)=d1+d2; nous avons alors une v.a. X pouvant prendre toutes les valeurs entre 2 et 12.
Voici un tableau récapitulatif
de toutes les situations possibles
Voici la loi de X :
d2\d1
1
2
3
4
5
6
1
2
3
4
5
6
7
2
3
4
5
6
7
8
3
4
5
6
7
8
9
4
5
6
7
8
9
10
5
6
7
8
9
10
11
6
7
8
9
10
11
12
P(X=2)
1/36
P(X=3) 2/36
P(X=4) 3/36
P(X=5) 4/36
P(X=6) 5/36
P(X=7) 6/36
P(X=8) 5/36
P(X=9) 4/36
P(X=10) 3/36
P(X=11) 2/36
P(X=12) 1/36

Exemple dans le cas d'univers dénombrables

On considère la loi de Pascal de paramètre 1/2 (voir cet exercice).
Pour cette loi sur Ω={1,2, ..., n, ...} on a p(n)=1/2n.
On considère la variable aléatoire X(n)= n%3 (n modulo 3) c'est à dire le reste de la division de n par 3.
Cherchons la loi de X.
P ( X = 0 ) = 1 2 3 + 1 2 6 + 1 2 9 + . . . . = 1 2 3 ( 1 + 1 2 3 + ( 1 2 3 ) 2 + . . . . ) = 1 2 3 ( 1 1 1 2 3 ) = 1 8 × 1 7 8 = 1 7
On vérifie de la même façon que P(X=1)=4/7 et P(X=2)=2/7

Exemple dans le cas d'univers non dénombrables

Nous considérons le tir aléatoire dans un carré de côté 2 (voir cette page).
Tout évènement élémentaire s'identifie donc à un point M(x,y) avec x ∈[0,2] et y ∈ [0,2].
Soit I=(1,1) le centre du carré.
On considère la variable aléatoire X(M)=MI=d(M,I) distance de M à I.
X prend toutes les valeurs entre 0 et √2.
Cherchons la loi de X.
Il faut évaluer P(a<X<b) dans tous les cas de figure possibles. Six cas sont à considérer :
  1. 0<a<b<1
  2. 0<a<1<b<√2
  3. 0<a<1 et b>√2
  4. 1<a<√2 et a<b<√2
  5. 1<a<√2 et et a<b et b>√2
  6. a>√2 et b>a
L'Applet suivante permet de visualiser ces 6 cas.
Faire varier a puis b avec les curseurs.

On obtient 6 formules distinctes :
  1. π 4 ( b 2 a 2 )
  2. π 4 ( b 2 a 2 ) ( b 2 arccos ( 1 b ) b 2 1 )
  3. π 4 ( b 2 a 2 ) ( b 2 arccos ( 1 b ) b 2 1 ) + ( a 2 arccos ( 1 a ) a 2 1 )
  4. 1 π a 2 4
  5. 1 π a 2 4 + ( a 2 arccos ( 1 a ) a 2 1 )
  6. 0

Couples de v.a.

il résulte des définitions que
Si X et Y sont deux variables aléatoires définies sur un même espace probabilisé Ω, et à valeurs dans ℝm et ℝn respectivement, alors l'application (X,Y) : Ω → ℝm+n est également une variable aléatoire.
Ceci s'étend aux ensembles finis de v.a. (X1,X2, ... ,Xn)

Variables aléatoires et opérations algébriques

Lorsque X et Y sont deux v.a. définies sur le même espace probabilisé et à valeurs dans le même espace, nous aurons fréquemment besoin de considérer la somme X+Y, la différence X-Y ou encore le produit XY de X et de Y (s'il existe, par exemple quand X et Y sont réelles). De la même façon nous aurons besoin de considérer des combinaisons linéaires λX+μY de ces deux variables.
Il est important de savoir que :
Toutes les fonctions ainsi construites sont elles-mêmes des variables aléatoires.
Une démonstration directe est assez malaisée.
Indications sur la démonstration:
Il suffit de combiner le fait que le couple (X,Y) est une v.a à valeurs dans ℝ2 avec le fait que les applications :
sont des applications continues (en un sens à préciser) de ℝ2 dans ℝ.
Il suffit ensuite d'utiliser le résultat disant que toute application continue est mesurable et que la composée de deux applications mesurables est encore mesurable.