Analyse du plan SxAxB

Précédent / Suivant / Table des matières

Chapitre V

Analyse du plan S×A×B

El Methni M.

V-1. A et B sont deux facteurs à effets fixes

V-1-1 Généralités

On considère le plan complet S×A×B défini par le croisement de trois facteurs S, A et B.
S est le facteur sujet (aléatoire) à n modalités. A et B sont deux facteurs à effets fixes, A possède r modalités et B c modalités. Chacun des n sujets est observé dans chacun des r×c croisements des modalités de A et B.

On dispose donc de N=n×r×c observations y_sij que l’on présente sous la forme d’un tableau :

Sujets

a₁

…

a_i

…

a_r

b₁

…

b_j

…

b_c

…

b₁

…

b_j

…

b_c

…

b₁

…

b_j

…

b_c

y₁₁₁

…

y₁₁_j

…

y₁₁_c

…

y₁_i₁

…

y₁_ij

…

y₁_ic

…

y₁_r₁

…

y₁_rj

…

y₁_rc

y₂₁₁

…

y₂₁_j

…

y₂₁_c

…

y₂_i₁

…

y₂_ij

…

y₂_ic

…

y₂_r₁

…

y₂_rj

…

y₂_rc

…

y_s₁₁

…

y_s₁_j

…

y_s₁_c

…

y_si₁

…

y_sij

…

y_sic

…

y_sr₁

…

y_srj

…

y_src

…

y_n₁₁

…

y_n₁_j

…

y_n₁_c

…

y_ni₁

…

y_nij

…

y_nic

…

y_nr₁

…

y_nrj

…

y_nrc

V-1-2 Modèle univarié :

Les données peuvent être d’une part, considérées comme les N = n×r×c observations d’une seule variable aléatoire Y dans les N = n×r×c conditions expérimentales décrites par le croisement des trois facteurs S, A et B. Elles peuvent d’autre part, être regardées comme les n observations d’un vecteur de r×c variables aléatoires. Ces deux points de vue conduisent à l’élaboration de deux modèles, le modèle mixte univarié dans le premier cas, et le modèle multivarié dans le second.

Comme pour le plan S×O, nous allons étudier le modèle mixte univarié dans lequel nous considérons que les modalités du facteur sujet ont été obtenues par échantillonnage, le facteur sujet est donc un facteur aléatoire. Les facteurs A et B sont des facteurs à effets fixes. Chaque donnée y_sij correspond alors à l’observation d’une variable aléatoire Y_sij et on pose le modèle mixte suivant :

Y_sij = μ_ij + π_s + (απ)_is + (βπ)_js + (αβπ)_sij + e_sij

Pour chaque croisement des modalités s, i et j nous ne disposons que d’une seule observation, l’interaction (αβπ)_sij sera confondue avec le résidu et on pose : ε_sij=(αβπ)_sij + e_sij

On a donc : Y_sij = μ_ij + π_s + (απ)_is + (βπ)_js + ε_sij

Où

Les µ_ij(i =1, 2, …, r, j=1, 2, …, c) sont des constantes qui mesurent les effets fixes des modalités (i,j) du croisement A×B

Les π_s (s = 1, 2, …, n) sont des variables aléatoires indépendantes et identiquement distribuées (iid) de loi N(0 ;σ²_π) qui mesurent les effets aléatoires des modalités s du facteur S

Les (απ)_si(s = 1, 2, …, n, i = 1, 2, …, r) sont des variables aléatoires indépendantes et identiquement distribuées (iid) de loi N(0 ;σ²_απ) qui mesurent les effets aléatoires d’interactions entre le facteur S et le facteur A

Les (βπ)_sj(s = 1, 2, …, n, j = 1, 2, …, c) sont des variables aléatoires indépendantes et identiquement distribuées (iid) de loi N(0 ;σ²_βπ) qui mesurent les effets aléatoires d’interactions entre le facteur S et le facteur B

Les résidus ε_sij sont des variables aléatoires indépendantes et identiquement distribuées (iid) de loi N(0 ;σ²)

De plus, on suppose que les résidus ε_sij sont indépendantes des π_s, des (απ)_si et des (βπ)_sj.

Nous pouvons réécrire l’effet fixe de la modalité (i,j) sous la forme suivante :

µ_ij = µ + α_i + β_j + (αβ)_ij

Où :

Le paramètre µ s’interprète comme un niveau général de réponse commun pour l’ensemble des observations,

Le paramètre α_i = µ_i- µ s’interprète comme l’effet de la modalité i du facteur A

Le paramètre β_j = µ_j- µ s’interprète comme l’effet de la modalité j du facteur B

Le paramètre (αβ)_ij = µ_ij - µ_i- µ_j+ µ s’interprète comme l’effet de la modalité (i,j) du croisement A×B (l’effet d’interaction de A et B).

Le modèle mixte univarié peut finalement s’écrire :

Y_sij = μ + α_i + β_j + (αβ)_ij + π_s + (απ)_is + (βπ)_js + ε_sij

Où : les Y_sij sont des variables aléatoires de loi :

Une telle paramétrisation nécessite de rajouter les contraintes d’identifiabilité suivantes :

V-1-3 Décomposition de la variation :

On commence par décomposer la variation totale en variation inter-sujets et variation intra-sujets : SCT_obs= SC_inter-sujets+ SC_intra-sujets

La variation inter-sujets est due au facteur sujet et la variation intra-sujets est due aux effets du croisement A×B et à l’effet des autres facteurs non contrôlés. L’effet du facteur A×B se fait à deux niveaux : effet principal et effet d’interaction.

SC_intra-sujets = SC(A×B)_obs+ SC(A×B)S_obs+ SCR_obs

Avec : SC(A×B)_obs= SC(A)_obs+ SC(B)_obs+ SC(AB)_obs

et : SC(A×B)S_obs= SC(AS)_obs+ SC(BS)_obs+ SC(ABS)_obs

Ne disposant que d’une seule observation pour chaque croisement (i,j,s) on ne peut donc séparer l’interaction SAB du résidu on a donc : SC(ABS)_obs = SCR

Conclusion : Dans le cas du plan complet S×A×B, la variation totale se décompose de façon additive en :

SCT_obs= SCS_obs+ SCA_obs+ SCB_obs+ SCAB_obs + SCAS_obs+ SCBS_obs+ SCR_obs

De même on a la décomposition des degrés de liberté :

N-1=ncr-1 = (n-1) + n(rc-1) = (n-1) + n(rc-1) - (c-1)(r-1)(n-1) + (c-1)(r-1)(n-1)

N-1=ncr-1 =(n-1)+(r-1)+(c-1)+(c-1)(r-1)+(r-1)(n-1)+(c-1)(n-1)

Les différentes sommes de carrées se calculent de façon habituelles par :

=N×variance de toutes les observations

=N×variance des n moyennes des sujets

=N×variance des r moyennes par modalités de A

=N×variance des c moyennes par modalités de B

=N×variance des r×c moyennes par croisement de A et B

SC(AB)_obs = SC(A×B)_obs - SCA_obs - SCB_obs

=N×variance des r×n moyennes par croisement de A et S

SC(AS)_obs = SC(A×S)_obs - SCA_obs - SCS_obs

=N×variance des n×c moyennes par croisement de B et S

SC(BS)_obs = SC(B×S)_obs - SCB_obs - SCS_obs

SCR_obs = SCT_obs - SCS_obs - SCA_obs - SCB_obs - SC(AB)_obs - SC(AS)_obs - SC(BS)_obs

Dans le cadre du modèle statistique ces sommes de carrés sont des réalisations de variables aléatoires dont on calcule les espérances et plus généralement les distributions des probabilités.

On montre le théorème fondamental suivant :

Théorème : Sous les hypothèses du modèle, les statistiques SCA, SCB, SCS, SCAB, SCAS, SCBS et SCR sont indépendantes et d’espérances respectives :

On ramène toutes les sommes de carrés à des moyennes de carrés en divisant par les degrés de liberté correspondants.

Ceci nous permet de réécrire le théorème précédent sous la forme suivante :

Théorème : Sous les hypothèses du modèle, les statistiques MCA, MCB, MCS, MCAB, MCAS, MCBS et MCR sont indépendantes et d’espérances respectives :

Ceci nous permet de tester l’existence des différents effets des facteurs. On peut construire des tests indépendants sur chacune des sources de variations :

Test 1 :

hypothèse nulle H₀_A : pas d’effet principal du facteur A (i) α_i = 0 contre

l’hypothèse alternative : H₁_A : il existe un effet principal du facteur A (i) α_i ≠ 0

Théorème : sous l’hypothèse H₀_A, la statistique suit une loi de Fischer à r - 1 et
(n - 1)(r - 1) degrés de liberté.

Le test1 est alors défini au seuil de signification α par la règle de décision suivante :

si F_{A obs} ≥ λ_α alors on rejette l’hypothèse nulle

où λ_αest donné par l’équation : α = P(F_A ≥ λ_α).

Test 2 :

hypothèse nulle H₀_B : pas d’effet principal du facteur B (j) β_j = 0 contre

l’hypothèse alternative : H₁_B : il existe un effet principal du facteur B (j) β_j ≠ 0

Théorème : sous l’hypothèse H₀_B, la statistique suit une loi de Fischer à c - 1 et
(n - 1)(c - 1) degrés de liberté.

Le test2 est alors défini au seuil de signification α par la règle de décision suivante :

si F_{B obs} ≥ λ_α alors on rejette l’hypothèse nulle

où λ_αest donné par l’équation : α = P(F_B ≥ λ_α).

Test 3 :

hypothèse nulle H₀_AB : pas d’effet d’interaction (i,j) (αβ)_ij= 0 contre

l’hypothèse alternative : H₁_AB : il existe une interaction (i,j) (αβ)_ij≠ 0

Théorème : sous l’hypothèse H₀_AB, la statistique suit une loi de Fischer à
(r - 1)(c - 1) et (n - 1)(c - 1) (r - 1) degrés de liberté.

Le test3 est alors défini au seuil de signification α par la règle de décision suivante :

si F_{AB obs} ≥ λ_α alors on rejette l’hypothèse nulle

où λ_αest donné par l’équation : α = P(F_AB ≥ λ_α).

On présente l’étude dans le tableau d’analyse de la variance :

Source	SC_obs	ddl	MC_obs	F_obs
Inter-sujets : S	SCS_obs	n - 1
Intra-sujets :
A	SCA_obs	r - 1	MCA_obs	F_A _obs
AS	SC(AS)_obs	(r - 1)(n - 1)	MC(AS)_obs
B	SCB_obs	c - 1	MCB_obs	F_B _obs
BS	SC(BS)_obs	(c - 1)(n - 1)	MC(BS)_obs
AB	SC(AB)_obs	(r - 1)(c - 1)	MC(AB)_obs	F_AB _obs
R	SCR_obs	(r - 1)(c - 1)(n - 1)	MCR_obs
Total	SCT_obs	N - 1

V-1-5 Condition de validation :

Le fait de mesurer plusieurs fois la variable réponse sur le même sujet introduit des corrélations entre les observations faites sur ce même sujet. Dans le cas du modèle mixte univarié on montre que :

Dans le cas du modèle multivarié on considère que les données sont les réalisations de n vecteurs aléatoires de dimension rc. Y_s=(Y_s₁, Y_s₂, …, Y_src) indépendants et de même loi normale caractérisés par : E(Y_sk)=μ_ij Var(Y_sk)=σ²_ij cov(Y_sk , Y_sk_’) = cov_kk’

Le modèle mixte univarié est donc un cas particulier du modèle multivarié correspondant aux hypothèses de circularité de la matrice de variance-covariance Σ de la forme :

A₁

A_i

A_r

B₁

…

B_c

…

B₁

…

B_j

…

B_c

…

B₁

…

B_c

A₁

B₁

σ²_π + σ²_πα+ σ²_πβ+ σ²

…

B_c

σ²_π+σ²_πα

σ²_π + σ²_πα+ σ²_πβ+ σ²

…

A_i

B₁

σ²_π+σ²_πβ

σ²_π

σ²_π + σ²_πα+ σ²_πβ+ σ²

…

B_j

σ²_π

σ²_π+σ²_πα

σ²_π + σ²_πα+ σ²_πβ+ σ²

…

B_c

σ²_π

σ²_π+σ²_πβ

σ²_π+σ²_πα

σ²_π + σ²_πα+ σ²_πβ+ σ²

…

A_r

B₁

σ²_π+σ²_πβ

σ²_π

σ²_π+σ²_πβ

σ²_π

σ²_π + σ²_πα+ σ²_πβ+ σ²

…

B_c

σ²_π

σ²_π+σ²_πβ

σ²_π

σ²_π+σ²_πβ

σ²_π+σ²_πα

σ²_π + σ²_πα+ σ²_πβ+ σ²

B₁

…

B_j

…

B_c

A₁

…

A_r

A₁

…

A_i

…

A_r

A₁

…

A_r

B₁

A₁

σ²_π + σ²_πα+ σ²_πβ+ σ²

…

A_r

σ²_π+σ²_πβ

σ²_π + σ²_πα+ σ²_πβ+ σ²

…

B_j

A₁

σ²_π+σ²_πα

σ²_π

σ²_π + σ²_πα+ σ²_πβ+ σ²

…

A_i

σ²_π

σ²_π+σ²_πβ

σ²_π + σ²_πα+ σ²_πβ+ σ²

…

A_r

σ²_π

σ²_π+σ²_πα

σ²_π+σ²_πβ

σ²_π + σ²_πα+ σ²_πβ+ σ²

…

B_c

A₁

σ²_π+σ²_πα

σ²_π

σ²_π+σ²_πα

σ²_π

σ²_π + σ²_πα+ σ²_πβ+ σ²

…

A_r

σ²_π

σ²_π+σ²_πα

σ²_π

σ²_π+σ²_πα

σ²_π+σ²_πβ

σ²_π + σ²_πα+ σ²_πβ+ σ²

V-1-6 Exemple :

		Test 1			Test 2
Sujet	M₁	M₂	M₆	M₁	M₂	M₆
1	10	11	9	3	6	3
2	18	20	17	16	20	14
3	6	8	8	5	6	3
4	4	9	9	10	10	6

Un expérimentateur veut étudier l’effet de la consommation de lécithine sur les troubles de mémoire. Il choisit 4 sujets auxquels il administre un traitement quotidien. Au bout d’un mois, de deux mois et de six mois de traitements, il fait passer à chaque sujet deux tests. Le premier test (test 1) est le même chaque mois, le deuxième test (test 2) est une forme parallèle chaque mois.

Pratique des calculs :

		Test 1			Test 2
Sujet	M₁	M₂	M₆	M₁	M₂	M₆
1	10	11	9	3	6	3
2	18	20	17	16	20	14
3	6	8	8	5	6	3
4	4	9	9	10	10	6

Pratique des calculs : autre méthode

A ^B	M₁	M₂	M₆	moyennes	A ^S	1	2	3	4
T₁	9,50	12,00	10,75	10,75	T₁	10,00	18,33	7,33	7,33
T₂	8,50	10,50	6,50	8,50	T₂	4,00	16,67	4,67	8,67
moyennes	9,00	11,25	8,625	9,625	moyennes	7,00	17,50	6,00	8,00

B ^S	1	2	3	4
M₁	6,50	17,00	5,50	7,00
M₂	8,50	20,00	7,00	9,50
M₆	6,00	15,50	5,50	7,50
moyennes	7,00	17,50	6,00	8,00

Calcul des sommes des carrées :

SCT=645,625 SCS=508,125 SCA=30,375 SCB=32,25

SC(A×B)=74,875 SC(AB)=12,25 SC(A×S)=579,5652 SC(AS)=41,133

SC(B×S)=546,125 SC(BS)=5,75 SCR=15,742

Tableau d’analyse de la variance :

Source	SC_obs	ddl	MC_obs	F_obs
Inter S	SCS_obs=508,125	n - 1=3
Intra S
A	SCA_obs=30,375	r - 1=1	MCA_obs=30,375	F_A _obs=2,215
AS	SC(AS)_obs=41,133	(r - 1)(n - 1)=3	MC(AS)_obs=13,711
B	SCB_obs=32,25	c - 1=2	MCB_obs=16,125	F_B _obs=16,827
BS	SC(BS)_obs=5,75	(c - 1)(n - 1)=6	MC(BS)_obs=0,9583
AB	SC(AB)_obs=12,25	(r - 1)(c - 1)=2	MC(AB)_obs=6,125	F_AB _obs=2,334
R	SCR_obs=15,742	(r - 1)(c - 1)(n - 1)=6	MCR_obs=2,624
Total	SCT_obs=645,625	N - 1=23

Test de l’existence des différents effets :

Test 1 : Effet principal du facteur A

hypothèse nulle H₀_A : pas d’effet principal du facteur A (i) α_i = 0 contre

l’hypothèse alternative : H₁_A : il existe un effet principal du facteur A (i) α_i ≠ 0

Théorème : sous l’hypothèse H₀_A, la statistique suit une loi de Fischer à r 1=1 et
(n - 1)(r - 1)=3 degrés de liberté.

Le test1 est alors défini au seuil de signification α=5% par la règle de décision suivante :

si F_{A obs} ≥ λ_α=10,1 alors on rejette l’hypothèse nulle

où λ_αest donné par l’équation : α = P(F_A ≥ λ_α).

Or F_A
obs =2,215 < λ_α=10,1 on en conclue qu’il n’y a pas d’effet principal du facteur A

Test 2 : Effet principal du facteur B

hypothèse nulle H₀_B : pas d’effet principal du facteur B (j) β_j = 0 contre

l’hypothèse alternative : H₁_B : il existe un effet principal du facteur B (j) β_j ≠ 0

Théorème : sous l’hypothèse H₀_B, la statistique suit une loi de Fischer à c 1=2 et
(n - 1)(c - 1)=6 degrés de liberté.

Le test2 est alors défini au seuil de signification α par la règle de décision suivante :

si F_{B obs} ≥ λ_α =5,14 alors on rejette l’hypothèse nulle

où λ_αest donné par l’équation : α = P(F_B ≥ λ_α).

Or F_B
obs =16,827 > λ_α=5,14 on en conclue qu’il y a un effet principal du facteur B

Test 3 : Test de l’effet d’interaction des facteurs A et B

hypothèse nulle H₀_AB : pas d’effet d’interaction (i,j) (αβ)_ij= 0 contre

l’hypothèse alternative : H₁_AB : il existe une interaction (i,j) (αβ)_ij≠ 0

Théorème : sous l’hypothèse H₀_AB, la statistique suit une loi de Fischer à
(r - 1)(c - 1)=2 et (n - 1)(c - 1) (r - 1)=6 degrés de liberté.

Le test3 est alors défini au seuil de signification α par la règle de décision suivante :

si F_{AB obs} ≥ λ_α =5,14 alors on rejette l’hypothèse nulle

où λ_αest donné par l’équation : α = P(F_AB ≥ λ_α).

Or F_AB
obs =2,334 < λ_α=5,14 on en conclue qu’il n’y a pas d’effet d’interaction des facteurs A et B

Condition de validation du modèle :

Calculons la matrice de variances covariances empirique (et aussi la matrice des corrélations) pour examiner la condition de validité du modèle mixte univarié. Les résultats sont présentés sous forme de blocs homogènes (qui devraient l’être).

Matrice de Variances Covariances

	A	Test1			Test2
A	B	M₁	M₂	M₆	M₁	M₂	M₆
Test1	M₁	28,750
	M₂	24,500	22,500
	M₆	17,875	17,000	13,188
Test2	M₁	16,250	18,750	15,875	25,250
	M₂	24,250	18,750	20,125	27,750	32,750
	M₆	19,250	19,750	15,875	21,750	25,750	20,250

Matrice des corrélations.

	A	Test 1			Test 2
A	B	M₁	M₂	M₆	M₁	M₂	M₆
Test 1	M₁	1
	M₂	0,9633	1
	M₆	0,9180	0,9869	1
Test 2	M₁	0,6031	0,7866	0,8700	1
	M₂	0,7903	0,7276	0,9684	0,9650	1
	M₆	0,7978	0,9253	0,9714	0,9619	0,9999	1

Le premier bloc (en haut et à gauche) est le bloc des variables issues des modalités de B alors que A prend la modalité « test1 ». Le deuxième bloc (en bas et à droite) est le bloc des variables issues des modalités de B alors que A prend la modalité « test2 ». Et le troisième bloc (en bas et à gauche) est le bloc des variables issues des modalités de B et aussi des modalités de A (test1 et test2) à la fois. Dans ce dernier bloc, on distingue les éléments de la diagonale, dont les modalités de B sont les mêmes des éléments hors diagonale.

Nous constatons qu'à l'intérieur des blocs nous avons, (plus ou moins) une homogénéité des covariances (et aussi des corrélations). En ce qui concerne la condition d'homoscédasticité (homogénéité des variances), nous ne constatons pas une différence importante sur la diagonale principale de la matrice, donc nous pouvons penser que cette condition est également acquise.