Santé Algérie Algérie

Sommaire
Page d'accueil
Présentation du site
La bibliothèque de Santé Maghreb
Les éditos du professeur Abid
Communications scientifiques
Histoire de l'Algérie médicale
Agenda scientifique algérien
Point de vue
Associations algériennes de la santé
Annuaire de la santé en Afrique
Forum de la santé en Afrique
Qui contacter ?


Aide mémoire pratique de statistiques appliquées à la médecine et à la biologie
Docteur Mohamed Sadreddine BOUROUBA (1999)

Accès rapide aux rubriques

Sommaire

Introduction

- Les données
- Les échantillons
- Le but du test

Diagrammes

- Comparaison d'échantillons - Données quantitatives
- Recherche de l'influence d'une donnée autre que celle étudiée - Données qualitatives

Tests

Test du c2 (KHI DEUX)
Test t de Student
Test t de Student apparié
Test de Mann-Withney

Test de Wilcoxson
ANOVA randomisée - Analyse de variance simple
LSD test (Least Significant Difference)

ANOVA repetead
Test de Newman Keuls - Range studentisé
Test de Kruskal Wallis
Test de Friedman
Corrélation
Régression
Test de Shapiro et Wilk - Test de normalité

Tables

Table du t de Student
Table du c2
Table du U de Mann-Whitney
Test du U de Wilcoxson
Table de Newman-Keuls - Range studentisé
Table Kruskal Wallis
Table de Friedman
Test de Shapiro et Wilk : table des coefficients
Test de Shapiro et Wilk : Table des valeurs limites de W
Tableau du F de Fisher Snedecor


Test de Friedman

Domaine d’application du test :

  • Données quantitatives
  • Plusieurs échantillons dépendants
  • Distributions non-paramétriques
  • Comparaison d’échantillons

1/ Classer les données sous forme de tableau

Noter N l’effectif total ; n le nombre de données de chaque échantillon et k le nombre de test

1/ Exemple pratique : On veut connaître l’influence de 3 médicaments, sur l’apparition de tumeurs hépatiques. Pour cela, on compte le nombre de nodules hépatiques chez 3 souris soumis aux différents traitements.

 

Souris 1

Souris 2 Souris 3
Traitement A 4 tumeurs 3 tumeurs 4 tumeurs
Traitement B 2 tumeurs 1 tumeur 1 tumeur
Traitement C 3 tumeurs 2 tumeurs 3 tumeurs

2/ Ranger les données en fonction de leurs fréquences dans chaque série

2/ Dans notre série :

Nombre de nodules

1

2 3 4
Fréquence pour le traitement A 0 0 1 2
Fréquence pour le traitement B 2 1 0 0
Fréquence pour le traitement C 0 1 2 0

3/ Calculer la somme des fréquences

3/ Dans notre exemple :

Nombre de nodules

1

2 3 4
Fréquence pour le traitement A 0 0 1 2
Fréquence pour le traitement B 2 1 0 0
Fréquence pour le traitement C 0 1 2 0
Somme des fréquences 2 2 3 2

4/ Classer les données en rang et par ordre

4/ Dans notre exemple :

Nombre de nodules

1

2 3 4
Fréquence pour le traitement A 0 0 1 2
Fréquence pour le traitement B 2 1 0 0
Fréquence pour le traitement C 0 1 2 0
Somme des fréquences 2 2 3 2
Rang

1

2

3

4

5

6

7

8

9

5/ Calculer le rang corrigé Rc, qui est la moyenne des rangs pour chaque fréquence

5/ Dans notre exemple :

Nombre de nodules

1

2 3 4
Fréquence pour le traitement A 0 0 1 2
Fréquence pour le traitement B 2 1 0 0
Fréquence pour le traitement C 0 1 2 0
Somme des fréquences 2 2 3 2
Rang

1

2

3

4

5

6

7

8

9

Rang corrigé 1,5 3,5 6 8,5

6/ Calculer les fréquences corrigées Fc

Fc = Rc x F

6/ Dans notre exemple :

Nombre de nodules

1

2 3 4
Fréquence pour le traitement A 0 0 1 2
Fréquence pour le traitement B 2 1 0 0
Fréquence pour le traitement C 0 1 2 0
Somme des fréquences 2 2 3 2
Rang

1

2

3

4

5

6

7

8

9

Rang corrigé 1,5 3,5 6 8,5
Fréquence corrigée FcA 0 0 6 17
Fréquence corrigée FcB 3 3,5 0 0
Fréquence corrigée FcC 0 3,5 12 0

7/ Calculer la somme des rangs de chaque fréquence corrigée

7/ Dans notre exemple :

Ta = 0+0+6+17 = 23
Tb = 3+3.5+0+0 = 6.5
Tc = 0+3.5+12+0 = 15.5

8/ Calculer cr tel que :

N étant le nombre de sujets
K étant le nombre de tests
Ti étant la somme des rangs de chaque effectif

8/ Dans notre exemple :

N=3, k=3
Ta = 23 Tb = 6,5 Tc = 15,5

9/ Si l’effectif total N est inférieur ou égal à 9

On compare le calculé au de la table pour N et k données

Si est supérieur au seuil, il n’y a pas de différence entre les séries considérées.

Si est inférieur au seuil, il existe une différence entre les séries considérées.

9/ Dans notre exemple :

de la table pour N=3 , k=3 : =6

calculé est supérieur au de la table.

Donc il n’existe pas de différence significative entre les 3 traitements quant à l’apparition de nodules hépatiques

10/ Si l’effectif total N est supérieur à 9

On passe au c2 avec un n=(k-1)

Corrélation

La corrélation permet de retrouver et de quantifier un lien de dépendance entre 2 séries ou 2 facteurs.
Il faut que les séries suivent chacune une loi normale

1/ Ranger les données selon un tableau à deux colonnes sous forme de couples

1/ Exemple pratique : Existe t-il une corrélation, entre le taux de cholestérol et le poids, chez 7 patients coronariens ?

Sujets

Cholestérol X

Poids Y
1 3 70
2 1,9 55
3 4 75
4 5 80
5 1,5 60
6 6 90
7 2 67

2/ Calculer :

SX : somme des X
SY : somme des Y
S(XY) : somme du produit XY
SX2 : somme des X au carré
(SY)2 : somme des Y au carré

2/ Dans notre exemple :

Sujets X X2 Y Y2 XY
1 3 9 70 4900 210
2 1,9 3,61 55 3025 104,5
3 4 16 75 5625 300
4 5 25 80 6400 400
5 1,5 2,25 60 3600 90
6 6 36 90 8100 540
7 2 4 67 4489 134
Somme SX = 23,4 SX2 = 95,86 SY = 497 SY2 = 36139 S(XY) = 1778,5

3/ Calculer le coefficient de corrélation r

N étant le nombre de couples.

3/ Dans notre exemple :

r =0.42

4/ Pour qu’il y ait une corrélation entre deux distributions, il faut que la valeur absolue de r soit comprise entre 0 et 1.

4/ Dans notre exemple r = 0,42. Il existe donc une corrélation "moyenne" entre le poids et le taux de cholestérol chez nos 7 coronariens

5/ Pour confirmer l’existence d’une corrélation, il faut appliquer le test t de conformité

Ce t est à comparer à la table de t (1-a/2) avec un degré de liberté n = N-2

Si t calculé est supérieur au t de la table, donc r diffère de zéro, il existe donc une corrélation.

Si t calculé est inférieur au t de la table, donc r est égal à zéro, il n’existe pas de corrélation

5/ Dans notre exemple :

t =1,03

Degré de liberté n = 7-2 = 5

Sur la table t = 1.28

t calculé 1,03 est inférieur au t de la table donc il n’existe pas de corrélation entre le poids des 7 coronariens et le taux de cholestérol.

Cet exemple résume bien la contradiction qui peut exister entre un r calculé qui montre une corrélation moyenne et un test de conformité qui affirme le contraire.
C’est finalement le test t de conformité qui a le plus de valeur statistique.

Régression

La régression permet, non seulement de vérifier le lien entre deux distributions, mais aussi de le représenter graphiquement. Cette opération permet de poser une loi mathématique expliquant la relation d’une distribution par rapport à l’autre.

1/ On représente la régression par une droite de la forme y = ax + b

et b = moyenne des Y – a x moyenne des X

1/ Reprenons l’exemple précèdent :

Sujets

Cholestérol X

X2 Poids Y Y2 XY
1 3   70    
2 1,9   55    
3 4   75    
4 5   80    
5 1,5   60    
6 6   90    
7 2   67    
Somme SX = 23,4 SX2 = 95,86 SY = 497 SY2 = 36139 S(XY) = 1778,5

a = 6,64 correspond à la pente de la droite de régression
b = 71 – (6,64 x 3,34 ) = 48,83 b correspond à l’ordonnée à l’origine
Donc la droite de régression s’écrit Y = 6,64 X + 48,83
Dans le cas de notre exemple : Poids = 6,64 Taux de cholestérol + 48.83

Page précédente Sommaire Page suivante

 
NG COM Santé Tropicale
Copyright © 2004 NG COM Santé tropicale. Tous droits réservés.