Back to Home / retour à Tumor Free

M2R EQSA Denis Corpet - Petit traité de STATISTIQUES - à l'usage des débutants. Page 1

 

1- Structures des données

            Je vous montre des manips de structure très SIMPLE. On peut faire plus compliqué !

            Structure et analyse des données doivent être prévues AVANT de faire l'expérience.

            Vous verrez dans vos labos, des stats plus complètes (ANOVA, modèle linéaire)

 

1.1- Comparer des moyennes :
on veut savoir si deux groupes sont identiques (hypothèse nulle) ou différents, pour une même mesure.
C'est simple. Ca donne des protocoles efficaces.

Certe, l'analyse de variance permet d'analyser plusieurs groupes de données, en construisant un modèle (non traité ici).
La comparaison de deux groupes est le cas le plus simple, vu ici.

Ex: les garçons sont-ils plus grands que les filles ? Souvent 2 groupes de 5 à 10 individus suffisent.

Ex.de test: t de Student (pour variances égales, données indépendantes et Normales)

 

1.2- Connaître le lien entre deux mesures : on veut savoir si deux mesures faites sur le même individu sont liées. Ce lien ne signifie pas un rapport de cause à effet ! Ex: les grands sont ils plus lourds ? (lien poids-taille). Souvent 20 à 50 individus, et donc couples x-y, suffisent.

Ex.de test: coefficient de corrélation (hypothèse nulle r = 0,

pas de lien, nuage de points circulaire pour données Normales)

 

1.3- Analyser table de contingence : On veut savoir si des "individus" sont répartis au hasard dans des catégories. L'hypothèse nulle est que les colonnes sont indépendantes des lignes. En général, il faut 100 à 300 "individus", moins si la différence de % est forte.

Ex: l'arsenic tue plus de gens que l'eau (table "mort/vivant" de 2x2 cases)

Ex.de test: Chi 2 (pour individus indépendants et toutes cases >5)

 



2- Interpréter p                                                  p

 

2.1- Pour les "Nuls": Plus p est petit, plus la différence est significative.

 

p est la probabilité de se tromper en disant "c'est significatif".

On "veut" souvent que p soit plus petit que 0.05 (= 5 %).

 

On écrit dans la partie "Résultats": "La différence est significative (p < 0.05)" ou au contraire: "On n'observe pas d'effet significatif (p=0.47)".

Attention si p est plus grand que le seuil on ne peut pas conclure.

                                    Absence de preuve n'est pas preuve d'absence !

 

2.2- Vrai p: p est la probabilité du résultat obtenu, ou de résultats plus extrêmes, sous l'hypothèse nulle. Autrement dit, si l'hypothèse nulle est vraie, p est la probabilité que 2 groupes pris au hasard dans une même population aient des moyennes aussi différentes (ou plus) que les groupes réellement mesurés. Si on a très peu de chances d'observer par pur hasard le résultat que l'on a obtenu (p très petit), ce résultat a des chances d'être dû à un "vrai effet", il est donc significatif.

            On écrit dans la partie "Méthodes": "On rejette l'hypothèse nulle si la probabilité que la différence entre groupes soit due au hasard est inférieure à 0.05".




 3. Stat-élém.: PRATIQUE avec le tableur logiciel  Excel

 

But 1 - obtenir une représentation résumée des données, pour mieux comprendre et communiquer

But 2 - estimer la "signification" des données: La réponse, c'est petit "p"

Y-a-t'il un effet réel ou est-ce du hasard ? 

 

3.1- Calculer & comparer des moyennes de 2 groupes: pratique du Student

 

1- entrer les données dans Excel (en 2 colonnes)

2- résumer les données: fonctions fx: Moyenne, Ecart-type

3.1- "figurer" données résumées: histogramme des moyennes

3.2- barres d'erreur (cliquer sur la série, "format", barre d'erreur Y, personnalisée)

4- fonction fx  statistiques  TEST.STUDENT 

Ou, mieux, si votre Excel le permet:

5- Outil /UtilitairedAnalyse (barre du haut)

Test d'égalité des espérances: deux observations de variances égales

 

6- Variations éventuelles sur ce test (t Student)

6.1- données appariées (paired data)

6.2- variances inégales (si cela "se voit")

6.3- p unilateral (ne pas utiliser normalement)

6.4- hypothèse autre que nulle

Exemple test Student dans Excel

 

3.2- Connaître le lien entre deux mesures: calcul de la corrélation

 

1- entrer les données dans Excel (en 2 colonnes)

2- représentation graphique (nuage de points, PAS "courbe")

3- fonction fx statistique COEFFICIENT.CORRELATION

(mais Excel donne r (coeff. correl), pas p : il faut regarder une table des p en fonction de r et du degré de liberté, cf. Table des "p"/Excel)

Ou, mieux, si votre Excel le permet:

4- Outil / Utilitaire d'analyse

Analyse de corrélation puis Analyse de Regression

Exemple de Corrélation dans Excel, et Table des "p"

 

3.3- Analyser table de contingence: pratique du Chi2 (ou Khi deux)

 

1- entrer données observées dans tableau 2x2 dans Excel

2- calculer  tableau "expected data"  (données attendues s'il n'y avait pas d'effet)

= le rapport du produit des totaux de ligne et de colonne, avec le total général.

En pratique,
mettre les 4 données réelles dans le coin haut/gauche,  
cases A1, B1, A2, B2 du tableur Excel.

Faire somme lignes en
C1=A1+B1 et
C2=A2+B2, et colonnes en
A3=A1+A2 et
B3=B1+B2 et enfin total général
C3=A3+B3 (attention, mettre les Formules dans les cases, pas les nombres calculés par vous!)

Les données "attendues" seront donc
D1=C1*A3/C3,
E1=C1*B3/C3 et
D2=C2*A3/C3,
E2=C2*B3/C3

On peut utiliser les formules "toutes faites" dans l'exemple /Excel

3- fonction fx stat TEST,KHIDEUX et définir les zones de données: Excel vous donne la valeur de p

4- c'est valable pour les grands nombres (1000)et si toutes les cases sont supérieures à 5

 

sinon il faut utiliser un "vrai" logiciel statistique pour

4,1- Chi 2 avec correction de Yates (faisable sous Excel, +0.5 ou -0.5, cf cf. Exemple)

4,2- Fisher exact test (le mieux car donne vraie valeur de p)

Exemple test Chi 2 dans Excel (avec aussi correction de Yates)

Enfin pour les inconditionnels de Systat:
un mode d'emploi (Word) pour test de Chi-deux sous Systat.
Back to Home / retour à Tumor Free