Tests sur les moyennes

Test t de Student pour des variables normales

Teste la significativité de différences de deux moyennes entre échantillons indépendants ou appariés.

Hypothèses :

  • les échantillons suivent une loi normale.
  • les échantillons sont soit indépendants soit appariés;
  • les échantillons ont la même variance.

Fonction R : t.test

A noter que la troisième hypothèse semble pouvoir être contournée à l'aide de l'argument var.test, mais cela peut compliquer l'interprétation. Voir :

http://en.wikipedia.org/wiki/Student%27s_t-test#Assumptions

Test non paramétrique de Wilcoxon/Mann-Whitney

Test sur l'identité de deux séries de valeurs numériques. C'est un test non-paramétrique, qui ne fait aucune hypothèse sur les données considérées.

Fonction R : wilcox.test

Tests sur les distributions

Test Shapiro-Wilk de normalité

Le nombre de valeurs non-manquantes doit être compris entre 3 et 5000.

Fonction R : shapiro.test

Test de Kolmogorov-Smirnov

Test d'ajustement à une loi continue. Il permet d'estimer si deux échantillons suivent la même loi, ou bien si un échantillon suit une loi donnée. Il compare les fonctions de répartition.

Pour un test d'ajustement à une loi normale, il vaut mieux utiliser le test de Shapiro.

Fonction R : ks.test

Test de Kruskal-Wallis

Test non-paramétrique, sorte de généralisation du test de Wilcoxon/Mann-Whitney à plus de deux échantillons. Il teste si des échantillons indépendants sont issus d'une même population.

Fonction R : kruskal.test

Tests sur les variances

Test F

Le test F estime si deux échantillons d'une même loi de distribution gaussienne sont de même variance.

Fonction R : var.test

Tests non paramétriques de Mood et d'Ansari-Bradley

Ce sont des tests non-paramétriques sur la distribution de deux échantillons (on peut parler de variance car on est en non-paramétrique).

Fonctions R : ansari.test et mood.test.

Test de Bartlett

Le test de Bartlett estime si les différentes sous-catégories d'une variable de distribution normale ont la même variance.

Le test donne un résultat global et ne permet pas d'estimer les différences de variances des sous-catégories deux à deux. Il est très sensible à la non-normalité.

Fonction R : bartlett.test

Test de Fligner-Kileen

Test non-paramétrique de comparaison de variances dans plusieurs sous-catégories d'une variable continue. C'est l'un des tests les plus robustes à la non-normalité des données.

Fonction R : fligner.test