Relations et corrélations Coefficient de corrélation linéaire

, par  Bernard Vuilleumier , popularité : 1%

Coefficient de corrélation

La science travaille avec des nombres et établit des relations entre des ensembles de nombres. Ces ensembles de nombres peuvent être liés par une fonction - on parle alors de loi - ou associés statistiquement et on parle de corrélation. Le coefficient de corrélation qui mesure l’association entre deux ensembles xi et yi de i nombres chacun dont la moyenne vaut respectivement xm et ym est donné par :

( Underscript[∑, i] (x_i - x_m) (y_i - y_m))/((Underscript[∑, i] (x_i - x_m)^2)^(1/2) (Underscript[∑, i] (y_i - y_m)^2)^(1/2))

Ce coefficient mesure une corrélation linéaire. Une valeur proche de zéro indique qu’il n’y a qu’une faible corrélation linéaire entre les variables mais n’exclut pas une corrélation non linéaire significative.

Pour en savoir plus
- Article « Corrélation » de Wikipédia
- Notion de corrélation
- Bernard Ycart, Test de corrélation

Expérimentation - Simulation

Vous disposez de deux ensembles xi et yi de i nombres chacun et vous aimeriez savoir s’ils existe une relation entre ces nombres ou s’il sont corrélés d’une certaine manière.

Questions

  1. Créez deux ensembles xi et yi de i nombres : a) distribués aléatoirement selon une loi normale de moyenne μ et d’écart type σ. b) liés par une relation linéaire y=kx ± Δy où Δy est distribué aléatoirement selon une loi normale de moyenne μ et d’écart type σ. c) obtenus en itérant la fonction y=rx(1-x) à partir d’une valeur initiale comprise entre 0 et 1 et pour un paramètre r compris entre 1 et 4.
  2. Calculez le coefficient de corrélation entre les deux ensembles de nombres dans chaque cas.
  3. Comment ce coefficient varie-t-il lorsque la taille des ensembles augmente ?
  4. Comment la relation entre les deux derniers ensembles de nombres peut-elle être mise en évidence ?

Voir en ligne : Visualizing R-Squared in Statistics