Statistiques descriptives
 

Définitions

Remarques

Population

Ensemble E d'individus définis par une propriété commune donnée.

Population et individus ne représentant pas forcément des personnes.

Echantillon

Sous-ensemble de la population

Le choix de l’échantillon conditionne la qualité des résultats statistiques.

Caractère / mesure / variable

Application qui fait correspondre aux individus de E une valeur définie comme le résultat de l’expérience.

Le résultat possible d'une expérience est appelé valeur d'un caractère.

Caractère quantitatif

Lorsque le résultat de la mesure (ou la valeur du caractère) est un nombre

Il existe alors une relation d'ordre entre les valeurs du caractère : plus petit que, plus grand que, etc.

Caractère qualitatif

Le résultat n’est pas un nombre. Par l'intermédiaire d'un code on peut associer aux résultats une valeur numérique.

Il n'y a pas de relation naturelle liant les mesures ou les codes entre eux

Caractère continu ou discret

Le caractère est défini par la nature de l’ensemble des résultats possibles : dénombrable fini ou infini, non dénombrable, continu.

Un caractère qualitatif est a priori discret et fini.

Série statistique

(x1,....,xi,xi+1,.......xn) ou xi représentent une mesure

n représente l'effectif, c'est à dire le nombre de mesures.

Caractère temporel

L'individu est unique, mais son observation est répétée dans le temps.

xi = x(ti) avec ti : instants différents.

 

 

Les paramètres statistiques (une dimension)

 

Contexte

Notation

Définition

Valeurs de la mesure x 1, x 2,… ,x i,……, x N x i représente le résultat d’une mesure du caractère sur un individu.

N représente le nombre d’individus et donc la taille de l’échantillon.

Valeur du caractère x1< x2<…….< xi<…….< xk
Cas discret : k valeurs distinctes des x i.
Cas continu : centre des k intervalles de classe créés à partir de x 1,… x N
Effectifs associés aux valeurs du caractère n1, n2,……., ni,………, nk Effectifs associés aux xi avec

Sur les données brutes issues de la mesure, la notion d’effectif n’a pas de sens.

Fréquences f1, f2,……., fi,………, fk Fréquences associées aux xi avec

Sur les données brutes issues de la mesure, la notion de fréquence n’a pas de sens.

Série statistique ou  
  Paramètres de position  
Médiane   Valeur du caractère qui divise les mesures en deux groupes d’effectifs égaux.
Mode ou classe modale   Valeur du caractère ayant un effectif ou une fréquence maximale.
Moyenne Les deux formules donnent des résultats différents dans le cas continu avec regroupement par classes.
  Paramètres de dispersion  
Variance Sur les données brutes on remplace k par N, ni par 1 et xi par x i.
Ecart-type  
      Les paramètres statistiques (deux dimensions)

Contexte

Notations et formules

Définition

Valeurs de la mesure de deux caractères Données brutes

(x 1,z 1), (x 2,z 2),… , (x i,z i),……, (x N,z N)

(x i,z i) résultat de la mesure des deux caractère sur un même individu.

N taille de l’échantillon.

Valeur des deux caractères x1< x2<…….< xi<…….< xk

y1< y2<…….< yj<…….< yl

Valeurs classées ou centres de classes.
Effectifs associés n1,1, n1,2,……., ni,j,………, nk,l

Effectifs associés à :

(x1, y1), ……., (xi, yj),…..., (xk, yl).

Fréquences f1,1, f1,2,……., fi,j,……, fk,l

Fréquences associées à (xi, yj). Sur les données brutes la notion de fréquence n’a pas de sens.
Série statistique ou  
  Paramètres marginaux  
Effectifs et fréquences marginales Les effectifs marginaux permettent de construire des distributions marginales en x et en y : (xi,ni.) et (yj,n.j)
Moyennes marginales en x et en y  
  Covariance et régression  
Covariance  
Coefficient de corrélation

Tester l’hypothèse H0(|r|=0) soit avec la table des coefficients de corrélation pour le ddl de (N-2), soit avec la table de la loi normale en calculant :

Droites de régression

Les deux droites se coupent au point de coordonnées (mx,my).