sept 24, 2012

Le traitement des non-réponses

Digg This
Reddit This
Stumble Now!
Buzz This
Vote on DZone
Share on Facebook
Bookmark this on Delicious
Kick It on DotNetKicks.com
Shout it
Share on LinkedIn
Bookmark this on Technorati
Post on Twitter
Google Buzz (aka. Google Reader)

La non-réponse est un problème « universel » au sens où elle concerne non seulement les enquêtes par sondage aléatoire mais aussi les recensements et les enquêtes par sondage empirique, comme les enquêtes par quotas.

On distingue traditionnellement deux grands types de non-réponse : la non-réponse totale lorsque l’on obtient aucune réponse à l’ensemble du questionnaire relatif à un individu échantillonné et la non-réponse partielle lorsqu’un individu échantillonné ne répond pas à une partie plus ou moins importante du questionnaire.

La présence de données manquantes influe sur la qualité de l’inférence. En effet, l’utilisation des formes habituelles d’estimateurs en se restreignant à la population des répondants pose problème lorsque les non-répondants ont un comportement différent des répondants pour le thème de l’enquête. Ceci est en général le cas car la non-réponse est rarement le fruit du hasard. Ainsi, par exemple, il est bien connu que pour une enquête sur les revenus les non-répondants ont le plus souvent des revenus élevés. Par conséquent, l’estimateur classique du revenu moyen par individu obtenu à partir des répondants sousestime le vrai revenu moyen. Cet estimateur est donc biaisé, le biais étant d’autant plus important que le comportement des non-répondants est différent de celui des répondants et que le taux de non-réponse est élevé. De plus, l’estimateur obtenu admet une variance d’échantillonnage plus grande (il est donc moins précis) puisque la taille de l’échantillon exploitable est plus faible que celle prévue au moment du tirage.

Il existe deux techniques de correction de la non-réponse :

  • Les méthodes de repondération, principalement utilisées pour compenser la non-réponse totale, consistent à augmenter le poids d’échantillonnage des répondants pour tenir compte des non-répondants.
  • Les méthodes d’imputation qui peuvent être employées pour la no-nréponse partielle et la non-réponse totale visent à remplacer les réponses manquantes par une (ou plusieurs) valeur(s) « plausible(s) ». Dans la pratique, on considère cette dernière technique comme avantageuse puisqu’une fois les données imputées on dispose d’un ensemble de données complet. Néanmoins, les résultats obtenus peuvent être assez trompeurs si le nombre de réponses imputées est relativement important.

http://www.insee.fr/fr/publications-et-services/

Leave a comment

*