La collecte des informations
Cette collecte a’ lieu grâce aux enquêtes qui consistent à rechercher et à recueillir de façon méthodique des informations.
Analysons en les aspects principaux
- Auprès de qui enquêter ?
- Quelles questions poser ? (Elaboration d’un questionnaire.)
- Les différentes catégories d’enquêtes.
AUPRÈS DE QUI ENQUÊTER ? (CHOIX D’UN ÉCHANTILLON REPRÉSENTATIF)
Pour des raisons de coût et de délai, l’enquête ne porte que très rarement sur l’ensemble des agents économiques à étudier. Dans ce cas, elle prend le nom de recensement. (Exemple r le recensement de la population française effectué par l’INSEE, en 1975.)
Dans le cadre des entreprises, des recensements sont effectués lorsque le nombre des agents économiques est relativement faible. Ainsi, une enquête portant sur les entreprises exportatrices d’un département donné, prend souvent la forme d’un recensement (quelques dizaines ou quelques centaines d’entreprises seulement sont concernées).
La plupart des enquêtes ne portent donc que sur une fraction, un échantillon, des agents économiques à étudier, c’est à dire de la « population de base » (1).
L’échantillon doit être représentatif de cette population de base, autrement dit, les informations recueillies sur l’échantillon doivent pouvoir être généralisées à la population de base.
Le choix d’un échantillon représentatif est un point fondamental
Rigoureusement, la condition de représentativité exige la détermination du degré de confiance que l’on peut accorder aux résultats généralisés ou du degré de l’erreur commise en passant de l’étude de l’échantillon à celle de la population de base.
Une seule méthode réalise cette condition : c’est celle qui permet l’utilisation des lois du calcul des probabilités, d’où le nom de Méthodes probabilistes retenu pour cette méthode et les méthodes dérivées.
Les méthodes de sélection de l’échantillon se regroupent ainsi en deux catégories
- Les méthodes probabilistes,
- Les méthodes non probabilistes,
que nous présenterons successivement.
Les méthodes probabilistes (1) de choix de l’échantillon
Les lois du calcul des probabilités ne peuvent être appliquées que si les agents économiques, les unités, de la population de base, ont la même chance de faire partie de l’échantillon. On dit alors que les unités ont été prélevées au hasard (2).
Méthode probabiliste de base . le sondage au hasard
Pour que la condition « chance égale de faire partie de l’échantillon » soit réalisée, il ne faut pas que le raisonnement ou les attitudes de la personne effectuant le tirage interviennent. On doit avoir recours à une méthode de « sélection automatique » (3).
On utilise des tables de nombres dits « au hasard » qui ont été obtenus par des procédés physiques (par exemple : chiffres de O à 9 disposés sur un disque en rotation dans le noir ; les chiffres retenus étant ceux qui sont éclairés de façon intermittente).
Les tables de nombres au hasard couramment utilisées sont celles
- de Tipett, qui renferme 41 600 chiffres au hasard,
- de Fischer et Yates, qui renferme 1 5 000 chiffres, de Kendall et Babington, qui renferme 100 000 chiffres,
- de la Rand Corporation, Smith, qui renferme 1 000 000 de chiffres.
Le document n° 6 donne un extrait de la table de Tippet (4).
Ces tables sont utilisables à partir de n’importe quel point, dans n’importe quel sens et n’importe quelle direction. Toutefois, un sens et une direction ayant été retenus, il faut s’y tenir.
Exemple On désire prélever un échantillon de 50 clients parmi 820 clients numérotés de O à 819. On retiendra 50 groupes de 3 chiffres, en remontant, par exemple, les colonnes à partir de la dernière (voir document n° 6, extrait de la table de Tipett)
409 737 379 289 994 238...remplace par le reste de la division par 820(5) soit 84.
Les clients qui auront les numéros ci dessus constitueront un échantillon représentatif de l’ensemble des clients
Le sondage au hasard :
exige la numérotation de la population de base (1),
entraîne de longs déplacements des enquêteurs lorsque la population de base est répartie sur un vaste territoire,
lie le degré de confiance que l’on peut accorder à la généralisation
à la taille de l’échantillon : il varie en fonction de la racine carrée de la taille de l’échantillon (une taille minimum de 30 est exigée)
à l’homogénéité de la population de base par rapport au caractère étudié. Plus l’homogénéité est grande et plus la taille de l’échantillon peut être faible. Exemple ,’taille importante pour une étude sur le lave vaisselle, taille réduite pour une étude portant sur le sèche cheveux.
Pour toutes ces raisons des méthodes dérivées ont été mises en place.
Méthodes probabilistes dérivées
Ces méthodes permettent de résoudre les problèmes posés par
La contrainte de numérotation : le sondage systématique ou en progression arithmétique.
Il suffit d’avoir une liste classée (1) de la population de base. On constitue l’échantillon en prélevant les unités suivant une progression arithmétique.
Exemple : tous les 16 noms (820/50) On dit que l’on fait un tirage au 1/16e, à partir d’une première unité choisie au hasard (table de nombres au hasard).
On est étonné de constater l’ignorance de cette méthode par les services commerciaux de petites et moyennes entreprises. C’est pourtant un moyen efficace, rapide et peu onéreux, de connaissance de la clientèle dans tous les cas où elle est répertoriée.
La contrainte de déplacements importants des enquêteurs : le sondage en grappes (sondage aérolaire)
On prélève au hasard des groupes d’unités voisines c’est à dire des grappes (au lieu de prélever des unités « individuelles »).
Lorsque le critère de regroupement est géographique, le sondage est un sondage aérolaire.
Exemple : Pour étudier la vente de systèmes d’arrosage, on prélève au hasard 10 petites aires géographiques sur une région donnée, et on étudie toutes les exploitations agricoles qui y seront comprises.
REMARQUE. Il est conseillé, pour avoir le même degré de précision que dans le sondage au hasard, de prendre une taille plus élevée de l’échantillon (en effet, les unités d’une même grappe peuvent présenter des ressemblances).
Les deux contraintes précédentes (liste et déplacements) : le sondage à plusieurs degrés
On pratique une succession de tirages au hasard. Par exemple, on prélève au hasard un département sur six, parmi les seize départements obtenus, on prélève au hasard une commune sur trente, soit environ36000/6x3 = 200 communes, parmi ces 200 communes, on prélève au hasard une épicerie sur cinq (sondage au hasard ou sondage systématique).
Il suffira donc d’avoir la liste des épiceries de 200 communes au lieu de celles de 36 000 communes.
Cette méthode concentre géographiquement les unités de l’échantillon.
La non homogénéité de la population de base : -le sondage à plusieurs phases
Ce sont les mêmes éléments des unités de sondage qui sont utilisés dans les phases successives, mais plus ou moins partiellement.
On pose à tous les éléments de l’échantillon, les questions qui concernent le caractère qui présente le plus de différences dans la population. Puis, on prélève au hasard, dans cet échantillon, un sous échantillon auquel on pose les questions qui portent sur le caractère qui présente de moindres différences dans la population et ainsi de suite.
Exemple : Enquête sur les appareils électriques.
La 1° phase portera sur le lave vaisselle.
La 2° phase portera sur la machine à laver.
La 3° phase portera sur le sèche cheveux.
-le sondage stratifié
Les statisticiens parlent de stratification, les mercaticiens (1) de segmentation. Il s’agit pourtant de la même notion (voir p. 110).
On découpe la population à étudier en strates, c’est à dire en segments homogènes par rapport au caractère étudié.
On effectue l’étude strate par strate. Le prélèvement au hasard a lieu au sein de chaque strate, et les résultats sont généralisés à chaque strate.
Exemple : Enquête sur la consommation de lait homogénéisé. On peut retenir deux strates : les communes rurales et les communes urbaines. Un petit échantillon prélevé dans chacune des strates assure un meilleur résultat qu’un échantillon de taille bien plus importante au niveau de l’ensemble des communes.