Test

Variable latente




adj (angl : latent variable)

Méthod. Variable non directement observable mais dont les valeurs peuvent être estimées à partir de données observables.

C'est le cas par exemple des variables déterminées au cours d'une analyse factorielle, des variables estimées à partir du chronométrage de variables observables,  telles que la différence entre deux temps de réaction à deux stimuli différents (voir aussi temps de latence).

Spearman et Thurstone sont parmi les premiers auteurs ayant introduit les modèles à variables latentes en sciences humaines. Confrontés au problème inhérent à la psychologie, mesurer l'inobservable (attitudes, pensées, opinions...) les deux auteurs partent du principe selon lequel pour estimer ces variables, on peut observer la covariation de ces variables supposées et de certaines variables directement observables (parfois appelées variables manifestes). Concrètement et par exemple, on peut vraisemblablement évaluer la religiosité d'une personne, en comptabilisant son nombre de visites dans des lieux de cultes. Une variable observable peut alors être mise en lien avec des modèles théoriques de la psyché humaine, fondés sur l'existence d'états mentaux. Ces variables latentes sont tout aussi nombreuses que les états mentaux supposés, elles peuvent être évasives, floues ou relativement concrètes, ou encore, totalement inconnues : amour, attitude, inégalités scolaires, peur de l'avion, facteur X...

On range sous le nom de variable latente plusieurs types de variables, au sens méthodologique :
  • les variables latentes hypothétiques, sont créées pour les besoins de l'expérimentation ou selon un cadre théorique concerné : le modèle théorique en psychologie sociale, des attitudes, par exemple, présuppose qu'existent des états mentaux que l'on va tenter d'évaluer à l'aide de questionnaires portant sur des opinions ou des comportements effectifs. 
  • les variables latentes globales ou facteurs, consistent en une estimation globale de nombreuses variables observées, c'est par exemple, une mesure de l'intelligence fondée sur le nombre de mots retenus sur une liste + le nombre d'erreurs à des jeux de logiques + un score représentant une variable latente supposée estimer l'intelligence verbale + etc... Ce type de variable synthétise en fait plusieurs variables observées. On obtient généralement moins de facteurs que de variables effectivement mesurées, car plusieurs peuvent être dépendantes. Dans ce cas, on estime un (ou plusieurs) facteur commun à ces variables observées, lequel représente la variable latente sous tendant les mesures.
S'il est difficile d'obtenir des estimations normées (c'est-à-dire, par rapport à des standards), il est par contre assez aisé d'établir des profils de covariations : une variable manifeste varie proportionnellement à une variable latente supposée (si ces variables sont fortement corrélées). Partant de ce principe, on peut observer au sein d'un modèle théorique, différentes variables manifestes et réaliser une analyse en facteurs communs et spécifiques (analyse factorielle) afin de déterminer quelles variables observables sont indépendantes entre elles, et s'il existe des facteurs indépendants, qui rendraient compte des mesures observées. Généralement, ceux-ci regroupent plusieurs des variables observables, relativement dépendantes entre elles, dont chaque groupe interdépendant correspondent à un facteur : la variable latente, inobservable directement.

Cette analyse factorielle est l'une des plus connues, principalement parce qu'elle permet d'associer des variables latentes quantitatives à des variables observables (quantitatives également). Lorsque les variables observables sont qualitatives, on effectue une analyse des classes latentes (variable latente qualitative) ou analyse des traits latents (variable latente quantitative).