Document Pédagogique : guide d`utilisation de Statistica pour
Transcription
Document Pédagogique : guide d`utilisation de Statistica pour
Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Maîtrise de Psychologie Sociale Méthodologie, (D145U) Corinne Mazé Jean-François Verlhiac Document Pédagogique : guide d’utilisation de Statistica pour données qualitatives et quantitatives 1 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac DOCUMENT PEDAGOGIQUE : GUIDE D’UTILISATION DE STATISTICA POUR DONNEES QUALITATIVES ET QUANTITATIVES 1 I- GESTION DES DONNEES 3 1/ Entrer des données sous le tableau Excel 3 2/ Importation d’un fichier Excel sous Statistica 5 3/ Constitution de blocs 7 4/ Transformer une variable continue en variable catégorielle 8 5/ Recodage des valeurs d’une échelle de mesure (renverser les valeurs d’une échelle) 12 II- TESTS STATITIQUES 13 1/ Test du Chi2 : test des différences entre variables qualitatives à 2 ou n classes 13 2/ Test des différences entre variables quantitatives dans le cas de deux groupes : 2/1. Le test t – Echantillons indépendants 2/2. Le test t – Echantillons appariés 15 15 16 3/ Test de Mann et Whitney (échantillons indépendants) et Wilcoxon (échantillons appariés): 17 4/ Analyse de Variance : Test des différences entre variables dans le cas de plus de 2 groupes. 18 4/1. Plan du type 3 facteur inter sujets 18 4/2. Plan du type 3 X 2 facteurs inter sujets X 3 facteur intra sujets. 21 4/2.1 Analyses en contrastes ou comparaisons planifiées 23 a- Tests sur la variable intra-sujet (Quand plus de deux modalités) 23 b- Test d'un effet simple de la variable intra-sujet sous une condition expérimentale 24 5/ Test d'homogénéité des échelles de mesure (Calcul de l'alpha de Cronbach) 26 6/ Corrélations 28 7/ Comparaison de deux proportions 32 III- QUELQUES CRITERES DE REALISATION D’UNE ANALYSE DE VARIANCE A EXPLORER 1/ Test de Normalité et test d'égalité des Variances Avant-Propos sur ces deux tests 1.1-Procédure générale, commune aux deux tests : 1.2-Test de Kolmogorov Smirnov et de Lilliefors : 1.3-Test d'homogénéité des variances-Tests Univariés : 36 36 36 36 36 38 IV- ARBRE DÉCISIONNEL 40 V- EXERCICES 41 NOTE : CE SUPPORT DE COURS PORTE SUR DES EXERCICES ET BASES DE DONNEES FOURNIS LORS DE L’ENSEIGNEMENT DE METHODOLOGIE. ADRESSE DU SITE OU RECUPERER LES EXERCICES (BASES DE DONNEES) : intranet.u-paris10.fr Tapez sur DOSSIERS PERSONNELS puis sur V puis VERLHIAC 2 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac I- GESTION DES DONNEES 1/ Entrer des données sous le tableau Excel - Utiliser Excel comme base de donnée de départ. Mettre en première ligne les intitulés des variables (données biographiques : code sujet, sexe, âge sujet, Variables indépendantes : niveau de réussite, type d’information, Variables dépendantes : performance, jugement, etc.). Exemple : première ligne : trois données biographiques, plan de type 2X2 avec une mesure dépendante Code sujet Sexe Age Niv. Réussite Type d’Info. Performance Les lignes suivantes contiennent les données ou observations par sujet (une ligne par sujet). Pour les variables indépendantes : indiquer les modalités des variables (exemple modalité 1: succès; modalité 2 : échec) ou les observations (données qualitatives, données quantitatives). Attention : Pour les modalités des variables indépendantes ; vous pouvez taper soit les codes numériques des modalités de la variable indépendante (par exemple : pour succès taper : 1 ; pour échec taper 0), soit la valeur texte elle-même de la modalité de la variable indépendante (par exemple : pour succès taper : SUCCES; pour échec taper ECHEC). Le logiciel statistitica reconnaît automatiquement le texte et le code d’une variable indépendante comme le nom de la modalité de la variable indépendante. NB : En cas d’utilisation d’un autre logiciel de traitement statistique que Statistica, il est conseillé de coder numériquement les modalités des variables Indépendantes. Exemple 1 lignes sujets : trois données biographiques, plan de type 2X2 avec deux mesures dépendantes. 9 lignes (1 ligne titre variables, 8 lignes d’observations), 7 colonnes. Code sujet 001 123 001 123 012 003 013 015 Sexe 1 2 2 1 1 2 1 2 Age 17 20 18 24 21 17 23 19 Niv. Réussite 1 1 1 1 2 2 2 2 Type d’Info. 1 1 2 2 1 1 2 2 Performance 24 20 18 12 12 10 9 12 Jugement 8 1 5 9 5 9 4 8 Exemple 2 lignes sujets : trois données biographiques, plan de type 2X2 avec deux mesures dépendantes, 9 lignes (1 ligne titre variables, 8 lignes d’observations), 7 colonnes. Code sujet 001 123 001 123 012 003 013 015 Sexe F M M F F M F M Age 17 20 18 24 21 17 23 19 Niv. Réussite SUC SUC SUC SUC ECH ECH ECH ECH Type d’Info. PERTINENT PERTINENT NONPERTI NONPERTI PERTINENT PERTINENT NONPERTI NONPERTI Performance 24 20 18 12 12 10 9 12 Jugement 8 1 5 9 5 9 4 8 3 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Le fichier doit être enregistré sous le format .xls. Nommez votre fichier à votre convenance. Par exemple : “ Mes données ”. 4 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac 2/ Importation d’un fichier Excel sous Statistica B/ Sélectionner le fichier excel à importer. - cliquer sur le fichier " Mes données ". - cliquer sur " ouvrir " Procédure : Ouvrir STATISTICA et sélectionner n’importe quel module, par exemple, Statistiques élémentaires. Cliquer sur “ Basculez vers ”. A / Cliquer dans Menu fichier - choisir importer des données -choisir Rapide - choisir "Feuil1 " puis " OK " 5 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac C/ 1. Il faut vérifier que le nombre de Variables et le nombre d'Observations indiquées par le logiciel correspondent aux nombres de Variables et d'Observations introduites dans le fichier Excel. Ouvrir le fichier “ Mes données STAT ”. Dans le menu Fichier, sélectionner “ Ouvrir un Fichier de Données ” et sélectionner puis Ouvrir le fichier “ Mes données STAT ”. Attention : Il ne faut pas oublier que la première ligne de la base de donnée est toujours une ligne Titre des Variables : code sujet ou Indépendante ou Dépendante et que la seconde ligne correspond à la première observation. Dans l’exemple qui va suivre, la base de données aura 9 lignes (Intitulées par Statitica : Observations. Soit 1 ligne Titre et 8 observations) et 7 colonnes (intitulées par Statistica : Variables). 2. Cocher " prendre les noms des variables de la 1ère ligne de l'étendue spécifiée " (Il s’agit de demander au logiciel de reconnaître la première ligne du fichier Excel comme la ligne Titre des variables, et les 8 autres lignes comme les observations). cliquer sur " OK " - renommer le fichier par exemple : " Mes données STAT " (le logiciel crée un fichier de données “ Statistica ”). cliquer " enregistrer " 6 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac 3/ Constitution de blocs L’objectif : A partir d’une série de données, constituer une seule mesure (faire la somme, la moyenne ou appliquer une formule particulière sur l’ensemble des mesures). Procédure : - Cliquer une fois sur la colonne 5 (n’importe ou sur la colonne 5). - Sélectionner dans le menu : “ Edition ”----“ variables ”----“Ajouter… ” Point de départ : ouvrir l’application statistique (Statistica), ouvrir le fichier de données qui vous intéresse. Pour exemple, le fichier suivant est composé de 5 variables et de 15 observations. - Dans la nouvelle fenêtre : Préciser le nombre de variables à rajouter : “1” Vérifier que le nom de la variable qui précède la nouvelle variable est : “ ITEM5 ” (sinon taper ITEM5). Faire “OK ”. Etape 1 : S’assurer que les items dont on va faire la moyenne ont un alpha de Cronbach, dont la valeur se situe aux alentours des valeurs .70 et .90 (cf. partie II, document 5 p. 26 : Calcul de l’alpha de Cronbach). Etape 2 : Objectif : Créer une nouvelle colonne après la colonne 5 (Item5) qui accueillera la mesure du bloc. Etape 3 : Objectif : Donner un titre à la nouvelle colonne : par exemple Moyenne et faire la moyenne des 5 colonnes du fichier. 7 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Cliquer “ oui ” : Procédure : Double cliquer sur le titre de la nouvelle colonne : “N_VAR ” Dans la case Nom : taper par exemple “ Moyenne ”. Dans l’encadré “ Décimales “ tapez 2 (décimales après la virgule). Dans l’encadré intitulé Description détaillée (étiquette, lien ou formules avec Fonctions) : Taper la formule “ = (V1 +V2+V3+V4+V5)/5 ” NB : V1 = colonne 1 intitulée ITEM1, V2 = colonne 2 intitulée ITEM2…V5 = colonne 5 intitulée ITEM5. Cliquer sur “ OK ” Vous avez désormais une seule variable dépendante qui regroupe les 5 mesures précédentes. 4/ Transformer une variable continue en variable catégorielle Objectif : on peut vouloir utiliser les données recueillies auprès des sujets d’une expérience (réponse à une échelle de mesure) et les transformer en données catégorielles. Par exemple, on peut créer deux voire trois modalités pour une même catégorie. 8 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Procédure : On veut transformer les données de la colonne ITEM2 en variable catégorielle à deux modalité. Les données se répartissent de la valeur 2 à la valeur 9. On sépare les données en deux populations en prenant leur valeur médiane. Sélectionner la base de données qui vous intéresse. - sélectionner la variable “ ITEM2 ” cliquer sur “ OK ” - cliquer sur “ Statistiques descriptives détaillées ” Sélectionner “Médiane” “OK” Etape 1 : Choisir la colonne que l’on veut transformer (par exemple ITEM2). - a- Recueillir la valeur médiane de la variable ITEM2. Ouvrir le module “ Statistiques descriptives ” sélectionner l’option “ Médiane et quartiles ” cliquer sur le bouton “Variables ”, 9 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac La valeur médiane est égale à 6 Etape 2 : Créer une nouvelle colonne pour procéder à la transformation de la variable ITEM2 en variable catégorielle et Nommez la nouvelle colonne “ Catégorie ” (cf. Partie I document 3, Etape 2 “ Constitution de blocs” pour créer une nouvelle colonne). Etape 3 : Recopier les valeurs de la valeur ITEM2 dans la nouvelle colonne “ Catégorie ” - a- Sélectionner toutes les cases de la colonne ITEM2, - b- Menu “ Edition ” -- “ Copier ” - c- Sélectionner toutes les cases de la colonne “ CATEGORIE ” - d- Menu “ Edition ” --“ Coller ” Etape 4 : Transformer les valeurs de la colonne CATEGORIE en un codage à deux modalités : 1 et 2. - Sélectionner la variable “ CATEGORIE ” (cliquer dans l’intitulé de la colonne) - Sélectionner “ Menu ”--“ Variables ”--“ Recodifier ” 10 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Cliquer sur “ Oui ” Cliquer “ Non ” Dans la nouvelle fenêtre taper par exemple les valeurs indiquées ci-dessous puis cliquer sur “ OK (recodifier) ” Etape 5 : Mettre les décimales à 0 en utilisant le bouton de défilement des décimales -Sélectionner la nouvelle variable : Cliquer “ 0 ” dans l’option “ Décimales ”. Cliquer “OK” NB : v7 = variable CATEGORIE (7ème colonne), médiane = 6, Les sujets dont les notes sont inférieures à 6 (valeur 6 non comprise dans la modalité 1) sont codés 1 et les sujets dont les notes sont supérieures à 5 sont codés 2 (valeur 5 non comprise dans la modalité 2) 11 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Vous obtenez le fichier de données suivant On souhaite recoder la variable V2 (TRISTE) dans un sens positif, c’est-à-dire renverser les valeurs de 1 en 6, de 2 en 5, de 3 en 4, de 4 en 3, de 5 en 2, de 6 en 1. Etape 1 : Sélectionnez la deuxième variable que vous souhaitez Recodifier (cf., Partie I, document 4, Etape 4 Constitution de bloc). Etape 2 : Procédez au codage de la variable intitulée V2 (i.e., Triste) Dans chaque cadre tapez v2=6 (valeur =1), V2=5 (valeur=2),….,V2=2, V2=1. comme ci-dessous. 5/ Recodage des valeurs d’une échelle de mesure (renverser les valeurs d’une échelle) Il est possible de recoder les valeurs d’une colonne en renversant toutes les valeurs d’une échelle, par exemple de 1 en 6, de 2 en 5, de 3 en 4, de 4 en 3, de 5 en 2, de 6 en 1. Ce codage est parfois nécessaire quand certaines questions posées apportent des réponses dans un sens positif (e.g., êtes-vous heureux ? : 1 = Pas du tout Heureux, à 6 = Tout à fait Heureux) et d’autres dans un sens négatif (e.g., êtes-vous triste ?: 1 = Pas du tout Triste à 6 = Tout à fait Triste). En effet, pour la première variable plus les valeurs sont élevées plus les sujets se déclarent heureux et pour la deuxième variable, plus les valeurs sont élevées plus les sujets se déclarent tristes. En procédant au recodage, on s’assure que les deux questions sont comparables entre-elles et qu’elles peuvent être réunies en bloc. Exemple : Le tableau de données qui suit illustre le cas de deux questions l’une formulée dans un sens positif (colonne Heureux : échelle de 1 = Pas du tout Heureux, à 6 = Tout à fait Heureux), l’autre dans un sens négatif (colonne Triste : échelle de 1 = Pas du tout Triste à 6 = Tout à fait Triste). Vous obtenez le tableau de données suivant. Les données de la colonne Triste sont recodées de telle sorte que pour cette colonne 2, plus les valeurs sont élevées plus les sujets ont une humeur positive. Il en est de même pour la colonne 1. 12 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac II- TESTS STATITIQUES 1/ Test du Chi2 : test des différences entre variables qualitatives à 2 ou n classes Etape 3 : Cliquer sur “ Spécifier les tables ” (choisir l’option de droite quand vous voulez comparer deux variables entre elles –tables 2X2 ou 3X3 etc. ou choisir l’option de gauche quand vous faites des croisements de plus de deux variables –tables 2X2X2 ou 3X3X3 ou 2 X 3 X 2 ou autres) Objectifs : a- tester l’indépendance ou non de deux séries de mesures. b-Elaborer une table de contingence, relever le Chi2, relever le degré d’association entre les mesures (mesures d’association -de corrélation entre les deux variables- : Phi, Tau de Kendall…). Etape 1 : Ouvrir ou importer au format Statistica (cf. partie 1/ document 2) le fichier qui vous intéresse. 1- Colonne de gauche : Sélectionner “ DOMAINES ” 2- Colonne de droite : Sélectionner “ PUBLICATIONS ”. 3- Cliquer “OK” -Il s’agit ici de données organisées en 2 colonnes (Domaines, Publication) avec 3 modalités de réponses chacune (Domaine: Sociale, Développement, Santé et Publications : Comité, Sans Comité, Congrès). Etape 2 : Dans Menu “ Analyse ” élémentaires ” puis “ tables de Banner ” choisir “Tables et Statistiques Cliquer “ ok ”. 13 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Si vous voulez comparer à l’intérieur d’une table des pourcentages : par exemple 61,54 et 7,69 suivez la procédure indiquée Partir II, doc. 7, page 32. “Comparaison de deux proportions”. Les fréquences théoriques attendues par condition : Si au moins l’une des conditions a une fréquence théorique < à 5 et > 2 on sélectionnera plutôt le chi2 corrigé de Yates. Cliquer “ ok ”. Etape 4 : Sélectionner : Pearson et Chi2 du MV, Tau-b et Tau-C de Kendall (mesures d’association), Pourcentages des effectifs des lignes,Pourcentages des effectifs des colonnes, Fréquences théoriques Cliquer sur “ Tables détaillées à double entrée ”. Dans le cas où vous utilisez des données qualitatives appariées, vous sélectionnerez le test de Mac Nemar. Les valeurs du chi2 et du lien entre les deux variables : Vous obtenez les trois tableaux suivants. Nombres de sujets par condition, Pourcentages en ligne : modalité Sociale : 61,54 + 7,69 + 30,77 = 100 Pourcentages en colonne : modalité Congrès : 33,33 + 16,67 +50= 100 Tâche : Déterminer les liens entre les deux variables - Relever le Chi2, et les mesures d’association - comparer les pourcentages en lignes et en colonnes (connaître les répartitions des effectifs). Conclusion : Le test du Chi2 n’est pas significatif, Chi2(4) = 2.82, p < .6). Plus précisément, les différences obtenues dans l’ensemble selon les conditions ne sont pas significatives. Les deux catégories (Domaine et Publication) n’entretiennent pas de lien significatif entre elles (Tau de Kendall = .01). La fréquence de parution des différents types de publications (comité de lecture, sans comité, congrès) ne diffèrent donc pas d’un domaine de la Psychologie à un autre (Sociale, Développement et Santé). On peut noter que les trois disciplines publient davantage dans des revues à comité de lecture (N = 260) que dans les deux autres types de revues (respectivement N = 40 et N = 120). 14 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac 2/ Test des différences entre variables quantitatives dans le cas de deux groupes : 2/1. Le test t – Echantillons indépendants 1- Ouvrir ou importer d’excel le fichier qui vous intéresse: Ici N = 30, n1 = 15, n2 =15 (échantillons indépendants) La première colonne intitulée “Echantil” est la variable indépendante à deux modalités La deuxième colonne intitulée “Score”est la variable dépendante. Cliquer sur “OK” 4- Cliquer sur “Tests t” Vous noterez que les intitulés des variables de classement et dépendante sont sélectionnés. 2- Après avoir ouvert le module “ Tables et Statistiques Elémentaires” cliquer dans le menu “Analyse” puis sélectionner “Test t pour des Echantillons Indépendants”. Vous obtenez le tableau suivant 3- Cliquer sur “Variables” afin de sélectionner la Variable dépendante (Score) et la variable de classement ou Variable Indépendante (Echantillon) Commentaire : Le score moyen du groupe 1 (M = 14,48, ET= 3,28) est significativement moins élevé que celui du groupe 2, (M = 17,58, ET = 2,84), t (28) = -2,76, p < .01. 15 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac 2/2. Le test t – Echantillons appariés 3- Cliquer sur “Variables” afin de sélectionner les deux variables. 1- Ouvrir ou importer d’excel le fichier qui vous intéresse: Ici N = 15, (échantillons Appariés) La première colonne intitulée “”Temps1” est la première mesure des performances de 15 sujets. Cliquer sur “OK” La deuxième colonne intitulée “”Temps2” est la deuxième mesure des performances des mêmes sujets. 2- Après avoir ouvert le module “ Tables et Statistiques Elémentaires” cliquer dans le menu “Analyse” puis sélectionner “Test t pour des Echantillons Appariés”. 4- Cliquer sur “Tests t” Cliquer sur “OK” 5Commentaire : Les sujets améliorent significativement leurs performances (M = 14,48, ET= 3,28) après entraînement (M = 17,58, ET = 2,84), t (14) = -2,60, p < .02. 16 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac 3/ Test de Mann et Whitney (échantillons indépendants) et Wilcoxon (échantillons appariés): 3- Cliquer sur « Variables » Nous travaillerons avec les mêmes données que le paragraphe 2/1. 1- Sélectionner le module “ Non paramétrique/Distribution ” 4- Colonne de gauche sélectionner la VI = “ Echantil ”, Colonne de droite sélectionnez la VD “ Scores ”, cliquer “ OK ” 2- Ce type de message apparaît à l’écran dès que vous passez d’un module à un autre module (par exemple module « Statistiques Elémentaires » vers le module « Non Paramétriques/Distributions ». Cliquer « Oui » Cliquer “OK” NB : En cliquant oui, vous demandez au logiciel de sauvegarder votre base de donnée et de la transférer d’un module à un autre (précaution sage à prendre dans tous les cas). 2- Sélectionner “ Test U-de Mann-Whitney ”- puis “ OK ” Commentaire: Le premier groupe de sujets a de moins bon résultats (Rangs = 165) que le second groupe (Rangs = 300), Test (U) = 45, Z= -2.79, p < .006. (nb : Les deux groupes diffèrent significativement à p < .006. (6 chances sur 1000 de se tromper en affirmant que les deux groupes diffèrent significativement entre eux). NB : Les procédures à suivre pour faire des tests non paramétriques, autres que le Mann-Whitney, sont identiques à celle décrite dans ce document. Par exemple Test Wilcoxon pour échantillons appareillés. 17 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac 4/ Analyse de Variance : Test des différences entre variables dans le cas de plus de 2 groupes. Sélectionner la VI “ Somnifer ” (colonne de Gauche) et la VD “ Satisfac ” (colonne de Droite) 4/1. Plan du type 3 facteur inter sujets Objectifs : Analyse de la variance pour un plan du type S12 <A3>, ou dit plan de type 3 (type de somnifère) facteur inter sujets. VD : Indice de satisfaction. N = 36, n = 12 La première colonne intitulée “SOMNIFER” est la variable indépendante à 3 modalités . 1 = dose de type1 2 = dose de type 2 3 = dose de type 3 La colonne 2 intitulée “SATISFAC” est la variable dépendante : l’indice de satisfaction. Procédure : Etape 1 : -Ouvrir ou importer d’excel le fichier qui vous intéresse. (cf base de donnée cidessus) -Ouvrir le module “Anova/Manova”. Cliquer sur“ OK ” Etape 3 : préciser les modalités de la VI Méthode 1 : sélectionner “ Codes des Facteurs Intergroupes ” puis cliquer sur “ Tous ” (les modalités 1 à 3 s’affichent dans le cadre) Vous pouvez ne comparer que deux modalités entre elles plutôt que les trois (par exemple dose de type 1 et 2, ou de type 1 et 3, ou de type 2 et 3). Dans ce cas, il vous suffit de taper uniquement les valeurs des deux modalités qui vous intéressent et d’effacer le tiret entre ces deux valeurs. Cf exemple ci dessous (seules les modalités 2 et 3 sont Cliquer sur “OK” comparées entre elles). Méthode 2 : Cliquer sur “OK sans préciser les modalités du facteur intersujets, le logiciel sélectionne automatiquement les trois modalités de la variable SOMNIFERE. Cette procédure est la plus rapide. Cliquer sur “ Variables ” 18 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Etape 4 : Analyse des résultats Sélectionner “ Tous les effets ” Sélectionner “ Stats & Graphiques descriptifs ” Analyse : L‘effet principal du Type de somnifère sur le degré de satisfaction des sujets est significatif, F (2,33) = 8.81, p < .001. a- L’homogénéité des variances - Sélectionner “ Homogénéité des variances/Covariances ” - Choisir “ Tests Univariés (C de Cochran, Hartley, Bartlett) ” Etape 5 : a- Egalité des variances, b- tables des moyennes et c- table des écarts types, d- tests Post Hoc Tuckey ou LSD (Least Square Différences : plus petites différences). Ces tests sont à faire quand la variable indépendante à plus de 2 modalités et quand on étudie un effet d’interaction. - Cliquer sur suite (cf. cadre ci-dessus) 19 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Analyse : les variances des trois groupes de sujets ne diffèrent pas significativement entre elles (p < .78). L’un des critères de la réalisation d’une analyse de variances est respecté. Plus précisément, les variations individuelles observées dans chacun des trois groupes de sujets (pour chaque type de somnifère) ne diffèrent pas d’un groupe à l’autre). b- c- Tables des moyennes et des Ecarts-Types - Sélectionner de nouveau “ Stats & Graphiques descriptifs ” Sélectionner “ Moyennes et Nbre d’Observations par groupe ” cliquer sur “ Suite ”, (suivre la même procédure pour obtenir les écarts-types) Spécifier l’effet à tester “SOMNIFER” et Cliquer “OK” Ces tests peuvent être réalisés pour des effets principaux (si plus de 3 modalités) et pour des interactions. Dans le cas présent, il n’y a qu’une seule variable. Le logiciel présente toutes les variables indépendantes introduites dans le plan d’analyse. Sélectionner “Test LSD ou comparaison planifiée” ou sélectionner “Test HSD de Tukey”. Si les effectifs par condition expérimentale sont différents, il faut sélectionner “Test HSD pour N différents (Spjolvoll/Stoline) » Nb : Le Test LSD est équivalent au test t de Student pour des échantillons indépendants ou appariés. Il est basé sur les n des cellules respectives du plan impliqué dans la comparaison. Il offre une moindre protection contre l'augmentation du taux d'erreur alpha et de type 1 due aux multiples comparaisons post hoc. Le test HSD produit moins d’erreurs de ce type que le test LSD, c’est-à-dire qu’il corrige davantage le risque d’erreur de type alpha que le test LSD. Erreur de type 1 : rejet de HO ou hypothèse nulle (fait de dire qu’il y a une différence significative entre deux moyennes alors que c’est le contraire). d- Tests Post Hoc Sélectionner “ Comparaisons Post Hoc ” : Ces tests de comparaison de moyennes sont valables uniquement pour les variables Intersujets. Erreur de type alpha : plus le nombre de tests entre deux moyennes est importants plus le risque d’erreur du test augmente. 20 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac 4/2. Plan du type 3 X 2 facteurs inter sujets X 3 facteur intra sujets. (Ou plan de type Sn <A3 X B2> X C3) V I1 : Feed-Back : Echec/Intermédiaire/Succès (nommée Fback) VI2 : Consensus : Faible/Elevé (Nommée Cons) VI3 : Cible de Comparaison : Egale/Supérieure/Très supérieure (nommée Cib) Résultats des tests Post Hoc : (a titre d’exemple deux tests sont réalisés. Bien entendu, un seul des deux tests doit être réalisé). Procédure : Analyse : Nous l’avons vu précédemment, l‘effet principal du Type de somnifère sur le degré de satisfaction des sujets est significatif, F (2,33) = 8.81, p < .008. Le premier somnifère (M = 11.25, ET= 1.91) apporte moins de satisfaction chez les sujets que les deux autres types de somnifères (Somnifère 2 = 13.5, ET = 1.56 test LSD p < .005 ; et somnifère 3 = 14.25 ET = 1.95 test LSD p < .0003). En revanche ces deux derniers somnifères apportent autant de satisfaction l’un que l’autre, test LSD ns. Etape 1 : -Ouvrir ou importer d’excel le fichier qui vous intéresse. -Ouvrir le module Anova/Manova. Etape 2 : ouvrir le fichier, sélectionner les variables - Cliquer sur “ Variables ” - Sélectionner les deux VI “ Fback ” et “ Consensu ” (colonne Gauche) Sélectionner les trois modalités de la variable indépendante appariée “ Egal” “ Sup ” et “ Très sup ” (colonne Droite). 21 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac modalités sont écrites dans l’ordre de sélection des VD lors de l’étape 2 et dans l’ordre des colonnes.) Cliquer sur “ OK ” Cliquer “ OK ” Etape 4 : résultats Anova et Graphe d’intéraction Vous pouvez relever les tables des moyennes, écarts types des effets principaux significatifs et des effets d’interaction, effectuer des tests Post Hoc et des comparaisons planifiées. Etape 3 : préciser les modalités de la variable Intra-sujets (appariée) Sélectionner “ Plan Mesures répétées (Intra-SC) ” Taper : “ 3 ”(Nbre de modalités) Nom du facteur: “ EST ” puis “ OK ” Sélectionner “Tous les effets” Nb : E pour Egal, S pour supérieure, T pour très supérieure (3 mesures introduites dans le plan comme variable indépendante à trois modalités. Ces 22 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Etape 5 : L’interaction d’ordre 2 : 123 (de type 3 X 2 X 3) est significative, F (4,124) = 2,62, p <. .04. On observe également une interaction des variables Feedback et Cible significative F (4,124) = 10,53, p <.0001 - A partir de la fenêtre (table ci-dessus) Sélectionner le plan 123 en cliquant dessus (dernière ligne du tableau d’anova) - Pour obtenir le tableau des moyennes Sélectionner “ Feuille de résultats” puis “ OK ” - Cliquer sur “suite” et Sélectionner “ Graphique” puis “ OK ” Préciser l’arrangement des facteurs pour le tracé. Par exemple Le graphique peut être mis en forme. Par exemple, pour écrire en entier les noms des modalités des variables Consensus et Feed-Back il suffit de double cliquer sur le texte à modifier. Une fenêtre s’ouvre et vous permet de faire vos transformations. Pour écrire en entier les noms des modalités de la variable Cible, il faut cliquer sur les flèches de la légende. 4/2.1 Analyses en contrastes ou comparaisons planifiées a- Tests sur la variable intra-sujet (Quand plus de deux modalités) Quand une variable intra-sujets a plus de deux modalités (ce qui est le cas ici de la variable “Cible de comparaison”), il peut parfois être utile de comparer les moyennes entre-elles deux à deux. Ceci est notamment nécessaire quand l’effet principal de la variable est significatif (p < .05) ou quand il est proche du seuil de tolérance (.05 ! P " .10) Bien que cela ne soit pas le cas dans notre exemple (p = .9276) nous allons faire ces analyses. 23 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Etape1 : Cliquer sur “Comparaisons planifiées” de la table de résultat d’Anova (cf., Etape 4 du document 4/2.). Comme nous souhaitons uniquement connaître les effets simples de la variables “Cible de comparaison” (i.e., comparer les moyennes 2 à 2) et conserver toutes les données dans l’analyse, nous cliquons directement sur Il n’y a pas de différences significatives entre les deux moyennes, F(1,62)= 0,07, p < .80. Cliquer “OK” Etape 2 : Spécifier les contrastes du facteur : Il n’y a pas de différences significatives entre les deux moyennes, F(1,62)= 0,008, p < .93. b - Test d’un effet simple de la variable intra-sujet sous une condition expérimentale Nous allons par exemple comparer entre-elles les moyennes Egal et SUP : soit 1 – 1 puis 0 pour la cible Très sup. Il peut être intéressant de considérer si les moyennes de la variable intra-sujet sont significativement différentes entre-elles dans une condition expérimentale. Par exemple quand les sujets sont soumis à un “Echec” et qu’ils sont dans un contexte de “Fort Consensus” Cliquer sur “OK” Etape 1 : Spécifier les contrastes des facteurs: Etape 3 : Analyse du résultat Il n’y a pas de différences significatives entre les deux moyennes, F(1,62)= 0,16, p < .70. Pour poursuivre les analyses, cliquer sur “Suite” et reprendre les étapes précédentes. Cliquer sur “Feed-Back” pour sélectionner la modalité “Echec” (1) et désélectionner les deux autres (0 et 0). Cliquer “OK” 24 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Les deux moyennes F(1,62)=12,36, p < .009. diffèrent entre elles, Le dernier test est également significatif. Cliquer sur “Consensus” pour sélectionner la modalité “Fort” (1) et désélectionner l’autre (0). Cliquer “OK” Comparer “Egal” (1) et “SUP” (-1), Tsup = 0 Cliquer “OK” Cliquer “OK” Commentaire : Les deux moyennes ne diffèrent pas entre elles. Procédez de même pour les deux autres comparaisons. 25 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac 5/ Test d’Homogénéité des Echelles de mesures (Calcul de l’alpha de cronbach) Objectifs : a-Tester l’homogénéité d’une série d’items censés mesurer la même dimension. b-Vérifier les corrélations entre les items. c-Trouver quels items contribuent peu à la mesure de la dimension pour ne pas les introduire dans l’échelle ou pour les retirer d’une formule (cf. formule de la constitution des blocs, Partie I, Doc. 3. Gestion des données). Ouvrir le fichier qui vous intéresse. Procédure Etape 1 Sélectionner dans le menu “ Analyse ” : “ Autres statistiques ”. sélectionner ITEM1, ITEM2…ITEM5 puis “OK ” Cliquer sur “ OK ” Sélectionner “ Fiabilité/Analyse d’échelle ” Puis“ Basculer Vers ” Etape 2 : Etude des liens entre les variables, cliquer sur Correlations” Cliquer sur “ Variables ”, Cliquer sur “ Corrélation” 26 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Procédure : Cliquer sur “ Statistiques du Total des Questions ” ou “OK” NB : il s’agit de connaître la nature des liens entre les items (corrélations positives ou négatives, importance des corrélations). Ici les corrélations sont relativement importantes et toutes positives. Cliquer sur “Suite…” puis “OK” Etape 3 : Relever l’alpha de Cronbach (Standardisé). Alpha = .89 Cette valeur est acceptable. L’échelle semble homogène (la valeur serait peut être même trop élevée, certains items sont peut-être de trop car ils mesurent la même chose). Il n’est toutefois pas nécessaire d’enlever un item du questionnaire. Si l’alpha était largement inférieur à .70 (e.g., .50) ou trop près de .1 il faudrait impérativement passer à l’étape suivante. Tâche : relever les items qui, si on les enlevait, augmenteraient ou diminueraient la valeur de l’alpha de cronbach par rapport à l’intervalle (.70 .90). Ici aucun item ne doit être enlevé puisque l’alpha est correct. Cependant une analyse plus fine permettra de comprendre la lecture du tableau. Analyse approfondie : Si on enlevait l’ITEM1 ou l’ITEM4, l’alpha ne serait pas, ou peu, modifié pour autant. Autrement dit, ces deux items apportent peu d’information par rapport aux autres items. En revanche, en enlevant l’ITEM2 ou l’ITEM3 ou l’ITEM5 (pas tous les 3): l’alpha évoluerait d’une valeur de .85 à .75 ce qui suggère que ces items contribuent davantage que l’ITEM1 ou l’ITEM4 à la fiabilité de l’échelle. Toutefois, même si l’un de ces trois items étaient enlevé l’alpha serait toujours acceptable. Décision : On n’enlève pas d’items. On peut cependant noter que d’enlever l’ITEM1 de la formule de la moyenne des items n’altère pas la précision de l’échelle de mesure. Etape 4 : Identifier le ou les items qui réduisent la valeur de l’alpha de cronbach (i.e., qui diminuent la fiabilité de l’échelle de mesure). 27 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Sélectionner “ Vessie, poumon, Leucémie ” puis “ OK ” 6/ Corrélations Etape 1 : Sélection du fichier -Ouvrir ou importer d’excel le fichier qui vous intéresse. Ici 6 colonnes et 44 observation. La colonne 1 reporte le type de Fumeur (1 = Petit, 2 = Grand, les colonnes 2, 3, 4 les types de cancers ; les données reportées sont fictives). -Ouvrir le module “ Stats Elémentaires & Tables ”. Etape 2 : Analyse de corrélation Sélectionner dans le menu “Analyse” : “Matrices de corrélations” Sélectionner “matrice de corr. (Afficher P & N)” puis “ Corrélations ” Etape 3 : Sélectionner “ 1 Listes de var. matrice carrée ” NB : Lors de la présentation de vos résultats, veillez à remplacer les valeurs P = .000 par P < .001 ; une Probabilité n’est jamais égale à O. 28 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Analyse : Toutes les corrélations observées entre les trois maladies sont positives et significatives. Sélectionner la variable de classement (VI) “ CIGARETT ” et les VD “ Vessie, poumon, Leucémie ”puis “ OK ” Etape 4 : Vérifier si les corrélations entre les différents types de cancer varient quand les sujets sont de petits fumeurs ou de grands fumeurs (Variable Indépendante de Classement). Sélectionner dans le module “ Tables et statistiques élémentaires ” : l’option “ ANOVA d’Ordre 1 & Décomposition” Cliquer sur “OK” Sélectionner le bouton “ Variables ” Sélectionner “tout” Puis “ OK ” 29 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Sélectionner “ G 1 : 1 ” ou “ G1 : 2 ” ou TsGroupes G1 = Petit fumeur, G 2 = Grand Fumeur Corrélations et leur niveau de probabilité pour les petits fumeurs : Cliquer sur “ Options ” Sélectionner “ Calculer & afficher les ls (p) de significativité ” “ OK ” Sélectionner “ Corrélations Intra Classes” 30 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Corrélations et leurs probabilités pour les grands fumeurs Etape 5 : Comparer les différences de corrélations obtenues pour les petits fumeurs et les grands fumeurs qui vous intéressent (par exemple comparer la corrélation entre Cancer de la Vessie et Cancer du Poumon pour les petits fumeurs : R = .47 à la corrélation obtenue entre ces deux types de cancer pour les grands fumeurs : R = .39 : ces deux corrélations sont-elles significativement différentes ? les liens entre ces deux maladies sont-ils vraiment plus fort pour un petit fumeur qu’un grand fumeur ?). N = 22 pour G1 et N = 21 pour G2 Dans le menu “ Analyse ” sélectionner “ Panneau de démarrage ” puis “ Autres tests de Significativité ” Procédure : a- Relever les effectifs des petits fumeurs et les effectifs des grands fumeurs -cliquer sur Nb d’observations et faire OK dans le menu “ Statistiques descriptives et Corrélations par classe ” Dans l’encadré “ Différences entre deux coefficients de corrélation ” Pour r1 taper “ ,47 ” puis indiquer son effectif N = “ 22 ” Pour r2 taper “ ,39 ” puis indiquer son effectif N = “ 21 ” Sélectionner “ Test Unilatéral” puis “ Calculer ” 31 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Etape 4 : Dans le menu “ Analyse ” sélectionner “ Panneau de démarrage ” puis “ Autres tests de Significativité ” Etape 5 : Dans l’encadré “ Différences entre deux proportions” Pour P1 taper “ ,61 ” puis indiquer son effectif N = “ 80 ” Pour P2 taper “ ,07 ” puis indiquer son effectif N = “ 10 ” Sélectionner “ Test Unilatéral” puis “ Calculer ” Relever la probabilité obtenue. Si P < .05 alors les deux corrélations diffèrent significativement entre elles. Ce n’est pas le cas ici. Résultat p < ,38 Conclusion : Les liens qu’entretiennent les deux types de cancers ne sont pas plus forts chez les petits fumeurs que chez les grands fumeurs (P > .05). Autrement dit, les liens observés entre les deux types de cancers ne varient pas d’une classe de fumeurs à l’autre. 7/ Comparaison de deux proportions Commentaire : les deux pourcentages sont significativement différents à p <.0009. Dans le domaine de la psychologie sociale, il y a davantage de productions d’articles dans des revues à comité de lecture que sans comité de lecture. Vous souhaitez comparer des pourcentages à l’intérieur d’une table de Banner. Utilisons la table de Banner suivante (cf., test chi2 p 13-15) Etape 1 Par exemple vous souhaitez comparer les pourcentages P1 = 61,54 et P2 = 7,69. Etape 2 Relever les effectifs correspondant à ces deux pourcentages : N1 = 80 et N2 = 10 Etape 3 : Calculer les rapports P1 : 80/130 = 0,61 et P2 = 10/130 = 0,07 32 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac 7 / Régression linéaire Procédure : Etape 1 : - Ouvrir ou importer d’excel le fichier “ Correl et Regression ” (2 colonnes et 107 observations). La colonne 1 reporte le niveau de stress, la colonne 2 l’ampleur des symptômes). - Sélectionner Variables Sélectionner “ Stress ” en tant que Variable Indépendante prédictrice (colonne de droite) et “ Symptôme ” en tant que variable dépendante, prédite (colonne de gauche) puis “ OK ” - Ouvrir le module “ Régression Multiple” Sélectionner “OK” 33 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac On peut réaliser l’Equation de la régression linéaire (Y = B + ax) Y = Symptôme (valeur prédite) Stress BETA = corrélation entre symptôme et stress = .506 X = Stress A = valeur que prend X B = ordonnée à l’origine Symptôme = 73,88 + .783 * Stress Etape 2 : Résultats Régression linéaire et calcul de la droite de régression NB : R2 = la part d’apparition des symptômes que l’on peut expliquer par le Stress des individus. Ici 24,89% des symptômes observés sont dus au stress des individus. Etape 3 : réalisation de la droite de régression Cliquer sur “OK” - Sélectionner “Synthèse de Régression” 34 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Sélectionner “ Corrélation bivariée (p) ” Sélectionner dans “ Variable X (horizontal) ” le prédicteur “ Stress ” (colonne de gauche) Sélectionner dans “ Variable Y (vertical) ” la variable prédite “ Symptôme ” puis “OK” Interprétation : Quand un individu a un niveau de stress qui augmente de 1 point (sur l’échelle de mesure de son stress) il développe 73.890 + 0.78311 fois son score antérieur de stress de plus. Le graphe reprend la droite de régression réalisée à partir du tableau de synthèse. Exemple : Score antérieur de Stress = 40 Symptôme = 73.890 + 0.78311*40 = 105.2144 Nouveau score de Stress = 41 Symptôme = = 73.890 + 0.78311*41 = 105.9975 Différence =105.9975 - 105.2144 = 0.753 Pour une unité de score de Stress supplémentaire, l’individu voit apparaître .75 d’un symptôme supplémentaire. 35 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac 1.1-Procédure générale, commune aux deux tests : III- QUELQUES CRITERES DE REALISATION D’UNE ANALYSE DE VARIANCE A EXPLORER - Ouvrir le fichier Statistica qui vous intéresse. Choisir le module " Tables et Statistiques élémentaires " 1/ Test de Normalité et test d'égalité des Variances Avant-Propos sur ces deux tests La normalité des données est un critère de réalisation des ANOVA, mais il ne s’agit pas d’un critère absolument essentiel car le test d’analyse de variance est robuste et autorise une déviation de ce critère. Il permet cependant de connaître la distribution des données, la répartition des sujets d’une expérience sur le continuum des échelles (y-a-t-il asymétrie à gauche ou à droite de la distribution ?). Les conséquences de violations même assez importantes de l'hypothèse d'homogénéité des variances ne sont pas problématiques pour la réalisation d’une Anova. Lindman (1974, p. 33) a synthétisé les résultats de nombreuses études sur la question, et a montré que seules les violations les plus sévères pouvaient remettre en cause la validité de la statistique du F obtenue lors d'une ANOVA sur les données. Ce test peut alerter le chercheur sur la signification de certains de ses résultats. Par exemple, indépendamment de la manipulation expérimentale réalisée ce test permet de savoir si les écarts individuels observés au sein d’un groupe expérimental (variance d’un groupe) diffèrent significativement des écarts individuels observés dans un autre groupe expérimental. Une erreur d’échantillonnage peut par exemple produire de tels écarts de variance d’un groupe à l’autre (e.g., lors d’une expérience l’échantillonnage n’a pas été correctement aléatorisé et les sujets d’un même groupe expérimental peuvent accorder à un même stimulus des significations très différentes alors qu’un autre groupe expérimental accorde une signification à peu près identique à ce même stimulus). 1.2-Test de Kolmogorov Smirnov et de Lilliefors : - Sélectionner le bouton " Variables ". Sélectionner le sous module "Statistiques descriptives" 36 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac - - Sélectionner les variables dépendantes (ATTENTES et SATISF F) puis "OK". - sélectionner bouton intitulé " Test de normalité de K-S et Lilliefors " Cliquer sur le bouton " Histogrammes Deux graphes apparaissent à l'écran Le test de Kolmogorov-Smirnov réalisé sur les deux groupes de données n’est pas significatif (.05 <p < .10 et p >.20). Cela permet de montrer que les données sont distribuées de façon normale. En effet, le test d’hypothèse H0 n’est pas rejeté alors que l’hypothèse H1 est rejetée (HO : Les données sont distribuées normalement ou les données observées ne diffèrent pas d’une distribution normale théorique des données, H1 : les données observées diffèrent de la distribution normale théorique des données). 37 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Nb :Le test de Lilliefors est plus sévère que le test de Kolmogorov-Smirnov. 1.3-Test d'homogénéité des variances-Tests Univariés : Procédure à suivre - Choisir le module " Tables et Statistiques élémentaires " faites " OK " Sélectionner " Anova d'ordre un et Décomposition " faites " OK " Cliquer “OK” Cliquer “OK” - Cliquer sur " LEVENE " ou " BROWN-FORSYTHE " (ce sont deux tests d'homogénéité des variances. Le second est moins sévère que le premier). D'autres tests existent : test de Hartley, test de Cochran (on peut les utiliser indifféremment cf. document : analyses de variances). - Cliquer sur le bouton " Variables " - Sélectionner les variables dépendantes (ATTENTES et SATISFACTION) et les variables indépendantes nommées variables de classement (FBACK et ORDRE) dans leurs colonnes respectives 38 Maîtrise de Psychologie Sociale, D145U: Méthodologie Corinne Mazé et Jean-François Verlhiac Tableaux des résultats Le test le moins sévère (Brown-Forsythe) réalisé pour les deux variables dépendantes n’est pas significatif (p = .15 et p = .11 pour chacune des mesures dépendantes). Cela permet de montrer que les variances sont égales entre les 6 conditions expérimentales. En effet, le test d’hypothèse H0 n’est pas rejeté alors que l’hypothèse H1 est rejetée (HO : Les variances sont égales entre toutes les conditions expérimentales, H1 : les variances diffèrent entre elles). Ce résultat se retrouve également avec le test de Levene (p <.06 et p>.10 pour chacune des mesures dépendantes). Nous espérons que ce document vous sera d’une grande utilité pour cette année et celles à venir… 39