Les données numériques, mai 2007
Transcription
Les données numériques, mai 2007
Les données numériques, mai 2007 2 types de fichiers de données - données d’enquêtes (brut, besoin d’un cliché d’enregistrement), micro données - données agrégées (traitement statistique), séries chronologiques Où trouver les données Statistique Canada, une source d'information unifiée: - Cansim II : le Système Canadien d'Information Socio-Economique est la base de données de Statistique Canada. Il est disponible à travers deux interfaces : E-Stat et CHASS. - Sherlock : données d’enquêtes de Statistique Canada (principalement) et rassemblées par la CREPUQ. Pour les États-Unis, il n’y a pas de site unifié, il faut aller chercher les données statistiques auprès de chaque Département d’état (ou auprès de tout autre organisme compétent). Ex : - ICPSR http://www.icpsr.umich.edu/ Microdonnées d’enquêtes et données agrégées. - le Bureau of Economic Analysis. http://www.bea.gov du Department of Commerce. - Department of Labor http://www.dol.gov - Bureau of Census, http://www.census.gov/ - Ameristat, http://www.ameristat.org/ - County and city datas http://fisher.lib.virginia.edu/collections/stats/ccdb/ - Integrated Public Use Microdata Series http://www.ipums.org/ Ailleurs: - Institut de la statistique du Québec http://www.bdso.gouv.qc.ca/pls/ken/iwae.proc_acce?p_temp_bran=ISQ - AMECO, statistiques macros collectées par l'Union européenne sur les pays européens et de l'OCDE. Gratuit. http://europa.eu.int/comm/economy_finance/indicators/annual_macro_economic_database/ameco_en.htm - Un CD-Rom de la Banque Mondiale appelé "World Development Indicators (WDI) 1971-2001" est disponible au 3e étage de la bibliothèque. Sujets : World View, People, Environment, Economy, States and Markets, and Global Links. - Un CD-Rom de Statistiques Canada sur le commerce mondial est disponible à HEC ("World trade data" aka "World Trade Analyzer"), pour les années 1980-1999. S'utilise avec SPSS. - Pour les autres sources de statistiques possibles, voir le répertoire de liens sur le site de la bibliothèque : http://www.bib.umontreal.ca/SB/num/dataweb.htm Micro données venant d’enquêtes Accès aux enquêtes par CANSIM II E-Stat et CHASS: elles sont associées aux tableaux. Par Sherlock http://sherlock.crepuq.qc.ca/ : - Lister toutes les enquêtes par ordre alphabétique - Moteur de recherche (par variables entre autre) - Pour chaque enquête, il faut utiliser : o Obligatoire : Le « Cliché d’enregistrement » ou « Manuel des codes » permet d’avoir le détail des variables utilisées avec leurs codes. o Fortement conseillé : Le « Résumé » ou « Guide de l’utilisateur » : synthèses, méthodologie et aperçu général de l’enquête - Possibilité d’extraire les données par variables o par 30 max. o possibilité de les fusionner ensuite (fonction merge dans Stata) o en extraire plus que moins c’est mieux - Extraction conseillées : ASCII séparées par des tabulations - Parfois, être patient pour l’envoi de statistiques par courriel. Données agrégées de CANSIM Via E-Stat http://estat.statcan.ca/cgi-win/CNSMCGI.exe?Lang=F&CANSIMFile=EStat/Francais/CII_1_F.htm - Cansim II contient des tableaux et des séries. o Les tableaux : ont des « numéros » sous la forme 000-0000. ils sont des consolidations de « séries ». il y a des tableaux « actifs » et des tableaux « terminés » o Les séries ont des « codes » sous la forme V0000000. - Comment trouver le(s) série(s) et/ou tableau(x) qui m’intéressent ? o en connaissant déjà leurs numéros ou codes (sic) o Répertoire des tableaux (PDF) de E-Stat http://estat.statcan.ca/MIS/Directory/Estat_Repertoire_des_tableaux.pdf o en utilisant le moteur de recherche Web de E-Stat et CHASS. ne renvoie que des tableaux, il faut ensuite trouver la(les) série(s) pertinentes. Utiliser le signe de troncature * après les mots-clés utilisés (Ex: Salaire* Légume*) - Le point fort de E-Stat : o Il permet d’obtenir facilement des extractions de plusieurs séries et de les consolider. Par exemple : Avoir les données de plusieurs provinces et de plusieurs indicateurs dans le même tableau. Il faut chercher les données par séries, les unes après les autres. Puis quand elles ont toutes été réunies, on peut lancer l’extraction de données. On peut sélectionner plusieurs séries de tableaux différents. - Extraction des données et périodicité Éviter de faire des transformations de fréquences dans le sens annuel -> trimestriel. NB : Si les séries proviennent de plusieurs tableaux différents, elles devront avoir la même périodicité (ce qui n’est pas toujours le cas). Via CHASS Les points forts de CHASS : - On peut faire des recherches par mot clé dans les séries. - Conseil : chercher d’abord dans « titres de tableaux », puis « titre de séries ». - Données un peu plus nombreuses et mieux mise à jour mais extraction moins souple qu’avec E-Stat.
Documents pareils
Données numériques - Département de sciences économiques
• Utiliser le signe de troncature * après les mots-clés utilisés (Ex: Salaire* Légume*)
• Le point fort de E-Stat :
• Il permet d’obtenir facilement des extractions de plusieurs séries et de les co...