Le catalogue permet un accès en ligne, direct et gratuit, aux métadonnées des enquêtes et bases de données que l’Institut national d’études démographiques (Ined) a réalisées depuis les années 1940.
Plus précisément, ces enquêtes sont celles dont l’Ined a la maîtrise d’ouvrage, ou, en cas de partenariat, la co-maîtrise d’ouvrage, et/ou celles dont l’Ined est responsable du traitement vis-à-vis de la CNIL. Ce sont les enquêtes pour lesquelles un investissement important de l’Institut dans la conception et le déroulement de l’enquête a eu lieu, ce qui est donc garantie de qualité des données et métadonnées.
Le catalogue répertorie également les bases de données démographiques et contextuelles que l’Ined développe et maintient, en collaboration ou non avec d’autres instituts.
DataIned est développé et maintenu par le DataLab du Service des enquêtes et sondages (SES) de l’Ined. Le catalogue s’enrichit progressivement et de nouvelles références seront ajoutées au fur et à mesure. Il a vocation à être moissonné par d’autres catalogues comme data.progedo.fr pour les enquêtes mises à disposition sur Quetelet-PROGEDO-Diffusion.
Vous pouvez consulter :
- La documentation des enquêtes et, dans certains cas, des variables associées
- Diverses ressources associées aux enquêtes (comme les questionnaires, plaquettes de présentation, etc.)
- Les bibliographies associées aux enquêtes, pour la plupart d’entre elles
- La documentation de bases de données démographiques et contextuelles
Pour plus d’informations sur l’utilisation du catalogue, rendez-vous sur le guide d’utilisation.
Fondé en 1945, l’Ined est un Établissement public à caractère scientifique et technologique (EPST) placé sous la double tutelle du ministère chargé de la recherche et du ministère chargé des affaires sociales. L’institut a pour missions d’étudier les populations de la France et des pays étrangers, de diffuser largement les connaissances produites et d’apporter son concours à la formation à la recherche et par la recherche. Par une approche ouverte de la démographie, il mobilise un large éventail de disciplines comme l’économie, l’histoire, la géographie, la sociologie, l’anthropologie, la biologie, l’épidémiologie. Fort de ses équipes de recherche, il encourage les échanges et conduit de nombreux projets de recherche européens ou internationaux.
En savoir plus : https://www.ined.fr/fr/institut/qui-sommes-nous/histoire/
A propos du Service des Enquêtes et Sondages
Le service des enquêtes et sondages (SES) a été créé en 1982, prenant la suite de l’unité d’enquête qui existait depuis 1979 dans le département socio-démographique de l’Ined. Il a pour mission d’apporter un appui aux chercheurs et chercheuses de l’Ined souhaitant réaliser une enquête dans le cadre de leurs projets de recherche : il participe avec l’équipe de recherche à la définition des différentes étapes de l’enquête et à leur cadencement, au montage de l’enquête, à l’élaboration du protocole, questionnaire et plan de sondage adapté ; il propose des applications informatiques de collecte ad hoc, assure le suivi de la collecte, redresse les données collectées et prépare leur mise à disposition.
En savoir plus : https://ses.site.ined.fr/fr/
Le DataLab a été créé en 2019, au sein du SES, afin de centraliser, structurer et renforcer le travail relatif à la mise à disposition de bases de données. Plus généralement, le DataLab est dédié à la croissance et à la visibilité des données disponibles à l’Ined, ainsi qu’à la diffusion de données fiables et précises pour la recherche en démographie et, plus largement, en sciences sociales.
Le DataLab s’occupe d’une part, de la mise à disposition des données d’enquêtes de l’Ined : préparation, documentation et diffusion des Fichiers de Production et de Recherche (FPR). D’autre part, il est impliqué dans la conception, la collecte, la mise en ligne, la mise à jour et la maintenance de bases de données démographiques et contextuelles. Le DataLab participe également à la coordination et mise à disposition de données du projet Generations and Gender Programme (GGP). Les activités du DataLab sont développées en collaboration avec Quetelet-PROGEDO-Diffusion, le département français du Consortium Européen des Archives de Données en Sciences Sociales (CESSDA).
En savoir plus : https://datalab.site.ined.fr/
Lancé en mai 2022, DataIned est une plateforme développée avec le logiciel NADA qui référence, identifie et archive de façon pérenne les enquêtes de l’Ined et les bases de données maintenues par l’Ined. Il favorise le libre accès et la visibilité des résultats de la recherche en sciences sociales et contribue au développement de la science ouverte par l’adoption des principes FAIR (findable, accessible, interoperable, reusable).
Le catalogue DataIned permet d’explorer les métadonnées des enquêtes et des bases de données de l’Ined grâce à une interface moderne et des outils de recherche puissants : barre de recherche, filtres prédéfinis (thèmes, années de collecte, séries, etc.), base de question, comparaison de variables, etc.
Certaines des enquêtes sont aussi classées par collections, valorisant des thématiques phares de l’Ined comme les Enquêtes Biographiques ou des méthodologies particulières.
Les ressources associées aux enquêtes (questionnaire, instructions aux enquêteurs, dictionnaire des codes, présentation de l’enquête, etc.) sont consultables directement sur la page de chaque référence. Dans le cas où les variables des fichiers de données associés à une référence sont documentées, il est possible d’explorer les métadonnées associées à ces variables, et de visualiser des tris à plat.
La documentation des enquêtes ainsi que les informations sur le contenu des variables sont préparées en suivant le modèle du standard DDI (Data Documentation Initiative).
En savoir plus : Guide d’utilisation
Le standard DDI a été adopté en 2003 par l’Ined. Il a été conçu pour répondre au besoin de disposer d’un système international commun pour décrire et cataloguer des enquêtes, notamment en sciences sociales. Il fonctionne en plusieurs groupes de champs, qui permettent chacun de décrire en détail les caractéristiques d’un fichier de données statistique. Les métadonnées sur les enquêtes sont ainsi organisées par blocs d’informations (4 sections qui comportent 81 champs au total) auxquels il est possible d’appliquer des filtres prédéfinis (thèmes, années de collecte, séries, etc.).
En savoir plus : https://ddialliance.org/
Le catalogue regroupe des références pour différents types de données :
-
Données d’enquêtes
Il s’agit de fichiers de données individuelles issus des enquêtes de l’Ined. Ils comportent les variables directement issues des questionnaires et des variables construites a posteriori par les équipes de recherche.
Les enquêtes de l’Ined peuvent être disponibles selon plusieurs niveaux de détail, d’utilisation et d’accès afin de répondre aux divers besoins des utilisateur.ice.s, tout en garantissant le respect des normes de confidentialité et de sécurité requises pour la manipulation de données individuelles. Pour une même enquête, l’utilisateur.ice pourra ainsi accéder à des données anonymisées en libre accès (FPA), et à des données pseudonymisées (FPR) ou détaillées en accès restreint (FDC).
- Les données anonymisées (FPA) sont en accès libre, directement téléchargeables sur le catalogue après l’acceptation des conditions d’utilisation et quelques renseignements facultatifs à fournir sur l’usage futur du ou des fichiers ;
- Les données pseudonymisées (Fichier de Production et de Recherche) sont en accès restreint à la communauté scientifique et académique et téléchargeables sur Quetelet-Progedo-Diffusion après enregistrement, brève présentation d’un projet de recherche, signature de formulaires d’engagements et habilitation par le Comité du Secret Statistique ;
- Les données détaillées sont en accès restreint à la communauté scientifique uniquement, accessibles via le Centre Sécurisé d’Accès aux Données après une procédure d’habilitation encadrée par la loi, impliquant une série de démarches conformes aux normes du Comité du Secret Statistique.
Certains fichiers anonymisés sont conçus à partir des Fichiers de Production et de Recherche et permettent aux étudiant·es de se familiariser avec les microdonnées statistiques. D’autres fichiers anonymisés ne contiennent dès leur conception pas de données personnelles. Ces jeux de données pédagogiques et simplifiés comportent en général un nombre réduit de variables. Ils sont élaborés de telle manière que les individus enquêté·es ne puissent pas être identifiés (brouillage, regroupements…), ce qui entraine nécessairement une perte d’information. Ils ne peuvent pas être utilisés à des fins de recherche scientifique mais sont utiles pour l’autoformation et l’enseignement en permettant de répondre à des questions simples.
Les Fichiers de Production et de Recherche sont conçus à partir des données confidentielles et permettent aux chercheur·es, post-doctorant·es, doctorant·es, étudiant·es de Licence et de Master d’effectuer des analyses et des traitements statistiques dans le cadre d’un projet de recherche. Ces jeux de données sont pseudonymisés pour réduire le risque de ré-identification des enquêtés tout en conservant un niveau de détail élevé permettant d’effectuer des analyses.
Les fichiers détaillés sont conçus à partir du fichier brut de la collecte et sont réservés à la communauté scientifique. Ces données des-identifiées conservent un niveau de détail très fin permettant d’effectuer des traitements poussés à des fins de statistique publique ou de recherche scientifique ou historique.
- Bases de données démographiques
Elles regroupent de multiples indicateurs, dans le domaine de la démographie principalement (mortalité, natalité, migrations, etc.), mais aussi de la sociologie, de l’économie ou de la science politique. Elles couvrent un grand nombre de pays européens, voire du monde pour certaines bases de données.
Pour en savoir plus sur comment accéder à ces données, rendez-vous sur l’onglet "Accéder aux données" du guide.
Informations techniques :
NADA (https://nada.ihsn.org/) est un logiciel open source développé par la Banque Mondiale. Le code source et la documentation technique sont disponibles sur Github.
Ressources utiles :
Nous contacter
Pour toute question sur le catalogue et les références : enquetes@ined.fr
Pour toute question sur le DataLab : datalab@ined.fr
The catalogue provides direct and free online access to the metadata of the surveys and databases that the French Institute for Demographic Studies (INED) has conducted since the 1940s.
More specifically, these surveys are those for which INED is the project manager or, in the case of a partnership, the co-project manager, and/or those for which INED is responsible to the CNIL. These are the surveys for which the Institute has made a significant investment in their design and conduct, which is therefore a guarantee of data and metadata quality.
The catalogue also lists the demographic and contextual databases that INED develops and maintains, whether or not in collaboration with other institutes.
DataIned is developed and maintained by the DataLab of the Survey Departmentof INED. The catalogue is gradually being enriched and new references will be added over time. It is meant to be harvested by external repositories, such as https://data.progedo.fr/ when it comes to surveys which data are available through Quetelet-PROGEDO-Diffusion for instance.
You can:
- Browse the documentation of the surveys and, in some cases, the associated variables
- Consult various resources associated with the surveys (such as questionnaires, presentation leaflets, etc.)
- Consult the bibliographies associated with the surveys, for most of them
- Browse the documentation of the demographic and contextual databases
For more information on how to use the catalogue, go to the user guide.
INED was founded in 1945, and in 1986 it acquired the status of an Etablissement Public à Caractère Scientifique et Technologique (EPST), meaning that it is under joint administrative supervision of the ministries of research and social affairs. The Institute’s missions are to study the populations of France and other countries, to ensure wide dissemination of the knowledge thereby acquired, and to provide training in research through research. INED’s approach to demography is resolutely open and interdisciplinary, implicating a wide range of disciplines including economics, history, geography, sociology, anthropology, biology and epidemiology. With its research units, the Institute promotes communication and exchange within the scientific community and between researchers and the general public while conducting numerous European and international research projects.
Read more : https://www.ined.fr/en/institute/who-are-we/history/
About the Survey Department
The Survey Department (SES) was created in 1982, taking over from the survey unit that had existed since 1979 in the socio-demographic department of INED. Its mission is to provide support to INED researchers wishing to carry out a survey as part of their research projects: it collaborates with the research team to define the various stages of the survey and their timing, to set up the survey, to draw up the protocol, questionnaire and adapted sampling plan; it proposes ad hoc computer applications for data collection, monitors the data collection, rectifies the data collected and prepares them for dissemination.
Read more: https://ses.site.ined.fr/fr/
The DataLab was created in 2019, within the SES, in order to centralize, structure and strengthen the work related to data dissemination. More generally, the DataLab is dedicated to the growth and visibility of the data available at INED, as well as to the dissemination of reliable and accurate data for research in demography and, more broadly, in social sciences.
The DataLab is responsible for the provision of INED survey data: specifically the preparation, documentation and dissemination of Production and Research Files (FPR). On the other hand, it is involved in designing, collecting, publishing, updating and maintaining demographic and contextual databases. The DataLab is also involved in the coordination and provision of data for the Generations and Gender Programme (GGP). The DataLab activities are developed in collaboration with Quetelet-PROGEDO-Diffusion, the French department of the Consortium of European Social Science Data Archives (CESSDA).
Read more : https://datalab.site.ined.fr/en/
Launched in May 2022, DataIned is a platform developed with the NADA software that references, identifies and archives INED surveys and databases maintained by INED. It promotes open access and visibility of social science research results and contributes to the development of open science by adopting the FAIR (findable, accessible, interoperable, reusable) principles.
The DataIned catalogue allows you to explore the metadata of INED’s surveys and databases thanks to a modern interface and powerful search tools (search bar, predefined filters (themes, years of collection, series, etc.), question base, comparison of variables, etc.
Some of the surveys are also classified by collection, highlighting key INED themes such as Biographical Surveys or specific methodologies.
The resources associated with the surveys (questionnaire, interviewers instructions, codebooks, presentation leaflets, etc.) can be consulted directly on the page of each reference. If the variables in the data files associated with a reference are documented, it is possible to explore the metadata associated with these variables, and to view descriptive statistics.
Survey documentation along with information regarding the content of variables are prepared according to the DDI (Data Documentation Initiative) standard.
Read more : Guide
The DDI standard was adopted in 2003 by INED. It was designed to meet the need for a common international system for describing and cataloguing surveys, particularly in social sciences. It operates in several fields groups, each of which allows for a detailed description of the characteristics of a statistical data file. The metadata on surveys are thus organised in blocks of information (4 sections with a total of 81 fields) to which it is possible to apply predefined filters (themes, collection years, series, etc.)
Read more : https://ddialliance.org/
The catalogue contains references for different types of data:
-
Microdata
These are the microdata data files stemming from the surveys. They include both variables directly from the questionnaires and variables constructed ex post by the research teams.
INED’s survey data may be available at several levels of detail, use and access in order to meet the diverse needs of users, while guaranteeing compliance with confidentiality and security standards required for the handling of individual data. For the same survey, users may have access to anonymised open access data (FPA), pseudonymised data (FPR) or detail restricted access data (FDC).
- Anonymized data (FPA) are freely accessible, and can be downloaded directly from the catalog after accepting the conditions of use and providing some optional information on the future use of the file(s);
- Pseudonymized data (Scientific Use Files) are restricted to the scientific and academic community and can be downloaded from Quetelet-Progedo-Diffusion after registration, brief presentation of a research project, signature of commitment forms and clearance by the Comité du Secret Statistique (Statistical Confidentiality Committee);
- Detailed data are restricted to the scientific community only, accessible via the Centre Sécurisé d’Accès aux Données (Secured Data Access Center) after a legal clearance procedure, involving a series of steps in line with the standards of Statistical Confidentiality Committee.
Some anonymized files are based on the Scientific Use Files (FPR) and enable students to familiarize themselves with statistical microdata. Other anonymized files contain no personal data from the outset. These simplified pedagogical datasets generally contain a reduced number of variables. They are designed in such a way that the individuals surveyed cannot be identified (scrambling, grouping, etc.), which necessarily leads to a loss of information. They cannot be used for scientific research, but are useful for self-training and teaching purposes, as they enable simple questions to be answered.
Scientific Use Files (FPR) are designed from confidential data and enable researchers, post-docs, PhD students, undergraduates and Masters students to carry out analyses and statistical processing as part of a research project. These datasets are pseudonymized to reduce the risk of re-identification of respondents, while maintaining a high level of detail for analysis.
Detailed files are created from the raw collected data, and are reserved for the scientific community. This de-identified data retains a very fine level of detail, enabling advanced processing for public statistics or scientific or historical research purposes.
- Demographic tables
They combine multiple indicators, mainly in the field of demography (mortality, birth rate, migration, etc.), but also of sociology, economics and political science. They cover a large number of European countries, and even extra-European ones for certain databases.
You can learn more about the way to access those data in the "Access the data" section of the Guide.
Technical information:
NADA is an open source software developed by the World Bank. The source code and technical documentation are available on Github.
Useful resources :
Contact us
For any question regarding the catalogue or its references: enquetes@ined.fr
For any question regarding the DataLab: datalab@ined.fr