Ce jeu de données est un jeu de données relationnelles pour la population entière (~10 millions d'habitants) d'un pays imaginaire à revenu intermédiaire. Le jeu de données contient deux fichiers de données : l'un avec des variables au niveau du ménage, l'autre avec des variables au niveau individuel. Il comprend des variables qui sont généralement collectées dans les recensements de la population (démographie, éducation, profession, caractéristiques des logements, fécondité, mortalité et migration) et dans les enquêtes auprès des ménages (dépenses des ménages, données anthropométriques pour les enfants, possession d'actifs). Les données ne comprennent que des ménages ordinaires (pas de ménages communautaires/institutionels). Le jeu de données a été créé à l'aide de REaLTabFormer, un modèle qui tire parti des méthodes d'apprentissage en profondeur ("deep learning"). Le jeu de données a été créé à des fins de formation et de simulation et n'est pas destiné à être représentatif d'un pays en particulier.
Un jeu de données est également disponible pour un échantillon de 8000 ménages, sous forme de données ouvertes (open data).