Ce jeu de données est un jeu de données relationnelles pour 8000 ménages, représentant un échantillon de la population d'un pays imaginaire à revenu intermédiaire. Le jeu de données contient deux fichiers de données : l'un avec des variables au niveau du ménage, l'autre avec des variables au niveau individuel. Il comprend des variables qui sont généralement collectées dans les recensements de la population (démographie, éducation, profession, caractéristiques des logements, fécondité, mortalité et migration) et dans les enquêtes auprès des ménages (dépenses des ménages, données anthropométriques pour les enfants, possession d'actifs). Les données ne comprennent que des ménages ordinaires (pas de ménages communautaires/institutionels). Le jeu de données a été créé à l'aide de REaLTabFormer, un modèle qui tire parti des méthodes d'apprentissage en profondeur ("deep learning"). Le jeu de données a été créé à des fins de formation et de simulation et n'est pas destiné à être représentatif d'un pays en particulier.
Le jeu de données de la population complète (comprenant les données pour environ 10 millions d'individus) est également distribué sous forme de données ouvertes (open data).