Выборка 10% микроданных переписи населения 2002 г: различия между версиями

Материал из Data-in
(→‎История изменений: добавлена таблица)
Строка 18: Строка 18:


== Общая информация о датасете ==
== Общая информация о датасете ==
'''Десятипроцентная''' выборка с микроданными Всероссийской переписи населения 2002 года по частным домохозяйствам и индивидам, проживающим в этих домохозяйствах.
При формировании выборки использовался метод систематического сэмплинга (Two-Stage Systematic Sampling), а также исключались наблюдения, которые соответствуют временно пребывающим на территории России, лицам из коллективных домохозяйств и лицам, проживающим в населенных пунктах, которые входят в состав ЗАТО. При формировании выборки '''не учитывались''' домохозяйства, в которых проживает '''восемь и более лиц.'''
В каталоге в продвинутом режиме доступа размещена [https://data.rcsi.science/data-catalog/datasets/191/ расширенная двадцатипроцентная выборка.]
Единица наблюдения в датасете — член частного домохозяйства. Выборка разделена на восемь частей по федеральным округам. Минимальный уровень географической детализации — муниципальное образование второй ступени (муниципальные районы, городские округа и внутригородские районы).
В выборке представлены основные показатели из переписных листов: характеристики индивидов (возраст, пол, уровень образования, владение языками, экономическая активность, источники дохода и др.), характеристики домохозяйства (размер, родственные связи) и информация об основных характеристиках жилища.
Всего набор содержит 13 647 647 наблюдений по 57 атрибутам.
Датасет доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»).


== Общее описание набора данных ==
== Общее описание набора данных ==

Версия 11:42, 14 декабря 2021

История изменений

Дата Версия Автор Описание изменений
16.12.2021

1.0

Копыток Витовт Константинович Документ создан

Кузьмина Юлия Викторовна
Тихонов Сергей Владимирович

Общая информация о датасете

Десятипроцентная выборка с микроданными Всероссийской переписи населения 2002 года по частным домохозяйствам и индивидам, проживающим в этих домохозяйствах.

При формировании выборки использовался метод систематического сэмплинга (Two-Stage Systematic Sampling), а также исключались наблюдения, которые соответствуют временно пребывающим на территории России, лицам из коллективных домохозяйств и лицам, проживающим в населенных пунктах, которые входят в состав ЗАТО. При формировании выборки не учитывались домохозяйства, в которых проживает восемь и более лиц.

В каталоге в продвинутом режиме доступа размещена расширенная двадцатипроцентная выборка.

Единица наблюдения в датасете — член частного домохозяйства. Выборка разделена на восемь частей по федеральным округам. Минимальный уровень географической детализации — муниципальное образование второй ступени (муниципальные районы, городские округа и внутригородские районы).

В выборке представлены основные показатели из переписных листов: характеристики индивидов (возраст, пол, уровень образования, владение языками, экономическая активность, источники дохода и др.), характеристики домохозяйства (размер, родственные связи) и информация об основных характеристиках жилища.

Всего набор содержит 13 647 647 наблюдений по 57 атрибутам.

Датасет доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»).

Общее описание набора данных

Структура набора данных

Источники данных

​Описание проведенных проверок и их результатов

Внесенные в набор данных изменения по сравнению с источниками

Источники данных

Ответственные за набор данных