Социально-демографические характеристики зарегистрированных безработных: различия между версиями

Материал из Data-in
(→‎Структура набора данных (Codebook): изменено описание атрибута find_new_job)
Строка 457: Строка 457:
| [mailto:v.kopytok@cpur.ru v.kopytok@cpur.ru]
| [mailto:v.kopytok@cpur.ru v.kopytok@cpur.ru]
|}
|}
[[Category: Описания датасетов]]

Версия 09:02, 2 ноября 2021

История изменений

Дата Версия Автор Описание изменений
21.10.2021 1.0 Копыток Витовт Константинович Документ создан

Общая информация о датасете

Основные социально-демографические характеристики безработных, обратившихся в центры занятости населения (ЦЗН) в 2017—2020 гг. Датасет получен на основе обработки (агрегации) административных данных и не является официальной статинформацией.

Единица наблюдения в датасете — совокупность личных дел безработных по определенным характеристикам. Данные приведены по атрибутам: фед. округ, регион, месяц обращения, возрастная группа, пол, уровень образования безработного, факт повторного обращения, трудоустройства, отсутствия официального опыта работы, наименование ЦЗН. К наименованиям ЦЗН привязан точный адрес из справочника (отдельная таблица сzn_list.csv). По адресу через сервис dadata.ru восстановлены ОКТМО и географические координаты органа занятости.

Набор данных охватывает все субъекты РФ (исключая г. Байконур) и содержит 4 347 416 наблюдений по 15 атрибутам.

Набор доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»).

Ознакомьтесь с предложением по дизайну исследования по ссылке.

Общее описание набора данных

Атрибут Значение
Общие сведения
Полное наименование набора данных Регистрируемая безработица в России: общие социально-демографические характеристики с детализацией до органа занятости населения
Сокращенное наименование набора данных Социально-демографические характеристики зарегистрированных безработных
Краткое описание набора данных Основные социально-демографические характеристики безработных, обратившихся в центры занятости населения (ЦЗН) в 2017—2020 гг. Датасет получен на основе обработки (агрегации) административных данных и не является официальной статинформацией. Датасет включает в себя информацию о безработных в возрасте от 16 до 60 лет.

Единица наблюдения в датасете — совокупность личных дел безработных по определенным характеристикам. Данные приведены по атрибутам: фед. округ, регион, месяц обращения, возрастная группа, пол, уровень образования безработного, факт повторного обращения, трудоустройства, отсутствия официального опыта работы, наименование ЦЗН. К наименованиям ЦЗН привязан точный адрес из справочника (отдельная таблица сzn_list.csv). По адресу через сервис dadata.ru восстановлены ОКТМО и географические координаты органа занятости. Как правило, один ЦЗН размещается в одном муниципальном районе/городском округе. Однако в крупных городах может располагаться несколько ЦЗН.

Набор данных охватывает все субъекты РФ (исключая г. Байконур) и содержит 4 347 416 наблюдений по 15 атрибутам
Краткое описание источника набора данных Информация об основных характеристиках граждан, которые обращались за государственной услугой по содействию в поиске подходящей работы и были признаны безработными, а также о результатах оказания этой услуги вносится в регистр получателей государственных услуг в сфере занятости населения.

Информация об адресах органов занятости населения содержится в справочнике Роструда, публикуемом в разделе «Открытые данные» на официальном сайте
Покрываемый временной период 2017—2020 гг.
Доступные форматы CSV (кодировка: «UTF-8», разделитель: «;»)
Размер набора данных 1 Гб
Тематика набора данных Рынок труда и занятость
Режим доступа Открытый (у вас есть возможность работать с данными на своем личном ПК, в том числе и скачивать данные)
Периодичность публикации и обновления
Дата размещения в каталоге 21.10.2021
Периодичность обновления в каталоге Не обновляется
Дата последнего обновления набора данных в каталоге 21.10.2021
Характер последнего обновления Набор опубликован
Дата следующего обновления набора данных Не обновляется
Дополнительные сведения
Цитирование набора данных на русском языке Регистрируемая безработица в России: общие социально-демографические характеристики с детализацией до органа занятости населения // Роструд; обработка: Колесников И.В., Копыток В.К., Кузьмина Ю.В., Инфраструктура научно-исследовательских данных, АНО «ЦПУР», 2021. Доступ: открытая лицензия в исследовательских целях. Размещено: 21.10.2021. URL: https://data.rcsi.science/data-catalog/datasets/180/
For references (English) Registered unemployment in Russia: basic socio-demographic characteristics at the level of employment agencies // Rostrud; data-processing: Kolesnikov I., Kopytok V., Kuzmina Y., The Research Development Infrastructure (RDI), CAG, 2021. Access: open license for research purposes. Posted: 21.10.2021. URL: https://data.rcsi.science/data-catalog/datasets/180/
Ссылка на открытый репозиторий Отсутствует
Геоданные (пространственная привязка набора данных) Географические координаты в формате градусов с десятичной частью
Лицензия, под которой публикуется набор данных Вы можете использовать набор данных (копировать, распространять, передавать другим лицам, адаптировать, перерабатывать, создавать на его основе новые произведения) только в исследовательских целях.

Вы обязаны указывать Платформу ИНИД в качестве источника информации. Образец цитирования приведен в описании к данному набору данных. Вы также должны выделять изменения, внесенные вами в исходный набор данных. Если вы не принимаете условия настоящей лицензии в полном объеме, вы не имеете права использовать набор данных
Стандарт публикации http://opendata.gosmonitor.ru/standard/3.0
Параметры запросов API Интеграция через API не предусмотрена

Структура набора данных (Codebook)

Датасет представлен в виде двух плоских таблиц в формате CSV (кодировка: «UTF-8», разделитель: «;»):

  • основная таблица (data_180.csv);
  • вспомогательная таблица (сzn_list.csv).

Таблица «Социально-демографические характеристики зарегистрированных безработных» (data_180.csv)

Атрибут Описание Количество
пропусков (NaN)
(шт./%)
Единица измерения ОКЕИ Формат
Информация о заявителе, признанном безработным
id ID наблюдения в рамках набора данных.

Единица наблюдения в датасете — совокупность личных дел с соответствующими характеристиками
0 (0%)



integer
district Федеральный округ 0 (0%)



string
region Регион 0 (0%)



string
month_application Месяц обращения в орган занятости населения.

Для Чеченской Республики в исходных данных с мая 2019 года отсутствовали сведения о дате признания гражданина безработным. Эта дата была восстановлена следующим образом: для всех наблюдений, у которых была указана дата последней перерегистрации в качестве безработного, датой признания гражданина безработным может считаться дата обращения гражданина в орган занятости населения. Такой подход соответствует порядку, установленному правилами регистрации безработных граждан, и позволяет с достаточно высокой точностью восстановить пропущенные наблюдения. Для восстановленных таким образом дат атрибут changed_value принимает значение 1
0 (0%)



string
changed_value Отметка о том, что дата регистрации в качестве безработного была восстановлена по косвенным признакам 0 (0%)



boolean
age Группа по возрасту, к которой относится безработный гражданин. Принимает значения:
  • 16-21;
  • 22-27;
  • 28-33;
  • 34-39;
  • 40-45;
  • 46-51;
  • 52-57;
  • 58-60
0 (0%)



string
gender Пол безработного:
  • 1 — мужской;
  • 2 — женский
8



integer
education Уровень образования безработного:
  • 1 — начальное общее образование;
  • 2 — основное общее образование;
  • 3 — среднее общее образование;
  • 4 — среднее профессиональное образование;
  • 6 — высшее образование
  • 9 — другое.

Коды приведены в соответствии с Международной стандартной классификацией образования. В категорию «высшее образование» (код 6) включается высшее образование, полученное в рамках специалитета, бакалавриата, магистратуры, подготовки кадров высшей квалификации

2 138 703 (20,98%)



integer
hc_repeat Отметка о том, что безработный обратился повторно в органы занятости населения 0 (0%)



boolean
hc_didnotwork Отметка о том, что, по информации органов занятости населения, гражданин ранее официально не работал 0 (0%)



boolean
find_new_job Отметка о том, что гражданин нашел работу, в какой-либо период после признания безработным (в случае, если причина закрытия личного дела — «Трудоустройство» или была указана дата трудоустройства).

Органы занятости отслеживают статус занятости безработных только до тех пор, пока на них открыто личное дело. При этом личное дело может быть закрыто не только в связи с трудоустройством, но и по другим причинам: например, прохождение профессионального обучения или длительная неявка в ЦЗН (причины закрытия личных дел содержатся в датасете с микроданными в продвинутом режиме доступа]). Кроме того, некоторым безработным, которые, например, обратились в ЦЗН во второй половине 2020 года, нужно больше времени для того, чтобы найти новую работу (выгрузка данных осуществлялась в конце декабря 2020 года). Таким образом, в данных оценка доли трудоустроенных безработных занижена — данные цензурированы справа, необходимо использовать специальные методы для учета этой особенности.

0 (0%)



boolean
Информация об органе занятости, в который обратился безработный гражданин
szn_name Наименование органа занятости, в который обратился гражданин 0 (0%)



string
oktmo ОКТМО муниципального района/городского округа, в котором расположен орган занятости, в который обратился гражданин 0 (0%)



string
latitude_dd Широта органа занятости, в который обратился гражданин, в формате DD (градусы с десятичной частью) 0 (0%)



numeric
longitude_dd Долгота органа занятости, в который обратился гражданин, в формате DD (градусы с десятичной частью) 0 (0%)



numeric
count Количество личных дел с соответствующими характеристиками 0 (0%)




Таблица «Справочник центров и служб занятости» (сzn_list.csv)

Атрибут Описание Количество
пропусков (NaN)
(шт./%)
Единица измерения ОКЕИ Формат
id Идентификатор органа занятости населения Роструда 0 (0%)



string
number Порядковый номер записи в справочнике 0 (0%)



integer
region Регион, в котором расположен орган занятости населения 0 (0%)



string
szn_short_name Сокращенное наименование органа занятости населения 0 (0%)



string
szn_full_name Полное наименование органа занятости населения 72 (3%)



string
inn ИНН органа занятости населения 260 (10,7%)



string
adress Адрес 0 (0%)



string

Известные ограничения данных

Полнота данных

  • Представленные в наборе данные получены на основе административных источников и не являются официальной статистической информацией. В частности, в наборе данных представлена информация только о безработных в возрасте от 16 до 60 лет включительно.
  • Поскольку сведения из региональных сегментов передаются в федеральный регистр с задержкой, в данном наборе могут быть представлены не все обновления о личных делах, которые поступали в производство ноябре-декабре 2020 г. Выгрузка массива данных для формирования набора проводилась 28 декабря 2020 г.

Описание проведенных проверок и их результатов

  • При обработке исходных данных выявлено чуть больше 16 тысяч дублей личных дел (по комбинации признаков: регион, номер личного дела, дата обращения, дата рождения и пол заявителя). При формировании набора данных эти записи были исключены.

Внесенные в набор данных изменения по сравнению с источниками

  • Наблюдения из первоисточника отобраны в соответствии с правилами:
    • заявитель обратился за государственной услугой «Содействие в поиске подходящей работы»;
    • заявитель был признан официально зарегистрированным в качестве безработного;
    • на момент обращения в орган занятости населения заявитель был старше 15 лет и младше 61 года.
  • Исключены наблюдения, соответствующие г. Байконур и дублям личных дел (по комбинации признаков: регион, номер личного дела, дата обращения, дата рождения и пол заявителя).
  • По названию региона и наименованию органа занятости населения из Справочника Центров и служб занятости Роструда с использованием метрик схожести текстов привязаны адреса органов занятости населения.
  • При помощи сервиса dadata.ru к адресу каждого органа занятости привязаны географические координаты и ОКТМО муниципального района/городского округа, в котором расположен орган занятости населения.

Источники данных

Подсистема «Регистр получателей услуг» ИАС ОБВ «Работа в России»

Атрибут Значение
Полное наименование источника данных Подсистема «Регистр получателей услуг» информационно-аналитической системы «Общероссийская база вакансий «Работа в России»
Сокращенное наименование источника данных ПРПУ
Владелец источника данных Федеральная служба по труду и занятости (Роструд)
Краткое описание источника данных Информация об основных характеристиках граждан, которые обращались в органы занятости населения и были зарегистрированы в качестве безработных, вносится в регистры получателей государственных услуг в сфере занятости населения.

Регистры являются источником актуальных сведений обо всех получателях государственных услуг в сфере содействия занятости. Они содержат информацию о возрасте, трудовом стаже и последнем месте работы заявителей, уровне образования и квалификации, полученных в ЦЗН услугах и их сроках, дате и профессии трудоустройства. Отметка о признании гражданина безработным, а также о снятии с учета в качестве безработного также вносится в эти регистры
Ссылка на источник данных Прямая ссылка отсутствует, источник — информационная система ограниченного доступа
Перечень используемых классификаторов ОКТМО (Общероссийский классификатор территорий муниципальных образований)
Понятия, используемые в источнике Регистрируемая безработица — уровень безработицы, характеризуемый количеством граждан, официально зарегистрированных в органах занятости населения в качестве безработных. Данный показатель отличается от показателя безработицы, рассчитываемой по методологии Международной организации труда, для которого используются опросные данные
Методология и изменения методологии для источника данных Приказ Минздравсоцрзавития России № 972н устанавливает такой порядок формирования регистров:
  • службы занятости населения ежемесячно собирают сведения о получателях государственных услуг в сфере занятости населения и передают их органы исполнительной власти субъектов РФ;
  • органы исполнительной власти субъектов РФ сверяют полученные сведения с показателями статистической отчетности, в случае наличия расхождений осуществляют необходимые корректировки и формируют региональные сегменты регистров, которые ежемесячно передают в Роструд;
  • Роструд сверяет полученные сведения с показателями государственной статистической отчетности и формирует федеральные регистры получателей
Ссылки на методологию http://docs.cntd.ru/document/902245791

Справочник Центров и служб занятости из ИС Работа в России

Атрибут Значение
Полное наименование источника данных Справочник Центров и служб занятости из ИС Работа в России
Сокращенное наименование источника данных Справочник государственных органов занятости населения
Владелец источника данных Федеральная служба по труду и занятости (Роструд)
Краткое описание источника данных Справочник Центров и служб занятости размещен в разделе открытых данных на сайте Федеральной службы по труду и занятости. Содержит подробную информацию о службах и центрах занятости (полное и краткое наименование, регион, адрес, ИНН, ФИО руководителя и его должность, контактную информацию). При подготовке набора данных использовалась версия справочника от 23 марта 2021 г.
Ссылка на источник данных https://rostrud.gov.ru/opendata/7712345678-employmentcenters
Перечень используемых классификаторов Информация отсутствует
Методология и изменения методологии для источника данных Информация отсутствует
Ссылки на методологию Информация отсутствует

Ответственные за набор данных

ФИО ответственного лица Электронная почта ответственного лица

1.

Копыток Витовт Константинович

v.kopytok@cpur.ru