Социально-демографические характеристики зарегистрированных безработных: различия между версиями
Editor (обсуждение | вклад) |
Editor (обсуждение | вклад) м (→Таблица «Социально-демографические характеристики зарегистрированных безработных» (data_180.csv)) |
||
(не показана 1 промежуточная версия этого же участника) | |||
Строка 182: | Строка 182: | ||
| Пол безработного:<br> | | Пол безработного:<br> | ||
* 1 — мужской;<br> | * 1 — мужской;<br> | ||
* | * 0 — женский | ||
| style="text-align: center;" | 8 | | style="text-align: center;" | 8 | ||
| | | | ||
Строка 283: | Строка 283: | ||
<br> | <br> | ||
| | | | ||
numeric | |||
|} | |} | ||
Текущая версия на 08:51, 7 декабря 2021
История изменений
Дата | Версия | Автор | Описание изменений |
---|---|---|---|
21.10.2021 | 1.0 | Копыток Витовт Константинович | Документ создан |
Общая информация о датасете
Основные социально-демографические характеристики безработных, обратившихся в центры занятости населения (ЦЗН) в 2017—2020 гг. Датасет получен на основе обработки (агрегации) административных данных и не является официальной статинформацией.
Единица наблюдения в датасете — совокупность личных дел безработных по определенным характеристикам. Данные приведены по атрибутам: фед. округ, регион, месяц обращения, возрастная группа, пол, уровень образования безработного, факт повторного обращения, трудоустройства, отсутствия официального опыта работы, наименование ЦЗН. К наименованиям ЦЗН привязан точный адрес из справочника (отдельная таблица сzn_list.csv). По адресу через сервис dadata.ru восстановлены ОКТМО и географические координаты органа занятости.
Набор данных охватывает все субъекты РФ (исключая г. Байконур) и содержит 4 347 416 наблюдений по 15 атрибутам.
Набор доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»).
Ознакомьтесь с предложением по дизайну исследования по ссылке.
Общее описание набора данных
Атрибут | Значение |
---|---|
Общие сведения | |
Полное наименование набора данных | Регистрируемая безработица в России: общие социально-демографические характеристики с детализацией до органа занятости населения |
Сокращенное наименование набора данных | Социально-демографические характеристики зарегистрированных безработных |
Краткое описание набора данных | Основные социально-демографические характеристики безработных, обратившихся в центры занятости населения (ЦЗН) в 2017—2020 гг. Датасет получен на основе обработки (агрегации) административных данных и не является официальной статинформацией. Датасет включает в себя информацию о безработных в возрасте от 16 до 60 лет. Единица наблюдения в датасете — совокупность личных дел безработных по определенным характеристикам. Данные приведены по атрибутам: фед. округ, регион, месяц обращения, возрастная группа, пол, уровень образования безработного, факт повторного обращения, трудоустройства, отсутствия официального опыта работы, наименование ЦЗН. К наименованиям ЦЗН привязан точный адрес из справочника (отдельная таблица сzn_list.csv). По адресу через сервис dadata.ru восстановлены ОКТМО и географические координаты органа занятости. Как правило, один ЦЗН размещается в одном муниципальном районе/городском округе. Однако в крупных городах может располагаться несколько ЦЗН. Набор данных охватывает все субъекты РФ (исключая г. Байконур) и содержит 4 347 416 наблюдений по 15 атрибутам |
Краткое описание источника набора данных | Информация об основных характеристиках граждан, которые обращались за государственной услугой по содействию в поиске подходящей работы и были признаны безработными, а также о результатах оказания этой услуги вносится в регистр получателей государственных услуг в сфере занятости населения. Информация об адресах органов занятости населения содержится в справочнике Роструда, публикуемом в разделе «Открытые данные» на официальном сайте |
Покрываемый временной период | 2017—2020 гг. |
Доступные форматы | CSV (кодировка: «UTF-8», разделитель: «;») |
Размер набора данных | 1 Гб |
Тематика набора данных | Рынок труда и занятость |
Режим доступа | Открытый (у вас есть возможность работать с данными на своем личном ПК, в том числе и скачивать данные) |
Периодичность публикации и обновления | |
Дата размещения в каталоге | 21.10.2021 |
Периодичность обновления в каталоге | Не обновляется |
Дата последнего обновления набора данных в каталоге | 21.10.2021 |
Характер последнего обновления | Набор опубликован |
Дата следующего обновления набора данных | Не обновляется |
Дополнительные сведения | |
Цитирование набора данных на русском языке | Регистрируемая безработица в России: общие социально-демографические характеристики с детализацией до органа занятости населения // Роструд; обработка: Колесников И.В., Копыток В.К., Кузьмина Ю.В., Инфраструктура научно-исследовательских данных, АНО «ЦПУР», 2021. Доступ: открытая лицензия в исследовательских целях. Размещено: 21.10.2021. URL: https://data.rcsi.science/data-catalog/datasets/180/ |
For references (English) | Registered unemployment in Russia: basic socio-demographic characteristics at the level of employment agencies // Rostrud; data-processing: Kolesnikov I., Kopytok V., Kuzmina Y., The Research Development Infrastructure (RDI), CAG, 2021. Access: open license for research purposes. Posted: 21.10.2021. URL: https://data.rcsi.science/data-catalog/datasets/180/ |
Ссылка на открытый репозиторий | Отсутствует |
Геоданные (пространственная привязка набора данных) | Географические координаты в формате градусов с десятичной частью |
Лицензия, под которой публикуется набор данных | Вы можете использовать набор данных (копировать, распространять, передавать другим лицам, адаптировать, перерабатывать, создавать на его основе новые произведения) только в исследовательских целях. Вы обязаны указывать Платформу ИНИД в качестве источника информации. Образец цитирования приведен в описании к данному набору данных. Вы также должны выделять изменения, внесенные вами в исходный набор данных. Если вы не принимаете условия настоящей лицензии в полном объеме, вы не имеете права использовать набор данных |
Стандарт публикации | http://opendata.gosmonitor.ru/standard/3.0 |
Параметры запросов API | Интеграция через API не предусмотрена |
Структура набора данных (Codebook)
Датасет представлен в виде двух плоских таблиц в формате CSV (кодировка: «UTF-8», разделитель: «;»):
- основная таблица (data_180.csv);
- вспомогательная таблица (сzn_list.csv).
Таблица «Социально-демографические характеристики зарегистрированных безработных» (data_180.csv)
Атрибут | Описание | Количество пропусков (NaN) (шт./%) |
Единица измерения | ОКЕИ | Формат |
---|---|---|---|---|---|
Информация о заявителе, признанном безработным | |||||
id | ID наблюдения в рамках набора данных. Единица наблюдения в датасете — совокупность личных дел с соответствующими характеристиками |
0 (0%) |
|
|
integer |
district | Федеральный округ | 0 (0%) |
|
|
string |
region | Регион | 0 (0%) |
|
|
string |
month_application | Месяц обращения в орган занятости населения. Для Чеченской Республики в исходных данных с мая 2019 года отсутствовали сведения о дате признания гражданина безработным. Эта дата была восстановлена следующим образом: для всех наблюдений, у которых была указана дата последней перерегистрации в качестве безработного, датой признания гражданина безработным может считаться дата обращения гражданина в орган занятости населения. Такой подход соответствует порядку, установленному правилами регистрации безработных граждан, и позволяет с достаточно высокой точностью восстановить пропущенные наблюдения. Для восстановленных таким образом дат атрибут changed_value принимает значение 1 |
0 (0%) |
|
|
string |
changed_value | Отметка о том, что дата регистрации в качестве безработного была восстановлена по косвенным признакам | 0 (0%) |
|
|
boolean |
age | Группа по возрасту, к которой относится безработный гражданин. Принимает значения:
|
0 (0%) |
|
|
string |
gender | Пол безработного:
|
8 |
|
|
integer |
education | Уровень образования безработного:
Коды приведены в соответствии с Международной стандартной классификацией образования. В категорию «высшее образование» (код 6) включается высшее образование, полученное в рамках специалитета, бакалавриата, магистратуры, подготовки кадров высшей квалификации |
2 138 703 (20,98%) |
|
|
integer |
hc_repeat | Отметка о том, что безработный обратился повторно в органы занятости населения | 0 (0%) |
|
|
boolean |
hc_didnotwork | Отметка о том, что, по информации органов занятости населения, гражданин ранее официально не работал | 0 (0%) |
|
|
boolean |
find_new_job | Отметка о том, что гражданин нашел работу, в какой-либо период после признания безработным (в случае, если причина закрытия личного дела — «Трудоустройство» или была указана дата трудоустройства).
Органы занятости отслеживают статус занятости безработных только до тех пор, пока на них открыто личное дело. При этом личное дело может быть закрыто не только в связи с трудоустройством, но и по другим причинам: например, прохождение профессионального обучения или длительная неявка в ЦЗН (причины закрытия личных дел содержатся в датасете с микроданными в продвинутом режиме доступа]). Кроме того, некоторым безработным, которые, например, обратились в ЦЗН во второй половине 2020 года, нужно больше времени для того, чтобы найти новую работу (выгрузка данных осуществлялась в конце декабря 2020 года). Таким образом, в данных оценка доли трудоустроенных безработных занижена — данные цензурированы справа, необходимо использовать специальные методы для учета этой особенности. |
0 (0%) |
|
|
boolean |
Информация об органе занятости, в который обратился безработный гражданин | |||||
szn_name | Наименование органа занятости, в который обратился гражданин | 0 (0%) |
|
|
string |
oktmo | ОКТМО муниципального района/городского округа, в котором расположен орган занятости, в который обратился гражданин | 0 (0%) |
|
|
string |
latitude_dd | Широта органа занятости, в который обратился гражданин, в формате DD (градусы с десятичной частью) | 0 (0%) |
|
|
numeric |
longitude_dd | Долгота органа занятости, в который обратился гражданин, в формате DD (градусы с десятичной частью) | 0 (0%) |
|
|
numeric |
count | Количество личных дел с соответствующими характеристиками | 0 (0%) |
|
|
numeric |
Таблица «Справочник центров и служб занятости» (сzn_list.csv)
Атрибут | Описание | Количество пропусков (NaN) (шт./%) |
Единица измерения | ОКЕИ | Формат |
---|---|---|---|---|---|
id | Идентификатор органа занятости населения Роструда | 0 (0%) |
|
|
string |
number | Порядковый номер записи в справочнике | 0 (0%) |
|
|
integer |
region | Регион, в котором расположен орган занятости населения | 0 (0%) |
|
|
string |
szn_short_name | Сокращенное наименование органа занятости населения | 0 (0%) |
|
|
string |
szn_full_name | Полное наименование органа занятости населения | 72 (3%) |
|
|
string |
inn | ИНН органа занятости населения | 260 (10,7%) |
|
|
string |
adress | Адрес | 0 (0%) |
|
|
string |
Известные ограничения данных
Полнота данных
- Представленные в наборе данные получены на основе административных источников и не являются официальной статистической информацией. В частности, в наборе данных представлена информация только о безработных в возрасте от 16 до 60 лет включительно.
- Поскольку сведения из региональных сегментов передаются в федеральный регистр с задержкой, в данном наборе могут быть представлены не все обновления о личных делах, которые поступали в производство ноябре-декабре 2020 г. Выгрузка массива данных для формирования набора проводилась 28 декабря 2020 г.
Описание проведенных проверок и их результатов
- При обработке исходных данных выявлено чуть больше 16 тысяч дублей личных дел (по комбинации признаков: регион, номер личного дела, дата обращения, дата рождения и пол заявителя). При формировании набора данных эти записи были исключены.
Внесенные в набор данных изменения по сравнению с источниками
- Наблюдения из первоисточника отобраны в соответствии с правилами:
- заявитель обратился за государственной услугой «Содействие в поиске подходящей работы»;
- заявитель был признан официально зарегистрированным в качестве безработного;
- на момент обращения в орган занятости населения заявитель был старше 15 лет и младше 61 года.
- Исключены наблюдения, соответствующие г. Байконур и дублям личных дел (по комбинации признаков: регион, номер личного дела, дата обращения, дата рождения и пол заявителя).
- По названию региона и наименованию органа занятости населения из Справочника Центров и служб занятости Роструда с использованием метрик схожести текстов привязаны адреса органов занятости населения.
- При помощи сервиса dadata.ru к адресу каждого органа занятости привязаны географические координаты и ОКТМО муниципального района/городского округа, в котором расположен орган занятости населения.
Источники данных
Подсистема «Регистр получателей услуг» ИАС ОБВ «Работа в России»
Атрибут | Значение |
---|---|
Полное наименование источника данных | Подсистема «Регистр получателей услуг» информационно-аналитической системы «Общероссийская база вакансий «Работа в России» |
Сокращенное наименование источника данных | ПРПУ |
Владелец источника данных | Федеральная служба по труду и занятости (Роструд) |
Краткое описание источника данных | Информация об основных характеристиках граждан, которые обращались в органы занятости населения и были зарегистрированы в качестве безработных, вносится в регистры получателей государственных услуг в сфере занятости населения. Регистры являются источником актуальных сведений обо всех получателях государственных услуг в сфере содействия занятости. Они содержат информацию о возрасте, трудовом стаже и последнем месте работы заявителей, уровне образования и квалификации, полученных в ЦЗН услугах и их сроках, дате и профессии трудоустройства. Отметка о признании гражданина безработным, а также о снятии с учета в качестве безработного также вносится в эти регистры |
Ссылка на источник данных | Прямая ссылка отсутствует, источник — информационная система ограниченного доступа |
Перечень используемых классификаторов | ОКТМО (Общероссийский классификатор территорий муниципальных образований) |
Понятия, используемые в источнике | Регистрируемая безработица — уровень безработицы, характеризуемый количеством граждан, официально зарегистрированных в органах занятости населения в качестве безработных. Данный показатель отличается от показателя безработицы, рассчитываемой по методологии Международной организации труда, для которого используются опросные данные |
Методология и изменения методологии для источника данных | Приказ Минздравсоцрзавития России № 972н устанавливает такой порядок формирования регистров:
|
Ссылки на методологию | http://docs.cntd.ru/document/902245791 |
Справочник Центров и служб занятости из ИС Работа в России
Атрибут | Значение |
---|---|
Полное наименование источника данных | Справочник Центров и служб занятости из ИС Работа в России |
Сокращенное наименование источника данных | Справочник государственных органов занятости населения |
Владелец источника данных | Федеральная служба по труду и занятости (Роструд) |
Краткое описание источника данных | Справочник Центров и служб занятости размещен в разделе открытых данных на сайте Федеральной службы по труду и занятости. Содержит подробную информацию о службах и центрах занятости (полное и краткое наименование, регион, адрес, ИНН, ФИО руководителя и его должность, контактную информацию). При подготовке набора данных использовалась версия справочника от 23 марта 2021 г. |
Ссылка на источник данных | https://rostrud.gov.ru/opendata/7712345678-employmentcenters |
Перечень используемых классификаторов | Информация отсутствует |
Методология и изменения методологии для источника данных | Информация отсутствует |
Ссылки на методологию | Информация отсутствует |
Ответственные за набор данных
№ | ФИО ответственного лица | Электронная почта ответственного лица |
1. |
Копыток Витовт Константинович |
v.kopytok@cpur.ru |