Социально-демографические показатели зарегистрированных безработных: дизайны исследований на данных

Материал из Data-in
Версия от 14:20, 25 октября 2021; Editor (обсуждение | вклад) (Отмена правки 365, сделанной Editor (обсуждение))

Данные: краткое описание

Набор данныхРегистрируемая безработица в России: общие социально-демографические характеристики с детализацией до центра занятости населения.

Источник данных — административные регистры Федеральной службы по труду и занятости.

Доступный в открытом контуре проекта ИНИД набор данных содержит основные социально-демографические характеристики зарегистрированных в 2017—2020 годах безработных с привязкой к конкретному центру занятости населения (ЦЗН). Охватывает безработных в возрасте от 16 до 60 лет. К наименованиям ЦЗН был привязан точный адрес из справочника Роструда, а по адресу с помощью сервиса dadata.ru восстановлены географические координаты ЦЗН и ОКТМО муниципального района (городского округа), в котором расположен ЦЗН.

Единица наблюдения в датасете — совокупность личных дел с соответствующими характеристиками. Данные по каждому наблюдению приведены по следующим атрибутам:

  • федеральный округ, регион;
  • наименование ЦЗН, географические координаты ЦЗН, ОКТМО;
  • количество наблюдений с соответствующими характеристиками, месяц обращения;
  • возрастная группа, пол, уровень образования;
  • отметка о повторном обращении, отметка об отсутствии официального опыта работы, факт трудоустройства.

Дизайны исследований с использованием этих данных

Предложение № 1. Сопоставление общей и регистрируемой безработицы

Общий контекст
При оценке уровня безработицы обычно используется два альтернативных показателя. Первый — уровень регистрируемой безработицы — отношение числа безработных, которые обратились в ЦЗН и были официально зарегистрированы в качестве безработных, к общей численности всего экономически активного населения страны. Второй — уровень общей безработицы — доля среди экономически активного населения группы граждан трудоспособного возраста, которые (1) не имеют работы; (2) предпринимают усилия, чтобы ее найти; (3) готовы к ней приступить в ближайшее время.

Традиционно соотношение между регистрируемой и общей безработицей в России составляло примерно 1:5. Однако весной 2020 года на фоне пандемии коронавируса и изменения правил выплаты пособия по безработице два показателя сблизились. Наличие альтернативных источников данных о безработице (регистрируемой и общей) позволяет изучить эффективность государства в деле сбора информации об ищущих новую работу, предоставления последним помощи в поиске работы. В данном случае сбор информации центрами занятости преимущественно зависит от воли самих граждан: без их непосредственного обращения в органы центров занятости последними информация получена быть не может. Таким образом, возможно проанализировать региональную и временную вариации в расхождении между регистрируемой и общей безработицей, зависящую от того, в какой степени граждане опираются на государство в поиске места работы.

Исследовательские вопросы

  1. Как отличается структура общей и регистрируемой безработицы по основным социально-демографическим характеристикам?
  2. Как меняется соотношение между двумя показателями в зависимости от действия внешних факторов (например, пандемии)?
  3. Какие граждане чаще обращаются в центры занятости, предпочитая их альтернативным методам поиска работы?


Базовый метод и его применение

Основной метод исследования — описательные статистики и визуальный анализ доступных временных рядов в разрезе субъектов РФ и муниципалитетов. Такой анализ позволит провести детальное сопоставление структуры общей и регистрируемой безработицы по основным социально-демографическим характеристикам.

Необходимые дополнительные данные
Для анализа структуры общей безработицы могут быть использованы данные Выборочного обследования рабочей силы, которое проводит Росстат, а также данные Российского мониторинга экономического положения и здоровья населения (РМЭЗ) НИУ ВШЭ.

Примеры похожих исследований

  • Konle-Seidl R., Lüdeke B. What harmonised and registered unemployment rates do not tell. IAB-Forschungsbericht, 2017, no. 6/2017.[1]
  • Lee M.M., Zhang N. Legibility and the informational foundations of state capacity. Journal of Politics, 2017, vol. 79, no. 1, pp. 118—132.[2]

Предложение №2. Региональная вариация в эффективности услуг центров занятости

Общий контекст
Существует большая вариация по регионам России в количестве обращений в ЦЗН. Среди обращающихся на протяжении всего периода, по которым имеются данные, примерно трети не удается найти работу, в связи с чем их дела закрываются. Эти обстоятельства и экономический шок, вызванный пандемией в 2020 году, дают возможность проанализировать региональную вариацию в эффективности оказания ЦЗН услуги помощи в поиске работы.

Исследовательские вопросы

  1. Какие факторы, измеренные на региональном уровне или на уровне муниципального района/городского округа, увеличивали результативность предоставляемых центрами занятости населения услуг?
  2. Каково соотношение в части обеспечения успешного трудоустройства безработного между факторами индивидуальных характеристик безработного и эффективности работы органов занятости населения?


Возможные ограничения
Органы занятости отслеживают статус занятости безработных только до тех пор, пока на них открыто личное дело. При этом личное дело может быть закрыто не только в связи с трудоустройством, но и по другим причинам: например, прохождение профессионального обучения или длительная неявка в ЦЗН (причины закрытия личных дел содержатся в датасете с микроданными в продвинутом режиме доступа). Кроме того, некоторым безработным, которые, например, обратились в ЦЗН во второй половине 2020 года, нужно больше времени для того, чтобы найти новую работу (выгрузка данных осуществлялась в конце декабря 2020 года). Таким образом, в данных оценка доли трудоустроенных безработных занижена — данные цензурированы справа, необходимо использовать специальные методы для учета этой особенности.

Базовый метод и его применение
Для оценки влияния различных факторов на вероятность трудоустройства рекомендуется использовать одну из полупараметрических моделей выживания, например, модель пропорциональных рисков Кокса (регрессия Кокса).

В качестве риска (зависимой переменной) в данном случае может рассматриваться условная вероятность выхода из безработицы в определенный момент времени. Поскольку в данной модели риск рассматривается как функция, которая зависит от времени, необходимо использовать дополнительные данные, отсутствующие в текущем датасете — о месяце трудоустройства безработного.

В вектор объясняющих переменных могут быть включены индивидуальные характеристики (пол, возраст, уровень образования, опыт работы), внешние факторы (например, характеристики регионального или локального рынка труда) и характеристики услуг, полученных безработным гражданином в ЦЗН (направления на работу, переобучение). Анализ различных детерминант выхода из состояния безработицы позволит понять, какой вклад в этот процесс вносят непосредственно меры ЦЗН, а какой — прочие факторы.

Необходимые дополнительные данные


Примеры похожих исследований
Stuken, T., & Korzhova, O. (2020). The Efficiency of State Employment Centers: Case of Russia. International Scientific Conference Strategic Management and Decision Support Systems in Strategic Management. [3]
Denisova I. (2017). Exit of Senior Age Cohorts from the Russian Labour Market: a Survival Analysis Approach. Population and Economics, volume 1, issue 1, p. 152 - 175.[4]

Предложение №3. Поиск работы в условиях кризиса. Анализ индивидуальных характеристик

Общий контекст
Изучение профессионального статуса, его изменения в период кризиса — достаточно распространенный класс исследований. В случае экономического шока и пандемии 2020 года ситуация являлась особенной ввиду того, что пандемия — кризис не экономический, но прежде всего кризис здравоохранения. Для защиты здоровья граждан были введены такие меры, как самоизоляция, ограничение работы предприятий, строек и офисов. Таким образом, пандемия изменила рынок труда, поскольку ввела определенные ограничения на занятие некоторыми профессиями, требующими личного контакта с другими работниками. Указанное воздействие может быть частично оценено с помощью анализа индивидуальных траекторий, граждан, воспользовавшихся услугами центров занятости до, во время и после пандемии. Кроме того, это позволит оценить краткосрочный эффект пандемии для рынка труда — исследовать, какие навыки и индивидуальные характеристики стали более востребованы в условиях данного кризиса.

Исследовательский вопрос
Каким образом пандемия (введение ограничений, связанное с распространением вируса) изменила влияние индивидуальных характеристик на успех в нахождении работы при обращении в центры занятости населения?

Базовый метод и его применение
Для оценки влияния индивидуальных факторов предлагается использовать логистическую регрессию для бинарной зависимой переменной (1 — удалось найти работу, 0 — нет). Для оценки влияния пандемии на относительную важность различных индивидуальных показателей необходимо использовать модели с переменными взаимодействия. Модератором для индивидуальных характеристик в данном случае должно выступать время открытия дела. Возможны модификации модератора, при которых исследователь отследит даты введения локдауна на территории региона, в центр занятости которого обратился гражданин.

Второй возможный метод анализа — использование метода Difference-in-Difference («разность разностей»). В таком случае контрольная группа и группа воздействия будут строится на наблюдениях из разных отраслей в зависимости от того, насколько вводимые государством ограничения влияли на работу этих отраслей: группа воздействия — отрасли, работа которых в наибольшей степени была ограничена; контрольная группа — отрасли, которые пострадали менее сильно от локдауна.

Необходимые дополнительные данные


Примеры похожих исследований
Occupational mobility in Europe during the crisis: Did the social elevator break? Research in Social Stratification and Mobility, 72. [5]