Доходы и имущество госслужащих за 2013-2020 гг
История изменений
Дата | Версия | Автор | Описание изменений |
---|---|---|---|
28.10.2020 | 1.0 | Витовт Копыток Ольга Батова |
Документ создан |
30.11.2021 | 2.0 | Ксения Зиндер Эльвира Гизатуллина, |
Описание дополнено после обновления датасета данными за 2020 год и сведениями об имуществе чиновника, доходах и имуществе членов его семьи |
07.12.2021 | 2.1 | Ксения Зиндер Эльвира Гизатуллина, |
Датасет разделен на отдельные таблицы: доход, недвижимость в собственности, недвижимость в пользовании, транспортные средства |
Общая информация о датасете
Данные о доходах и имуществе сотрудников российских министерств и членов их семей, полученные из опубликованных антикоррупционных деклараций за 2013-2020 гг.
Согласно ФЗ №273 «О противодействии коррупции», госслужащие и прочие публичные должностные лица ежегодно подают декларации о доходах, транспортных средствах, недвижимом имуществе, находящемся в пользовании и в собственности в отношении себя, супруги(а) и несовершеннолетних детей. Эти сведения размещаются в открытом доступе в разделах «Противодействие коррупции» на официальных сайтах федеральных министерств. В наборе объединены распарсенные данные 17 федеральных министерств за 2013-2020 гг. Сведения были дополнены информацией о поле, семейном положении, количестве несовершеннолетних детей.
Единица наблюдения в датасете — сведения о госслужащем за конкретный год. Датасет включает в себя основную таблицу с доходами чиновника и членов его семьи, а также 3 дополнительные таблицы, содержащие информацию о недвижимости в пользовании и владении (раздельно), а также о транспортных средствах. Все таблицы могут быть связаны между собой по сочетанию атрибутов: year, state_agency, name, position.
Набор охватывает период с 2013 по 2020 год, содержит 22 201 наблюдение по 37 атрибутам. Датасет доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»).
Общее описание набора данных
Атрибут | Значение |
---|---|
Общие сведения | |
Полное наименование набора данных | Доходы и имущество госслужащих: объединенные сведения из антикоррупционных деклараций сотрудников российских министерств |
Сокращенное наименование набора данных | Доходы и имущество госслужащих за 2013-2020 гг. |
Краткое описание набора данных | Данные о доходах и имуществе сотрудников российских министерств и членов их семей, полученные из опубликованных антикоррупционных деклараций за 2013-2020 гг. Согласно ФЗ №273 «О противодействии коррупции», госслужащие и прочие публичные должностные лица ежегодно подают декларации о доходах, транспортных средствах, недвижимом имуществе, находящемся в пользовании и в собственности в отношении себя, супруги(а) и несовершеннолетних детей. Эти сведения размещаются в открытом доступе в разделах «Противодействие коррупции» на официальных сайтах федеральных министерств. В наборе объединены распарсенные данные 17 федеральных министерств за 2013-2020 гг. Сведения были дополнены информацией о поле, семейном положении, количестве несовершеннолетних детей. Единица наблюдения в датасете — сведения о госслужащем за конкретный год. Датасет включает в себя основную таблицу с доходами чиновника и членов его семьи, а также 3 дополнительные таблицы, содержащие информацию о недвижимости в пользовании и владении (раздельно), а также о транспортных средствах. Все таблицы могут быть связаны между собой по сочетанию атрибутов: year, state_agency, name, position. Набор охватывает период с 2013 по 2020 год, содержит 22201 наблюдение по 37 атрибутам. |
Краткое описание источника набора данных | Данные о декларируемом доходе и имуществе госслужащих размещаются в открытом доступе в разделах «Противодействие коррупции» на официальных сайтах федеральных министерств в виде файлов различных форматов. |
Покрываемый временной период | 2013-2020 |
Доступные форматы | CSV (кодировка: «UTF-8», разделитель: «;») |
Размер набора данных | 33,5 МБ |
Тематика набора данных | Доход государственных служащих. Экономика |
Режим доступа | Открытый (у Вас есть возможность работать с данными на своем личном ПК, в том числе и скачивать данные) |
Периодичность публикации и обновления | |
Дата размещения в каталоге | 28.10.2020 |
Периодичность обновления в каталоге | Ежегодно |
Дата последнего обновления набора данных в каталоге | 02.12.2021 |
Характер последнего обновления | Добавлены сведения за 2020 год, расширен состав атрибутов в наборе данных: добавлена информация о имуществе государственного служащего, а также о доходах и имуществе членов его/ее семьи. |
Дата следующего обновления набора данных | Не установлена |
Дополнительные сведения | |
Цитирование набора данных на русском языке | Доходы и имущество госслужащих: объединенные сведения из антикоррупционных деклараций сотрудников российских министерств // Официальные сайты федеральных министерств РФ; обработка: Зиндер К.М., Гизатуллина Э.Г. Инфраструктура научно-исследовательских данных, АНО «ЦПУР», 2020. Доступ: Лицензия CC BY-SA. Размещено: 30.11.2021. URL: https://data.rcsi.science/data-catalog/datasets/150/ |
For references (English) | Income and property of civil servants: information from anti-corruption declarations of Russian ministries // Official websites of the federal ministries of Russian Federation: Zinder. K., Gizatullina E., The Research Development Infrastructure (RDI), CAG, 2021. Access: License CC BY-SA. Posted: 30.11.2021. URL: https://data.rcsi.science/data-catalog/datasets/150/ |
Ссылка на открытый репозиторий | отсутствует |
Геоданные (пространственная привязка набора данных) | нет |
Лицензия, под которой публикуется набор данных | СС BY-SA (Creative Commons) https://creativecommons.org/licenses/by-sa/4.0/ Допускается использование, копирование и распространение данных в научно-исследовательских, коммерческих и любых иных целях. При преобразовании материала разрешается распространять переделанные части материала на условиях этой же лицензии — CC BY-SA |
Стандарт публикации | http://opendata.gosmonitor.ru/standard/3.0 |
Параметры запросов API | Интеграция через API не предусмотрена |
Структура набора данных (Codebook)
Набор данных состоит из 22 201 наблюдений по 37 атрибутам, размещенным в одной основной и трех дополнительных таблицах:
- income.csv (основная);
- own_realty.csv (дополнительная);
- use_realty.csv (дополнительная);
- cars.csv (дополнительная);
Формат данных: CSV (кодировка: «UTF-8», разделитель: «;»)
Декларированный доход (income.csv)
Атрибут | Описание | Единица измерения | Количество пропусков | Формат |
---|---|---|---|---|
year | Год, за который поданы сведения о доходах и имуществе | 0 | int | |
state_agency | Краткое обозначение министерства латиницей | 0 | string | |
state_agency_full | Полное название министерства | 0 | string | |
state_agency_short | Краткое обозначение министерства кириллицей | 0 | string | |
name | Фамилия, имя, отчество или фамилия и инициалы служащего, приведенные к стандартному написанию с помощью регулярных выражений | 0 | string | |
position | Наименование должности из первоисточника, скорректированное с помощью сервиса Яндекс.Спеллер | 0 | string | |
position_standard | Стандартизированная должность в соответствии с Указом Президента РФ от 31.12.2005 №1574 (ред. от 30.07.2020) «О Реестре должностей федеральной государственной гражданской службы». В случае, если указанная в первоисточнике должность не включена в данную классификацию, присвоено значение «не стандарт» | 0 | string | |
position_category | Категория должности | 0 | string | |
position_group | Группа должности | 0 | string | |
gender | Пол госслужащего, определенный с помощью автоматического алгоритма, исходя из его ФИО и/или исходя из пола того, с кем он/она состоит в браке. | 871 | string | |
married | Состоит ли служащий в браке | 0 | string | |
children | Количество несовершеннолетних детей | шт. | 0 | int |
extra | Данные о том, получал ли чиновник дополнительные доход (кредиты, наследство, субсидии и проч), не указав доход. Указано «extra», если получал, «no_extra», если не получал либо если получал и указал сумму. | 0 | string | |
coef | Коэффициент для приведения в цены 2020 года | 0 | numeric | |
income_ребенок | Декларированный годовой доход несовершеннолетнего ребенка | 0 | numeric | |
income_супруг(a) | Декларированный годовой доход супруга/супруги служащего | 0 | numeric | |
income_чиновник | Декларированный годовой доход служащего | 0 | numeric | |
source_sum_ребенок | Сумма дополнительного дохода, указанная в графе «source» или в графе «income», в случаях, когда дополнительный доход был указан в графе «income», а не в графе «source» несовершеннолетнего ребенка | рубль | 0 | numeric |
source_sum_супруг(a) | Сумма дополнительного дохода, указанная в графе «source» или в графе «income», в случаях, когда дополнительный доход был указан в графе «income», а не в графе «source» супруга/супруги служащего | рубль | 0 | numeric |
source_sum_чиновник | Сумма дополнительного дохода, указанная в графе «source» или в графе «income», в случаях, когда дополнительный доход был указан в графе «income», а не в графе «source» служащего | рубль | 0 | numeric |
income_diff_ребенок | Сумма дохода («income») за вычетом суммы дополнительного дохода («source_sum») для несовершеннолетнего ребенка служащего | рубль | 0 | numeric |
income_diff_супруг(a) | Сумма дохода («income») за вычетом суммы дополнительного дохода («source_sum») супруга/супруги служащего | рубль | 0 | numeric |
income_diff_чиновник | Сумма дохода («income») за вычетом суммы дополнительного дохода («source_sum») для служащего | рубль | 0 | numeric |
income_month_const_ребенок | Среднемесячный доход несовершеннолетнего ребенка за вычетом суммы дополнительного дохода приведенный в цены 2020 года | рубль | 0 | numeric |
income_month_const_супруг(a) | Среднемесячный доход супруга/супруги за вычетом суммы дополнительного дохода приведенный в цены 2020 года | 0 | numeric | |
income_month_const_чиновник | Среднемесячный доход служащего за вычетом суммы дополнительного дохода приведенный в цены 2020 года | рубль | 0 | numeric |
Объекты недвижимости, находящиеся в собственности (own_realty.csv)
Атрибут | Описание | Единица измерения | Количество пропусков | Формат |
---|---|---|---|---|
year | Год, за который поданы сведения о доходах и имуществе | 0 | int | |
state_agency | Краткое обозначение министерства латиницей | 0 | string | |
name | Фамилия, имя, отчество или фамилия и инициалы служащего, приведенные к стандартному написанию с помощью регулярных выражений | 0 | string | |
position | Наименование должности из первоисточника, скорректированное с помощью сервиса Яндекс.Спеллер | 0 | string | |
position_standard | Стандартизированная должность в соответствии с Указом Президента РФ от 31.12.2005 №1574 (ред. от 30.07.2020) «О Реестре должностей федеральной государственной гражданской службы». В случае, если указанная в первоисточнике должность не включена в данную классификацию, присвоено значение «не стандарт» | 0 | string | |
type |
Тип объекта недвижимости, находящегося в собственности (соответствует содержанию графы «Объекты недвижимости, находящиеся в собственности, вид объекта» файлов, скачанных с официального сайта министерства) | 94 | string | |
own_type | Вид собственности на объект недвижимости (соответствует содержанию графы «Объекты недвижимости, находящиеся в собственности, вид собственности», файлов, скачанных с официального сайта министерства) | 0 | string | |
meters | Площадь объекта недвижимости, находящегося в собственности (соответствует содержанию графы «Объекты недвижимости, находящиеся в собственности, площадь (кв.м)», файлов, скачанных с официального сайта министерства) | кв. м | 0 | string |
country | Страна расположения объекта недвижимости, находящегося в собственности (соответствует содержанию графы «Объекты недвижимости, находящиеся в собственности, страна расположения», файлов, скачанных с официального сайта министерства) | 0 | string |
Объекты недвижимости, находящиеся в пользовании (use_realty.csv)
Атрибут | Описание | Единица измерения | Количество пропусков | Формат |
---|---|---|---|---|
year | Год, за который поданы сведения о доходах и имуществе | 0 | int | |
state_agency | Краткое обозначение министерства латиницей | 0 | string | |
state_agency_short | Краткое обозначение министерства кириллицей | 0 | string | |
name | Фамилия, имя, отчество или фамилия и инициалы служащего, приведенные к стандартному написанию с помощью регулярных выражений | 0 | string | |
position | Наименование должности из первоисточника, скорректированное с помощью сервиса Яндекс.Спеллер | 0 | string | |
position_standard | Стандартизированная должность в соответствии с Указом Президента РФ от 31.12.2005 №1574 (ред. от 30.07.2020) «О Реестре должностей федеральной государственной гражданской службы». В случае, если указанная в первоисточнике должность не включена в данную классификацию, присвоено значение «не стандарт» | 0 | string | |
family | Указание на то, относится ли приведенные данные к самому служащему (значение «чиновник»), или членам его семьи («супруга», «супруг» или «ребенок») | 0 | string | |
use_type | Тип объекта недвижимости, находящегося в пользовании (соответствует содержанию графы «Объекты недвижимости, находящиеся в пользовании, вид объекта», файлов, скачанных с официального сайта министерства) | 353 | string | |
use_meters | Площадь объекта недвижимости, находящегося в пользовании (соответствует содержанию графы «Объекты недвижимости, находящиеся в пользовании, площадь (кв.м)», файлов, скачанных с официального сайта министерства) | кв. м | 0 | string |
use_country | Страна расположения объекта недвижимости, находящегося в пользовании (соответствует содержанию графы «Объекты недвижимости, находящиеся в пользовании, страна расположения», файлов, скачанных с официального сайта министерства) | 0 | string |
Транспортные средства (cars.csv)
Атрибут | Описание | Единица измерения | Количество пропусков | Формат |
---|---|---|---|---|
year | Год, за который поданы сведения о доходах и имуществе | 0 | int | |
state_agency | Краткое обозначение министерства латиницей | 0 | string | |
name | Фамилия, имя, отчество или фамилия и инициалы служащего, приведенные к стандартному написанию с помощью регулярных выражений | 0 | string | |
position | Наименование должности из первоисточника, скорректированное с помощью сервиса Яндекс.Спеллер | 0 | string | |
position_standard | Стандартизированная должность в соответствии с Указом Президента РФ от 31.12.2005 №1574 (ред. от 30.07.2020) «О Реестре должностей федеральной государственной гражданской службы». В случае, если указанная в первоисточнике должность не включена в данную классификацию, присвоено значение «не стандарт» | 0 | string | |
family | Указание на то, относится ли приведенные данные к самому служащему (значение «чиновник»), или членам его семьи («супруга», «супруг» или «ребенок») | 0 | string | |
car | Транспортные средства (соответствует содержанию графы «Транспортные средства (вид, наименование, марка)», файлов, скачанных с официального сайта министерства) | 0 | string | |
car_brands | Список марок автомобилей, указанных в поле car, в стандартизованном виде. Марки других транспортных средств в этом поле не указаны. | list |
Источники данных
Атрибут | Значение |
---|---|
Полное наименование источника данных | Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера, представленные федеральными государственными гражданскими служащими федеральных министерств РФ |
Сокращенное наименование источника данных | Сводные декларации государственных служащих |
Владелец источника данных | Федеральные министерства РФ |
Краткое описание источника данных | Информация о декларированных доходах сотрудников центральных министерств размещается в разделе «Противодействие коррупции» на официальных сайтах и обновляется раз в год. Эти сведения размещаются в виде файлов в формате xls, xlsx, doc, docx, pdf и ряде других форматов. Файлы были выгружены с сайтов федеральных министерств и обработаны парсером для преобразования в машиночитаемый формат. |
Ссылка на источник данных | Минцифры Минэкономразвития Минпросвет Минсельхозравития Минкульт Минэнерго Минфин Минюст Миннауки Минпромторг Минспорт Минстрой Минтранс Минтруд Минвостокразвития Минздрав Минприроды |
Перечень используемых классификаторов | Нет |
Понятия, используемые в источнике | Федеральный государственный служащий — гражданин, осуществляющий профессиональную служебную деятельность на должности федеральной государственной службы и получающий денежное содержание (вознаграждение, довольствие) за счет средств федерального бюджета (ст. 10 N 58-ФЗ от 27.05.2003 (ред. от 23.05.2016) «О системе государственной службы Российской Федерации»). В наборе данных представлены данные только о государственных служащих центральных аппаратов федеральных министерств Декларированный годовой доход федерального государственного служащего — доход, полученный за отчетный период (с 1 января по 31 декабря) от всех источников, включая денежное содержание по основному месту работы, пенсии, пособия, иные выплаты (доход от педагогической деятельности, от научной деятельности, от иной творческой деятельности, от вкладов в банках, от ценных бумаг и долей участия в коммерческих организациях), а также иные доходы, как реализация недвижимого и/или движимого имущества в отчетном периоде. |
Методология и изменения методологии для источника данных | Согласно Приказу Министерства труда и социальной защиты РФ от 7 октября 2013 г. N 530н «О требованиях к размещению и наполнению подразделов, посвященных вопросам противодействия коррупции, официальных сайтов федеральных государственных органов, Центрального банка Российской Федерации, Пенсионного фонда Российской Федерации, Фонда социального страхования Российской Федерации, Федерального фонда обязательного медицинского страхования, государственных корпораций (компаний), иных организаций, созданных на основании федеральных законов, и требованиях к должностям, замещение которых влечет за собой размещение сведений о доходах, расходах, об имуществе и обязательствах имущественного характера», требования о размещении сведений о доходах, расходах, об имуществе и обязательствах имущественного характера устанавливаются в том числе к следующим должностям: государственные должности Российской Федерации; должности федеральной государственной гражданской службы, отнесенные Реестром должностей федеральной государственной гражданской службы, утвержденным Указом Президента Российской Федерации от 31 декабря 2005 г. N 1574 «О Реестре должностей федеральной государственной гражданской службы», к высшей группе должностей федеральной государственной гражданской службы; должности федеральной государственной гражданской службы высшей и главной группы категорий «руководители», «помощники (советники)», «специалисты», включенные в перечни должностей, замещение которых связано с коррупционными рисками, утвержденные государственными органами в соответствии с разделом III Перечня, утвержденного Указом Президента Российской Федерации N 557. Более подробно о порядке предоставления деклараций государственными служащими можно прочитать в «Методических рекомендациях по вопросам представления сведений о доходах, расходах, об имуществе и обязательствах имущественного характера…», подготовленных Минтрудом РФ (https://mintrud.gov.ru/ministry/anticorruption/Methods/13). |
Ссылки на методологию | Детальный порядок сбора информации и размещения информации о доходах, имуществе и служащих центральных аппаратов федеральных министерств РФ и предоставления этих сведений для опубликования описан в Указе Президента РФ от 08.07.2013 N 613 (ред. от 10.12.2020) "Вопросы противодействия коррупции" |
Известные ограничения данных
Полнота данных
Наиболее полно в публикуемых в открытом доступе документах представлены сведения о декларированном годовом доходе и имуществе госслужащих федеральных министерств, занимающих следующие должности: первый заместитель министра, заместитель министра, директор департамента, заместитель директора департамента, начальник отдела, заместитель начальника отдела, референт. Сведения о декларированном доходе и имуществе государственных служащих, занимающих прочие должности, носят фрагментарный характер.
Данные Минстроя и Минобрнауки за 2013 г. и Минэкономразвития за 2013-2014 гг. исключены из набора на этапе парсинга по причине того, что формат заполнения выложенных на сайтах файлов не дает возможности обработать их автоматизированными способами и преобразовать в машиночитаемый вид без множественных ошибок.
В набор данных включались сведения только о государственных служащих центральных аппаратов федеральных министерств проживающих и работающих на территории Российской федерации. Кроме того были исключены данные сотрудников министерств, которые отработали не полный год в тех случаях, когда об это было указано в источнике данных. Эти сотрудники отработали меньше полного года, поэтому сумма их годового дохода несравнима с суммами дохода сотрудников, отработавших полный год.
В набор не включены данные МИД и негражданских министерств (МВД, МЧС, Минобороны) из-за невозможности стандартизировать должности этих ведомств и, соответственно, сравнивать их с остальными гражданскими министерствами. Кроме того, Минобороны не публикует в декларациях должности своих служащих, а МИД и МВД с 2019 года публикует декларации только усеченного списка сотрудников (менее 10 человек).
Охват данных министерств по годам представлен в таблице ниже.
Наименование министерства | Год | |||||||
---|---|---|---|---|---|---|---|---|
2013 | 2014 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | |
Минэкономразвития России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
Минфин России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минпромторг России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минэнерго России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минздрав России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минсельхоз России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минтранс России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минвостокразвития России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минцифры России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минкультуры России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минприроды России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минтруд России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минспорт России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минстрой России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
Минюст России | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Минобрнауки России | ✓ | ✓ | ✓ | ✓ | ||||
Минпросвещения России | ✓ | ✓ | ✓ | |||||
Минобрнауки России | ✓ | ✓ | ✓ |
Качество данных
- Данные в изначальных файлах заполняются и оформляются очень разнообразно, несмотря единую форму отчетной таблицы. В редких случаях при заполнении допускаются ошибки, данные вписываются в другой столбец, смещаются колонки таблицы. В ходе ручной обработки данных и парсинга были устранено большинство типичных смещений/искажений данных. Точность обработки по различным атрибутам колеблется между 98,3% и 100%.
- Наименования должностей государственных служащих в наборе данных не в полной мере соответствует должностям, перечисленным в Указе Президента РФ N 1574, поскольку в сведениях о доходах, расходах, об имуществе и обязательствах имущественного характера, публикуемых на официальных сайтах федеральных министерств, используются произвольные формулировки названий должностей. Например, затруднительно отделить должность «начальник отдела» (код 05-1-2-015) категории «руководители» от должности «начальник отдела в департаменте» (код 05-3-2-018) категории «специалисты». Такая же проблема характерна для государственных служащих, занимающих позиции заместителей начальника отдела. В наборе данных сохранена колонка «position», в которой приведены исходные формулировки (после проверки Яндекс.Спеллер), в колонке «position_standard» приведены скорректированные наименования должностей.
- Колонки с описанием имущества («type», «use_type») заполняются без использования четких стандартизованных типов, что приводит к появлению широкого разнообразия и разной степени детализации для описания схожих видов имущества. Колонка с типом собственности «own_type» в некоторых случаях содержит также размер доли в собственности.
- Графа «Сведения об источниках получения средств, за счет которых совершена сделка (вид приобретенного имущества, источники)» (колонка «source») заполняется с разным качеством. В некоторых случаях сведения о наличии дополнительного источника дохода имеются, но его размер не указан. Кроме того, иногда сведения о дополнительных источниках получения дохода указывается в графе «Декларированный доход».
Внесенные в набор данных изменения по сравнению с источниками
- Данные о декларированном годовом доходе, размещенные на официальных сайтах федеральных министерств в файлах разных форматов (xls, xlsx, doc, docx, rar, zip, pdf), преобразованы в плоскую таблицу в машиночитаемом формате;
- Исправлены опечатки в наименованиях должностей;
- Наименования должностей приведены к унифицированному виду в соответствии с Указом Президента РФ от 31.12.2005 N 1574 (ред. от 30.07.2020) «О Реестре должностей федеральной государственной гражданской службы»;
- Созданы дополнительные переменные с категорией и группой должностей («position_category» и «position_group»). Для присвоения категории и группы использована классификация в соответствии с Указом Президента РФ от 31.12.2005 №1574 (ред. от 30.07.2020) «О Реестре должностей федеральной государственной гражданской службы». В файлах-первоисточниках используются произвольные названия должностей, не в полной мере соответствующие реестру из-за чего в отдельных случаях оказывается затруднительно определять категории и группы должностей. Так, невозможно отделить должность «начальник отдела» (код 05-1-2-015) категории «руководители» от должности «начальник отдела в департаменте» (код 05-3-2-018) категории «специалисты». В связи с этим все начальники объединены в дополнительную категорию «руководители/специалисты». Аналогичная ситуация с «заместителем начальника отдела» (код 05-1-2-015.1) категории «руководители» главной группы должностей и «заместителем начальника отдела в департаменте» (код 05-3-3-023) категории «специалисты» ведущей группы должностей. Все заместители начальников объединены в дополнительную категорию «руководители/специалисты» и группу «главная/ведущая».
- Из данных, приведенных в графе «Декларируемый доход» файла-первоисточника, извлечена сумма дохода, переведена в числовой формат с удалением текстовых комментариев. Результат сохранен в переменной «income»;
- Из текстовых пояснений-описаний источников дохода извлечена сумма дополнительного дохода и размещена в переменной «source_sum»;
- На основании переменных «source» и «source_sum» создана дополнительная переменная «source_sort». Значения «exta» или «all_together» говорят о том, что имел место внешний источник дохода (наследство, субсидия, кредит), но сумма дополнительного дохода чиновником не указана;
- В отдельной колонке отражены полные («state_agency_full») и сокращенные («state_agency_short») названия федеральных министерств;
- С помощью библиотеки Russiannames (определяет пол по ФИО) и на основании информации о наличии у сотрудника супруга или супруги определен пол служащего и размещен в колонке «gender». Не удалось получить эту характеристику только у 4% наблюдений;
- Подсчитано количество несовершеннолетних детей и размещено в колонке «children»;
- Добавлено поле «married», в котором указан семейный статус служащего, определенный на основании наличия супруга/супруги;
- В части файлов-первоисточников данные о стране расположения объекта недвижимого имущества и его площади проведены в одной колонке. Проведена проверка на смешивание этих данных и автоматизированными средствами данные разделены по соответствующим отдельным колонкам.
- В случаях, когда транспортные средства служащих Министерства экономического развития, находящиеся одновременно в собственности нескольких членов семьи, дублировались в строке каждого собственника, повторения были удалены.
Ответственные за набор данных
№ | ФИО ответственного лица | Электронная почта |
---|---|---|
1. | Зиндер Ксения Михайлова | k.zinder@cpur.ru |
2. | Гизатуллина Эльвира Габдрашитовна | e.gizatullina@data.rcsi.science |