База данных показателей муниципальных образований России за 2006 – 2020 гг. (бета-версия)
История изменений
Дата | Версия | Автор | Описание изменений |
---|---|---|---|
12.11.2020 | 1.0 | Казанцев Кирилл Ильич Румянцева Александра Евгеньевна Уксусова Арина Сергеевна |
Документ создан |
27.01.2022 | 2.0 beta | Веденьков Максим Викторович Комин Михаил Олегович Цыганков Максим Валерьевич |
Обновлено описание датасета в связи с добавлением данных за 2019-2020 гг. и проведением дополнительных процедур обработки |
Общая информация о датасете
Социально-экономические характеристики муниципальных образований (МО) всех уровней в России за 2006-2020 гг. Сведения были получены из Базы данных показателей муниципальных образований (БД ПМО) Росстата, предварительно обработаны и преобразованы в формат панельных данных. Подготовка датасета велась совместно с Росстатом (соглашение о сотрудничестве № 8-С от 11.09.2020).
Текущая версия является предварительной (бета-версия), ее публикация направлена на получение откликов от пользователей по удобству формата представления данных и корректности результатов обработки. Комментарии можно отправлять на ask@data.rcsi.science
Единица наблюдения в датасете – муниципальное образование России по одному из показателей (с учетом его категорий) за конкретный период. Данные по каждому наблюдению приведены по атрибутам: субъект РФ, МО, ОКТМО, показатель, доступные категории этого показателя, период наблюдения и т.д. Для удобства использования набор разбит на 26 таблиц, где каждая таблица – это отдельная рубрика (группа) показателей и значения по ним для всех МО за все доступные периоды. Каждую таблицу можно скачать по отдельности, воспользовавшись рубрикатором, или загрузить полный датасет.
Датасет охватывает все доступные показатели по всем муниципальным образованиям России за 2006 – 2020 гг. Всего датасет содержит 211 258 972 наблюдений.
Датасет представлен в формате: CSV (кодировка: «UTF-8», разделитель: «;»)
Общее описание набора данных
Атрибут |
Значение |
---|---|
Общие сведения | |
Полное наименование набора данных |
База данных показателей муниципальных образований России за 2006 – 2020 гг. (бета-версия) |
Сокращенное наименование набора данных |
БД ПМО Росстата за 2006-2020 гг. |
Краткое описание набора данных |
Социально-экономические характеристики муниципальных образований (МО) всех уровней в России за 2006-2020 гг. Сведения были получены из Базы данных показателей муниципальных образований (БД ПМО) Росстата, предварительно обработаны и преобразованы в формат панельных данных. Подготовка датасета велась совместно с Росстатом (соглашение о сотрудничестве № 8-С от 11.09.2020).
Датасет охватывает все доступные показатели по всем муниципальным образованиям России за 2006 – 2020 гг. Всего датасет содержит 211 258 972 наблюдений. |
Краткое описание источника набора данных |
Территориальные органы Росстата собирают статистические сведения по муниципальным образованиям в своем субъекте РФ, в соответствии с ежегодно обновляемым заказом на показатели от федерального Росстата. Полученную региональную базу (фонд) данных тер.органы передают в Росстат. Росстат проводит консолидацию данных и публикует сведения на странице «База данных показателей муниципальных образований». |
Покрываемый временной период |
2006-2020 гг. |
Доступные форматы |
CSV (кодировка: «UTF-8», разделитель: «;») |
Размер набора данных |
1,3 ГБ |
Тематика набора данных |
Статистика |
Режим доступа |
Открытый |
Периодичность публикации и обновления | |
Дата размещения в каталоге |
28.09.2020 |
Периодичность обновления в каталоге |
Не установлена |
Дата последнего обновления набора данных в каталоге |
27.01.2022 |
Характер последнего обновления |
Добавлены сведения за 2019-2020 гг.; проведена дополнительная очистка и консолидация данных за счет разработки универсального справочника по всем показателям и группам категорий этих показателей, доступным в БД ПМО; универсальный справочник был применен для проверки корректности сведений во всех 85 региональных фондах данных; обнаруженные несоответствия были скорректированы путем применения автоматических алгоритмов или проверены и исправлены вручную сотрудниками Росстата и его территориальных органов. |
Дата следующего обновления набора данных |
Не установлена |
Дополнительные сведения | |
Цитирование набора данных на русском языке |
База данных показателей муниципальных образований: объединенные и обработанные данные за 2006 – 2020 гг. // Росстат; обработка: Веденьков М. В., Комин М.О., Цыганков М.В., Инфраструктура научно-исследовательских данных. АНО «ЦПУР», 2022. Доступ: Лицензия CC BY-SA. Размещено: 28.09.2020 (v.2.0, от 27.01.2022). URL: https://data.rcsi.science/data-catalog/datasets/115/ |
For references (English) |
Database of municipality statistics in Russia // Rosstat; data-processing: Vedenkov M., Komin M., Tsygankov M., The Research Development Infrastructure (RDI), CAG, 2021. Access: License CC BY-SA. Posted: 09.23.2021 (version 2.0 from 27.01.2022). URL: https://data.rcsi.science/data-catalog/datasets/115/ |
Ссылка на открытый репозиторий |
отсутствует |
Геоданные (пространственная привязка набора данных) |
нет |
Лицензия, под которой публикуется набор данных |
СС BY-SA (Creative Commons) https://creativecommons.org/licenses/by-sa/4.0/ Допускается использование, копирование и распространение данных в научно-исследовательских, коммерческих и любых иных целях. При преобразовании материала разрешается распространять переделанные части материала на условиях этой же лицензии — CC BY-SA |
Стандарт публикации |
http://opendata.gosmonitor.ru/standard/3.0 |
Параметры запросов API |
Интеграция через API не предусмотрена |
Структура набора данных (Codebook)
Датасет представлен в виде 26 однотипных плоских таблиц. Каждая таблица вида data_115_r1.csv – это сгруппированные в рамках одной рубрики показатели БД ПМО. Таблица data_115_old_indicators.csv содержит наиболее важные архивные показатели БД ПМО, которые на момент 2021 года были выведены из производства Росстатом.
Формат данных: CSV (кодировка: «UTF-8», разделитель: «;»)
Атрибут |
Описание |
Количество пропусков (NaN) (шт/%) |
Единица измерения |
ОКЕИ |
Формат |
---|---|---|---|---|---|
id_rosstat |
Уникальный код показателя, используемый в изначальной базе данных Росстата Примеры: 8070001; 8008009 |
0 (0%) |
integer | ||
indicator |
Наименование показателя Примеры: - Число источников теплоснабжения; - Количество выданных разрешений на строительство; - Численность муниципальных служащих на конец отчетного года |
0 (0%) |
string | ||
Группы категорий, по которым доступен показатель (в классификации Росстата). Наблюдение (строка в датасете) может формироваться как на пересечении одной из указанных ниже, так и на пересечении нескольких групп категорий.
Кроме примеров, приведенных ниже, поле также может содержать значения:
| |||||
dol |
Должности Пример: Должности муниципальной службы категории «Б» | ||||
gilsem |
Категории семей Пример: Семьи ветеранов боевых действий | ||||
grup_2 |
Структура населения Примеры: Взрослые, Мужчины, Женщины | ||||
istkoop |
Источники поступления товаров (продукции) и направления выплат за проданные товары (продукцию) Примеры: Граждане, ведущие личное подсобное хозяйство | ||||
kategor |
Категории хозяйств Пример: Сельскохозяйственные организации (все сельхозорганизации) | ||||
kfs |
Формы собственности Пример: Муниципальная собственность | ||||
kultur |
Сельскохозяйственные культуры Пример: Сахарная свекла | ||||
mest |
Население Пример: Городское население | ||||
migr |
Вид миграции Пример: Внутрирегиональная миграция | ||||
nazsostv |
Национальный состав Пример: Русские | ||||
obras |
Уровень образования Пример: Имеющие среднее профессиональное образование | ||||
obroz |
Виды объектов розничной торговли и общественного питания Пример: Аптечные киоски и пункты | ||||
okco |
Направление подготовки Пример: Юриспруденция | ||||
okei |
Единица измерения (встречается только у показателей: Пример: Тысяча штук | ||||
okogu |
Органы власти и управления Пример: Органы местного самоуправления городских поселений (с 2012 г.) | ||||
okpd2 |
Виды товаров (продукции) и услуг по видам экономической деятельности Пример: Комбикорма | ||||
okpdST |
Виды товаров (продукции) в стоимостном выражении Пример: Коньяки | ||||
okpdn |
Виды товаров (продукции) в натуральном выражении Пример: Виноград | ||||
okved |
Виды экономической деятельности по ОКВЭД Пример: Научные исследования и разработки | ||||
okved2 |
Виды экономической деятельности по ОКВЭД-2 Пример: Транспорт услуги | ||||
pokdor |
Покрытия дорог Пример: Асфальтобетонное покрытие | ||||
prich |
Причины отклонения заявок Пример: Участник не отвечал требованиям, установленным законом | ||||
selmash |
Сельхозмашины Пример: Кормоуборочные комбайны | ||||
skoop |
Состав кооператива Пример: Индивидуальные предприниматели | ||||
skot |
Виды скота и птицы Пример: Овцы | ||||
sport |
Виды спортивных сооружений Пример: Плавательные бассейны | ||||
sptorg |
Торги и другие способы размещения заказов Пример: Открытые аукционы | ||||
spzakmp |
Способы размещения заказов среди суб.мал. предпринимательства Пример: Открытые аукционы в электронной форме | ||||
stash |
Стаж муниципальной службы Пример: От 15 до 25 лет | ||||
stdohod |
Статьи доходов местного бюджета Пример: Земельный налог | ||||
strashod |
Статьи расходов местного бюджета Пример: Транспорт | ||||
tipotd |
Типы отделений при Центрах социального обслуживания населения Пример: Дневного проживания | ||||
tipushr |
Тип учебных заведений Пример: Дошкольные образовательные учреждения | ||||
ucheb |
Участники Пример: Организации инвалидов | ||||
uslug |
Виды услуг населению Пример: Бани, душевые и сауны | ||||
vidazc |
Виды заправочных станций Пример: Многотопливные заправочные станции (МТЗС) | ||||
vidfond |
Вид основных фондов Пример: Культивируемые биологические ресурсы растительного происхождения | ||||
vidoshist |
Виды очистки Пример: Уловленные и обезвреженные загрязняющие атмосферу вещества из общего объема поступивших на очистку | ||||
vidpost |
Виды поставок Пример: Поставки белорусских товаров | ||||
vidtorgv |
Специализация торговой сети Пример: Открытые повторные конкурсы | ||||
vozr |
Возрастные группы Пример: 70 и старше | ||||
wetwl |
Уровни управления Пример: Сельский уровень | ||||
zagr |
Типы загрязняющих веществ Пример: Диоксид серы (тыс. тонн с тремя знаками после запятой) | ||||
zdrav |
Здравоохранение Пример: Негосударственные лечебно-профилактические организации | ||||
region |
Субъект РФ Примеры: Костромская область; Республика Татарстан |
0 (0%) |
|||
mun-level |
Уровень муниципального образования. Принимает значения: 1 – муниципальное образование верхнего уровня (муниципальные районы; муниципальные округа городские округа; городские округа с внутригородским делением; внутригородские территории (внутригородские муниципальные образования) городов федерального значения) 2 – муниципальное образование нижнего уровня (сельские поселения; городские поселения; внутригородские районы; межселенные территории) |
0 (0%) |
|||
municipality |
Название муниципального образования (любой уровень) Пример: город Змеиногорск; Степноозерский поссовет |
0 (0%) |
|||
munr |
Название территориальной единицы, в которую входит муниципальное образование, указанное в атрибуте municipality Пример: Благовещенский муниципальный район |
Не уточнено |
|||
mun_type |
Тип муниципального образования (по внутренней классификации Росстата) Принимает значения: 1 - Городские поселения 3 - Внутригородские территории городов федерального значения (Москвы и Санкт-Петербурга) 4 - Сельские поселения 7 - Городские округа, городские округа с внутригородским делением 10 - Муниципальные районы 13 - Межселенные территории 17 - Внутригородские районы 109 – Субъект РФ |
0 (0%) |
|||
oktmo |
Значение кода ОКТМО. Код ОКТМО населенных пунктов состоит из четырех частей и 11 знаков: 2 знака — «Код региона»; 3 знака — «Код района/города МО»; 3 знака — «Код поселения МО»; 3 знака — «Код населенного пункта МО». |
0 (0%) |
|||
year |
Год Принимает любое значение из периода: 2006-2020 гг. |
0 (0%) |
string | ||
value |
Значение показателя |
Не уточнено |
numeric | ||
unit |
Единица измерения Пример: га - гектары |
Не уточнено |
numeric | ||
period |
Период наблюдения Пример: Значение показателя за год |
Не уточнено |
integer |
Рубрикатор показателей БД ПМО
Для удобства работы, показатели БД ПМО были сгруппированы в тематические рубрики. Каждую рубрику можно скачать отдельным файлом, воспользовавшись специальным рубрикатором.
Рубрикатор также содержит информацию о форме отчетности, из которой получен показатель, периодичности его сбора, и годы, за которые доступны данные по этому показателю (необходимо учитывать, что в один год показатель мог собираться только в части субъектов РФ или муниципальных образований).
Известные ограничения данных
Полнота данных
Данные по показателям содержат достаточно большое количество пропусков. Причины пропусков могут быть следующие:
- за указанный период показатель либо полностью (во всех субъектах РФ), либо частично (в отдельных субъектах РФ) не собирался. Доступность данных по годам (хотя бы для одного из субъектов РФ) представлена в рубрикаторе.
- за указанный период показатель собирался, но его значения по отдельным муниципалитетам отсутствуют, поскольку были либо не представлены территориальным органом государственной статистики в Росстат, либо некорректно занесены в БД ПМО, и поэтому не содержатся в выгрузке.
- в ходе обработки данных с помощью нормализации справочников и создания универсального справочника для всех региональных фондов данных БД ПМО, не удалось устранить расхождения между кодом и наименованием показателя, а также между кодом и наименованием группы категории показателя (в разных регионах один код мог соответствовать разным наименованиям и наоборот). В таких случаях данные по показателю или группе категорий этого показателя либо полностью отсутствуют в датасете, либо соответствующие ячейки содержат значение «NaN».
Кроме того, на полноту данных может влиять смена названий муниципальных образований; изменение кодов ОКТМО; изменение состава населенных пунктов, входящих в МО. Эти изменения не фиксируются в БД ПМО отдельно, а отражаются только на уровне кода ОКТМО. В связи с этим, при построении длинного ряда по конкретному МО (отталкиваясь от кода ОКТМО и/или наименования МО) этот ряд может быть неполным. Проследить историю изменения ОКТМО и состава входящих в МО населенных пунктов (с 2015 по 2021 гг., более ранние периоды недоступны), можно используя специальный инструмент, разработанный ЦПУР.
Описание проведенных проверок и их результатов
- Проведена проверка, входят ли значения нумерических показателей датасета в их домен; по результатам проверки, выявленные проблемы скорректированы.
- Проведена проверка идентичности написания названий одних и тех же населенных пунктов, МО и субъектов РФ; по результатам проверки названия были унифицированы.
Все указанные проверки проводились после процедуры обработки данных, описанной ниже. Проверки самих значений по показателям (value) на наличие выбросов, а также оценка корректности диапазона значений по каждому показателю на данном этапе обработки не проводились.
Внесенные в набор данных изменения по сравнению с источниками
Обработка данных велась на основе работы с предоставленным Росстатом дампом БД ПМО (на конец 2021 г.) по трем направлениям.
- Разработка универсального справочника (классификатора) по всем показателям и группам категорий этих показателей в БД ПМО, а также унификация справочников, содержащих сведения о субъектах РФ, МО, населенных пунктах, единицах измерения и доступном периоде данных. Разработанный универсальный справочник был применен для проверки корректности сведений во всех 85 региональных базах данных. Обнаруженные несоответствия (например, различия для одних и тех же показателей в базах разных регионов пар «код показателя – наименование показателя»; «код категории – наименование категории» и др.) были скорректированы с помощью автоматических алгоритмов или проверены и исправлены вручную сотрудниками Росстата и его территориальных органов.
- Исправление ошибок в региональных базах данных, возникших при ручном заполнении кодов показателей, наименований показателей и других атрибутов (например, внесение значений в соседнюю ячейку вместо нужной, внесение под одним кодом разных наименований показателей или одного наименования под разными кодами и т.д.).
- Преобразование формата представления данных в БД ПМО в виде панельных данных (panel table) с объединением показателей в максимально длинный временной ряд.
Источники данных
Атрибут |
Значение |
---|---|
Полное наименование источника данных |
База данных показателей муниципальных образований Росстата |
Сокращенное наименование источника данных |
БД ПМО |
Владелец источника данных |
Росстат |
Краткое описание источника данных |
Территориальные органы Росстата собирают статистические сведения по муниципальным образованиям в своем субъекте РФ, в соответствии ежегодном обновляемым заказом от федерального Росстата на основании раздела 1.33 «Муниципальная статистика» Федерального плана статистических работ (утв. распоряжением Правительства Российской Федерации от 6 мая 2008 г. № 671-р с последующими изменениями). Полученные региональные базы (фонды) данных тер.органы передают в Росстат. Росстат проводит консолидацию данных и публикует сведения на странице «База данных показателей муниципальных образований», в соответствии с требованиями Федерального закона Российской Федерации от 29 ноября 2007 г. № 282-ФЗ «Об официальном статистическом учете и системе государственной статистики в Российской Федерации» (с изменениями в ред. Федерального закона Российской Федерации от 02 июля 2013 г. № 171-ФЗ) в части гарантии конфиденциальности первичных данных респондентов. |
Ссылка на источник данных |
https://www.gks.ru/dbscripts/munst/munst15/DBInet.cgi |
Перечень используемых классификаторов |
ОКТМО – общероссийский классификатор территорий муниципальных образований |
Понятия, используемые в источнике |
Отсутствуют |
Методология и изменения методологии для источника данных |
Краткие методологические комментарии к Базе данных показателей, характеризующих состояние экономики и социальной сферы муниципального образования (БД ПМО) |
Ссылки на методологию |
https://rosstat.gov.ru/storage/mediabank/rXy6Utk9/met_bdpmo.htm |
Ответственные за набор данных
№ |
ФИО ответственного лица |
Электронная почта ответственного лица |
---|---|---|
1. |
Веденьков Максим Викторович |
ask@data.rcsi.science |