База данных показателей муниципальных образований России за 2006 – 2020 гг. (бета-версия)

Материал из Data-in

История изменений

Дата Версия Автор Описание изменений
12.11.2020 1.0 Казанцев Кирилл Ильич
Румянцева Александра Евгеньевна Уксусова Арина Сергеевна
Документ создан
27.01.2022 2.0 beta Веденьков Максим Викторович
Комин Михаил Олегович
Цыганков Максим Валерьевич
Обновлено описание датасета в связи с добавлением данных за 2019-2020 гг. и проведением дополнительных процедур обработки

Общая информация о датасете

Социально-экономические характеристики муниципальных образований (МО) всех уровней в России за 2006-2020 гг. Сведения были получены из Базы данных показателей муниципальных образований (БД ПМО) Росстата, предварительно обработаны и преобразованы в формат панельных данных. Подготовка датасета велась совместно с Росстатом (соглашение о сотрудничестве № 8-С от 11.09.2020).


Текущая версия является предварительной (бета-версия), ее публикация направлена на получение откликов от пользователей по удобству формата представления данных и корректности результатов обработки. Комментарии можно отправлять на ask@data.rcsi.science


Единица наблюдения в датасете – муниципальное образование России по одному из показателей (с учетом его категорий) за конкретный период. Данные по каждому наблюдению приведены по атрибутам: субъект РФ, МО, ОКТМО, показатель, доступные категории этого показателя, период наблюдения и т.д. Для удобства использования набор разбит на 26 таблиц, где каждая таблица – это отдельная рубрика (группа) показателей и значения по ним для всех МО за все доступные периоды. Каждую таблицу можно скачать по отдельности, воспользовавшись рубрикатором, или загрузить полный датасет.

Датасет охватывает все доступные показатели по всем муниципальным образованиям России за 2006 – 2020 гг. Всего датасет содержит 211 258 972 наблюдений.

Датасет представлен в формате: CSV (кодировка: «UTF-8», разделитель: «;»)

Общее описание набора данных


Атрибут

Значение
Общие сведения

Полное наименование набора данных

База данных показателей муниципальных образований России за 2006 – 2020 гг. (бета-версия)

Сокращенное наименование набора данных

БД ПМО Росстата за 2006-2020 гг.

Краткое описание набора данных

Социально-экономические характеристики муниципальных образований (МО) всех уровней в России за 2006-2020 гг. Сведения были получены из Базы данных показателей муниципальных образований (БД ПМО) Росстата, предварительно обработаны и преобразованы в формат панельных данных. Подготовка датасета велась совместно с Росстатом (соглашение о сотрудничестве № 8-С от 11.09.2020).


Текущая версия является предварительной (бета-версия), ее публикация направлена на получение откликов от пользователей по удобству формата представления данных и корректности результатов обработки. Комментарии можно отправлять на ask@data.rcsi.science


Единица наблюдения в датасете – муниципальное образование России по одному из показателей (с учетом его категорий) за конкретный период. Данные по каждому наблюдению приведены по атрибутам: субъект РФ, МО, ОКТМО, показатель, доступные категории этого показателя, период наблюдения и т.д. Для удобства использования набор разбит на 26 таблиц, где каждая таблица – это отдельная рубрика (группа) показателей и значения по ним для всех МО за все доступные периоды. Каждую таблицу можно скачать по отдельности, воспользовавшись рубрикатором, или загрузить полный датасет

Датасет охватывает все доступные показатели по всем муниципальным образованиям России за 2006 – 2020 гг. Всего датасет содержит 211 258 972 наблюдений.


Краткое описание источника набора данных

Территориальные органы Росстата собирают статистические сведения по муниципальным образованиям в своем субъекте РФ, в соответствии с ежегодно обновляемым заказом на показатели от федерального Росстата. Полученную региональную базу (фонд) данных тер.органы передают в Росстат. Росстат проводит консолидацию данных и публикует сведения на странице «База данных показателей муниципальных образований».

Покрываемый временной период

2006-2020 гг.

Доступные форматы

CSV (кодировка: «UTF-8», разделитель: «;»)

Размер набора данных

1,3 ГБ

Тематика набора данных

Статистика

Режим доступа

Открытый
Периодичность публикации и обновления

Дата размещения в каталоге

28.09.2020

Периодичность обновления в каталоге

Не установлена

Дата последнего обновления набора данных в каталоге

27.01.2022

Характер последнего обновления

Добавлены сведения за 2019-2020 гг.; проведена дополнительная очистка и консолидация данных за счет разработки универсального справочника по всем показателям и группам категорий этих показателей, доступным в БД ПМО; универсальный справочник был применен для проверки корректности сведений во всех 85 региональных фондах данных; обнаруженные несоответствия были скорректированы путем применения автоматических алгоритмов или проверены и исправлены вручную сотрудниками Росстата и его территориальных органов.

Дата следующего обновления набора данных

Не установлена
Дополнительные сведения

Цитирование набора данных на русском языке

База данных показателей муниципальных образований: объединенные и обработанные данные за 2006 – 2020 гг. // Росстат; обработка: Веденьков М. В., Комин М.О., Цыганков М.В., Инфраструктура научно-исследовательских данных. АНО «ЦПУР», 2022. Доступ: Лицензия CC BY-SA. Размещено: 28.09.2020 (v.2.0, от 27.01.2022). URL: https://data.rcsi.science/data-catalog/datasets/115/


For references (English)

Database of municipality statistics in Russia // Rosstat; data-processing: Vedenkov M., Komin M., Tsygankov M., The Research Development Infrastructure (RDI), CAG, 2021. Access: License CC BY-SA. Posted: 09.23.2021 (version 2.0 from 27.01.2022). URL: https://data.rcsi.science/data-catalog/datasets/115/


Ссылка на открытый репозиторий

отсутствует

Геоданные (пространственная привязка набора данных)

нет

Лицензия, под которой публикуется набор данных

СС BY-SA (Creative Commons)

https://creativecommons.org/licenses/by-sa/4.0/

Допускается использование, копирование и распространение данных в научно-исследовательских, коммерческих и любых иных целях. При преобразовании материала разрешается распространять переделанные части материала на условиях этой же лицензии —
CC BY-SA

Стандарт публикации

http://opendata.gosmonitor.ru/standard/3.0

Параметры запросов API

Интеграция через API не предусмотрена

Структура набора данных (Codebook)

Датасет представлен в виде 26 однотипных плоских таблиц. Каждая таблица вида data_115_r1.csv – это сгруппированные в рамках одной рубрики показатели БД ПМО. Таблица data_115_old_indicators.csv содержит наиболее важные архивные показатели БД ПМО, которые на момент 2021 года были выведены из производства Росстатом.


Формат данных: CSV (кодировка: «UTF-8», разделитель: «;»)


Атрибут

Описание

Количество

пропусков (NaN)

(шт/%)

Единица измерения

ОКЕИ

Формат

id_rosstat

Уникальный код показателя, используемый в изначальной базе данных Росстата



Примеры: 8070001; 8008009

0 (0%)



integer

indicator

Наименование показателя



Примеры:
- Число источников теплоснабжения;

- Количество выданных разрешений на строительство;

- Численность муниципальных служащих на конец отчетного года

0 (0%)



string
Группы категорий, по которым доступен показатель (в классификации Росстата). Наблюдение (строка в датасете) может формироваться как на пересечении одной из указанных ниже, так и на пересечении нескольких групп категорий.

Кроме примеров, приведенных ниже, поле также может содержать значения:

  • «-1» - указанная группа категорий не применяется с этим показателем (строкой в датасете)
  • NaN – указанная группа категорий применяется с этим показателем, но данные отсутствуют или были исключены при обработке.

dol

Должности

Пример: Должности муниципальной службы категории «Б»


gilsem

Категории семей

Пример: Семьи ветеранов боевых действий


grup_2

Структура населения

Примеры: Взрослые, Мужчины, Женщины


istkoop

Источники поступления товаров (продукции) и направления выплат за проданные товары (продукцию)

Примеры: Граждане, ведущие личное подсобное хозяйство


kategor

Категории хозяйств

Пример: Сельскохозяйственные организации (все сельхозорганизации)


kfs

Формы собственности

Пример: Муниципальная собственность


kultur

Сельскохозяйственные культуры

Пример: Сахарная свекла


mest

Население

Пример: Городское население


migr

Вид миграции

Пример: Внутрирегиональная миграция


nazsostv

Национальный состав

Пример: Русские


obras

Уровень образования

Пример: Имеющие среднее профессиональное образование


obroz

Виды объектов розничной торговли и общественного питания

Пример: Аптечные киоски и пункты


okco

Направление подготовки

Пример: Юриспруденция


okei

Единица измерения (встречается только у показателей:

Пример: Тысяча штук


okogu

Органы власти и управления

Пример: Органы местного самоуправления городских поселений (с 2012 г.)


okpd2

Виды товаров (продукции) и услуг по видам экономической деятельности

Пример: Комбикорма


okpdST

Виды товаров (продукции) в стоимостном выражении

Пример: Коньяки


okpdn

Виды товаров (продукции) в натуральном выражении

Пример: Виноград


okved

Виды экономической деятельности по ОКВЭД

Пример: Научные исследования и разработки


okved2

Виды экономической деятельности по ОКВЭД-2

Пример: Транспорт услуги


pokdor

Покрытия дорог

Пример: Асфальтобетонное покрытие


prich

Причины отклонения заявок

Пример: Участник не отвечал требованиям, установленным законом


selmash

Сельхозмашины

Пример: Кормоуборочные комбайны


skoop

Состав кооператива

Пример: Индивидуальные предприниматели


skot

Виды скота и птицы

Пример: Овцы


sport

Виды спортивных сооружений

Пример: Плавательные бассейны


sptorg

Торги и другие способы размещения заказов

Пример: Открытые аукционы


spzakmp

Способы размещения заказов среди суб.мал. предпринимательства

Пример: Открытые аукционы в электронной форме


stash

Стаж муниципальной службы

Пример: От 15 до 25 лет


stdohod

Статьи доходов местного бюджета

Пример: Земельный налог


strashod

Статьи расходов местного бюджета

Пример: Транспорт


tipotd

Типы отделений при Центрах социального обслуживания населения

Пример: Дневного проживания


tipushr

Тип учебных заведений

Пример: Дошкольные образовательные учреждения


ucheb

Участники

Пример: Организации инвалидов


uslug

Виды услуг населению

Пример: Бани, душевые и сауны


vidazc

Виды заправочных станций

Пример: Многотопливные заправочные станции (МТЗС)


vidfond

Вид основных фондов

Пример: Культивируемые биологические ресурсы растительного происхождения


vidoshist

Виды очистки

Пример: Уловленные и обезвреженные загрязняющие атмосферу вещества из общего объема поступивших на очистку


vidpost

Виды поставок

Пример: Поставки белорусских товаров


vidtorgv

Специализация торговой сети

Пример: Открытые повторные конкурсы


vozr

Возрастные группы

Пример: 70 и старше


wetwl

Уровни управления

Пример: Сельский уровень


zagr

Типы загрязняющих веществ

Пример: Диоксид серы (тыс. тонн с тремя знаками после запятой)


zdrav

Здравоохранение

Пример: Негосударственные лечебно-профилактические организации


region

Субъект РФ



Примеры: Костромская область; Республика Татарстан

0 (0%)




mun-level

Уровень муниципального образования. Принимает значения:

1 – муниципальное образование верхнего уровня (муниципальные районы; муниципальные округа

городские округа; городские округа с внутригородским делением;

внутригородские территории (внутригородские муниципальные образования) городов федерального значения)

2 – муниципальное образование нижнего уровня (сельские поселения; городские поселения; внутригородские районы; межселенные территории)

0 (0%)




municipality

Название муниципального образования (любой уровень)



Пример: город Змеиногорск; Степноозерский поссовет

0 (0%)




munr

Название территориальной единицы, в которую входит муниципальное образование, указанное в атрибуте municipality



Пример: Благовещенский муниципальный район

Не уточнено





mun_type

Тип муниципального образования (по внутренней классификации Росстата)



Принимает значения:

1 - Городские поселения

3 - Внутригородские территории городов федерального значения (Москвы и Санкт-Петербурга)

4 - Сельские поселения

7 - Городские округа, городские округа с внутригородским делением

10 - Муниципальные районы

13 - Межселенные территории

17 - Внутригородские районы 109 – Субъект РФ

0 (0%)




oktmo

Значение кода ОКТМО.

Код ОКТМО населенных пунктов состоит из четырех частей и 11 знаков:

2 знака — «Код региона»;

3 знака — «Код района/города МО»;

3 знака — «Код поселения МО»;

3 знака — «Код населенного пункта МО».

0 (0%)




year

Год

Принимает любое значение из периода: 2006-2020 гг.


0 (0%)



string

value

Значение показателя

Не уточнено




numeric

unit

Единица измерения



Пример: га - гектары

Не уточнено



numeric

period

Период наблюдения



Пример: Значение показателя за год

Не уточнено



integer


Рубрикатор показателей БД ПМО

Для удобства работы, показатели БД ПМО были сгруппированы в тематические рубрики. Каждую рубрику можно скачать отдельным файлом, воспользовавшись специальным рубрикатором.

Рубрикатор также содержит информацию о форме отчетности, из которой получен показатель, периодичности его сбора, и годы, за которые доступны данные по этому показателю (необходимо учитывать, что в один год показатель мог собираться только в части субъектов РФ или муниципальных образований).

Известные ограничения данных

Полнота данных

Данные по показателям содержат достаточно большое количество пропусков. Причины пропусков могут быть следующие:

  • за указанный период показатель либо полностью (во всех субъектах РФ), либо частично (в отдельных субъектах РФ) не собирался. Доступность данных по годам (хотя бы для одного из субъектов РФ) представлена в рубрикаторе.
  • за указанный период показатель собирался, но его значения по отдельным муниципалитетам отсутствуют, поскольку были либо не представлены территориальным органом государственной статистики в Росстат, либо некорректно занесены в БД ПМО, и поэтому не содержатся в выгрузке.
  • в ходе обработки данных с помощью нормализации справочников и создания универсального справочника для всех региональных фондов данных БД ПМО, не удалось устранить расхождения между кодом и наименованием показателя, а также между кодом и наименованием группы категории показателя (в разных регионах один код мог соответствовать разным наименованиям и наоборот). В таких случаях данные по показателю или группе категорий этого показателя либо полностью отсутствуют в датасете, либо соответствующие ячейки содержат значение «NaN».


Кроме того, на полноту данных может влиять смена названий муниципальных образований; изменение кодов ОКТМО; изменение состава населенных пунктов, входящих в МО. Эти изменения не фиксируются в БД ПМО отдельно, а отражаются только на уровне кода ОКТМО. В связи с этим, при построении длинного ряда по конкретному МО (отталкиваясь от кода ОКТМО и/или наименования МО) этот ряд может быть неполным. Проследить историю изменения ОКТМО и состава входящих в МО населенных пунктов (с 2015 по 2021 гг., более ранние периоды недоступны), можно используя специальный инструмент, разработанный ЦПУР.


Описание проведенных проверок и их результатов

  • Проведена проверка, входят ли значения нумерических показателей датасета в их домен; по результатам проверки, выявленные проблемы скорректированы.
  • Проведена проверка идентичности написания названий одних и тех же населенных пунктов, МО и субъектов РФ; по результатам проверки названия были унифицированы.

Все указанные проверки проводились после процедуры обработки данных, описанной ниже. Проверки самих значений по показателям (value) на наличие выбросов, а также оценка корректности диапазона значений по каждому показателю на данном этапе обработки не проводились.

Внесенные в набор данных изменения по сравнению с источниками

Обработка данных велась на основе работы с предоставленным Росстатом дампом БД ПМО (на конец 2021 г.) по трем направлениям.

  • Разработка универсального справочника (классификатора) по всем показателям и группам категорий этих показателей в БД ПМО, а также унификация справочников, содержащих сведения о субъектах РФ, МО, населенных пунктах, единицах измерения и доступном периоде данных. Разработанный универсальный справочник был применен для проверки корректности сведений во всех 85 региональных базах данных. Обнаруженные несоответствия (например, различия для одних и тех же показателей в базах разных регионов пар «код показателя – наименование показателя»; «код категории – наименование категории» и др.) были скорректированы с помощью автоматических алгоритмов или проверены и исправлены вручную сотрудниками Росстата и его территориальных органов.
  • Исправление ошибок в региональных базах данных, возникших при ручном заполнении кодов показателей, наименований показателей и других атрибутов (например, внесение значений в соседнюю ячейку вместо нужной, внесение под одним кодом разных наименований показателей или одного наименования под разными кодами и т.д.).
  • Преобразование формата представления данных в БД ПМО в виде панельных данных (panel table) с объединением показателей в максимально длинный временной ряд.


Источники данных


Атрибут

Значение

Полное наименование источника данных

База данных показателей муниципальных образований Росстата

Сокращенное наименование источника данных

БД ПМО

Владелец источника данных

Росстат

Краткое описание источника данных

Территориальные органы Росстата собирают статистические сведения по муниципальным образованиям в своем субъекте РФ, в соответствии ежегодном обновляемым заказом от федерального Росстата на основании раздела 1.33 «Муниципальная статистика» Федерального плана статистических работ (утв. распоряжением Правительства Российской Федерации от 6 мая 2008 г. № 671-р с последующими изменениями).



Полученные региональные базы (фонды) данных тер.органы передают в Росстат. Росстат проводит консолидацию данных и публикует сведения на странице «База данных показателей муниципальных образований», в соответствии с требованиями Федерального закона Российской Федерации от 29 ноября 2007 г. № 282-ФЗ «Об официальном статистическом учете и системе государственной статистики в Российской Федерации» (с изменениями в ред. Федерального закона Российской Федерации от 02 июля 2013 г. № 171-ФЗ) в части гарантии конфиденциальности первичных данных респондентов.


Ссылка на источник данных

https://www.gks.ru/dbscripts/munst/munst15/DBInet.cgi

Перечень используемых классификаторов

ОКТМО – общероссийский классификатор территорий муниципальных образований

Понятия, используемые в источнике

Отсутствуют

Методология и изменения методологии для источника данных

Краткие методологические комментарии к Базе данных показателей, характеризующих состояние экономики и социальной сферы муниципального образования (БД ПМО)

Ссылки на методологию

https://rosstat.gov.ru/storage/mediabank/rXy6Utk9/met_bdpmo.htm

Ответственные за набор данных



ФИО ответственного лица

Электронная почта ответственного лица

1.

Веденьков Максим Викторович

ask@data.rcsi.science