История изменений ОКТМО: различия между версиями
Editor (обсуждение | вклад) (2. Заполнен контент до раздела «Внесенные в набор данных изменения по сравнению с источниками» невключительно (чист.)) |
Editor (обсуждение | вклад) (→Общее описание набора данных: исправлено короткое описание) |
||
(не показано 7 промежуточных версий этого же участника) | |||
Строка 16: | Строка 16: | ||
== Общая информация о датасете == | == Общая информация о датасете == | ||
Датасет позволяет отследить изменения, происходившие с муниципалитетами в 2015-2021 гг.: состав населенных пунктов, код ОКТМО и название МО. Для отслеживания истории, воспользуйтесь инструментом ovrazhki из библиотеки Susanin на Github: https://github.com/CAG-ru/susanin | Датасет позволяет отследить изменения, происходившие с муниципалитетами в 2015-2021 гг.: состав населенных пунктов, код ОКТМО и название МО. Для отслеживания истории, воспользуйтесь инструментом ovrazhki из библиотеки Susanin на Github: https://github.com/CAG-ru/susanin | ||
Датасет был собран на основе публичной информации: наборы данных с ОКТМО и перекодировочные таблицы ОКТМО, размещенные на сайте Росстата; таблицы соответствия ОКАТО и ОКТМО, размещенные на сайте Минфина; и акты, устанавливающие изменение ОКТМО на сайте «Консультант Плюс». В результате сопоставления источников был в том числе сгенерирован GUID – глобальный ID (внешний ключ) населенного пункта, с помощью которого можно отследить изменение кода ОКТМО и/или названия во времени. Таким образом, датасет можно использовать для построения длинных рядов показателей муниципальных образований с 2015 по 2021 гг. | Датасет был собран на основе публичной информации: наборы данных с ОКТМО и перекодировочные таблицы ОКТМО, размещенные на сайте Росстата; таблицы соответствия ОКАТО и ОКТМО, размещенные на сайте Минфина; и акты, устанавливающие изменение ОКТМО на сайте «Консультант Плюс». В результате сопоставления источников был в том числе сгенерирован GUID – глобальный ID (внешний ключ) населенного пункта, с помощью которого можно отследить изменение кода ОКТМО и/или названия во времени. Таким образом, датасет можно использовать для построения длинных рядов показателей муниципальных образований с 2015 по 2021 гг. | ||
Строка 29: | Строка 29: | ||
Датасет доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»). | Датасет доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»). | ||
== Общее описание набора данных == | == Общее описание набора данных == | ||
{| class="wikitable" | {| class="wikitable" | ||
|- style="font-weight:bold; background-color:#D2FEF0;" | |- style="font-weight:bold; background-color:#D2FEF0;" | ||
! Атрибут | ! Атрибут | ||
Строка 36: | Строка 36: | ||
|- style=" text-align:center; background-color:#FFF;" | |- style=" text-align:center; background-color:#FFF;" | ||
| colspan="2" | '''Общие сведения''' | | colspan="2" | '''Общие сведения''' | ||
|- | |- | ||
| Полное наименование набора данных | | Полное наименование набора данных | ||
| История изменений муниципалитетов в России: наименования, коды ОКТМО и входящие в состав населенные пункты | | История изменений муниципалитетов в России: наименования, коды ОКТМО и входящие в состав населенные пункты | ||
|- | |- | ||
| Сокращенное наименование набора данных | | Сокращенное наименование набора данных | ||
| История | | История изменений ОКТМО | ||
|- | |- | ||
| Краткое описание набора данных | | Краткое описание набора данных | ||
| Датасет позволяет отследить изменения, происходившие с муниципалитетами в 2015-2021 гг.: состав населенных пунктов, код ОКТМО и название МО. Для отслеживания истории, воспользуйтесь библиотекой: https://github.com/CAG-ru/susanin/ovrazhki <br | | Датасет позволяет отследить изменения, происходившие с муниципалитетами в 2015-2021 гг.: состав населенных пунктов, код ОКТМО и название МО. Для отслеживания истории, воспользуйтесь библиотекой: https://github.com/CAG-ru/susanin/ovrazhki <br><br>Датасет был собран на основе публичной информации: наборы данных с ОКТМО и перекодировочные таблицы ОКТМО, размещенные на сайте Росстата; таблицы соответствия ОКАТО и ОКТМО, размещенные на сайте Минфина; и акты, устанавливающие изменение ОКТМО на сайте «Консультант Плюс». В результате сопоставления источников был в том числе сгенерирован GUID – глобальный ID (внешний ключ) населенного пункта, с помощью которого можно отследить изменение кода ОКТМО и/или названия во времени. Таким образом, датасет можно использовать для построения длинных рядов показателей муниципальных образований с 2015 по 2021 гг.<br><br>Единица наблюдения в датасете — муниципальное образование / населенный пункт на определенную дату. Данные для каждого наблюдения приведены по следующим атрибутам: ОКТМО, наименование, тип, хэш и уровень (для муниципальных образований), GUID и т.д.<br><br>Датасет состоит из трех плоских таблиц:<br> | ||
* <span style="background-color: #e5fffb">np_mun_mapping.csv</span>: 233 042 наблюдения по 3 атрибутам;<br | * <span style="background-color: #e5fffb">np_mun_mapping.csv</span>: 233 042 наблюдения по 3 атрибутам;<br> | ||
* <span style="background-color: #e5fffb">mun_obr.csv</span>; 25 056 наблюдений по 9 атрибутам;<br | * <span style="background-color: #e5fffb">mun_obr.csv</span>; 25 056 наблюдений по 9 атрибутам;<br> | ||
* <span style="background-color: #e5fffb">np.csv</span>: 189 213 наблюдений по 7 атрибутам | * <span style="background-color: #e5fffb">np.csv</span>: 189 213 наблюдений по 7 атрибутам | ||
|- | |- | ||
| Краткое описание источника набора данных | | Краткое описание источника набора данных | ||
| Информацию о кодах ОКТМО и изменениях границ и состава населенных пунктов муниципалитетов в России собирают три ведомства: Росстандарт, выпускающий нормативные акты, которые устанавливают изменение ОКТМО; Росстат, собирающий разные версии ОКТМО и перекодировочные таблицы и Минфин, собирающий таблицы соответствия кодов ОКАТО кодам ОКТМО. | | Информацию о кодах ОКТМО и изменениях границ и состава населенных пунктов муниципалитетов в России собирают три ведомства: Росстандарт, выпускающий нормативные акты, которые устанавливают изменение ОКТМО; Росстат, собирающий разные версии ОКТМО и перекодировочные таблицы и Минфин, собирающий таблицы соответствия кодов ОКАТО кодам ОКТМО. | ||
|- | |- | ||
| Покрываемый временной период | | Покрываемый временной период | ||
| 28.01.2015–03.11.2021 | | 28.01.2015–03.11.2021 | ||
|- | |- | ||
| Доступные форматы | | Доступные форматы | ||
| CSV (кодировка: «UTF-8», разделитель: «;») | | CSV (кодировка: «UTF-8», разделитель: «;») | ||
|- | |- | ||
| Размер набора данных | | Размер набора данных | ||
| style="background-color:#FFF;" | 42,1 МБ | | style="background-color:#FFF;" | 42,1 МБ | ||
|- | |- | ||
| Тематика набора данных | | Тематика набора данных | ||
| Статистика | | Статистика | ||
|- | |- | ||
| Режим доступа | | Режим доступа | ||
| Открытый (у Вас есть возможность работать с данными на своем личном ПК, в том числе и скачивать данные) | | Открытый (у Вас есть возможность работать с данными на своем личном ПК, в том числе и скачивать данные) | ||
|- style="text-align:center;" | |- style="text-align:center;" | ||
| colspan="2" | '''Периодичность публикации и обновления''' | | colspan="2" | '''Периодичность публикации и обновления''' | ||
|- | |- | ||
| Дата размещения в каталоге | | Дата размещения в каталоге | ||
| 25.11.2021 | | 25.11.2021 | ||
|- | |- | ||
| Периодичность обновления в каталоге | | Периодичность обновления в каталоге | ||
| Ежегодно | | Ежегодно | ||
|- | |- | ||
| Дата последнего обновления набора данных в каталоге | | Дата последнего обновления набора данных в каталоге | ||
| Отсутствует | | Отсутствует | ||
|- | |- | ||
| Характер последнего обновления | | Характер последнего обновления | ||
| — | | — | ||
|- | |- | ||
| Дата следующего обновления набора данных | | Дата следующего обновления набора данных | ||
| — | | — | ||
|- style="text-align:center;" | |- style="text-align:center;" | ||
| colspan="2" | '''Дополнительные сведения''' | | colspan="2" | '''Дополнительные сведения''' | ||
|- | |- | ||
| Цитирование набора данных на русском языке | | Цитирование набора данных на русском языке | ||
| История изменений муниципалитетов в России: наименования, коды ОКТМО и входящие в состав населенные пункты // Росстат; обработка: Гостева И., Сёмин П., Инфраструктура научно-исследовательских данных, АНО «ЦПУР», 2021. Доступ: Лицензия CC BY-SA. Размещено: 25.11.2021. URL: http://data.rcsi.science/data-catalog/datasets/ | | История изменений муниципалитетов в России: наименования, коды ОКТМО и входящие в состав населенные пункты // Росстат; обработка: Гостева И., Сёмин П., Инфраструктура научно-исследовательских данных, АНО «ЦПУР», 2021. Доступ: Лицензия CC BY-SA. Размещено: 25.11.2021. URL: http://data.rcsi.science/data-catalog/datasets/185 | ||
|- | |- | ||
| For references (English) | | For references (English) | ||
| History of changes in municipalities in Russia: names, OKTMO codes and settlements // Rosstat; data-processing: Gosteva I., Syomin P., The Research Development Infrastructure (RDI), CAG, 2021. Access: License CC BY-SA. Posted: 09.23.2021. URL: http://data.rcsi.science/data-catalog/datasets/ | | History of changes in municipalities in Russia: names, OKTMO codes and settlements // Rosstat; data-processing: Gosteva I., Syomin P., The Research Development Infrastructure (RDI), CAG, 2021. Access: License CC BY-SA. Posted: 09.23.2021. URL: http://data.rcsi.science/data-catalog/datasets/185 | ||
|- | |- | ||
| Ссылка на открытый репозиторий | | Ссылка на открытый репозиторий | ||
| style="text-decoration:underline; color:#0563C1;" | https://github.com/CAG-ru/susanin/ovrazhki | | style="text-decoration:underline; color:#0563C1;" | https://github.com/CAG-ru/susanin/ovrazhki | ||
|- | |- | ||
| Геоданные (пространственная привязка набора данных) | | Геоданные (пространственная привязка набора данных) | ||
| Нет | | Нет | ||
|- | |- | ||
| Лицензия, под которой публикуется набор данных | | Лицензия, под которой публикуется набор данных | ||
| СС BY-SA (Creative Commons)<br | | СС BY-SA (Creative Commons)<br>https://creativecommons.org/licenses/by-sa/4.0/ <br>Допускается использование, копирование и распространение данных в научно-исследовательских, коммерческих и любых иных целях. При преобразовании материала разрешается распространять переделанные части материала на условиях этой же лицензии — CC BY-SA | ||
|- | |- | ||
| Стандарт публикации | | Стандарт публикации | ||
| style="text-decoration:underline; color:#0563C1;" | http://opendata.gosmonitor.ru/standard/3.0 | | style="text-decoration:underline; color:#0563C1;" | http://opendata.gosmonitor.ru/standard/3.0 | ||
|- | |- | ||
| Параметры запросов API | | Параметры запросов API | ||
| Интеграция через API не предусмотрена | | Интеграция через API не предусмотрена | ||
Строка 308: | Строка 308: | ||
Проведены различные проверки соответствия правилам кодирования муниципальных образований и населённых пунктов. Пример проверки: внутри муниципального округа не может быть муниципальных образований второго уровня. | Проведены различные проверки соответствия правилам кодирования муниципальных образований и населённых пунктов. Пример проверки: внутри муниципального округа не может быть муниципальных образований второго уровня. | ||
== Внесенные в набор данных изменения по сравнению с источниками == | == Внесенные в набор данных изменения по сравнению с источниками == | ||
'''Сведения по населенным пунктам обогащены внешним ключом (<span style="background-color:#e5fffb" >guid</span>),''' который позволяет отследить изменение кода ОКТМО или наименования в привязке ко времени. Например, село Галенки Октябрьского района Приморского края Российской Федерации за период с 2013 по 2021 гг. сменило 3 кода ОКТМО: 05 626 402 101 на 05 626 410 103, который в свою очередь превратился в 05 526 000 111. При этом все три записи с разным кодом ОКТМО обозначают один и тот же населённый пункт и связаны внешним ключом guid = 9001. | |||
Алгоритм расстановки внешнего ключа (<span style="background-color:#e5fffb" >guid</span>) заключается в последовательном выполнении следующих действий: | |||
# Взять список населённых пунктов из первой (самой ранней, выпущенной 28 января 2015 г.) версии открытых данных Росстата и пронумеровать их. Каждый такой номер — это <span style="background-color:#e5fffb" >guid</span>, присвоенный путём первоначальной расстановки. | |||
# Просмотреть остальные версии открытых данных Росстата. Если в них встречаются населённые пункты с теми же кодами ОКТМО, что и в первой версии, то присвоить тот же <span style="background-color:#e5fffb" >guid</span>, который был присвоен в ходе первоначальной расстановки. | |||
# Просмотреть перекодировочные таблицы. Для каждой пары «старый код — новый код», содержащейся в перекодировочной таблице, проверить, есть ли guid у старого кода. Если есть, то присвоить записям с новым кодом тот же <span style="background-color:#e5fffb" >guid</span>, что у старого кода. Повторять до тех пор, пока не останется старых кодов, для которых неизвестен <span style="background-color:#e5fffb" >guid</span>. Например, если населённый пункт до 2020 года имел код ОКТМО 01 601 401 001 и guid 100, после 2020 года такие код и <span style="background-color:#e5fffb" >guid</span> отсутствуют, а в перекодировочной таблице есть изменение 01 601 401 001 → 01 501 000 001, и после 2020 года в наборе данных встречается код 01 501 000 001, то ему присваивается <span style="background-color:#e5fffb" >guid</span> 100. | |||
# Просмотреть список населённых пунктов региона. Если в регионе есть только один населённый пункт с каким-либо наименованием, при этом у части записей с таким наименованием есть <span style="background-color:#e5fffb" >guid</span>, а у части — нет, то распространить <span style="background-color:#e5fffb" >guid</span> на те записи с таким же наименованием, где <span style="background-color:#e5fffb" >guid</span> отсутствует. Например, если в N-ской области есть только одна д Простоквашино, у которой до 2020 года был <span style="background-color:#e5fffb" >guid</span>, а после 2020 его нет, то все записи после 2020 года получают тот же <span style="background-color:#e5fffb" >guid</span>, что был указан для записей до 2020 года. | |||
# Просмотреть таблицы соответствия между ОКАТО и ОКТМО (описание таблиц — в разделе «Источники данных», п. 5.3). Если населённые пункты имеют один код ОКАТО, но разные коды ОКТМО, и для одного из кодов ОКТМО известен <span style="background-color:#e5fffb" >guid</span>, а для другого — нет, то все коды ОКТМО, имеющие один код ОКАТО, получают одинаковый <span style="background-color:#e5fffb" >guid</span>. Например, если из таблиц соответствия следует, что город с ОКАТО 01 101 102 001 до 2020 года имел ОКТМО 01 701 000 001, а после — 01 702 000 001, то записи после 2020 года получают тот же <span style="background-color:#e5fffb" >guid</span>, что до 2020 года. | |||
# Вручную проанализировать записи без guid и либо присвоить новый <span style="background-color:#e5fffb" >guid</span>, либо исправить ошибки в предыдущей расстановке. Ошибки при расстановке по правилам, указанным в предыдущих пунктах появляются, т.к. есть допущения, на которых основан описанный выше алгоритм, но которые не всегда выполняются на практике. | |||
'''Сведения о муниципальных образованиях обогащены хэшем, который идентифицирует муниципальное образование как уникальную территорию''', не изменявшуюся в течение периода, указанного в полях odate_start и odate_end. Для вычисления хэша использовались два алгоритма: основной и резервный. | |||
== | Основной алгоритм: муниципальное образование рассматривалось как множество населённых пунктов, которые входят в его состав. Каждый элемент множества — это <span style="background-color:#e5fffb" >guid</span> населённого пункта. Поскольку <span style="background-color:#e5fffb" >guid</span> неизменен, то переименование населённого пункта или изменение его кода, не меняющее принадлежность к тому или иному муниципальному образованию, не влияет на хэш. Сам хэш — это результат применения функции <span style="background-color:#e5fffb" >md5sum</span> к строке, состоящей из <span style="background-color:#e5fffb" >guid</span> населённых пунктов, разделённых запятой и пробелом. Например, если в муниципальное образование А входят населённые пункты с <span style="background-color:#e5fffb" >guid</span> 1, 2 и 1300, то хэш муниципального образования — это <span style="background-color:#e5fffb" >md5sum(“1, 2, 1300”)</span>. Если населённый пункт с <span style="background-color:#e5fffb" >guid</span> 2 уходит из состава муниципального образования А, то хэш вычисляется от другой строки — “1, 1300” — и становится другим, в результате чего изменение состава муниципального образования можно отследить по изменению хэша. Кроме того, если муниципальное образование А переименовывают в Б, но сохраняют прежний набор населённых пунктов, то хэш тоже не меняется, так что изменение наименования муниципального образования, при котором его состав не изменился, можно отследить по одинаковому хэшу. | ||
Резервный алгоритм: бывает, что в муниципальном образовании нет населённых пунктов. Пример — большинство внутригородских территорий городов федерального значения, которые не включают в свой состав населённые пункты, а наоборот, делят один город на несколько частей. В этом случае вычислить хэш по основному алгоритму невозможно, так как строка из <span style="background-color:#e5fffb" >guid</span> получится пустой во всех случаях и перестанет быть уникальной. Для таких муниципальных образований хэш — это <span style="background-color:#e5fffb" >md5sum</span> от строки вида «кодНаименование» (без пробела, например: «45319000муниципальный округ Крылатское»). В таком случае при изменении кода ОКТМО или наименования хэш меняется, что позволяет отслеживать переименование при сохранении кода или изменение кода при сохранении наименования. | |||
Выбранный алгоритм расстановки хэша не позволяет отследить ситуации, когда одновременно менялись все характерные признаки муниципального образования: код ОКТМО, наименование, состав. Например, если городское поселение «Город А» с кодом 99 601 101, включающее в свой состав город с <span style="background-color:#e5fffb" >guid</span> 1000, переименовали в «Город Б», поменяли код на 99 601 102 и добавили в его состав посёлок городского типа с <span style="background-color:#e5fffb" >guid 1001</span>, то в результате у городского поселения «Город А» и городского поселения «Город Б» будут разные наименования, коды ОКТМО и хэши, и отследить их преемственность напрямую будет невозможно. Вариант в такой ситуации — смотреть состав муниципальных образований и сравнивать список населённых пунктов. | |||
Сведения по муниципальным образованиям обогащены нормализованными наименованиями регионов, уровнем (1 или 2) и типом муниципального образования. | |||
Расстановка типов проходила по следующему алгоритму: | |||
* если муниципальное образование первого уровня (<span style="background-color:#e5fffb" >lvl = 1</span>), то тип определяется по третьей цифре кода ОКТМО (например, 81 <u>6</u>57 000 Хоринский муниципальный район): | |||
** 3 — внутригородская территория города федерального значения, | |||
** 5 — муниципальный округ, | |||
** 6 — муниципальный район, | |||
** 7 — городской округ; | |||
* если определить по третьей цифре не получилось и регион — город федерального значения (первые две цифры ОКТМО — 40, 45, 67), то тип — внутригородская территория города федерального значения. | |||
* если определить по третьей цифре не получилось и регион — не город федерального значения, то тип определяется по четвертой и пятой цифрам (например, 71 <u>87</u>1 000 город Ханты-Мансийск): | |||
** 10–30 — муниципальный район, | |||
** 30–49 — муниципальный округ, | |||
** 50–99 — городской округ; | |||
* исключение из правил: oktmo = 30832000 — муниципальный район; | |||
* если муниципальное образование второго уровня (<span style="background-color:#e5fffb" >lvl = 2</span>), то тип определяется по шестой цифре кода ОКТМО (например, 82 605 <u>4</u>40 село Лологонитль): | |||
** 1 — городское поселение, | |||
** 3 — внутригородской район, | |||
** 4 — сельское поселение, | |||
** 7 — межселенная территория. | |||
Расстановка уровня муниципального образования проходила по следующему алгоритму: если шестая цифра кода ОКТМО — ноль, то уровень 1, иначе 2. Например, 01 657 <u>0</u>00 (Целинный муниципальный район) — уровень 1, а 01 611 <u>4</u>89 (Чистоозёрский сельсовет) — уровень 2. | |||
'''Сведения по населенным пунктам также обогащены типом территориальной единицы'''. Расстановка типов проходила по трем последним цифрам кода ОКТМО (например, 99 701 000 <u>001</u> г Биробиджан):<br> | |||
* 001–049 — город;<br> | |||
* 051–099 — поселок городского типа (рабочие поселки, курортные поселки, дачные поселки, поселки, городские поселки);<br> | |||
* 101–999 — сельский населенный пункт (поселки, села, станицы, деревни, хутора, кишлаки, аулы и др.). | |||
== Источники данных == | |||
=== ОКТМО в разделе «открытые данные» сайта Росстата === | === ОКТМО в разделе «открытые данные» сайта Росстата === | ||
{| class="wikitable" | |||
|- style="font-weight:bold; background-color:#D2FEF0;" | |||
! Атрибут | |||
! Значение | |||
|- | |||
| Полное наименование источника данных | |||
| Набор данных «Общероссийский классификатор территорий муниципальных образований (ОКТМО)», размещённый в разделе «открытые данные» сайта Росстата. | |||
|- | |||
| Сокращенное наименование источника данных | |||
| Открытые данные Росстата. | |||
|- | |||
| Владелец источника данных | |||
| Федеральная служба государственной статистики (Росстат). | |||
|- | |||
| Краткое описание источника данных | |||
| Набор данных Росстата по ОКТМО — это CSV-таблица, которая содержит классификатор целиком. Каждая версия набора данных соответствует классификатору в том состоянии, в котором он был на определённый период времени с учётом всех накопленных изменений. Помимо сведений, содержащихся в классификаторе, в таблице указаны метаданные: номер и тип изменения (если запись в классификаторе менялась), дата введения записи в действие. | |||
|- | |||
| Ссылка на источник данных | |||
| style="text-decoration:underline; color:#0563C1;" | https://rosstat.gov.ru/opendata/7708234640-oktmo <br /> | |||
|- | |||
| Перечень используемых классификаторов | |||
| Общероссийский классификатор территорий муниципальных образований (ОКТМО) | |||
|- | |||
| Понятия, используемые в источнике | |||
| ОКТМО — общероссийский классификатор территорий муниципальных образований. Представляет собой перечень всех муниципальных образований и населённых пунктов России, где у каждой записи указан уникальный код.<br /> <br />Муниципальное образование — территория, в границах которой осуществляется местное самоуправление. С точки зрения территориального деления, по сути, представляет собой территориальную единицу в составе субъекта России, занимающую промежуточное положение в ряду «субъект — муниципальное образование — населённый пункт». Территория субъекта делится на территории муниципальных образований. Муниципальные образования могут быть двух уровней. Помимо муниципальных образований, есть административно-территориальные образования — это другие территориальные единицы, границы которых могут совпадать с границами муниципальных образований, а могут не совпадать.<br /> <br />Типы (виды) муниципальных образований:<br /> | |||
* муниципальный округ,<br /> | |||
* городской округ (в том числе городские округа с внутригородским делением),<br /> | |||
* муниципальный район,<br /> | |||
* внутригородская территория города федерального значения,<br /> | |||
* городское поселение,<br /> | |||
* сельское поселение,<br /> | |||
* внутригородской район.<br /> | |||
Муниципальные образования первого уровня — муниципальные образования, территории которых не входят в состав территорий других муниципальных образований. К ним относятся муниципальные округа, городские округа (в том числе городские округа с внутригородским делением), муниципальные районы, внутригородские территории городов федерального значения.<br />Муниципальные образования второго уровня — муниципальные образования, территории которых входят в состав территорий муниципальных образований первого уровня. К ним относятся городские поселения, сельские поселения и внутригородские районы.<br />Межселенная территория — территория муниципального района, находящаяся вне границ поселений. Она не является муниципальным образованием, но в наборе данных условно отнесена к муниципальным образованиям второго уровня.<br />Населённый пункт — территория, компактно заселённая людьми: город, посёлок городского типа или сельский населённый пункт. Не путать с поселениями, которые являются разновидностью муниципальных образований (хотя поселение может состоять из одного населённого пункта). | |||
|- | |||
| Методология и изменения методологии для источника данных | |||
| Порядок составления ОКТМО описан во введении к нему. Объекты классификации — муниципальные образования и населённые пункты. Соответственно, ОКТМО состоит из двух разделов: в первом кодируются муниципальные образования, во втором — населённые пункты. Коды муниципальных образований состоят из 8 цифр, коды населённых пунктов — из 11. Первые 8 цифр кода населённого пункта — это код муниципального образования, внутри которого он находится.<br /> <br />Код муниципального образования имеет вид AA BBB CCC:<br /> | |||
* AA — код субъекта России,<br /> | |||
* BBB — код муниципального образования первого уровня;<br /> | |||
* CCC — код муниципального образования второго уровня (если его нет, то ставится 000).<br> | |||
Код населённого пункта имеет вид AA BBB CCC DDD, где первые три части — такие же, как в коде муниципального образования, а DDD — это код населённого пункта внутри муниципального образования.<br /> <br />При изменении муниципального деления субъектов в ОКТМО вносятся изменения. Изменения могут убирать или вводить код, а также менять часть записи в классификаторе без изменения кода (например, менять наименование муниципального образования). | |||
|- | |||
| Ссылки на методологию | |||
| style="text-decoration:underline; color:#15C;" | http://www.consultant.ru/document/cons_doc_LAW_149911/fe0fcde01af39800bd620af2a8e83bd5634875f4/ | |||
|} | |||
=== Перекодировочные таблицы аннулированных кодов ОКТМО === | === Перекодировочные таблицы аннулированных кодов ОКТМО === | ||
{| class="wikitable" | |||
|- style="font-weight:bold; background-color:#D2FEF0;" | |||
! Атрибут | |||
! Значение | |||
|- | |||
| Полное наименование источника данных | |||
| Перекодировочные таблицы аннулированных кодов ОКТМО | |||
|- | |||
| Сокращенное наименование источника данных | |||
| Перекодировочные таблицы ОКТМО | |||
|- | |||
| Владелец источника данных | |||
| Федеральная служба государственной статистики (Росстат). | |||
|- | |||
| Краткое описание источника данных | |||
| Перекодировочные таблицы — текстовые документы. Каждый такой документ относится к одному изменению ОКТМО и содержит одну таблицу. В таблице отражено изменение кода одного и того же населённого пункта: в одном поле указан старый код, в другом — новый. Изменение кодов муниципальных образований в перекодировочных таблицах не отражено. Если населённый пункт исчез и его код был аннулирован, то поле с новым кодом остаётся пустым. Если населённого пункта не было, и он появился, то в перекодировочную таблицу он не включается. | |||
|- | |||
| Ссылка на источник данных | |||
| style="text-decoration:underline; color:#15C;" | https://rosstat.gov.ru/classification | |||
|- | |||
| Перечень используемых классификаторов | |||
| Общероссийский классификатор территорий муниципальных образований (ОКТМО) | |||
|- | |||
| Понятия, используемые в источнике | |||
| —<br /> | |||
|- | |||
| Методология и изменения методологии для источника данных | |||
| — | |||
|- | |||
| Ссылки на методологию | |||
| — | |||
|} | |||
=== Таблицы соответствия кодов ОКАТО кодам ОКТМО муниципальных образований и входящих в их состав населенных пунктов и межселенных территорий Минфина === | === Таблицы соответствия кодов ОКАТО кодам ОКТМО муниципальных образований и входящих в их состав населенных пунктов и межселенных территорий Минфина === | ||
{| class="wikitable" | |||
|- style="font-weight:bold; background-color:#D2FEF0;" | |||
! Атрибут | |||
! Значение | |||
|- | |||
| Полное наименование источника данных | |||
| Таблицы соответствия кодов ОКАТО кодам ОКТМО муниципальных образований и входящих в их состав населенных пунктов и межселенных территорий Минфина | |||
|- | |||
| Сокращенное наименование источника данных | |||
| Таблицы соответствия между ОКАТО и ОКТМО | |||
|- | |||
| Владелец источника данных | |||
| Министерство финансов Российской Федерации (Минфин России) | |||
|- | |||
| Краткое описание источника данных | |||
| На странице сайта Минфина публикуются таблицы соответствия между кодами ОКАТО и ОКТМО. Каждая из таких таблиц отражает соответствие между кодами в определённый момент времени. Таблица — это файл Excel (иногда в zip- или rar-архиве), в которой, в частности, указаны код ОКАТО для той или иной территориальной единицы и соответствующий ей код ОКТМО. В некоторых случаях код ОКАТО или ОКТМО не указан: это значит, что он на тот момент не был присвоен. | |||
|- | |||
| Ссылка на источник данных | |||
| style="text-decoration:underline; color:#15C;" | https://minfin.gov.ru/ru/ismf/eiasmfrf/ <br /> | |||
|- | |||
| Перечень используемых классификаторов | |||
| Общероссийский классификатор административно-территориальных образований (ОКАТО)<br />Общероссийский классификатор территорий муниципальных образований (ОКТМО) | |||
|- | |||
| Понятия, используемые в источнике | |||
| ОКАТО — общероссийский классификатор объектов административно-территориального деления. Представляет собой перечень административно-территориальных единиц и населённых пунктов, где у каждой записи указан уникальный код. Административно-территориальные единицы — не то же самое, что муниципальные образования, хотя их границы иногда совпадают.<br /> <br />ОКТМО — общероссийский классификатор территорий муниципальных образований. Представляет собой перечень всех муниципальных образований и населённых пунктов России, где у каждой записи указан уникальный код. | |||
|- | |||
| Методология и изменения методологии для источника данных | |||
| Порядок составления ОКАТО описан во введении к нему<br /> <br />Территориальные органы Минфина проводили сопоставление ОКАТО и ОКТМО в соответствии с методическими рекомендациями, заполняя специальные таблицы и отправляя их в центральный аппарат ведомства. | |||
|- | |||
| Ссылки на методологию | |||
| style="text-decoration:underline; color:#15C;" | http://www.consultant.ru/document/cons_doc_LAW_35362/fe0fcde01af39800bd620af2a8e83bd5634875f4/<br /> <br />https://minfin.gov.ru/ru/document/?id_4=115768-prilozhenie | |||
|} | |||
=== Нормативно-правовые акты субъектов РФ, устанавливающие изменения муниципально-территориального устройства («Консультант Плюс») === | === Нормативно-правовые акты субъектов РФ, устанавливающие изменения муниципально-территориального устройства («Консультант Плюс») === | ||
{| class="wikitable" | |||
|- style="font-weight:bold; background-color:#D2FEF0;" | |||
! Атрибут | |||
! Значение | |||
|- | |||
| Полное наименование источника данных | |||
| Нормативно-правовые акты субъектов РФ, устанавливающие изменения муниципально-территориального устройства, размещенные на портале «Консультант Плюс». | |||
|- | |||
| Сокращенное наименование источника данных | |||
| НПА об изменениях муниципально-территориального устройства | |||
|- | |||
| Владелец источника данных | |||
| Субъекты РФ | |||
|- | |||
| Краткое описание источника данных | |||
| Общие принципы изменений границ муниципального образования, а также изменения границ между субъектами РФ описаны в Федеральном законе от 06.10.2003 N 131-ФЗ (ред. от 01.07.2021) "Об общих принципах организации местного самоуправления в Российской Федерации" (с изм. и доп., вступ. в силу с 30.09.2021)<br />http://www.consultant.ru/document/cons_doc_LAW_44571/ <br /> <br />В датасете использовались нормативно-правовые акты субъектов РФ, устанавливающие изменения муниципально-территориального устройства, например, Закон Московской области от 07.04.2017 N 41/2017-ОЗ "Об отнесении города Павловский Посад Павлово-Посадского района Московской области к категории города областного подчинения Московской области, упразднении Павлово-Посадского района Московской области и внесении изменений в Закон Московской области "Об административно-территориальном устройстве Московской области" (принят постановлением Мособлдумы от 23.03.2017 N 16/19-П):<br />http://www.consultant.ru/cons/cgi/online.cgi?req=doc&base=MOB&n=247183 | |||
|- | |||
| Ссылка на источник данных | |||
| style="text-decoration:underline; color:#0563C1;" | http://www.consultant.ru/ | |||
|- | |||
| Перечень используемых классификаторов | |||
| —<br /> | |||
|- | |||
| Понятия, используемые в источнике | |||
| — | |||
|- | |||
| Методология и изменения методологии для источника данных | |||
| —<br /> | |||
|- | |||
| Ссылки на методологию | |||
| — | |||
|} | |||
== Ответственные за набор данных == | |||
{| class="wikitable" style="width: 100%; height: 20px; border-style: solid" | |||
|- style="background-color:#e5fffb; font-family: TT Norms Medium" | |||
| № | |||
| ФИО ответственного лица | |||
| Электронная почта ответственного лица | |||
|- style="background-color:#ffffff" | |||
| <p>1.</p> | |||
| <p>Гостева Инесса Игоревна</p> | |||
| [mailto:i.gosteva@cpur.ru i.gosteva@cpur.ru] | |||
|- style="background-color:#ffffff" | |||
| <p>2.</p> | |||
| <p>Сёмин Павел Олегович</p> | |||
| [mailto:p.semin@cpur.ru p.semin@cpur.ru] | |||
|} | |||
[[Category: Описания датасетов]] |
Текущая версия на 19:00, 25 ноября 2021
История изменений
Дата | Версия | Автор | Описание изменений |
25.11.2021 |
1.0 |
Гостева Инесса Игоревна |
Документ создан |
Сёмин Павел Олегович |
Общая информация о датасете
Датасет позволяет отследить изменения, происходившие с муниципалитетами в 2015-2021 гг.: состав населенных пунктов, код ОКТМО и название МО. Для отслеживания истории, воспользуйтесь инструментом ovrazhki из библиотеки Susanin на Github: https://github.com/CAG-ru/susanin
Датасет был собран на основе публичной информации: наборы данных с ОКТМО и перекодировочные таблицы ОКТМО, размещенные на сайте Росстата; таблицы соответствия ОКАТО и ОКТМО, размещенные на сайте Минфина; и акты, устанавливающие изменение ОКТМО на сайте «Консультант Плюс». В результате сопоставления источников был в том числе сгенерирован GUID – глобальный ID (внешний ключ) населенного пункта, с помощью которого можно отследить изменение кода ОКТМО и/или названия во времени. Таким образом, датасет можно использовать для построения длинных рядов показателей муниципальных образований с 2015 по 2021 гг.
Единица наблюдения в датасете — муниципальное образование / населенный пункт на определенную дату. Данные для каждого наблюдения приведены по следующим атрибутам: ОКТМО, наименование, тип, хэш и уровень (для муниципальных образований), GUID и т.д.
Датасет состоит из трех плоских таблиц:
- np_mun_mapping.csv: 233 042 наблюдения по 3 атрибутам;
- mun_obr.csv; 25 056 наблюдений по 9 атрибутам;
- np.csv: 189 213 наблюдений по 7 атрибутам;
Датасет доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»).
Общее описание набора данных
Атрибут | Значение |
---|---|
Общие сведения | |
Полное наименование набора данных | История изменений муниципалитетов в России: наименования, коды ОКТМО и входящие в состав населенные пункты |
Сокращенное наименование набора данных | История изменений ОКТМО |
Краткое описание набора данных | Датасет позволяет отследить изменения, происходившие с муниципалитетами в 2015-2021 гг.: состав населенных пунктов, код ОКТМО и название МО. Для отслеживания истории, воспользуйтесь библиотекой: https://github.com/CAG-ru/susanin/ovrazhki Датасет был собран на основе публичной информации: наборы данных с ОКТМО и перекодировочные таблицы ОКТМО, размещенные на сайте Росстата; таблицы соответствия ОКАТО и ОКТМО, размещенные на сайте Минфина; и акты, устанавливающие изменение ОКТМО на сайте «Консультант Плюс». В результате сопоставления источников был в том числе сгенерирован GUID – глобальный ID (внешний ключ) населенного пункта, с помощью которого можно отследить изменение кода ОКТМО и/или названия во времени. Таким образом, датасет можно использовать для построения длинных рядов показателей муниципальных образований с 2015 по 2021 гг. Единица наблюдения в датасете — муниципальное образование / населенный пункт на определенную дату. Данные для каждого наблюдения приведены по следующим атрибутам: ОКТМО, наименование, тип, хэш и уровень (для муниципальных образований), GUID и т.д. Датасет состоит из трех плоских таблиц:
|
Краткое описание источника набора данных | Информацию о кодах ОКТМО и изменениях границ и состава населенных пунктов муниципалитетов в России собирают три ведомства: Росстандарт, выпускающий нормативные акты, которые устанавливают изменение ОКТМО; Росстат, собирающий разные версии ОКТМО и перекодировочные таблицы и Минфин, собирающий таблицы соответствия кодов ОКАТО кодам ОКТМО. |
Покрываемый временной период | 28.01.2015–03.11.2021 |
Доступные форматы | CSV (кодировка: «UTF-8», разделитель: «;») |
Размер набора данных | 42,1 МБ |
Тематика набора данных | Статистика |
Режим доступа | Открытый (у Вас есть возможность работать с данными на своем личном ПК, в том числе и скачивать данные) |
Периодичность публикации и обновления | |
Дата размещения в каталоге | 25.11.2021 |
Периодичность обновления в каталоге | Ежегодно |
Дата последнего обновления набора данных в каталоге | Отсутствует |
Характер последнего обновления | — |
Дата следующего обновления набора данных | — |
Дополнительные сведения | |
Цитирование набора данных на русском языке | История изменений муниципалитетов в России: наименования, коды ОКТМО и входящие в состав населенные пункты // Росстат; обработка: Гостева И., Сёмин П., Инфраструктура научно-исследовательских данных, АНО «ЦПУР», 2021. Доступ: Лицензия CC BY-SA. Размещено: 25.11.2021. URL: http://data.rcsi.science/data-catalog/datasets/185 |
For references (English) | History of changes in municipalities in Russia: names, OKTMO codes and settlements // Rosstat; data-processing: Gosteva I., Syomin P., The Research Development Infrastructure (RDI), CAG, 2021. Access: License CC BY-SA. Posted: 09.23.2021. URL: http://data.rcsi.science/data-catalog/datasets/185 |
Ссылка на открытый репозиторий | https://github.com/CAG-ru/susanin/ovrazhki |
Геоданные (пространственная привязка набора данных) | Нет |
Лицензия, под которой публикуется набор данных | СС BY-SA (Creative Commons) https://creativecommons.org/licenses/by-sa/4.0/ Допускается использование, копирование и распространение данных в научно-исследовательских, коммерческих и любых иных целях. При преобразовании материала разрешается распространять переделанные части материала на условиях этой же лицензии — CC BY-SA |
Стандарт публикации | http://opendata.gosmonitor.ru/standard/3.0 |
Параметры запросов API | Интеграция через API не предусмотрена |
Структура набора данных (Codebook)
Датасет представлен в виде трёх плоских таблиц (формат данных: CSV; кодировка: «UTF-8», разделитель: «;»):
- Таблица «Соответствие между муниципальными образованиями и населенными пунктами, входящими в их состав в определенный промежуток времени» (np_mun_mapping.csv); 233 042 наблюдения по 3 атрибутам за 28.01.2015–03.11.2021.
- Таблица «Муниципальные образования» (mun_obr.csv); 25 056 наблюдений по 9 атрибутам за 28.01.2015–03.11.2021;
- Таблица «Населённые пункты» (np.csv); 189 213 наблюдений по 7 атрибутам за 28.01.2015–03.11.2021;
Соответствие между муниципальными образованиями и населенными пунктами, входящими в их состав в определенный промежуток времени (np_mun_mapping.csv)
Атрибут | Описание | Количество пропусков (NaN) (шт/%) |
Единица измерения | ОКЕИ | Формат |
---|---|---|---|---|---|
guid | Cгенерированный в ходе обработки данных глобальный ID населённого пункта в рамках этого датасета. В отличие от ID, не меняется при изменении кода ОКТМО или наименования населённого пункта. GUID позволяет отследить изменение кода ОКТМО или наименования в привязке ко времени. | 0 (0%) | integer | ||
hash1 | Хэш муниципального образования второго уровня, внутри которого находится населённый пункт с указанным guid. Соответствует полю hash в таблице mun_obr.csv. | 0 (0%) | string | ||
hash2 | Хэш муниципального образования второго уровня, внутри которого находится населённый пункт с указанным guid. Соответствует полю hash в таблице mun_obr.csv. Если не заполнено, то населённый пункт находится напрямую в муниципальном образовании первого уровня, которое не включает в свой состав другие муниципальные образования (например, в муниципальном округе). |
0 (0%) | string |
Муниципальные образования (mun_obr.csv)
Атрибут | Описание | Количество пропусков (NaN) (шт/%) |
Единица измерения | ОКЕИ | Формат |
---|---|---|---|---|---|
id | ID наблюдения в рамках набора данных | 0 (0%) | integer | ||
hash | Хэш муниципального образования. Хэш рассчитан как md5sum от строки, включающей в себя guid’ы населённых пунктов, входящих в данное муниципальное образование. Одинаковый хэш означает, что список населённых пунктов в муниципальном образовании не менялся. Если в муниципальном образовании нет населённых пунктов, то хэш считается от строки, включающей в себя код ОКТМО и наименование муниципального образования. В таком случае одинаковый хэш означает, что ни название, ни код ОКТМО муниципального образования не менялись. |
0 (0%) | string | ||
oktmo | Код ОКТМО муниципального образования. | 0 (0%) | string | ||
municipality | Наименование муниципального образования. | 0 (0%) | string | ||
lvl | Уровень муниципального образования. К первому уровню относятся: муниципальные округа; городские округа; муниципальные районы; внутригородские территории городов федерального значения. Ко второму уровню относятся: городские поселения; сельские поселения; межселенные территории; внутригородские районы. | 0 (0%) | integer | ||
odate_start | Дата начала действия записи. Период от даты начала до даты окончания — это «время существования» муниципального образования в указанном составе. Даты начала и окончания соответствуют датам опубликования разных версий набора открытых данных Росстата. | 0 (0%) | date | ||
odate_end | Дата окончания действия записи. | 0 (0%) | date | ||
region | Субъект РФ, в котором находится муниципальное образование. | 0 (0%) | string | ||
mun_type | Тип муниципального образования:
|
0 (0%) | string |
Населённые пункты (np.csv)
Атрибут | Описание | Количество пропусков (NaN) (шт/%) |
Единица измерения | ОКЕИ | Формат |
---|---|---|---|---|---|
id | ID наблюдения в рамках набора данных | 0 (0%) | integer | ||
guid | Cгенерированный в ходе обработки данных глобальный ID населённого пункта в рамках этого датасета. В отличие от ID, не меняется при изменении кода ОКТМО или наименования населённого пункта. GUID позволяет отследить изменение кода ОКТМО или наименования в привязке ко времени. | 0 (0%) | integer | ||
oktmo | Код ОКТМО населённого пункта. | 0 (0%) | string | ||
settlement | Наименование населённого пункта. | 0 (0%) | string | ||
np_type | Тип населённого пункта. Возможные значения: город, посёлок городского типа, сельский населённый пункт. | 0 (0%) | string | ||
odate_start | Дата начала действия записи. Период от даты начала до даты окончания — это «время существования» населённого пункта с указанным кодом ОКТМО и указанным наименованием. Даты начала и окончания соответствуют датам опубликования разных версий набора открытых данных Росстата. | 0 (0%) | date | ||
odate_end | Дата окончания действия записи. | 0 (0%) | date |
Известные ограничения данных
Полнота данных
- Несмотря на то, что текущая версия классификатора ОКТМО ведётся с 2013 г., в набор данных включена история ОКТМО с 2015 г., потому что первая версия открытых данных Росстата, которая послужила источником информации, датируется январём 2015 г.
- В наборе данных не отражены планируемые изменения ОКТМО, которые не вступили в силу на 25.11.2021.
- В таблице np_mun_mapping.csv примерно для 29 тысяч guid не указан хэш «родительского» муниципального образования второго уровня (поле hash2), т.к. населённые пункты находятся непосредственно внутри муниципальных образований первого уровня и эти муниципальные образования не содержат внутри себя муниципальных образований второго уровня. Примеры таких муниципальных образований первого уровня — это муниципальные округа, внутригородские территории городов федерального значения и большинство городских округов (кроме городских округов с внутригородским делением).
Описание проведенных проверок и их результатов
Сгенерированный в ходе обработки данных внешний ключ guid населённых пунктов (см. подробнее п. «внесенные в набор данных изменения») проверялся на реалистичность значений:
- максимальное число строк с одним guid в таблице np.csv не должно превышать 41 (по числу версий набора открытых данных Росстата на ноябрь 2021 года). Проверка пройдена, исключения (42 штуки) обработаны вручную и исправлены;
- наименование населённых пунктов с одним guid должно быть одинаковым, за исключением случаев переименования без изменения кода ОКТМО (например, 25 636 434 106 д Еловая → 25 636 434 106 д Еловое). Проверка пройдена;
- наименование населённых пунктов с одним кодом ОКТМО должно быть одинаковым, за исключением случаев переименования без изменения кода ОКТМО. Проверка пройдена;
- одному guid могут соответствовать несколько кодов ОКТМО, но одному коду ОКТМО должен соответствовать один guid. Иначе говоря, населённый пункт может поменять код ОКТМО, но при этом, по общему правилу, не должно быть ситуаций, когда код ОКТМО передан от одного населённого пункта другому. Проверка пройдена, исключения (35 штук) обработаны вручную. В этих исключительных случаях код ОКТМО действительно был передан от одного населённого пункта другому. Такое случается, когда меняется административный центр муниципального образования. По правилам ведения ОКТМО, у административного центра должен быть код, заканчивающийся на 1. Если этот код раньше принадлежал другому населённому пункту, то он передаётся новому административному центру. Пример: до середины 2016 года в Липецкой области было с Шишкино (код 42 656 484 101 — административный центр) и п Рощинский (код 42 656 484 106). В середине 2016 года п Рощинский сделали административным центром и передали ему код 42 656 484 101, а с Шишкино получило новый код — 42 656 484 103. В результате один код ОКТМО соответствует разным населённым пунктам и разным guid (93703 и 93704) в таблице np.csv.
Проведён поиск и устранение ошибок в открытых данных и перекодировочных таблицах Росстата. Скорректированы записи со следующими guid:
- 59197 и 59413 (с учётом оригинального текста изменения 121/2015 ОКТМО);
- 144112, 144302, 144341, 144947, 147190 (в перекодировочной таблице 352/2019 были ошибки);
- 179628 и 203550 (из-за переименований, упразднений и передачи кодов несколько населённых пунктов в Дагестане перепутались);
- 203549 (в Пермском крае, судя по имеющейся информации, две д Сюзи)
Проведена проверка на переполнение кода. Пример ситуации, когда возможно переполнение: допустим, что есть муниципальный район с кодом 58 601 000. Тогда сельские поселения в данном муниципальном районе получат коды вида 58 601 4NN, где NN — число от 01 до 99. Следовательно, если в муниципальном районе больше 99 сельских поселений, то свободные номера закончатся. По правилам ведения ОКТМО, в таком случае необходимо делать дополнительный код для муниципального района (например, 58 602 000), включать в него оставшиеся сельские поселения и в примечании указывать отсылку к основному коду. При переполнении становится сложнее отслеживать состав муниципальных образований, так как они оказываются разделены между несколькими кодами. Однако проверка показала, что переполнений не наблюдается. Исключение — это переполнение внутригородских территорий городов федерального значения (их больше 99, поэтому отведённые коды вида 40 3NN закончились), однако этот случай специально оговорён в правилах ведения ОКТМО и не требует дополнительных проверок. Проведены различные проверки соответствия правилам кодирования муниципальных образований и населённых пунктов. Пример проверки: внутри муниципального округа не может быть муниципальных образований второго уровня.
Внесенные в набор данных изменения по сравнению с источниками
Сведения по населенным пунктам обогащены внешним ключом (guid), который позволяет отследить изменение кода ОКТМО или наименования в привязке ко времени. Например, село Галенки Октябрьского района Приморского края Российской Федерации за период с 2013 по 2021 гг. сменило 3 кода ОКТМО: 05 626 402 101 на 05 626 410 103, который в свою очередь превратился в 05 526 000 111. При этом все три записи с разным кодом ОКТМО обозначают один и тот же населённый пункт и связаны внешним ключом guid = 9001.
Алгоритм расстановки внешнего ключа (guid) заключается в последовательном выполнении следующих действий:
- Взять список населённых пунктов из первой (самой ранней, выпущенной 28 января 2015 г.) версии открытых данных Росстата и пронумеровать их. Каждый такой номер — это guid, присвоенный путём первоначальной расстановки.
- Просмотреть остальные версии открытых данных Росстата. Если в них встречаются населённые пункты с теми же кодами ОКТМО, что и в первой версии, то присвоить тот же guid, который был присвоен в ходе первоначальной расстановки.
- Просмотреть перекодировочные таблицы. Для каждой пары «старый код — новый код», содержащейся в перекодировочной таблице, проверить, есть ли guid у старого кода. Если есть, то присвоить записям с новым кодом тот же guid, что у старого кода. Повторять до тех пор, пока не останется старых кодов, для которых неизвестен guid. Например, если населённый пункт до 2020 года имел код ОКТМО 01 601 401 001 и guid 100, после 2020 года такие код и guid отсутствуют, а в перекодировочной таблице есть изменение 01 601 401 001 → 01 501 000 001, и после 2020 года в наборе данных встречается код 01 501 000 001, то ему присваивается guid 100.
- Просмотреть список населённых пунктов региона. Если в регионе есть только один населённый пункт с каким-либо наименованием, при этом у части записей с таким наименованием есть guid, а у части — нет, то распространить guid на те записи с таким же наименованием, где guid отсутствует. Например, если в N-ской области есть только одна д Простоквашино, у которой до 2020 года был guid, а после 2020 его нет, то все записи после 2020 года получают тот же guid, что был указан для записей до 2020 года.
- Просмотреть таблицы соответствия между ОКАТО и ОКТМО (описание таблиц — в разделе «Источники данных», п. 5.3). Если населённые пункты имеют один код ОКАТО, но разные коды ОКТМО, и для одного из кодов ОКТМО известен guid, а для другого — нет, то все коды ОКТМО, имеющие один код ОКАТО, получают одинаковый guid. Например, если из таблиц соответствия следует, что город с ОКАТО 01 101 102 001 до 2020 года имел ОКТМО 01 701 000 001, а после — 01 702 000 001, то записи после 2020 года получают тот же guid, что до 2020 года.
- Вручную проанализировать записи без guid и либо присвоить новый guid, либо исправить ошибки в предыдущей расстановке. Ошибки при расстановке по правилам, указанным в предыдущих пунктах появляются, т.к. есть допущения, на которых основан описанный выше алгоритм, но которые не всегда выполняются на практике.
Сведения о муниципальных образованиях обогащены хэшем, который идентифицирует муниципальное образование как уникальную территорию, не изменявшуюся в течение периода, указанного в полях odate_start и odate_end. Для вычисления хэша использовались два алгоритма: основной и резервный.
Основной алгоритм: муниципальное образование рассматривалось как множество населённых пунктов, которые входят в его состав. Каждый элемент множества — это guid населённого пункта. Поскольку guid неизменен, то переименование населённого пункта или изменение его кода, не меняющее принадлежность к тому или иному муниципальному образованию, не влияет на хэш. Сам хэш — это результат применения функции md5sum к строке, состоящей из guid населённых пунктов, разделённых запятой и пробелом. Например, если в муниципальное образование А входят населённые пункты с guid 1, 2 и 1300, то хэш муниципального образования — это md5sum(“1, 2, 1300”). Если населённый пункт с guid 2 уходит из состава муниципального образования А, то хэш вычисляется от другой строки — “1, 1300” — и становится другим, в результате чего изменение состава муниципального образования можно отследить по изменению хэша. Кроме того, если муниципальное образование А переименовывают в Б, но сохраняют прежний набор населённых пунктов, то хэш тоже не меняется, так что изменение наименования муниципального образования, при котором его состав не изменился, можно отследить по одинаковому хэшу.
Резервный алгоритм: бывает, что в муниципальном образовании нет населённых пунктов. Пример — большинство внутригородских территорий городов федерального значения, которые не включают в свой состав населённые пункты, а наоборот, делят один город на несколько частей. В этом случае вычислить хэш по основному алгоритму невозможно, так как строка из guid получится пустой во всех случаях и перестанет быть уникальной. Для таких муниципальных образований хэш — это md5sum от строки вида «кодНаименование» (без пробела, например: «45319000муниципальный округ Крылатское»). В таком случае при изменении кода ОКТМО или наименования хэш меняется, что позволяет отслеживать переименование при сохранении кода или изменение кода при сохранении наименования. Выбранный алгоритм расстановки хэша не позволяет отследить ситуации, когда одновременно менялись все характерные признаки муниципального образования: код ОКТМО, наименование, состав. Например, если городское поселение «Город А» с кодом 99 601 101, включающее в свой состав город с guid 1000, переименовали в «Город Б», поменяли код на 99 601 102 и добавили в его состав посёлок городского типа с guid 1001, то в результате у городского поселения «Город А» и городского поселения «Город Б» будут разные наименования, коды ОКТМО и хэши, и отследить их преемственность напрямую будет невозможно. Вариант в такой ситуации — смотреть состав муниципальных образований и сравнивать список населённых пунктов.
Сведения по муниципальным образованиям обогащены нормализованными наименованиями регионов, уровнем (1 или 2) и типом муниципального образования.
Расстановка типов проходила по следующему алгоритму:
- если муниципальное образование первого уровня (lvl = 1), то тип определяется по третьей цифре кода ОКТМО (например, 81 657 000 Хоринский муниципальный район):
- 3 — внутригородская территория города федерального значения,
- 5 — муниципальный округ,
- 6 — муниципальный район,
- 7 — городской округ;
- если определить по третьей цифре не получилось и регион — город федерального значения (первые две цифры ОКТМО — 40, 45, 67), то тип — внутригородская территория города федерального значения.
- если определить по третьей цифре не получилось и регион — не город федерального значения, то тип определяется по четвертой и пятой цифрам (например, 71 871 000 город Ханты-Мансийск):
- 10–30 — муниципальный район,
- 30–49 — муниципальный округ,
- 50–99 — городской округ;
- исключение из правил: oktmo = 30832000 — муниципальный район;
- если муниципальное образование второго уровня (lvl = 2), то тип определяется по шестой цифре кода ОКТМО (например, 82 605 440 село Лологонитль):
- 1 — городское поселение,
- 3 — внутригородской район,
- 4 — сельское поселение,
- 7 — межселенная территория.
Расстановка уровня муниципального образования проходила по следующему алгоритму: если шестая цифра кода ОКТМО — ноль, то уровень 1, иначе 2. Например, 01 657 000 (Целинный муниципальный район) — уровень 1, а 01 611 489 (Чистоозёрский сельсовет) — уровень 2.
Сведения по населенным пунктам также обогащены типом территориальной единицы. Расстановка типов проходила по трем последним цифрам кода ОКТМО (например, 99 701 000 001 г Биробиджан):
- 001–049 — город;
- 051–099 — поселок городского типа (рабочие поселки, курортные поселки, дачные поселки, поселки, городские поселки);
- 101–999 — сельский населенный пункт (поселки, села, станицы, деревни, хутора, кишлаки, аулы и др.).
Источники данных
ОКТМО в разделе «открытые данные» сайта Росстата
Атрибут | Значение |
---|---|
Полное наименование источника данных | Набор данных «Общероссийский классификатор территорий муниципальных образований (ОКТМО)», размещённый в разделе «открытые данные» сайта Росстата. |
Сокращенное наименование источника данных | Открытые данные Росстата. |
Владелец источника данных | Федеральная служба государственной статистики (Росстат). |
Краткое описание источника данных | Набор данных Росстата по ОКТМО — это CSV-таблица, которая содержит классификатор целиком. Каждая версия набора данных соответствует классификатору в том состоянии, в котором он был на определённый период времени с учётом всех накопленных изменений. Помимо сведений, содержащихся в классификаторе, в таблице указаны метаданные: номер и тип изменения (если запись в классификаторе менялась), дата введения записи в действие. |
Ссылка на источник данных | https://rosstat.gov.ru/opendata/7708234640-oktmo |
Перечень используемых классификаторов | Общероссийский классификатор территорий муниципальных образований (ОКТМО) |
Понятия, используемые в источнике | ОКТМО — общероссийский классификатор территорий муниципальных образований. Представляет собой перечень всех муниципальных образований и населённых пунктов России, где у каждой записи указан уникальный код. Муниципальное образование — территория, в границах которой осуществляется местное самоуправление. С точки зрения территориального деления, по сути, представляет собой территориальную единицу в составе субъекта России, занимающую промежуточное положение в ряду «субъект — муниципальное образование — населённый пункт». Территория субъекта делится на территории муниципальных образований. Муниципальные образования могут быть двух уровней. Помимо муниципальных образований, есть административно-территориальные образования — это другие территориальные единицы, границы которых могут совпадать с границами муниципальных образований, а могут не совпадать. Типы (виды) муниципальных образований:
Муниципальные образования первого уровня — муниципальные образования, территории которых не входят в состав территорий других муниципальных образований. К ним относятся муниципальные округа, городские округа (в том числе городские округа с внутригородским делением), муниципальные районы, внутригородские территории городов федерального значения. |
Методология и изменения методологии для источника данных | Порядок составления ОКТМО описан во введении к нему. Объекты классификации — муниципальные образования и населённые пункты. Соответственно, ОКТМО состоит из двух разделов: в первом кодируются муниципальные образования, во втором — населённые пункты. Коды муниципальных образований состоят из 8 цифр, коды населённых пунктов — из 11. Первые 8 цифр кода населённого пункта — это код муниципального образования, внутри которого он находится. Код муниципального образования имеет вид AA BBB CCC:
Код населённого пункта имеет вид AA BBB CCC DDD, где первые три части — такие же, как в коде муниципального образования, а DDD — это код населённого пункта внутри муниципального образования. |
Ссылки на методологию | http://www.consultant.ru/document/cons_doc_LAW_149911/fe0fcde01af39800bd620af2a8e83bd5634875f4/ |
Перекодировочные таблицы аннулированных кодов ОКТМО
Атрибут | Значение |
---|---|
Полное наименование источника данных | Перекодировочные таблицы аннулированных кодов ОКТМО |
Сокращенное наименование источника данных | Перекодировочные таблицы ОКТМО |
Владелец источника данных | Федеральная служба государственной статистики (Росстат). |
Краткое описание источника данных | Перекодировочные таблицы — текстовые документы. Каждый такой документ относится к одному изменению ОКТМО и содержит одну таблицу. В таблице отражено изменение кода одного и того же населённого пункта: в одном поле указан старый код, в другом — новый. Изменение кодов муниципальных образований в перекодировочных таблицах не отражено. Если населённый пункт исчез и его код был аннулирован, то поле с новым кодом остаётся пустым. Если населённого пункта не было, и он появился, то в перекодировочную таблицу он не включается. |
Ссылка на источник данных | https://rosstat.gov.ru/classification |
Перечень используемых классификаторов | Общероссийский классификатор территорий муниципальных образований (ОКТМО) |
Понятия, используемые в источнике | — |
Методология и изменения методологии для источника данных | — |
Ссылки на методологию | — |
Таблицы соответствия кодов ОКАТО кодам ОКТМО муниципальных образований и входящих в их состав населенных пунктов и межселенных территорий Минфина
Атрибут | Значение |
---|---|
Полное наименование источника данных | Таблицы соответствия кодов ОКАТО кодам ОКТМО муниципальных образований и входящих в их состав населенных пунктов и межселенных территорий Минфина |
Сокращенное наименование источника данных | Таблицы соответствия между ОКАТО и ОКТМО |
Владелец источника данных | Министерство финансов Российской Федерации (Минфин России) |
Краткое описание источника данных | На странице сайта Минфина публикуются таблицы соответствия между кодами ОКАТО и ОКТМО. Каждая из таких таблиц отражает соответствие между кодами в определённый момент времени. Таблица — это файл Excel (иногда в zip- или rar-архиве), в которой, в частности, указаны код ОКАТО для той или иной территориальной единицы и соответствующий ей код ОКТМО. В некоторых случаях код ОКАТО или ОКТМО не указан: это значит, что он на тот момент не был присвоен. |
Ссылка на источник данных | https://minfin.gov.ru/ru/ismf/eiasmfrf/ |
Перечень используемых классификаторов | Общероссийский классификатор административно-территориальных образований (ОКАТО) Общероссийский классификатор территорий муниципальных образований (ОКТМО) |
Понятия, используемые в источнике | ОКАТО — общероссийский классификатор объектов административно-территориального деления. Представляет собой перечень административно-территориальных единиц и населённых пунктов, где у каждой записи указан уникальный код. Административно-территориальные единицы — не то же самое, что муниципальные образования, хотя их границы иногда совпадают. ОКТМО — общероссийский классификатор территорий муниципальных образований. Представляет собой перечень всех муниципальных образований и населённых пунктов России, где у каждой записи указан уникальный код. |
Методология и изменения методологии для источника данных | Порядок составления ОКАТО описан во введении к нему Территориальные органы Минфина проводили сопоставление ОКАТО и ОКТМО в соответствии с методическими рекомендациями, заполняя специальные таблицы и отправляя их в центральный аппарат ведомства. |
Ссылки на методологию | http://www.consultant.ru/document/cons_doc_LAW_35362/fe0fcde01af39800bd620af2a8e83bd5634875f4/ https://minfin.gov.ru/ru/document/?id_4=115768-prilozhenie |
Нормативно-правовые акты субъектов РФ, устанавливающие изменения муниципально-территориального устройства («Консультант Плюс»)
Атрибут | Значение |
---|---|
Полное наименование источника данных | Нормативно-правовые акты субъектов РФ, устанавливающие изменения муниципально-территориального устройства, размещенные на портале «Консультант Плюс». |
Сокращенное наименование источника данных | НПА об изменениях муниципально-территориального устройства |
Владелец источника данных | Субъекты РФ |
Краткое описание источника данных | Общие принципы изменений границ муниципального образования, а также изменения границ между субъектами РФ описаны в Федеральном законе от 06.10.2003 N 131-ФЗ (ред. от 01.07.2021) "Об общих принципах организации местного самоуправления в Российской Федерации" (с изм. и доп., вступ. в силу с 30.09.2021) http://www.consultant.ru/document/cons_doc_LAW_44571/ В датасете использовались нормативно-правовые акты субъектов РФ, устанавливающие изменения муниципально-территориального устройства, например, Закон Московской области от 07.04.2017 N 41/2017-ОЗ "Об отнесении города Павловский Посад Павлово-Посадского района Московской области к категории города областного подчинения Московской области, упразднении Павлово-Посадского района Московской области и внесении изменений в Закон Московской области "Об административно-территориальном устройстве Московской области" (принят постановлением Мособлдумы от 23.03.2017 N 16/19-П): http://www.consultant.ru/cons/cgi/online.cgi?req=doc&base=MOB&n=247183 |
Ссылка на источник данных | http://www.consultant.ru/ |
Перечень используемых классификаторов | — |
Понятия, используемые в источнике | — |
Методология и изменения методологии для источника данных | — |
Ссылки на методологию | — |
Ответственные за набор данных
№ | ФИО ответственного лица | Электронная почта ответственного лица |
1. |
Гостева Инесса Игоревна |
i.gosteva@cpur.ru |
2. |
Сёмин Павел Олегович |
p.semin@cpur.ru |