Адресный классификатор: ФИАС + Почта России: различия между версиями

Материал из Data-in
(→‎Общее описание набора данных: раздел заполнен (чист.))
(→‎Структура набора данных (Codebook): раздел заполнен (чист.))
Строка 102: Строка 102:


== Структура набора данных (Codebook) ==
== Структура набора данных (Codebook) ==
Датасет представлен в виде плоской таблицы, содержащей 11 атрибутов, 26 072 081 наблюдений. <br>
Формат данных: CSV (кодировка: «UTF-8», разделитель: «;»)
{| class="wikitable"
|- style="background-color:#D2FEF0;"
! style="font-weight:bold;" | Атрибут
! Описание
! Количество пропусков (NaN) (шт/%)
! Единица измерения 
! ОКЕИ 
! Формат 
|-
| region
| Уровень федерального округа
| 0,0%
|
|
| string
|-
| municipality
| Уровень муниципального округа
| 41,8%
|
|
| string
|-
| municipality_type
| Тип уровня муниципального округа
| 41,8%
|
|
| string
|-
| settlement
| Уровень населенного пункта
| 4,5%
|
|
| string
|-
| settlement_type
| Тип уровня населенного пункта
| 4,5%
|
|
| string
|-
| location
| Уровень локации
| 77,2%
|
|
| string
|-
| location_type
| Тип уровня локации
| 77,2%
|
|
| string
|-
| street
| Уровень улицы
| 17,1%
|
|
| string
|-
| street_type
| Тип уровня улицы
| 17,1%
|
|
| string
|-
| house
| Уровень дома
| 0,0%
|
|
| string
|-
| source
| Код источника данных об адресе<br>1 - ФИАС<br>2 - Почта России
| 0,0%
|
|
| int
|}
== Известные ограничения данных ==
== Известные ограничения данных ==
== Внесенные в набор данных изменения по сравнению с источниками ==
== Внесенные в набор данных изменения по сравнению с источниками ==
== Источники данных ==  
== Источники данных ==  
== Ответственные за набор данных ==
== Ответственные за набор данных ==

Версия 09:21, 13 октября 2021

Общая информация о датасете

Набор содержит объединённые из двух источников (ФИАС и Почта России) географические данные РФ с детализацией до дома.

Цель датасета — создание единого максимально полного классификатора (эталона) географических данных, с помощью которого можно было бы осуществлять поиск и привязку географических объектов к официальным стандартизированным геоданным. Для осуществления этой привязки можно использовать библиотеку, доступную в публичном репозитории на Github

Единица наблюдения в датасете — адрес объекта недвижимости. Данные для каждого наблюдения приведены по следующим атрибутам: федеральный округ, субъект РФ, муниципальное образование, населенный пункт, локация, улица, дом.

Набор данных охватывает все регионы Российской Федерации. Всего набор содержит 26 072 081 наблюдений по 11 атрибутам.

Набор доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»)

История изменений

Дата Версия Автор Описание изменений
14.10.2021 1.0 Валько Данила Валерьевич
Глонин Константин Вячеславович
Давыдов Николай Юрьевич
Документ создан

Общее описание набора данных

Атрибут Значение
Общие сведения
Полное наименование набора данных Адресный классификатор: объединённые географические данные ФИАС и Почты России с точностью до дома
Сокращенное наименование набора данных Адресный классификатор: ФИАС + Почта России
Краткое описание набора данных Эталонный датасет, позволяющий осуществить поиск и привязку географических объектов к официальным стандартизированным геоданным. Для осуществления привязки воспользуйтесь библиотекой по ссылке https://github.com/CAG-ru/geonorm
Краткое описание источника набора данных 1) Федеральная информационная адресная система - хранит и обновляет (до 31.08.2021 г.) данные об адресных объектах, расположенных на территории РФ: субъектах РФ, районах, населенных пунктах, улицах, домах и др.
2) Адресный справочник Почты России
Покрываемый временной период Актуален на 14.10.2021
Доступные форматы CSV (кодировка: «UTF-8», разделитель: «;»)
Размер набора данных 3,2 ГБ
Тематика набора данных Геоданные, Эталоны
Режим доступа Открытый (у Вас есть возможность работать с данными на своем личном ПК, в том числе и скачивать данные)
Периодичность публикации и обновления
Дата размещения в каталоге 14.10.2021
Периодичность обновления в каталоге Ежеквартально
Дата последнего обновления набора данных в каталоге отсутствует
Характер последнего обновления
Дата следующего обновления набора данных 14.01.2022
Дополнительные сведения
Цитирование набора данных на русском языке Адресный классификатор: объединённые географические данные ФИАС и Почты России с детализацией до дома // ФИАС, ФНС России; Почта России; обработка: Валько Д.В., Глонин К.В., Давыдов Н.Ю., Инфраструктура научно-исследовательских данных, АНО «ЦПУР», 2021. Доступ: Лицензия CC BY-SA. Размещено: 14.10.2021. URL: http://data.rcsi.science/data-catalog/datasets/179
For references (English) Address classifier: geodata of FIAS and Russian Post with detailing to the building // Federal Tax Service of Russia, Russian Post; data-processing: Valko D., Glonin K., Davydov N., The Research Development Infrastructure (RDI), CAG, 2021. Access: License CC BY-SA. Posted: 14.10.2021. URL: http://data.rcsi.science/data-catalog/datasets/179
Ссылка на открытый репозиторий отсутствует
Геоданные (пространственная привязка набора данных) Есть привязка по адресам
Лицензия, под которой публикуется набор данных СС BY-SA (Creative Commons)
https://creativecommons.org/licenses/by-sa/4.0/
Допускается использование, копирование и распространение данных в научно-исследовательских, коммерческих и любых иных целях. При преобразовании материала разрешается распространять переделанные части материала на условиях этой же лицензии —
CC BY-SA
Стандарт публикации http://opendata.gosmonitor.ru/standard/3.0
Параметры запросов API Интеграция через API не предусмотрена

Структура набора данных (Codebook)

Датасет представлен в виде плоской таблицы, содержащей 11 атрибутов, 26 072 081 наблюдений.
Формат данных: CSV (кодировка: «UTF-8», разделитель: «;»)

Атрибут Описание Количество пропусков (NaN) (шт/%) Единица измерения ОКЕИ Формат
region Уровень федерального округа 0,0% string
municipality Уровень муниципального округа 41,8% string
municipality_type Тип уровня муниципального округа 41,8% string
settlement Уровень населенного пункта 4,5% string
settlement_type Тип уровня населенного пункта 4,5% string
location Уровень локации 77,2% string
location_type Тип уровня локации 77,2% string
street Уровень улицы 17,1% string
street_type Тип уровня улицы 17,1% string
house Уровень дома 0,0% string
source Код источника данных об адресе
1 - ФИАС
2 - Почта России
0,0% int

Известные ограничения данных

Внесенные в набор данных изменения по сравнению с источниками

Источники данных

Ответственные за набор данных