Показатели валового регионального продукта в России: объединенные данные за 1998—2019 гг
История изменений
Дата |
Версия |
Автор |
Описание изменений |
18.11.2021 |
1.0 |
Гостева Инесса Игоревна |
Документ создан |
Общая информация о датасете
Ежегодные показатели валового регионального продукта (в субъектах РФ) за период с 1998 по 2019 г. Публикуются как официальная статистическая информация на сайте Росстата. В ходе подготовки датасета эти сведения были спарсены и преобразованы в панельные данные в машиночитаемом формате.
Единица наблюдения в датасете — субъект РФ за конкретный год. Данные для каждого наблюдения приведены по следующим атрибутам: ОКАТО, территориальная единица, год, показатель, вид деятельности по ОКВЭД (при наличии), значение показателя и др. Основная проблема при формировании длинного исторического ряда по ВРП заключается в смене классификатора ОКВЭД в 2017 г.
При обработке данных в таблице data_by_kind_of_activity.csv была предпринята попытка сформировать объединенные сведения по схожим разделам ОКВЭД и ОКВЭД-2. Сопоставление разделов по наименованию приведено в таблице okved_matching.csv. В таблице data_by_okved.csv приведены изначальные данные без объединения.
Набор доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»).
Общее описание набора данных
Атрибут |
Значение |
Наименование набора данных |
Показатели валового регионального продукта в России: объединенные данные за 1998—2019 гг. |
Краткое описание набора данных |
Ежегодные показатели валового регионального продукта (в субъектах РФ) за период с 1998 по 2019 г. Публикуются как официальная статистическая информация на сайте Росстата. В ходе подготовки датасета эти сведения были спарсены и преобразованы в панельные данные в машиночитаемом формате.
Единица наблюдения в датасете — субъект РФ за конкретный год. Данные для каждого наблюдения приведены по следующим атрибутам: ОКАТО, территориальная единица, год, показатель, вид деятельности по ОКВЭД (при наличии), значение показателя и др. Основная проблема при формировании длинного исторического ряда по ВРП заключается в смене классификатора ОКВЭД в 2017 г. При обработке данных в таблице data_by_kind_of_activity.csv была предпринята попытка сформировать объединенные сведения по схожим разделам ОКВЭД и ОКВЭД-2. Сопоставление разделов по наименованию приведено в таблице okved_matching.csv. В таблице data_by_okved.csv приведены изначальные данные без объединения. Набор доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»). |
Источник набора данных |
|
Покрываемый временной период |
1998—2019 гг. |
Доступные форматы |
CSV (кодировка: «UTF-8», разделитель: «;») |
Размер набора данных |
45,3 МБ |
Тематика набора данных |
Экономика |
Режим доступа |
Открытый (у вас есть возможность работать с данными на своем личном ПК, в том числе и скачивать данные) |
Дата размещения в каталоге |
18.11.2021 |
Периодичность обновления в каталоге |
Ежегодно |
Дата последнего обновления набора данных в каталоге |
Отсутствует |
Цитирование набора данных на русском языке |
Показатели валового регионального продукта в России: объединенные данные за 1998—2019 гг. // Росстат; обработка: Гостева И.И., Инфраструктура научно-исследовательских данных, АНО «ЦПУР», 2021. Доступ: Лицензия CC BY-SA. Размещено: 18.11.2021. URL: http://data.rcsi.science/data-catalog/datasets/184 |
For references (English) |
Gross Regional Product (GRP) in Russia: combined data for 1998—2019 // Rosstat; data-processing: Gosteva I., The Research Development Infrastructure (RDI), CAG, 2021. Access: License CC BY-SA. Posted: 18.11.2021. URL: http://data.rcsi.science/data-catalog/datasets/184 |
Лицензия, под которой публикуется набор данных |
|
Стандарт публикации |
|
Параметры запросов API |
Интеграция через API не предусмотрена |
Структура набора данных (Codebook)
Датасет представлен в виде трех плоских таблиц (формат данных: CSV; кодировка: «UTF-8», разделитель: «;»):
- data_by_okved.csv: «Ключевые показатели ВРП в разрезе ОКВЭД, ОКВЭД-2»; 59 026 строк; 10 атрибутов;
- data_by_kind_of_activity.csv: «Ключевые показатели ВРП в разрезе видов деятельности (объединенные ряды на основании разделов ОКВЭД/ОКВЭД-2)»: 55 448 строк; 8 атрибутов;
- okved_matching.csv: «Сопоставление разделов ОКВЭД и ОКВЭД-2»: 40 строк; 3 атрибута.
Ключевые показатели ВРП в разрезе ОКВЭД, ОКВЭД-2 (data_by_okved.csv)
Атрибут |
Описание |
Количество пропусков (NaN) (шт/%) |
Единица измерения |
ОКЕИ |
Формат |
id |
ID наблюдения |
0 (0%) |
integer | ||
okato |
ОКАТО |
0 (0%) |
varchar | ||
location |
Территориальная единица. Например, «Российская Федерация», «Центральный федеральный округ», «Курская область» и пр. |
0 (0%) |
varchar | ||
indicator |
Показатель. Например, «Валовой региональный продукт на душу населения по субъектам Российской Федерации» |
0 (0%) |
varchar | ||
okved_version |
Версия ОКВЭД |
0 (0%) |
varchar | ||
okved_section |
Раздел ОКВЭД. Например, «Раздел J» |
0 (0%) |
varchar | ||
okved_name |
Наименование раздела ОКВЭД. Например, «Финансовая деятельность» |
0 (0%) |
varchar | ||
units |
Единицы |
0 (0%) |
varchar | ||
year |
Год |
0 (0%) |
integer | ||
value |
Значение |
0 (0%) |
numeric |
Ключевые показатели ВРП в разрезе видов деятельности (объединенные ряды на основании разделов ОКВЭД/ОКВЭД-2)» (data_by_kind_of_activity.csv)
Атрибут |
Описание |
Количество пропусков (NaN) (шт/%) |
Единица измерения |
ОКЕИ |
Формат |
id |
ID наблюдения |
0 (0%) |
integer | ||
okato |
ОКАТО |
0 (0%) |
varchar | ||
location |
Территориальная единица. Например, «Российская Федерация», «Центральный федеральный округ», «Курская область» и пр. |
0 (0%) |
varchar | ||
indicator |
Показатель. Например, «Валовой региональный продукт на душу населения по субъектам Российской Федерации» |
0 (0%) |
varchar | ||
kind_of_activity |
Обобщенное наименование вида деятельности на основе наименований разделов ОКВЭД/ОКВЭД-2. Например, «Сельское, лесное хозяйство, охота, рыболовство и рыбоводство» |
0 (0%) |
varchar | ||
units |
Единицы |
0 (0%) |
varchar | ||
year |
Год |
0 (0%) |
integer | ||
value |
Значение |
0 (0%) |
numeric |
Сопоставление разделов ОКВЭД и ОКВЭД-2 (okved_matching.csv)
Атрибут |
Описание |
Количество пропусков (NaN) (шт/%) |
Единица измерения |
ОКЕИ |
Формат |
okved_version |
Версия ОКВЭД |
0 (0%) |
varchar | ||
name_by_okved |
Наименование вида деятельности ОКВЭД/ОКВЭД-2 |
0 (0%) |
varchar | ||
generic_name |
Обобщенное наименование |
0 (0%) |
varchar |
Внесенные в набор данных изменения по сравнению с источниками
- Данные извлечены из xlsx-файлов и преобразованы в машиночитаемую таблицу в формате панельных данных.
- Наименования территориальных единиц нормализованы, например, «Ненецкий авт. округ» нормализован как «Ненецкий автономный округ». Набор обогащен кодом ОКАТО (за исключением наблюдений по РФ в целом, федеральным округам и территориальным единицам, не имеющим кода ОКАТО («Архангельская область без автономного округа» и «Тюменская область без автономных округов»)).
- Таблица «Ключевые показатели ВРП в разрезе видов деятельности (объединенные ряды на основании разделов ОКВЭД/ОКВЭД-2)» (data_by_kind_of_activity.csv) составлена на основе таблицы «Ключевые показатели ВРП в разрезе ОКВЭД, ОКВЭД-2» (data_by_okved.csv), при этом виды деятельности разделов ОКВЭД/ОКВЭД-2 объединены согласно логике и общему контексту.
Например:- «Раздел C: Добыча полезных ископаемых» ОКВЭД соответствует разделу «Раздел B: Добыча полезных ископаемых» ОКВЭД-2;
- «Раздел A: Сельское хозяйство, охота и лесное хозяйство» и «Раздел B: Рыболовство, рыбоводство» ОКВЭД соответствуют «Раздел A: Сельское, лесное хозяйство, охота, рыболовство и рыбоводство» ОКВЭД-2. При этом значения нескольких разделов одной версии ОКВЭД, соответствующие одному разделу другой версии ОКВЭД, суммировались;
- в случае если соответствие не найдено, наименование оставлено оригинальным, например, «Раздел О: Предоставление прочих коммунальных, социальных и персональных услуг» ОКВЭД и «Раздел M: Деятельность профессиональная, научная и техническая» ОКВЭД-2.
Источники данных
Атрибут |
Значение |
Полное наименование источника данных |
Официальный сайт Росстата |
Владелец источника данных |
Росстат |
Краткое описание источника данных |
Данные по ключевым показателям ВРП публикуются на официальном сайте Росстата |
Ссылка на источник данных |
|
Понятия, используемые в источнике |
Валовой региональный продукт (ВРП) — обобщающий показатель экономической деятельности региона, характеризующий процесс производства товаров и услуг для конечного использования |
Методология сбора данных в источнике (ссылка) |
https://www.gks.ru/bgd/regl/B08_14p/IssWWW.exe/Stg/d2/11-08.htm https://rosstat.gov.ru/storage/mediabank/WXWTVX2I/Понятия%20и%20определения%20(ВРП).pdf |
Ответственные за набор данных
№ | ФИО ответственного лица | Электронная почта |
---|---|---|
1. | Гостева Инесса Игоревна | i.gosteva@cpur.ru |