Примеры использования набора данных со средними ценами и структурой расходов

Материал из Data-in


Средние цены

Набор данных «Потребительские цены: объединённые панельные данные Росстата по средним ценам и индексам цен» представляет интерес для исследований динамики инфляции и цен в территориальном разрезе. К примеру, можно отслеживать изменения цены как на конкретные товары или услуги, так и на полноценную потребительскую корзину или определенный набор.

Например, мы взяли рецепт из «Книги о вкусной и здоровой пище» 1939 года издания и построили помесячный график стоимости продуктов, необходимых для приготовления четырех порций борща. Можно заметить ,что стоимость увеличивается постепенно, причем основной вклад в увеличение стоимости борща вносит рост цены на мясо, а цена на овощи растет меньше. Любопытно, что стоимость мяса также подвержена сезонному колебанию цен.

[

Если включить в анализ пространственный разрез, то оказывается, что самый дорогой борщ на Чукотке, Камчатке, Магадане и в Мурманской и Сахалинской областях.

Помимо этого, можно смотреть на стоимость в разрезе регионов и населенных пунктов, что может быть полезно при исследованиях российских регионов, к примеру в контексте неравенства или доступности тех или иных услуг. Например, из нематериальных товаров можно построить карту стоимости, наверное самой распространенной медицинской манипуляции — установки зубной пломбы. Дороже всего лечение зубов обойдется в Москве и Санкт-Петербурге, а также Чукотке, Мурманской области и Республике Коми. Там стоимость установки пломбы может превышать четыре тысячи рублей.



Также набор данных позволяет исследовать влияние шоков или иных внешних факторов на динамику цен. Данные по индексам потребительских цен представляют интерес в контексте исследований инфляции, в том числе региональную вариацию. К тому же детальные данные по ИПЦ позволяют отследить за счет изменения цен на какие конкретные товары и услуги менялась инфляция. К примеру, в 2006 году общенациональная инфляция в значительной степени выросла за счет скачка цен на соль в некоторых регионах центральной России. За исключением этого эпизода соль дорожала равномерно.


Стоимость гречки оказывается подвержена резким сезонным колебаниям, которые оказываются вызваны либо неурожаем гречки (эту культуру Россия для внутреннего потребления производит самостоятельно), либо экономическим шоками, вызванными неожиданными событиями.


Напротив, стоимость хлеба оказывается относительно стабильной на всем промежутке времени, за который доступны данные за исключением Международного экономического кризиса 2008 года.


Для упрощения работы стоит отфильтровать даты, территориальные единицы, и группы товаров и услуг, которые представляют интерес для исследователя воспользовавшись словарями. Например, чтобы получить данные о ценах на соль в среднем по стране в 2004 году, надо отфильтровать значения с kipc == 2002 (Соль поваренная пищевая, кг), type == 10 (средняя цена), okato = 643 (Российская Федерация) и year == 2004.

Структура расходов

Набор данных structure_2012-2022 в свою очередь может быть интересен для исследования временной динамики потребления и имущественного неравенства в территориальном разрезе. В частности, можно напрямую отследить какую долю своего дохода граждане тратят на определенный вид товаров или услуг, например высокая доля расходов на еду может служить индикатором низких доходов. К тому же этот набор данных дополняет информацию о ценах, позволяя исследовать не просто абсолютные, но и относительные (относительно дохода определенной группы населения) значения. Аналогичным образом, стоит пользоваться словарями для того, чтобы отфильтровать интересующие исследователя временные промежутки, территориальные единицы, группы населения и типы товаров и услуг. Например, чтобы получить данные о доле расходов жителей Хабаровского края на сырки творожные, глазированные шоколадом необходимо отфильтровать значения с kipc == 1126 и okato == 8000000.