Загрязнение поверхностных вод в России: ежемесячные данные о высоком и экстремально высоком загрязнении водных объектов за 2008—2021 гг: различия между версиями

Материал из Data-in
(→‎История изменений: 5. убраны br (пустое пространство))
(→‎Общая информация о датасете: Поправлены ошибки (дата конца наблюдений исправлена с 07 на 08))
 
(не показано 14 промежуточных версий этого же участника)
Строка 1: Строка 1:
<div>
== История изменений ==
 
= История изменений =
{| class="wikitable" style="width: 100%; border-style: solid;"
{| class="wikitable" style="width: 100%; border-style: solid;"
|- style="background-color:#e5fffb; font-family: TT Norms Medium;"
|- style="background-color:#e5fffb; font-family: TT Norms Medium;"
<p>'''Дата'''</p>
|  Дата
<p>'''Версия'''</p>
|  Версия
<p>'''Автор'''</p>
|  Автор
<p>'''Описание изменений'''</p>
|  Описание изменений
|- style="background-color:#ffffff;"
|- style="background-color:#ffffff;"
|rowspan="2"|  <p>23.09.2021</p>
|rowspan="2"|  <p>23.09.2021</p>
Строка 17: Строка 15:
|}
|}


= Общая информация о датасете =
== Общая информация о датасете ==
<p>Набор данных включает в себя ежемесячные сведения о загрязнении поверхностных водных объектов на территории России за период с 2008 по 2021 г. Экстремально высокие загрязнения доступны с детализацией до муниципальных образований; высокие загрязнения — с детализацией до субъекта РФ. Эти сведения публикуются в ежемесячных отчетах Росгидромета на официальном сайте в виде файлов в формате docx. В ходе подготовки этого датасета данные были собраны из этих файлов и преобразованы в машиночитаемые таблицы в формате панельных данных, а также обогащены дополнительными атрибутами.</p>
<p>Набор данных включает в себя ежемесячные сведения о загрязнении поверхностных водных объектов на территории России за период с 2008 по 2021 г. Экстремально высокие загрязнения доступны с детализацией до муниципальных образований; высокие загрязнения — с детализацией до субъекта РФ. Эти сведения публикуются в ежемесячных отчетах Росгидромета на официальном сайте в виде файлов в формате docx. В ходе подготовки этого датасета данные были собраны из этих файлов и преобразованы в машиночитаемые таблицы в формате панельных данных, а также обогащены дополнительными атрибутами.</p>
<p>Единица наблюдения в датасете — место, в котором зафиксирован случай или случаи высокого или экстремально высокого загрязнения водного объекта за отчетный период (месяц). Данные для каждого наблюдения приведены по следующим атрибутам: регион, населенный пункт, в котором или вблизи которого произошел случай, наименование загрязняющего вещества или другого индикатора загрязнения, концентрация загрязняющего вещества или значение иного индикатора, класс опасности загрязняющего вещества и др.</p>
<p>Единица наблюдения в датасете — место, в котором зафиксирован случай или случаи высокого или экстремально высокого загрязнения водного объекта за отчетный период (месяц). Данные для каждого наблюдения приведены по следующим атрибутам: регион, населенный пункт, в котором или вблизи которого произошел случай, наименование загрязняющего вещества или другого индикатора загрязнения, концентрация загрязняющего вещества или значение иного индикатора, класс опасности загрязняющего вещества и др.</p>
<p>Набор состоит из двух основных таблиц и одной вспомогательной:</p>
<p>Набор состоит из двух основных таблиц и одной вспомогательной:</p>
* <span style="background-color: #e5fffb">extreme_pollution.csv </span> (основная); 7671 наблюдение по 13 атрибутам за 01.01.2008 — 31.07.2021;</p>
* <span style="background-color: #e5fffb">extreme_pollution.csv </span> (основная); 7 671 наблюдение по 13 атрибутам за 01.01.2008 — 31.08.2021;
*  <span style="background-color: #e5fffb">high_pollution.csv</span> (основная) 10&nbsp;198 наблюдений по 11 атрибутам за 01.01.2008 — 31.07.2021;</p>
*  <span style="background-color: #e5fffb">high_pollution.csv</span> (основная) 10 198 наблюдений по 11 атрибутам за 01.01.2008 — 31.08.2021;
*  <span style="background-color: #e5fffb">pdk.csv</span> (вспомогательная): 212 наблюдений по 10 атрибутам.</p>
*  <span style="background-color: #e5fffb">pdk.csv</span> (вспомогательная): 212 наблюдений по 10 атрибутам.
<p>Набор доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»).</p>
<p>Набор доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»).</p>


= 1. Общее описание набора данных =
== Общее описание набора данных ==
{| class="wikitable" style="width: 100%; height: 20px; border-style: solid;"
{| class="wikitable" style="width: 100%; height: 20px; border-style: solid;"
|- style="background-color:#e5fffb; font-family: TT Norms Medium; text-align: center"
|- style="background-color:#e5fffb; font-family: TT Norms Medium; text-align: center"
| Атрибут  
| Атрибут
| Значение
| Значение
|- style="background-color:#ffffff;"
| style="padding: 5px 0 5px 0; height:25px; font-family: TT Norms Medium; text-align:center" colspan=2| Общие сведения
|- style="background-color:#ffffff;"
|- style="background-color:#ffffff;"
| <p>Полное наименование набора данных</p>
| style="padding: 5px 0 5px 0; height:25px; font-family: TT Norms Medium; text-align:center" colspan="2" | Общие сведения
| <p>Загрязнение поверхностных вод в России: ежемесячные данные о высоком и экстремально высоком загрязнении водных объектов за 2008—2021 гг.</p>
|- style="background-color:#ffffff;"
|- style="background-color:#ffffff;"  
<p>Полное наименование набора данных</p>
| <p>Сокращенное наименование набора данных</p>
|   <p>Загрязнение поверхностных вод в России: ежемесячные данные о высоком и экстремально высоком загрязнении водных объектов за 2008—2021 гг.</p>
| <p>Высокое и экстремально высокое загрязнение поверхностных вод в России</p>
|- style="background-color:#ffffff;"
|- style="background-color:#ffffff;"  
|   <p>Сокращенное наименование набора данных</p>
| <p>Краткое описание набора данных</p>
|   <p>Высокое и экстремально высокое загрязнение поверхностных вод в России</p>
| <p>Набор данных включает в себя ежемесячные сведения о загрязнении поверхностных водных объектов на территории России за период с 2008 по 2021 г. Экстремально высокие загрязнения доступны с детализацией до муниципальных образований; высокие загрязнения — с детализацией до субъекта РФ. Эти сведения публикуются в ежемесячных отчетах Росгидромета на официальном сайте в виде файлов в формате docx. В ходе подготовки этого датасета данные были собраны из этих файлов и преобразованы в машиночитаемые таблицы в формате панельных данных, а также обогащены дополнительными атрибутами.</p>
|- style="background-color:#ffffff;"
|   <p>Краткое описание набора данных</p>
|   <p>Набор данных включает в себя ежемесячные сведения о загрязнении поверхностных водных объектов на территории России за период с 2008 по 2021 г. Экстремально высокие загрязнения доступны с детализацией до муниципальных образований; высокие загрязнения — с детализацией до субъекта РФ. Эти сведения публикуются в ежемесячных отчетах Росгидромета на официальном сайте в виде файлов в формате docx. В ходе подготовки этого датасета данные были собраны из этих файлов и преобразованы в машиночитаемые таблицы в формате панельных данных, а также обогащены дополнительными атрибутами.</p>
<p>Единица наблюдения в датасете — место, в котором зафиксирован случай или случаи высокого или экстремально высокого загрязнения водного объекта за отчетный период (месяц). Данные для каждого наблюдения приведены по следующим атрибутам: регион, населенный пункт, в котором или вблизи которого произошел случай, наименование загрязняющего вещества или другого индикатора загрязнения, концентрация загрязняющего вещества или значение иного индикатора, класс опасности загрязняющего вещества и др.</p>
<p>Единица наблюдения в датасете — место, в котором зафиксирован случай или случаи высокого или экстремально высокого загрязнения водного объекта за отчетный период (месяц). Данные для каждого наблюдения приведены по следующим атрибутам: регион, населенный пункт, в котором или вблизи которого произошел случай, наименование загрязняющего вещества или другого индикатора загрязнения, концентрация загрязняющего вещества или значение иного индикатора, класс опасности загрязняющего вещества и др.</p>
|- style="background-color:#ffffff;"
|- style="background-color:#ffffff;"
| <p>Краткое описание источника набора данных</p>
|   <p>Краткое описание источника набора данных</p>
| <p>В качестве первоисточника данных выступают ежемесячные отчеты Росгидромета об аварийном, экстремально высоком и высоком загрязнении окружающей среды, а также радиационной обстановке на территории России. В этих отчетах содержатся две таблицы: перечень случаев экстремально высокого загрязнения поверхностных вод суши и перечень случаев высокого загрязнения водных объектов. Эти таблицы были извлечены из отчетов, объединены, нормализованы, обогащены дополнительными данными</p>
|   <p>В качестве первоисточника данных выступают ежемесячные отчеты Росгидромета об аварийном, экстремально высоком и высоком загрязнении окружающей среды, а также радиационной обстановке на территории России. В этих отчетах содержатся две таблицы: перечень случаев экстремально высокого загрязнения поверхностных вод суши и перечень случаев высокого загрязнения водных объектов. Эти таблицы были извлечены из отчетов, объединены, нормализованы, обогащены дополнительными данными</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Покрываемый временной период</p>
|   <p>Покрываемый временной период</p>
| <p>2008—2021 гг.</p>
|   <p>2008—2021 гг.</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Доступные форматы</p>
|   <p>Доступные форматы</p>
| <p>CSV (кодировка: «UTF-8», разделитель: «;»)</p>
|   <p>CSV (кодировка: «UTF-8», разделитель: «;»)</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Размер набора данных</p>
|   <p>Размер набора данных</p>
| <p>2,75 МБ</p>
|   <p>2,75 МБ</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Тематика набора данных</p>
|   <p>Тематика набора данных</p>
| <p>Экология</p>
|   <p>Экология</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Режим доступа</p>
|   <p>Режим доступа</p>
| <p>Открытый (у вас есть возможность работать с данными на своем личном ПК, в том числе и скачивать данные)</p>
|   <p>Открытый (у вас есть возможность работать с данными на своем личном ПК, в том числе и скачивать данные)</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| style="padding: 5px 0 5px 0; height:25px; font-family: TT Norms Medium; text-align:center" colspan=2| Общие сведения
| style="padding: 5px 0 5px 0; height:25px; font-family: TT Norms Medium; text-align:center" colspan="2" | Периодичность публикации и обновления
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Дата размещения в каталоге</p>
|   <p>Дата размещения в каталоге</p>
| <p>23.09.2021</p>
|   <p>23.09.2021</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Дата последнего обновления набора данных в каталоге</p>
|   <p>Дата последнего обновления набора данных в каталоге</p>
| <p>Отсутствует</p>
|   <p>Отсутствует</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Характер последнего обновления</p>
|   <p>Характер последнего обновления</p>
| <p>—</p>
|   <p>—</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Периодичность обновления в каталоге</p>
|   <p>Периодичность обновления в каталоге</p>
| <p>Не обновляется</p>
|   <p>Не обновляется</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Дата следующего обновления набора данных</p>
|   <p>Дата следующего обновления набора данных</p>
| <p>Не обновляется</p>
|   <p>Не обновляется</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| style="padding: 5px 0 5px 0; height:25px; font-family: TT Norms Medium; text-align:center" colspan=2| Общие сведения
| style="padding: 5px 0 5px 0; height:25px; font-family: TT Norms Medium; text-align:center" colspan="2" | Дополнительные сведения
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Цитирование набора данных на русском языке</p>
|   <p>Цитирование набора данных на русском языке</p>
| <p>Загрязнение поверхностных вод в России: ежемесячные данные о высоком и экстремально высоком загрязнении водных объектов за 2008—2021 гг. // Росгидромет; обработка: Гостева И.И., Сёмин П.О., Инфраструктура научно-исследовательских данных, АНО «ЦПУР», 2021. Доступ: Лицензия CC BY-SA. Размещено: 23.09.2021. URL: http://data.rcsi.science/data-catalog/datasets/176</p>
|   <p>Загрязнение поверхностных вод в России: ежемесячные данные о высоком и экстремально высоком загрязнении водных объектов за 2008—2021 гг. // Росгидромет; обработка: Гостева И.И., Сёмин П.О., Инфраструктура научно-исследовательских данных, АНО «ЦПУР», 2021. Доступ: Лицензия CC BY-SA. Размещено: 23.09.2021. URL: http://data.rcsi.science/data-catalog/datasets/176</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>For references (English)</p>
|   <p>For references (English)</p>
| <p>Water pollution in Russia: monthly data on high and extremely high pollution of water surface for 2008—2021 // Roshydromet; data-processing: Gosteva I., Semin P., The Research Development Infrastructure (RDI), CAG, 2021. Access: License CC BY-SA. Posted: 09.23.2021. URL: http://data.rcsi.science/data-catalog/datasets/176</p>
|   <p>Water pollution in Russia: monthly data on high and extremely high pollution of water surface for 2008—2021 // Roshydromet; data-processing: Gosteva I., Semin P., The Research Development Infrastructure (RDI), CAG, 2021. Access: License CC BY-SA. Posted: 09.23.2021. URL: http://data.rcsi.science/data-catalog/datasets/176</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Ссылка на открытый репозиторий</p>
|   <p>Ссылка на открытый репозиторий</p>
| <p>Отсутствует</p>
|   <p>Отсутствует</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Геоданные (пространственная привязка набора данных)</p>
|   <p>Геоданные (пространственная привязка набора данных)</p>
| <p>Отсутствуют</p>
|   <p>Отсутствуют</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Лицензия, под которой публикуется набор данных</p>
|   <p>Лицензия, под которой публикуется набор данных</p>
| <p>СС BY-SA (Creative Commons)</p>
|   <p>СС BY-SA (Creative Commons)</p>
<p>https://creativecommons.org/licenses/by-sa/4.0/</p>
<p>https://creativecommons.org/licenses/by-sa/4.0/</p>
<p>Допускается использование, копирование и распространение данных в научно-исследовательских, коммерческих и любых иных целях. При преобразовании материала разрешается распространять переделанные части материала на условиях этой же лицензии — <br>CC BY-SA</p>
<p>Допускается использование, копирование и распространение данных в научно-исследовательских, коммерческих и любых иных целях. При преобразовании материала разрешается распространять переделанные части материала на условиях этой же лицензии — <br>CC BY-SA</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Стандарт публикации</p>
|   <p>Стандарт публикации</p>
| <p>http://opendata.gosmonitor.ru/standard/3.0</p>
|   <p>http://opendata.gosmonitor.ru/standard/3.0</p>
|- style="background-color:#ffffff;"  
|- style="background-color:#ffffff;"
| <p>Параметры запросов API</p>
|   <p>Параметры запросов API</p>
| <p>Интеграция через API не предусмотрена</p>
|   <p>Интеграция через API не предусмотрена</p>
|}
|}
</div>


<br><div>


= 2. Структура набора данных (Codebook) =
<br><div></div>
 
== Структура набора данных (Codebook) ==
<p>Датасет представлен в виде трех плоских таблиц (формат данных: CSV; кодировка: «UTF-8», разделитель: «;»):</p>
<p>Датасет представлен в виде трех плоских таблиц (формат данных: CSV; кодировка: «UTF-8», разделитель: «;»):</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ''extreme_pollution.csv'': «Экстремально высокое загрязнение поверхностных вод»; временной период: 01.01.2008 — 31.07.2021; 7&nbsp;671 строка; 13 атрибутов;</p>
* <span style="background-color: #e5fffb">extreme_pollution.csv</span>: «Экстремально высокое загрязнение поверхностных вод»; временной период: 01.01.2008 — 31.07.2021; 7&nbsp;671 строка; 13 атрибутов;
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ''high_pollution.csv'': «Высокое загрязнение поверхностных вод»; временной период: 01.01.2008 — 31.07.2021; 10&nbsp;198 строк; 11 атрибутов;</p>
* <span style="background-color: #e5fffb">high_pollution.csv</span>: «Высокое загрязнение поверхностных вод»; временной период: 01.01.2008 — 31.07.2021; 10&nbsp;198 строк; 11 атрибутов;
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ''pdk.csv'': «Справочная информация по ПДК загрязняющих веществ»; 212 строк; 10 атрибутов.</p>
* <span style="background-color: #e5fffb">pdk.csv</span>: «Справочная информация по ПДК загрязняющих веществ»; 212 строк; 10 атрибутов.</p>
<p><br></p>
=== Таблица «Экстремально высокое загрязнение поверхностных вод» (<span style="background-color: #e5fffb">extreme_pollution.csv</span>)===
<p>'''2.1. Таблица «Экстремально высокое загрязнение поверхностных вод» (''extreme_pollution.csv'')'''</p>
{| class="wikitable" style="width: 100%; height: 20px; border-style: solid;"
<p>'''&nbsp;'''</p>
|- style="background-color:#ffffff"style="background-color:#e5fffb; font-family: TT Norms Medium"
 
| Атрибут
{|
| Описание
|-  
| Количество пропусков (NaN), шт. (%)
| <p>'''Атрибут'''</p>
| Единица измерения'''</p>
| <p>'''Описание'''</p>
| ОКЕИ
| <p>'''Количество'''</p>
|  Формат
<p>'''пропусков (NaN), шт. (%)'''</p>
|- style="background-color:#ffffff"style="background-color:#ffffff"
| <p>'''Единица измерения'''</p>
| <p>'''ОКЕИ'''</p>
<p>'''Формат'''</p>
|-  
|  <p>id</p>
|  <p>id</p>
|  <p>ID наблюдения в рамках набора данных</p>
|  <p>ID наблюдения в рамках набора данных</p>
<p><br></p>
|   
<p><br></p>
|   
<p><br></p>
|   
|  <p>integer</p>
|  <p>integer</p>
|-  
|- style="background-color:#ffffff"
|  <p>period</p>
|  <p>period</p>
|  <p>Последний день отчетного периода (месяца)</p>
|  <p>Последний день отчетного периода (месяца)</p>
|  <p>0 (0%)</p>
|  <p>0 (0%)</p>
|  <p><br></p>
|  <p><br></p>
<p><br></p>
|   
|  <p>date</p>
|  <p>date</p>
|-  
|- style="background-color:#ffffff"
|  <p>subject</p>
|  <p>subject</p>
|  <p>Наименование субъекта Российской Федерации, в котором зафиксирован случай загрязнения</p>
|  <p>Наименование субъекта Российской Федерации, в котором зафиксирован случай загрязнения</p>
|  <p>0 (0%)</p>
|  <p>0 (0%)</p>
<p><br></p>
|   
<p><br></p>
|   
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>municipality</p>
|  <p>municipality</p>
|  <p>Наименование муниципального образования Российской Федерации, в котором зафиксирован случай загрязнения</p>
|  <p>Наименование муниципального образования Российской Федерации, в котором зафиксирован случай загрязнения</p>
|  <p>347 (4%)</p>
|  <p>347 (4%)</p>
<p><br></p>
|   
<p><br></p>
|   
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>settlement</p>
|  <p>settlement</p>
|  <p>Наименование населенного пункта, в котором или вблизи которого произошло загрязнение</p>
|  <p>Наименование населенного пункта, в котором или вблизи которого произошло загрязнение</p>
Строка 161: Строка 155:
|  <p><br></p>
|  <p><br></p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>oktmo</p>
|  <p>oktmo</p>
<p>Значение кода ОКТМО для населенного пункта.</p>
|  Значение кода ОКТМО для населенного пункта.</p>
<p>Код ОКТМО населенных пунктов состоит из четырех частей и 11 знаков:</p>
<p>Код ОКТМО населенных пунктов состоит из четырех частей и 11 знаков:</p>
<p>2 знака — «код региона»;</p>
<p style="padding-left:2em">2 знака — «код региона»;</p>
<p>3 знака — «код района/города МО»;</p>
<p style="padding-left:2em">3 знака — «код района/города МО»;</p>
<p>3 знака — «код поселения МО»;</p>
<p style="padding-left:2em">3 знака — «код поселения МО»;</p>
<p>3 знака — «код населенного пункта МО»</p>
<p style="padding-left:2em">3 знака — «код населенного пункта МО»</p>
|  <p>347 (4%)</p>
|  <p>347 (4%)</p>
|  <p><br></p>
|  <p><br></p>
|  <p><br></p>
|  <p><br></p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>water_body</p>
|  <p>water_body</p>
|  <p>Наименование водного объекта, в котором зафиксировано загрязнение</p>
|  <p>Наименование водного объекта, в котором зафиксировано загрязнение</p>
Строка 181: Строка 175:
|  <p><br></p>
|  <p><br></p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>indicator</p>
|  <p>indicator</p>
|  <p>Загрязняющее вещество, по которому превышен ПДК, или иной показатель, значение которого не соответствует нормативу, что характеризует ситуацию как экстремально высокое загрязнение. Например, «Аммоний-ион», «Взвешенные вещества», «БПК5», «Водородный показатель (pH)»</p>
|  <p>Загрязняющее вещество, по которому превышен ПДК, или иной показатель, значение которого не соответствует нормативу, что характеризует ситуацию как экстремально высокое загрязнение. Например, «Аммоний-ион», «Взвешенные вещества», «БПК5», «Водородный показатель (pH)»</p>
Строка 188: Строка 182:
|  <p><br></p>
|  <p><br></p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>hazard_class</p>
|  <p>hazard_class</p>
|  <p>Класс опасности загрязняющего вещества:</p>
|  <p>Класс опасности загрязняющего вещества:</p>
<p>1-й класс — чрезвычайно опасные;</p>
<p style="padding-left:2em">1-й класс — чрезвычайно опасные;</p>
<p>2-й класс — высоко опасные;</p>
<p style="padding-left:2em">2-й класс — высоко опасные;</p>
<p>3-й класс — опасные;</p>
<p style="padding-left:2em">3-й класс — опасные;</p>
<p>4-й класс — умеренно опасные;</p>
<p style="padding-left:2em">4-й класс — умеренно опасные;</p>
<p>4-й Э — «экологический» подкласс 4 класса.</p>
<p style="padding-left:2em">4-й Э — «экологический» подкласс 4 класса.</p>
<p>Для иных индикаторов, которые не являются загрязняющими веществами (например, запах, БПК5 или pH), класс опасности не указан, так как не имеет смысла</p>
<p>Для иных индикаторов, которые не являются загрязняющими веществами (например, запах, БПК5 или pH), класс опасности не указан, так как не имеет смысла</p>
|  <p>0 (0%)</p>
|  <p>0 (0%)</p>
Строка 201: Строка 195:
|  <p><br></p>
|  <p><br></p>
|  <p>integer</p>
|  <p>integer</p>
|-  
|- style="background-color:#ffffff"
|  <p>cnt_cases</p>
|  <p>cnt_cases</p>
|  <p>Количество случаев загрязнения, зафиксированных в данном месте в данном месяце</p>
|  <p>Количество случаев загрязнения, зафиксированных в данном месте в данном месяце</p>
Строка 208: Строка 202:
|  <p><br></p>
|  <p><br></p>
|  <p>integer</p>
|  <p>integer</p>
|-  
|- style="background-color:#ffffff"
|  <p>value_min</p>
|  <p>value_min</p>
|  <p>Минимальная измеренная концентрация загрязняющего вещества или минимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время</p>
|  <p>Минимальная измеренная концентрация загрязняющего вещества или минимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время</p>
Строка 215: Строка 209:
|  <p><br></p>
|  <p><br></p>
|  <p>numeric</p>
|  <p>numeric</p>
|-  
|- style="background-color:#ffffff"
|  <p>value_max</p>
|  <p>value_max</p>
|  <p>Максимальная измеренная концентрация загрязняющего вещества или максимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время</p>
|  <p>Максимальная измеренная концентрация загрязняющего вещества или максимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время</p>
Строка 222: Строка 216:
|  <p><br></p>
|  <p><br></p>
|  <p>numeric</p>
|  <p>numeric</p>
|-  
|- style="background-color:#ffffff"
|  <p>unit</p>
|  <p>unit</p>
|  <p>Единица измерения значения, указанного в полях ''value_min, value_max'':</p>
|  <p>Единица измерения значения, указанного в полях <span style="background-color: #e5fffb">value_min,</span> <span style="background-color: #e5fffb">value_max</span>:</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ПДК — число раз, в которое зафиксированная концентрация загрязняющего вещества превышает его ПДК, действующий в данном месяце данного года. Иначе говоря, это частное от деления измеренной концентрации загрязняющего вещества на его ПДК;</p>
* ПДК — число раз, в которое зафиксированная концентрация загрязняющего вещества превышает его ПДК, действующий в данном месяце данного года. Иначе говоря, это частное от деления измеренной концентрации загрязняющего вещества на его ПДК;</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; мг/л — миллиграммы на литр;</p>
* мг/л — миллиграммы на литр;</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; pH — единицы pH;</p>
* pH — единицы pH;</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; балл — условная характеристика интенсивности запаха</p>
* балл — условная характеристика интенсивности запаха</p>
|  <p>0 (0%)</p>
|  <p>0 (0%)</p>
|  <p><br></p>
|  <p><br></p>
Строка 234: Строка 228:
|  <p>string</p>
|  <p>string</p>
|}
|}
 
=== Таблица «Высокое загрязнение поверхностных вод» (<span style="background-color: #e5fffb">high_pollution.csv</span>) ===
<p>'''&nbsp;'''</p>
{| class="wikitable" style="width: 100%; height: 20px; border-style: solid;"
<p>'''&nbsp;'''</p>
|- style="background-color:#ffffff"style="background-color:#e5fffb; font-family: TT Norms Medium"
<p>'''&nbsp;'''</p>
|  Атрибут
<p>'''&nbsp;'''</p>
|  Описание
<p>'''2.2. Таблица «Высокое загрязнение поверхностных вод» (''high_pollution.csv'')'''</p>
|  Количество пропусков (NaN), шт. (%)
<p>'''&nbsp;'''</p>
|  Единица измерения
 
|  ОКЕИ
{|
|  Формат
|-  
|- style="background-color:#ffffff"
<p>'''Атрибут'''</p>
<p>'''Описание'''</p>
<p>'''Количество'''</p>
<p>'''пропусков (NaN),'''</p>
<p>'''шт. (%)'''</p>
<p>'''Единица измерения'''</p>
<p>'''ОКЕИ'''</p>
<p>'''Формат'''</p>
|-  
|  <p>id</p>
|  <p>id</p>
|  <p>ID наблюдения в рамках набора данных</p>
|  <p>ID наблюдения в рамках набора данных</p>
Строка 259: Строка 244:
|  <p>'''&nbsp;'''</p>
|  <p>'''&nbsp;'''</p>
|  <p>integer</p>
|  <p>integer</p>
|-  
|- style="background-color:#ffffff"
|  <p>period</p>
|  <p>period</p>
|  <p>Последний день отчетного периода (месяца)</p>
|  <p>Последний день отчетного периода (месяца)</p>
Строка 266: Строка 251:
|  <p>'''&nbsp;'''</p>
|  <p>'''&nbsp;'''</p>
|  <p>date</p>
|  <p>date</p>
|-  
|- style="background-color:#ffffff"
|  <p>subject</p>
|  <p>subject</p>
|  <p>Наименование субъекта Российской Федерации, в котором произошло загрязнение</p>
|  <p>Наименование субъекта Российской Федерации, в котором произошло загрязнение</p>
Строка 273: Строка 258:
|  <p>'''&nbsp;'''</p>
|  <p>'''&nbsp;'''</p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>okato</p>
|  <p>okato</p>
|  <p>Код ОКАТО субъекта Российской Федерации, в котором произошло загрязнение</p>
|  <p>Код ОКАТО субъекта Российской Федерации, в котором произошло загрязнение</p>
Строка 280: Строка 265:
|  <p>'''&nbsp;'''</p>
|  <p>'''&nbsp;'''</p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>river_basin</p>
|  <p>river_basin</p>
|  <p>Название крупной реки, в речном бассейне которой зафиксировано загрязнение, либо указание на то, что загрязнение произошло в малой реке, озере, водохранилище или морской акватории.</p>
|  <p>Название крупной реки, в речном бассейне которой зафиксировано загрязнение, либо указание на то, что загрязнение произошло в малой реке, озере, водохранилище или морской акватории.</p>
Строка 288: Строка 273:
|  <p>'''&nbsp;'''</p>
|  <p>'''&nbsp;'''</p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>indicator</p>
|  <p>indicator</p>
|  <p>Загрязняющее вещество, по которому превышен ПДК, или иной показатель, значение которого не соответствует нормативу, что характеризует ситуацию как высокое загрязнение.</p>
|  <p>Загрязняющее вещество, по которому превышен ПДК, или иной показатель, значение которого не соответствует нормативу, что характеризует ситуацию как высокое загрязнение.</p>
Строка 296: Строка 281:
|  <p>'''&nbsp;'''</p>
|  <p>'''&nbsp;'''</p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>hazard_class</p>
|  <p>hazard_class</p>
|  <p>Класс опасности загрязняющего вещества:</p>
|  <p>Класс опасности загрязняющего вещества:</p>
<p>1-й класс — чрезвычайно опасные;</p>
<p style="padding-left:2em">1-й класс — чрезвычайно опасные;</p>
<p>2-й класс — высоко опасные;</p>
<p style="padding-left:2em">2-й класс — высоко опасные;</p>
<p>3-й класс — опасные;</p>
<p style="padding-left:2em">3-й класс — опасные;</p>
<p>4-й класс — умеренно опасные;</p>
<p style="padding-left:2em">4-й класс — умеренно опасные;</p>
<p>4-й Э — «экологический» подкласс 4 класса.</p>
<p style="padding-left:2em">4-й Э — «экологический» подкласс 4 класса.</p>
<p>Для иных индикаторов, которые не являются загрязняющими веществами (например, запах, БПК5 или pH), класс опасности не указан, так как не имеет смысла</p>
<p>Для иных индикаторов, которые не являются загрязняющими веществами (например, запах, БПК5 или pH), класс опасности не указан, так как не имеет смысла</p>
|  <p>0 (0%)</p>
|  <p>0 (0%)</p>
Строка 309: Строка 294:
|  <p>'''&nbsp;'''</p>
|  <p>'''&nbsp;'''</p>
|  <p>integer</p>
|  <p>integer</p>
|-  
|- style="background-color:#ffffff"
|  <p>cnt_cases</p>
|  <p>cnt_cases</p>
|  <p>Количество случаев загрязнения, зафиксированных в данном месте в данном месяце</p>
|  <p>Количество случаев загрязнения, зафиксированных в данном месте в данном месяце</p>
Строка 316: Строка 301:
|  <p>'''&nbsp;'''</p>
|  <p>'''&nbsp;'''</p>
|  <p>integer</p>
|  <p>integer</p>
|-  
|- style="background-color:#ffffff"
|  <p>value_min</p>
|  <p>value_min</p>
|  <p>Минимальная измеренная концентрация загрязняющего вещества или минимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время</p>
|  <p>Минимальная измеренная концентрация загрязняющего вещества или минимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время</p>
Строка 323: Строка 308:
|  <p>'''&nbsp;'''</p>
|  <p>'''&nbsp;'''</p>
|  <p>numeric</p>
|  <p>numeric</p>
|-  
|- style="background-color:#ffffff"
|  <p>value_max</p>
|  <p>value_max</p>
|  <p>Максимальная измеренная концентрация загрязняющего вещества или максимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время</p>
|  <p>Максимальная измеренная концентрация загрязняющего вещества или максимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время</p>
Строка 330: Строка 315:
|  <p>'''&nbsp;'''</p>
|  <p>'''&nbsp;'''</p>
|  <p>numeric</p>
|  <p>numeric</p>
|-  
|- style="background-color:#ffffff"
|  <p>unit</p>
|  <p>unit</p>
|  <p>Единица измерения значения, указанного в полях ''value_min, value_max'':</p>
|  <p>Единица измерения значения, указанного в полях <span style="background-color: #e5fffb">value_min, value_max</span>:</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ПДК — число раз, в которое зафиксированная концентрация загрязняющего вещества превышает его ПДК, действующий в данный месяц данного года. Иначе говоря, это частное от деления измеренной концентрации загрязняющего вещества на его ПДК;</p>
* ПДК — число раз, в которое зафиксированная концентрация загрязняющего вещества превышает его ПДК, действующий в данный месяц данного года. Иначе говоря, это частное от деления измеренной концентрации загрязняющего вещества на его ПДК;</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; мг/л — миллиграммы на литр;</p>
* мг/л — миллиграммы на литр;</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; pH — единицы pH</p>
* pH — единицы pH</p>
|  <p>0 (0%)</p>
|  <p>0 (0%)</p>
|  <p>'''&nbsp;'''</p>
|  <p>'''&nbsp;'''</p>
Строка 341: Строка 326:
|  <p>string</p>
|  <p>string</p>
|}
|}
 
=== Таблица «Справочная информация по ПДК загрязняющих веществ» (<span style="background-color: #e5fffb">pdk.csv</span>) ===
<p>'''&nbsp;'''</p>
{| class="wikitable" style="width: 100%; height: 20px; border-style: solid;"
<p>'''&nbsp;'''</p>
|- style="background-color:#ffffff"style="background-color:#e5fffb; font-family: TT Norms Medium"
<p>'''2.3. Таблица «Справочная информация по ПДК загрязняющих веществ» (''pdk.csv'')'''</p>
| Атрибут
<p>'''&nbsp;'''</p>
| Описание
 
| Количество пропусков (NaN) (шт/%)
{|
| Единица измерения
|-  
| ОКЕИ
| <p>'''Атрибут'''</p>
| Формат
| <p>'''Описание'''</p>
|- style="background-color:#ffffff"
| <p>'''Количество'''</p>
<p>'''пропусков (NaN)'''</p>
<p>'''(шт/%)'''</p>
| <p>'''Единица измерения'''</p>
| <p>'''ОКЕИ'''</p>
| <p>'''Формат'''</p>
|-  
|  <p>ingredient</p>
|  <p>ingredient</p>
|  <p>Название загрязняющего вещества (нормализованное)</p>
|  <p>Название загрязняющего вещества (нормализованное)</p>
Строка 364: Строка 342:
|  <p><br></p>
|  <p><br></p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>ingredient_npa</p>
|  <p>ingredient_npa</p>
|  <p>Название загрязняющего вещества (исходное из нормативно-правового акта)</p>
|  <p>Название загрязняющего вещества (исходное из нормативно-правового акта)</p>
Строка 371: Строка 349:
|  <p><br></p>
|  <p><br></p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>hazard_class</p>
|  <p>hazard_class</p>
|  <p>Класс опасности загрязняющего вещества:</p>
|  <p>Класс опасности загрязняющего вещества:</p>
<p>1-й класс — чрезвычайно опасные;</p>
<p style="padding-left:2em">1-й класс — чрезвычайно опасные;</p>
<p>2-й класс — высоко опасные;</p>
<p style="padding-left:2em">2-й класс — высоко опасные;</p>
<p>3-й класс — опасные;</p>
<p style="padding-left:2em">3-й класс — опасные;</p>
<p>4-й класс — умеренно опасные;</p>
<p style="padding-left:2em">4-й класс — умеренно опасные;</p>
<p>4-й Э — «экологический» подкласс 4 класса</p>
<p style="padding-left:2em">4-й Э — «экологический» подкласс 4 класса</p>
|  <p>1 (0%)</p>
|  <p>1 (0%)</p>
|  <p><br></p>
|  <p><br></p>
|  <p><br></p>
|  <p><br></p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>value</p>
|  <p>value</p>
|  <p>Предельно допустимая концентрация (ПДК)</p>
|  <p>Предельно допустимая концентрация (ПДК)</p>
Строка 390: Строка 368:
|  <p><br></p>
|  <p><br></p>
|  <p>numeric</p>
|  <p>numeric</p>
|-  
|- style="background-color:#ffffff"
|  <p>lpv</p>
|  <p>lpv</p>
|  <p>Лимитирующий показатель вредности (ЛПВ):</p>
|  <p>Лимитирующий показатель вредности (ЛПВ):</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; токc — токсикологический (прямое токсическое действие веществ на водные биологические ресурсы);</p>
* токc — токсикологический (прямое токсическое действие веществ на водные биологические ресурсы);</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; сан-токс — санитарно-токсикологический (действие вещества на водные биологические ресурсы и санитарные показатели водных объектов рыбохозяйственного значения);</p>
* сан-токс — санитарно-токсикологический (действие вещества на водные биологические ресурсы и санитарные показатели водных объектов рыбохозяйственного значения);</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; общ — общесанитарный;</p>
* общ — общесанитарный;</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; орг — органолептический (образование пленок и пены на поверхности воды водных объектов рыбохозяйственного значения, появление посторонних привкусов и запахов в воде водных объектов рыбохозяйственного значения, выпадение осадка, появление опалесценции, мутности и взвешенных веществ, изменение цвета воды водных объектов). При этом указывается расшифровка характера изменения органолептических свойств воды водных объектов рыбохозяйственного значения:</p>
* орг — органолептический (образование пленок и пены на поверхности воды водных объектов рыбохозяйственного значения, появление посторонних привкусов и запахов в воде водных объектов рыбохозяйственного значения, выпадение осадка, появление опалесценции, мутности и взвешенных веществ, изменение цвета воды водных объектов). При этом указывается расшифровка характера изменения органолептических свойств воды водных объектов рыбохозяйственного значения:</p>
<p>–&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; рыб-хоз — рыбохозяйственный (изменение товарных качеств видов водных биологических ресурсов, отнесенных к объектам промышленного и прибрежного рыболовства: появление неприятных и посторонних привкусов и запахов);</p>
** рыб-хоз — рыбохозяйственный (изменение товарных качеств видов водных биологических ресурсов, отнесенных к объектам промышленного и прибрежного рыболовства: появление неприятных и посторонних привкусов и запахов);</p>
<p>–&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; зап. — изменяет запах воды;</p>
** зап. — изменяет запах воды;</p>
<p>–&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; мутн. — увеличивает мутность воды;</p>
** мутн. — увеличивает мутность воды;</p>
<p>–&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; окр. — придает воде окраску,</p>
** окр. — придает воде окраску,</p>
<p>–&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; пена — вызывает образование пены;</p>
** пена — вызывает образование пены;</p>
<p>–&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; пл. — образует пленку на поверхности воды;</p>
** пл. — образует пленку на поверхности воды;</p>
<p>–&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; привк. — придает воде привкус</p>
** привк. — придает воде привкус</p>
|  <p>0 (0%)</p>
|  <p>0 (0%)</p>
|  <p><br></p>
|  <p><br></p>
|  <p><br></p>
|  <p><br></p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>formula</p>
|  <p>formula</p>
|  <p>Формула вещества</p>
|  <p>Формула вещества</p>
Строка 415: Строка 393:
|  <p><br></p>
|  <p><br></p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>n_cas</p>
|  <p>n_cas</p>
|  <p>Регистрационный номер CAS</p>
|  <p>Регистрационный номер CAS</p>
Строка 422: Строка 400:
|  <p><br></p>
|  <p><br></p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>npa</p>
|  <p>npa</p>
|  <p>Сокращенное название нормативно-правового акта (НПА), из которого взята информация</p>
|  <p>Сокращенное название нормативно-правового акта (НПА), из которого взята информация</p>
Строка 429: Строка 407:
|  <p><br></p>
|  <p><br></p>
|  <p>string</p>
|  <p>string</p>
|-  
|- style="background-color:#ffffff"
|  <p>date_start</p>
|  <p>date_start</p>
|  <p>Дата начала действия нормативно-правового акта, указанного в поле ''npa''</p>
|  <p>Дата начала действия нормативно-правового акта, указанного в поле ''npa''</p>
Строка 436: Строка 414:
|  <p><br></p>
|  <p><br></p>
|  <p>date</p>
|  <p>date</p>
|-  
|- style="background-color:#ffffff"
|  <p>date_end</p>
|  <p>date_end</p>
|  <p>Дата завершения действия нормативно-правового акта, указанного в поле ''npa''</p>
|  <p>Дата завершения действия нормативно-правового акта, указанного в поле ''npa''</p>
Строка 444: Строка 422:
|  <p>date</p>
|  <p>date</p>
|}
|}
</div>
<br>
= 3. Известные ограничения данных =
== Полнота данных ==
*В датсете ''pdk.''''csv'' не указана справочная информация по некоторым индикаторам: БПК5, ХПК, взвешенные вещества, запах, минерализация, водородный показатель (pH), растворенный кислород. Это связано с тем, что данные показатели загрязняющими веществами не являются, но контролируются как важные критерии уровня загрязнения водоема.
*У ряда индикаторов не указан класс опасности (поле ''hazard_class''): БПК5, ХПК, взвешенные вещества, запах, минерализация, водородный показатель (pH), растворенный кислород. Отсутствие класса опасности объясняется тем, что перечисленные индикаторы не являются загрязняющими веществами. Некоторые из этих показателей иногда условно относят к четвертому (наименьшему) классу опасности, однако было решено не указывать условный класс, чтобы не усложнять набор данных.
*В таблице по экстремально высокому загрязнению присутствует одно наблюдение, у которого в первоисточнике в качестве концентрации указано «аналитическое отсутствие». Поскольку аналитическое отсутствие означает, что концентрация растворенного кислорода была ниже порога обнаружения, но при этом ее точное значение установить невозможно, в полях ''value_min'' и'' value_max'' указано пропущенное значение (NaN).
== Описание проведенных проверок и их результатов ==


*Для атрибутов осуществлялись проверки на реалистичность представленных в наборе значений. В частности, проверялось, попадают ли значения концентраций загрязняющих веществ в диапазоны, соответствующие высокому и экстремально высокому загрязнению (диапазоны указаны в определениях, см. раздел 5 документации). Было выявлено 97 случаев, в которых значения не попадают в диапазоны. Из этих 97 случаев в 74 индикатором являются «Сульфиды и сероводород», а сами значения в источнике, видимо, содержат ошибку при указании единиц измерения или конкретных значений, устранить которую невозможно.
== Известные ограничения данных ==
*Проведена проверка соответствия между нормализованным названием индикатора и его единицей измерения. Ожидается, что у каждого индикатора должна быть ровно одна единица измерения. Однако был выявлен ряд индикаторов с разными единицами измерения:
=== Полнота данных ===
**o экстремально высокое загрязнение (extreme_pollution):
* В датасете <span style="background-color: #e5fffb">pdk.csv</span> не указана справочная информация по некоторым индикаторам: БПК5, ХПК, взвешенные вещества, запах, минерализация, водородный показатель (pH), растворенный кислород. Это связано с тем, что данные показатели загрязняющими веществами не являются, но контролируются как важные критерии уровня загрязнения водоема.
<div>
* У ряда индикаторов не указан класс опасности (поле <span style="background-color: #e5fffb">hazard_class</span>): БПК5, ХПК, взвешенные вещества, запах, минерализация, водородный показатель (pH), растворенный кислород. Отсутствие класса опасности объясняется тем, что перечисленные индикаторы не являются загрязняющими веществами. Некоторые из этих показателей иногда условно относят к четвертому (наименьшему) классу опасности, однако было решено не указывать условный класс, чтобы не усложнять набор данных.
 
* В таблице по экстремально высокому загрязнению присутствует одно наблюдение, у которого в первоисточнике в качестве концентрации указано «аналитическое отсутствие». Поскольку аналитическое отсутствие означает, что концентрация растворенного кислорода была ниже порога обнаружения, но при этом ее точное значение установить невозможно, в полях <span style="background-color: #e5fffb">value_min</span> и <span style="background-color: #e5fffb">value_max</span> указано пропущенное значение (NaN).
{|
=== Описание проведенных проверок и их результатов ===
|-  
* Для атрибутов осуществлялись проверки на реалистичность представленных в наборе значений. В частности, проверялось, попадают ли значения концентраций загрязняющих веществ в диапазоны, соответствующие высокому и экстремально высокому загрязнению (диапазоны указаны в определениях, см. раздел 5 документации). Было выявлено 97 случаев, в которых значения не попадают в диапазоны. Из этих 97 случаев в 74 индикатором являются «Сульфиды и сероводород», а сами значения в источнике, видимо, содержат ошибку при указании единиц измерения или конкретных значений, устранить которую невозможно.
| <p>'''Индикатор'''</p>
* Проведена проверка соответствия между нормализованным названием индикатора и его единицей измерения. Ожидается, что у каждого индикатора должна быть ровно одна единица измерения. Однако был выявлен ряд индикаторов с разными единицами измерения:
<p>'''Единица измерения'''</p>
** экстремально высокое загрязнение (<span style="background-color: #e5fffb">extreme_pollution</span>):
<p>'''Кол-во наблюдений'''</p>
{| class="wikitable" style="width: 100%; height: 20px; border-style: solid; margin-left: 4em"
|-  
|- style="background-color:#e5fffb; font-family: TT Norms Medium"
| Индикатор
|  Единица измерения
|  Кол-во наблюдений
|- style="background-color:#ffffff"
|  <p>БПК5</p>
|  <p>БПК5</p>
|  <p>ПДК</p>
|  <p>ПДК</p>
|  <p>189</p>
|  <p>189</p>
|-  
|- style="background-color:#ffffff"
|  <p>БПК5</p>
|  <p>БПК5</p>
|  <p>мг/л</p>
|  <p>мг/л</p>
|  <p>6</p>
|  <p>6</p>
|-  
|- style="background-color:#ffffff"
|  <p>Сульфиды и сероводород</p>
|  <p>Сульфиды и сероводород</p>
|  <p>мг/л</p>
|  <p>мг/л</p>
|  <p>27</p>
|  <p>27</p>
|-  
|- style="background-color:#ffffff"
|  <p>Сульфиды и сероводород</p>
|  <p>Сульфиды и сероводород</p>
|  <p>ПДК</p>
|  <p>ПДК</p>
|  <p>15</p>
|  <p>15</p>
|}
|}
</div>
** высокое загрязнение (high_pollution):
<p>'''&nbsp;'''</p>
{| class="wikitable" style="width: 100%; height: 20px; border-style: solid; margin-left: 4em"
*o высокое загрязнение (high_pollution):
|- style="background-color:#e5fffb; font-family: TT Norms Medium"
<div>
| Индикатор
 
| Единица измерения
{|
| Кол-во наблюдений
|-  
|- style="background-color:#ffffff"
| <p>'''Индикатор'''</p>
| <p>'''Единица измерения'''</p>
| <p>'''Кол-во наблюдений'''</p>
|-  
|  <p>БПК5</p>
|  <p>БПК5</p>
|  <p>ПДК</p>
|  <p>ПДК</p>
|  <p>703</p>
|  <p>703</p>
|-  
|- style="background-color:#ffffff"
|  <p>БПК5</p>
|  <p>БПК5</p>
|  <p>мг/л</p>
|  <p>мг/л</p>
|  <p>41</p>
|  <p>41</p>
|-  
|- style="background-color:#ffffff"
|  <p>Взвешенные вещества</p>
|  <p>Взвешенные вещества</p>
|  <p>ПДК</p>
|  <p>ПДК</p>
|  <p>1732</p>
|  <p>1732</p>
|-  
|- style="background-color:#ffffff"
|  <p>Взвешенные вещества</p>
|  <p>Взвешенные вещества</p>
|  <p>мг/л</p>
|  <p>мг/л</p>
|  <p>3</p>
|  <p>3</p>
|-  
|- style="background-color:#ffffff"
|  <p>Сульфиды и сероводород</p>
|  <p>Сульфиды и сероводород</p>
|  <p>мг/л</p>
|  <p>мг/л</p>
|  <p>43</p>
|  <p>43</p>
|-  
|- style="background-color:#ffffff"
|  <p>Сульфиды и сероводород</p>
|  <p>Сульфиды и сероводород</p>
|  <p>ПДК</p>
|  <p>ПДК</p>
|  <p>17</p>
|  <p>17</p>
|-  
|- style="background-color:#ffffff"
|  <p>ХПК</p>
|  <p>ХПК</p>
|  <p>ПДК</p>
|  <p>ПДК</p>
|  <p>244</p>
|  <p>244</p>
|-  
|- style="background-color:#ffffff"
|  <p>ХПК</p>
|  <p>ХПК</p>
|  <p>мг/л</p>
|  <p>мг/л</p>
|  <p>5</p>
|  <p>5</p>
|}
|}
</div>
<p><br></p>
<p>Данные случаи оставлены без изменений, потому что в наборе данных отсутствует дополнительная информация, которая позволяла бы привести все наблюдения к одинаковой единице измерения.</p>
<p>Данные случаи оставлены без изменений, потому что в наборе данных отсутствует дополнительная информация, которая позволяла бы привести все наблюдения к одинаковой единице измерения.</p>
*В пяти случаях у индикатора «Водородный показатель (pH) указана неправильная единица измерения: ПДК (1 случай) или мг/л (4 случая). Поскольку pH не может измеряться в миллиграммах на литр или относительно ПДК, то было решено, что в источнике единица измерения указана ошибочно, в связи с чем в наборе данных единица измерения была заменена на pH.
* В пяти случаях у индикатора «Водородный показатель (pH) указана неправильная единица измерения: ПДК (1 случай) или мг/л (4 случая). Поскольку pH не может измеряться в миллиграммах на литр или относительно ПДК, то было решено, что в источнике единица измерения указана ошибочно, в связи с чем в наборе данных единица измерения была заменена на pH.
<p>'''&nbsp;'''</p>
<p>'''&nbsp;'''</p>


<br><p>'''&nbsp;'''</p>
== Внесенные в набор данных изменения по сравнению с источниками ==
 
* Атрибуты из первоисточника по экстремально высокому загрязнению, связанные с территориальными единицами (названия субъектов РФ, муниципалитетов, населенных пунктов), были нормализованы согласно эталонному набору «Населенные пункты России: численность населения и географические координаты», опубликованному в каталоге ИНИД (https://data.rcsi.science/data-catalog/datasets/160/). <br>При этом:
= 4. Внесенные в набор данных изменения по сравнению с источниками =
** населенный пункт «г. Северский» (Свердловская область) нормализован как «г.&nbsp;Полевской» <br>(г. Северский включен в состав г. Полевской Свердловской области в 1942 году);
 
** населенный пункт «пос. Молоканка» (Забайкальский Край) нормализован как «c. Абагайтуй» <br>(«Молоканка» — это территориальный пункт, входящий в состав села Абагайтуй).
*Атрибуты из первоисточника по экстремально высокому загрязнению, связанные с территориальными единицами (названия субъектов РФ, муниципалитетов, населенных пунктов), были нормализованы согласно эталонному набору «Населенные пункты России: численность населения и географические координаты», опубликованному в каталоге ИНИД (https://data.rcsi.science/data-catalog/datasets/160/).
<p>При этом:</p>
*населенный пункт «г. Северский» (Свердловская область) нормализован как «г.&nbsp;Полевской» (г. Северский включен в состав г. Полевской Свердловской области в 1942 году);
*населенный пункт «пос. Молоканка» (Забайкальский Край) нормализован как «c. Абагайтуй» («Молоканка» — это территориальный пункт, входящий в состав села Абагайтуй).
<p><br></p>
<p>В случае если сопоставить данные не удалось, наименование бралось из первоисточника с приведением формата к близкому к эталонному (например, с помощью удаления лишних пробелов). По некоторым наблюдениям не удалось восстановить код ОКТМО. Это связано с тем, что в первоисточнике есть населенные пункты, находящиеся в разных муниципальных образованиях, но на территории одного субъекта, и поскольку в наборе нет указания на муниципальное образование, возникает неоднозначность в идентификации принадлежности населенного пункта.</p>
<p>В случае если сопоставить данные не удалось, наименование бралось из первоисточника с приведением формата к близкому к эталонному (например, с помощью удаления лишних пробелов). По некоторым наблюдениям не удалось восстановить код ОКТМО. Это связано с тем, что в первоисточнике есть населенные пункты, находящиеся в разных муниципальных образованиях, но на территории одного субъекта, и поскольку в наборе нет указания на муниципальное образование, возникает неоднозначность в идентификации принадлежности населенного пункта.</p>
<p>'''&nbsp;'''</p>
*В первоисточнике по экстремально высокому загрязнению встречались наблюдения, в которых зафиксировано несколько случаев загрязнения конкретным веществом в конкретном населенном пункте за отчетный период. В таблице ниже приведены три типовых ситуации.
*В первоисточнике по экстремально высокому загрязнению встречались наблюдения, в которых зафиксировано несколько случаев загрязнения конкретным веществом в конкретном населенном пункте за отчетный период. В таблице ниже приведены три типовых ситуации.
 
{| class="wikitable" style="width: 100%; height: 20px; border-style: solid; margin-left: 1.7em"
{|
|- style="background-color:#e5fffb; font-family: TT Norms Medium"
|-  
|  <p>'''Река, пункт'''</p>
|  <p>'''Река, пункт'''</p>
|  <p>'''Регион'''</p>
|  <p>'''Регион'''</p>
|  <p>'''Ингредиент'''</p>
|  <p>'''Ингредиент'''</p>
|  <p>'''Концентрация (ПДК)'''</p>
|  <p>'''Концентрация (ПДК)'''</p>
|-  
|- style="background-color:#ffffff"
|  <p>р. Вязьма, г.&nbsp;Вязьма</p>
|  <p>р. Вязьма, г.&nbsp;Вязьма</p>
|  <p>Смоленская область</p>
|  <p>Смоленская область</p>
|  <p>Кислород</p>
|  <p>Кислород</p>
|  <p>0,2, 20 случаев</p>
|  <p>0,2, 20 случаев</p>
|-  
|- style="background-color:#ffffff"
|  <p>р. Омь, г. Омск</p>
|  <p>р. Омь, г. Омск</p>
|  <p>Омская область</p>
|  <p>Омская область</p>
|  <p>Кислород, 4 случая</p>
|  <p>Кислород, 4 случая</p>
|  <p>1,78; 2 по 0,93 и 0,46</p>
|  <p>1,78; 2 по 0,93 и 0,46</p>
|-  
|- style="background-color:#ffffff"
|  <p>р. Чапаевка, г.&nbsp;Чапаевск</p>
|  <p>р. Чапаевка, г.&nbsp;Чапаевск</p>
|  <p>Самарская область</p>
|  <p>Самарская область</p>
Строка 569: Строка 525:
|}
|}


<p>В первой ситуации строки разбивались на 20 наблюдений, значение 0,2 относилось и в ''value_min'', и в ''value_max'', при этом ''cnt_cases'' у каждого наблюдения заполнялось «1», т.е. один случай.</p>
<p style="margin-left: 1.7em">В первой ситуации строки разбивались на 20 наблюдений, значение 0,2 относилось и в <span style="background-color: #e5fffb">value_min</span>, и в <span style="background-color: #e5fffb">value_max</span>, при этом <span style="background-color: #e5fffb">cnt_cases</span> у каждого наблюдения заполнялось «1», т.е. один случай.</p>
<p>Во второй ситуации строки разбивались на 4 наблюдения; в первом из них ''value_min'' и ''value_max'' заполнялись значением 1,78, во втором и третьем — значением 0,93, в четвертом — 0,46; при этом ''cnt_cases'' у каждого наблюдения заполнялось «1», т.е. один случай.</p>
<p style="margin-left: 1.7em">Во второй ситуации строки разбивались на 4 наблюдения; в первом из них <span style="background-color: #e5fffb">value_min</span> и <span style="background-color: #e5fffb">value_max</span> заполнялись значением 1,78, во втором и третьем — значением 0,93, в четвертом — 0,46; при этом <span style="background-color: #e5fffb">cnt_cases</span> у каждого наблюдения заполнялось «1», т.е. один случай.</p>
<p>Третья ситуация, поскольку в ней количество значений не совпадает с количеством случаев, оставлено одной строкой, при этом ''cnt_cases ''заполнялась значением «6», а ''value_min'' и ''value_max'' значениями «5» и «10» соответственно.</p>
<p style="margin-left: 1.7em">Третья ситуация, поскольку в ней количество значений не совпадает с количеством случаев, оставлено одной строкой, при этом <span style="background-color: #e5fffb">cnt_cases</span> заполнялась значением «6», а <span style="background-color: #e5fffb">value_min</span> и <span style="background-color: #e5fffb">value_max</span> значениями «5» и «10» соответственно.</p>
<p>В наблюдениях, где зафиксирован единичный случай (таких подавляющее большинство), ''cnt_cases ''заполнялся значением «1», концентрация записывалась и в ''value_min'', и в ''value_max''. Как следствие, если ''cnt_cases'' равняется 1, то ''value_min'' = ''value_max''.</p>
<p style="margin-left: 1.7em">В наблюдениях, где зафиксирован единичный случай (таких подавляющее большинство), <span style="background-color: #e5fffb">cnt_cases </span> заполнялся значением «1», концентрация записывалась и в <span style="background-color: #e5fffb">value_min</span>, и в <span style="background-color: #e5fffb">value_max.</span> Как следствие, если <span style="background-color: #e5fffb">cnt_cases</span> равняется 1, то <span style="background-color: #e5fffb">value_min</span> = <span style="background-color: #e5fffb">value_max.</span></p>
<p>'''&nbsp;'''</p>
*Набор данных дополнен таблицей, содержащей сведения о предельно допустимых концентрациях и классах опасности загрязняющих веществ согласно следующим нормативно-правовым актам:
*Набор данных дополнен таблицей, содержащей сведения о предельно допустимых концентрациях и классах опасности загрязняющих веществ согласно следующим нормативно-правовым актам:
*o Приказ Госкомрыболовства РФ от 28.04.1999 № 96 «О рыбохозяйственных нормативах» (Госкомрыболовство-99);
** Приказ Госкомрыболовства РФ от 28.04.1999 № 96 «О рыбохозяйственных нормативах» (Госкомрыболовство-99);
*o Приказ Росрыболовства от 18.01.2010 № 20 «Об утверждении нормативов качества воды водных объектов рыбохозяйственного значения, в том числе нормативов предельно допустимых концентраций вредных веществ в водах водных объектов рыбохозяйственного значения» (Росрыболовство-2010);
** Приказ Росрыболовства от 18.01.2010 № 20 «Об утверждении нормативов качества воды водных объектов рыбохозяйственного значения, в том числе нормативов предельно допустимых концентраций вредных веществ в водах водных объектов рыбохозяйственного значения» (Росрыболовство-2010);
*o Приказ Минсельхоза России от 13.12.2016 № 552 «Об утверждении нормативов качества воды водных объектов рыбохозяйственного значения, в том числе нормативов предельно допустимых концентраций вредных веществ в водах водных объектов рыбохозяйственного значения» (Минсельхоз-2016);
** Приказ Минсельхоза России от 13.12.2016 № 552 «Об утверждении нормативов качества воды водных объектов рыбохозяйственного значения, в том числе нормативов предельно допустимых концентраций вредных веществ в водах водных объектов рыбохозяйственного значения» (Минсельхоз-2016);
*o «СанПиН 2.1.5.980-00. 2.1.5. Водоотведение населенных мест, санитарная охрана водных объектов. Гигиенические требования к охране поверхностных вод. Санитарные правила и нормы» (утв. Главным государственным санитарным врачом РФ 22.06.2000) (СанПиН-2000);
** «СанПиН 2.1.5.980-00. 2.1.5. Водоотведение населенных мест, санитарная охрана водных объектов. Гигиенические требования к охране поверхностных вод. Санитарные правила и нормы» (утв. Главным государственным санитарным врачом РФ 22.06.2000) (СанПиН-2000);
*o Постановление Главного государственного санитарного врача РФ от 30.04.2003 № 78 «О введении в действие ГН 2.1.5.1315-03» (вместе с «ГН 2.1.5.1315-03. Предельно допустимые концентрации (ПДК) химических веществ в воде водных объектов хозяйственно-питьевого и культурно-бытового водопользования. Гигиенические нормативы», утв. Главным государственным санитарным врачом РФ 27.04.2003) (СанПиН-2003);
** Постановление Главного государственного санитарного врача РФ от 30.04.2003 № 78 «О введении в действие ГН 2.1.5.1315-03» (вместе с «ГН 2.1.5.1315-03. Предельно допустимые концентрации (ПДК) химических веществ в воде водных объектов хозяйственно-питьевого и культурно-бытового водопользования. Гигиенические нормативы», утв. Главным государственным санитарным врачом РФ 27.04.2003) (СанПиН-2003);
*o Постановление Главного государственного санитарного врача РФ от 28.01.2021 № 2 «Об утверждении санитарных правил и норм СанПиН 1.2.3685-21 «Гигиенические нормативы и требования к обеспечению безопасности и (или) безвредности для человека факторов среды обитания» (вместе с «СанПиН 1.2.3685-21. Санитарные правила и нормы...») (СанПиН-2021).
** Постановление Главного государственного санитарного врача РФ от 28.01.2021 № 2 «Об утверждении санитарных правил и норм СанПиН 1.2.3685-21 «Гигиенические нормативы и требования к обеспечению безопасности и (или) безвредности для человека факторов среды обитания» (вместе с «СанПиН 1.2.3685-21. Санитарные правила и нормы...») (СанПиН-2021).
<p><br></p>
 
<p>При извлечении информации из указанных выше нормативно-правовых актов было сделано следующее:</p>
* При извлечении информации из указанных выше нормативно-правовых актов было сделано следующее:
*o ПДК для нитрит-иона, нитрат-иона и аммоний-иона пересчитаны на чистый азот. Например, для нитрит-иона (NO2-) ПДК составляет 0,08 мг/л. С учетом массовой доли азота в нитрит-ионе, которая приблизительно равна 0,3, ПДК в пересчете на азот составит после округления 0,02 мг/л;
** ПДК для нитрит-иона, нитрат-иона и аммоний-иона пересчитаны на чистый азот. Например, для нитрит-иона (NO2-) ПДК составляет 0,08 мг/л. С учетом массовой доли азота в нитрит-ионе, которая приблизительно равна 0,3, ПДК в пересчете на азот составит после округления 0,02 мг/л;
*o для фосфатов из трех доступных значений — для эвтрофных, мезотрофных и олиготрофных водоемов — выбрано значение ПДК для эвтрофных водоемов;
** для фосфатов из трех доступных значений — для эвтрофных, мезотрофных и олиготрофных водоемов — выбрано значение ПДК для эвтрофных водоемов;
*o в качестве значения ПДК для ДДЭ (дихлордифенилдихлорэтилен) взято значение ПДК для позиции «Хлорорганические токсиканты, ДДТ и его метаболиты, ПХБ, альдрин, линдан и др.», так как ДДЭ является продуктом распада ДДТ;
** в качестве значения ПДК для ДДЭ (дихлордифенилдихлорэтилен) взято значение ПДК для позиции «Хлорорганические токсиканты, ДДТ и его метаболиты, ПХБ, альдрин, линдан и др.», так как ДДЭ является продуктом распада ДДТ;
*o для лигносульфонатов при анализе источника «Госкомрыболовство-99» в качестве значения ПДК было взято среднее значение ПДК для лигносульфонатов магния и лигносульфонатов натрия, так как отдельной позиции по лигносульфанатам в данном нормативно-правовом акте нет; класс опасности среди них был выбран более «жесткий» (3, а не 4).
** для лигносульфонатов при анализе источника «Госкомрыболовство-99» в качестве значения ПДК было взято среднее значение ПДК для лигносульфонатов магния и лигносульфонатов натрия, так как отдельной позиции по лигносульфанатам в данном нормативно-правовом акте нет; класс опасности среди них был выбран более «жесткий» (3, а не 4).
<p>'''&nbsp;'''</p>
*Наименования загрязняющих веществ и иных индикаторов загрязнения были нормализованы. Для нормализации названий использовались указанные выше нормативно-правовые акты, а также ежегодники «Качество поверхностных вод Российской Федерации», подготавливаемые Гидрохимическим институтом Росгидромета.
*Наименования загрязняющих веществ и иных индикаторов загрязнения были нормализованы. Для нормализации названий использовались указанные выше нормативно-правовые акты, а также ежегодники «Качество поверхностных вод Российской Федерации», подготавливаемые Гидрохимическим институтом Росгидромета.
<p>'''&nbsp;'''</p>
*Классы опасности загрязняющих веществ были проверены и уточнены по указанным выше нормативно-правовым актам. Если класс опасности был указан в нескольких одновременно действующих нормативно-правовых актах, то выбиралось значение из того, в котором была указана меньшая (более жесткая) предельно допустимая концентрация. Если ПДК были одинаковыми, то выбиралось меньшее (более жесткое) значение класса опасности. Класс опасности сульфатов (4) взят из ежегодника Гидрохимического института «Качество поверхностных вод Российской Федерации» за 2010 г., так как ни в одном нормативно-правовом акте он не указан.
*Классы опасности загрязняющих веществ были проверены и уточнены по указанным выше нормативно-правовым актам. Если класс опасности был указан в нескольких одновременно действующих нормативно-правовых актах, то выбиралось значение из того, в котором была указана меньшая (более жесткая) предельно допустимая концентрация. Если ПДК были одинаковыми, то выбиралось меньшее (более жесткое) значение класса опасности. Класс опасности сульфатов (4) взят из ежегодника Гидрохимического института «Качество поверхностных вод Российской Федерации» за 2010 г., так как ни в одном нормативно-правовом акте он не указан.
<p><br></p>
<p>'''&nbsp;'''</p>


<br><p>'''&nbsp;'''</p>
== Источники данных ==
 
{| class="wikitable" style="width: 100%; height: 20px; border-style: solid"
= 5. Источники данных =
|- style="background-color:#e5fffb; font-family: TT Norms Medium"
{|
|  Атрибут
|-  
|  Значение
<p>'''Атрибут '''</p>
|- style="background-color:#ffffff"
<p>'''Значение'''</p>
|-  
|  <p>Полное наименование источника данных</p>
|  <p>Полное наименование источника данных</p>
|  <p>Ежемесячные отчеты Росгидромета об аварийном, экстремально высоком и высоком загрязнении окружающей среды, а также радиационной обстановке на территории России</p>
|  <p>Ежемесячные отчеты Росгидромета об аварийном, экстремально высоком и высоком загрязнении окружающей среды, а также радиационной обстановке на территории России</p>
|-  
|- style="background-color:#ffffff"
|  <p>Сокращенное наименование источника данных</p>
|  <p>Сокращенное наименование источника данных</p>
|  <p>Отсутствует</p>
|  <p>Отсутствует</p>
|-  
|- style="background-color:#ffffff"
|  <p>Владелец источника данных</p>
|  <p>Владелец источника данных</p>
|  <p>Федеральная служба по гидрометеорологии и мониторингу окружающей среды</p>
|  <p>Федеральная служба по гидрометеорологии и мониторингу окружающей среды</p>
|-  
|- style="background-color:#ffffff"
|  <p>Краткое описание источника данных</p>
|  <p>Краткое описание источника данных</p>
|  <p>Отчеты размещены на официальном сайте Росгидромета. Отчет представляет собой один или несколько файлов в формате docx. В каждом отчете есть текстовая информация и таблицы. Среди таблиц есть одна с перечнем случаев экстремально высокого загрязнения поверхностных вод и одна с перечнем случаев высокого загрязнения поверхностных вод</p>
|  <p>Отчеты размещены на официальном сайте Росгидромета. Отчет представляет собой один или несколько файлов в формате docx. В каждом отчете есть текстовая информация и таблицы. Среди таблиц есть одна с перечнем случаев экстремально высокого загрязнения поверхностных вод и одна с перечнем случаев высокого загрязнения поверхностных вод</p>
|-  
|- style="background-color:#ffffff"
|  <p>Ссылка на источник данных</p>
|  <p>Ссылка на источник данных</p>
|  <p>http://www.meteorf.ru/product/infomaterials/99/</p>
|  <p>http://www.meteorf.ru/product/infomaterials/99/</p>
|-  
|- style="background-color:#ffffff"
|  <p>Перечень используемых классификаторов</p>
|  <p>Перечень используемых классификаторов</p>
|  <p>Нет</p>
|  <p>Нет</p>
|-  
|- style="background-color:#ffffff"
|  <p>Понятия, используемые в источнике</p>
|  <p>Понятия, используемые в источнике</p>
|  <p>Высокое загрязнение (ВЗ) — состояние воды в водном объекте, соответствующее любому из следующих критериев:</p>
|  <p>Высокое загрязнение (ВЗ) — состояние воды в водном объекте, соответствующее любому из следующих критериев:</p>
<p>·&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; максимальное разовое содержание для нормируемых веществ 1—2-й класса опасности в концентрациях, превышающих ПДК от 3 до 5 раз, для веществ 3—4-й класса опасности — от 10 до 50 раз (для нефтепродуктов, фенолов, соединений меди, железа и марганца — от 30 до 50 раз);</p>
* максимальное разовое содержание для нормируемых веществ 1—2-й класса опасности в концентрациях, превышающих ПДК от 3 до 5 раз, для веществ 3—4-й класса опасности — от 10 до 50 раз (для нефтепродуктов, фенолов, соединений меди, железа и марганца — от 30 до 50 раз);</p>
<p>·&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; величина биохимического потребления кислорода (БПК5) от 10 до 40 мг/л;</p>
* величина биохимического потребления кислорода (БПК5) от 10 до 40 мг/л;</p>
<p>·&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; снижение концентрации растворенного кислорода до значений от 3 до 2 мг/л;</p>
* снижение концентрации растворенного кислорода до значений от 3 до 2 мг/л;</p>
<p>·&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; покрытие пленкой (нефтяной, масляной или другого происхождения) от 1/4 до 1/3 поверхности водного объекта при его обозримой площади до 6 кв. км;</p>
* покрытие пленкой (нефтяной, масляной или другого происхождения) от 1/4 до 1/3 поверхности водного объекта при его обозримой площади до 6 кв. км;</p>
<p>·&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; покрытие пленкой поверхности водного объекта на площади от 1 до 2 кв. км при его обозримой площади более 6 кв. км.</p>
* покрытие пленкой поверхности водного объекта на площади от 1 до 2 кв. км при его обозримой площади более 6 кв. км.</p>
<p>Экстремально высокое загрязнение (ЭВЗ) — состояние воды в водном объекте, соответствующее любому из следующих критериев:</p>
<p>Экстремально высокое загрязнение (ЭВЗ) — состояние воды в водном объекте, соответствующее любому из следующих критериев:</p>
<p>·&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; максимальное разовое содержание для нормируемых веществ 1—2-й класса опасности в концентрациях, превышающих ПДК в 5 и более раз, для веществ 3—4-й класса опасности — в 50 и более раз;</p>
* максимальное разовое содержание для нормируемых веществ 1—2-й класса опасности в концентрациях, превышающих ПДК в 5 и более раз, для веществ 3—4-й класса опасности — в 50 и более раз;</p>
<p>·&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; увеличение биохимического потребления кислорода (БКП5) свыше 40 мг/л;</p>
* увеличение биохимического потребления кислорода (БКП5) свыше 40 мг/л;</p>
<p>·&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; снижение содержания растворенного кислорода до значения 2 мг/л и менее;</p>
* снижение содержания растворенного кислорода до значения 2 мг/л и менее;</p>
<p>·&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; покрытие пленкой (нефтяной, масляной или другого происхождения) более 1/3 поверхности водного объекта при его обозримой площади до 6 кв. км;</p>
* покрытие пленкой (нефтяной, масляной или другого происхождения) более 1/3 поверхности водного объекта при его обозримой площади до 6 кв. км;</p>
<p>·&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; покрытие пленкой поверхности водного объекта на площади 2 и более кв. км при его обозримой площади более 6 кв. км;</p>
* покрытие пленкой поверхности водного объекта на площади 2 и более кв. км при его обозримой площади более 6 кв. км;</p>
<p>·&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; появление запаха вод интенсивностью более 4-х баллов и не свойственного воде ранее;</p>
* появление запаха вод интенсивностью более 4-х баллов и не свойственного воде ранее;</p>
<p>·&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; массовая гибель моллюсков, раков, лягушек, рыб, других водных организмов и водной растительности.</p>
* массовая гибель моллюсков, раков, лягушек, рыб, других водных организмов и водной растительности.</p>
<p>Предельно допустимая концентрация (ПДК) — максимальная концентрация вредного вещества, при которой в водном объекте не возникает последствий, снижающих его рыбохозяйственную ценность или возможность использования для хозяйственно-питьевых целей. Можно выделить две разновидности ПДК: рыбохозяйственные и санитарно-гигиенические. Первые устанавливаются для водных объектов рыбохозяйственного значения, вторые — для водных объектов хозяйственно-питьевого и культурно-бытового назначения. Если для одного и того же вещества установлены разные ПДК, то при мониторинге окружающей среды используется наиболее «жесткое», то есть наименьшее, значение.</p>
<p>Предельно допустимая концентрация (ПДК) — максимальная концентрация вредного вещества, при которой в водном объекте не возникает последствий, снижающих его рыбохозяйственную ценность или возможность использования для хозяйственно-питьевых целей. Можно выделить две разновидности ПДК: рыбохозяйственные и санитарно-гигиенические. Первые устанавливаются для водных объектов рыбохозяйственного значения, вторые — для водных объектов хозяйственно-питьевого и культурно-бытового назначения. Если для одного и того же вещества установлены разные ПДК, то при мониторинге окружающей среды используется наиболее «жесткое», то есть наименьшее, значение.</p>
<p>'''&nbsp;'''</p>
<p>Класс опасности — условная величина, характеризующая вредное воздействие вещества на здоровье человека или экологические системы. Есть четыре класса опасности:</p>
<p>Класс опасности — условная величина, характеризующая вредное воздействие вещества на здоровье человека или экологические системы. Есть четыре класса опасности:</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1-й класс — чрезвычайно опасные вещества;</p>
* 1-й класс — чрезвычайно опасные вещества;</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2-й класс — высоко опасные;</p>
* 2-й класс — высоко опасные;</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 3-й класс — опасные;</p>
* 3-й класс — опасные;</p>
<p>●&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4-й класс — умеренно опасные.</p>
* 4-й класс — умеренно опасные.</p>
<p>Кроме того, при мониторинге окружающей среды в четвертом классе выделяют «экологический» подкласс 4-э. Он означает, что действие вещества проявляются в изменении экологических условий в водоеме.</p>
<p>Кроме того, при мониторинге окружающей среды в четвертом классе выделяют «экологический» подкласс 4-э. Он означает, что действие вещества проявляются в изменении экологических условий в водоеме.</p>
<p>'''&nbsp;'''</p>
<p>Лимитирующий признак вредности в воде — признак, характеризующийся наименьшей безвредной концентрацией вещества в воде</p>
<p>Лимитирующий признак вредности в воде — признак, характеризующийся наименьшей безвредной концентрацией вещества в воде</p>
|-  
|- style="background-color:#ffffff"
|  <p>Методология и изменения методологии для источника данных</p>
|  <p>Методология и изменения методологии для источника данных</p>
|  <p>Порядок представления информации об аварийных выбросах вредных веществ установлен в Приказе Росгидромета от 31.10.2000 № 156 «О введении в действие Порядка подготовки и представления информации общего назначения о загрязнении окружающей природной среды»</p>
|  <p>Порядок представления информации об аварийных выбросах вредных веществ установлен в Приказе Росгидромета от 31.10.2000 № 156 «О введении в действие Порядка подготовки и представления информации общего назначения о загрязнении окружающей природной среды»</p>
|-  
|- style="background-color:#ffffff"
|  <p>Ссылки на методологию</p>
|  <p>Ссылки на методологию</p>
|  <p>https://docs.cntd.ru/document/901791258</p>
|  <p>https://docs.cntd.ru/document/901791258</p>
|}
|}


<p>'''&nbsp;'''</p>
== Ответственные за набор данных ==
 
<span style="font-family: TT Norms Medium; font-size:1.1em">Ответственный 1</span>
<br><p><br></p>
 
= 6. Ответственные за набор данных =
<p>'''Ответственный 1'''</p>
<p>Гостева Инесса Игоревна</p>
<p>Гостева Инесса Игоревна</p>
<p>i.gosteva@cpur.ru</p>
<p>[mailto:i.gosteva@cpur.ru i.gosteva@cpur.ru]</p>
<p>'''&nbsp;'''</p>
<span style="font-family: TT Norms Medium; font-size:1.1em">Ответственный 2'''</span>
<p>'''Ответственный 2'''</p>
<p>Сёмин Павел Олегович</p>
<p>Сёмин Павел Олегович</p>
<p>p.semin@cpur.ru</p>
<p>[mailto:p.semin@cpur.ru p.semin@cpur.ru]</p>
<p>'''&nbsp;'''</p>
<p>'''&nbsp;'''</p>


{|
{| class="wikitable" style="width: 100%; height: 20px; border-style: solid"
|-  
|- style="background-color:#e5fffb; font-family: TT Norms Medium"
<p></p>
|  №
<p>ФИО ответственного лица</p>
|  ФИО ответственного лица
<p>Электронная почта ответственного лица</p>
|  Электронная почта ответственного лица
|-  
|- style="background-color:#ffffff"
|  <p>1.</p>
|  <p>1.</p>
|  <p>Гостева Инесса Игоревна</p>
|  <p>Гостева Инесса Игоревна</p>
| <p>i.gosteva@cpur.ru</p>
| [mailto:i.gosteva@cpur.ru i.gosteva@cpur.ru]
|-  
|- style="background-color:#ffffff"
|  <p>2.</p>
|  <p>2.</p>
|  <p>Сёмин Павел Олегович</p>
|  <p>Сёмин Павел Олегович</p>
<p>p.semin@cpur.ru</p>
[mailto:p.semin@cpur.ru p.semin@cpur.ru]
|}
|}


<p>'''&nbsp;'''</p>
[[Category: Описания датасетов]]
<p>'''&nbsp;'''</p>

Текущая версия на 13:05, 23 сентября 2021

История изменений

Дата Версия Автор Описание изменений

23.09.2021

1.0

Гостева Инесса Игоревна

Документ создан

Сёмин Павел Олегович

Общая информация о датасете

Набор данных включает в себя ежемесячные сведения о загрязнении поверхностных водных объектов на территории России за период с 2008 по 2021 г. Экстремально высокие загрязнения доступны с детализацией до муниципальных образований; высокие загрязнения — с детализацией до субъекта РФ. Эти сведения публикуются в ежемесячных отчетах Росгидромета на официальном сайте в виде файлов в формате docx. В ходе подготовки этого датасета данные были собраны из этих файлов и преобразованы в машиночитаемые таблицы в формате панельных данных, а также обогащены дополнительными атрибутами.

Единица наблюдения в датасете — место, в котором зафиксирован случай или случаи высокого или экстремально высокого загрязнения водного объекта за отчетный период (месяц). Данные для каждого наблюдения приведены по следующим атрибутам: регион, населенный пункт, в котором или вблизи которого произошел случай, наименование загрязняющего вещества или другого индикатора загрязнения, концентрация загрязняющего вещества или значение иного индикатора, класс опасности загрязняющего вещества и др.

Набор состоит из двух основных таблиц и одной вспомогательной:

  • extreme_pollution.csv (основная); 7 671 наблюдение по 13 атрибутам за 01.01.2008 — 31.08.2021;
  • high_pollution.csv (основная) 10 198 наблюдений по 11 атрибутам за 01.01.2008 — 31.08.2021;
  • pdk.csv (вспомогательная): 212 наблюдений по 10 атрибутам.

Набор доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»).

Общее описание набора данных

Атрибут Значение
Общие сведения

Полное наименование набора данных

Загрязнение поверхностных вод в России: ежемесячные данные о высоком и экстремально высоком загрязнении водных объектов за 2008—2021 гг.

Сокращенное наименование набора данных

Высокое и экстремально высокое загрязнение поверхностных вод в России

Краткое описание набора данных

Набор данных включает в себя ежемесячные сведения о загрязнении поверхностных водных объектов на территории России за период с 2008 по 2021 г. Экстремально высокие загрязнения доступны с детализацией до муниципальных образований; высокие загрязнения — с детализацией до субъекта РФ. Эти сведения публикуются в ежемесячных отчетах Росгидромета на официальном сайте в виде файлов в формате docx. В ходе подготовки этого датасета данные были собраны из этих файлов и преобразованы в машиночитаемые таблицы в формате панельных данных, а также обогащены дополнительными атрибутами.

Единица наблюдения в датасете — место, в котором зафиксирован случай или случаи высокого или экстремально высокого загрязнения водного объекта за отчетный период (месяц). Данные для каждого наблюдения приведены по следующим атрибутам: регион, населенный пункт, в котором или вблизи которого произошел случай, наименование загрязняющего вещества или другого индикатора загрязнения, концентрация загрязняющего вещества или значение иного индикатора, класс опасности загрязняющего вещества и др.

Краткое описание источника набора данных

В качестве первоисточника данных выступают ежемесячные отчеты Росгидромета об аварийном, экстремально высоком и высоком загрязнении окружающей среды, а также радиационной обстановке на территории России. В этих отчетах содержатся две таблицы: перечень случаев экстремально высокого загрязнения поверхностных вод суши и перечень случаев высокого загрязнения водных объектов. Эти таблицы были извлечены из отчетов, объединены, нормализованы, обогащены дополнительными данными

Покрываемый временной период

2008—2021 гг.

Доступные форматы

CSV (кодировка: «UTF-8», разделитель: «;»)

Размер набора данных

2,75 МБ

Тематика набора данных

Экология

Режим доступа

Открытый (у вас есть возможность работать с данными на своем личном ПК, в том числе и скачивать данные)

Периодичность публикации и обновления

Дата размещения в каталоге

23.09.2021

Дата последнего обновления набора данных в каталоге

Отсутствует

Характер последнего обновления

Периодичность обновления в каталоге

Не обновляется

Дата следующего обновления набора данных

Не обновляется

Дополнительные сведения

Цитирование набора данных на русском языке

Загрязнение поверхностных вод в России: ежемесячные данные о высоком и экстремально высоком загрязнении водных объектов за 2008—2021 гг. // Росгидромет; обработка: Гостева И.И., Сёмин П.О., Инфраструктура научно-исследовательских данных, АНО «ЦПУР», 2021. Доступ: Лицензия CC BY-SA. Размещено: 23.09.2021. URL: http://data.rcsi.science/data-catalog/datasets/176

For references (English)

Water pollution in Russia: monthly data on high and extremely high pollution of water surface for 2008—2021 // Roshydromet; data-processing: Gosteva I., Semin P., The Research Development Infrastructure (RDI), CAG, 2021. Access: License CC BY-SA. Posted: 09.23.2021. URL: http://data.rcsi.science/data-catalog/datasets/176

Ссылка на открытый репозиторий

Отсутствует

Геоданные (пространственная привязка набора данных)

Отсутствуют

Лицензия, под которой публикуется набор данных

СС BY-SA (Creative Commons)

https://creativecommons.org/licenses/by-sa/4.0/

Допускается использование, копирование и распространение данных в научно-исследовательских, коммерческих и любых иных целях. При преобразовании материала разрешается распространять переделанные части материала на условиях этой же лицензии —
CC BY-SA

Стандарт публикации

http://opendata.gosmonitor.ru/standard/3.0

Параметры запросов API

Интеграция через API не предусмотрена



Структура набора данных (Codebook)

Датасет представлен в виде трех плоских таблиц (формат данных: CSV; кодировка: «UTF-8», разделитель: «;»):

  • extreme_pollution.csv: «Экстремально высокое загрязнение поверхностных вод»; временной период: 01.01.2008 — 31.07.2021; 7 671 строка; 13 атрибутов;
  • high_pollution.csv: «Высокое загрязнение поверхностных вод»; временной период: 01.01.2008 — 31.07.2021; 10 198 строк; 11 атрибутов;
  • pdk.csv: «Справочная информация по ПДК загрязняющих веществ»; 212 строк; 10 атрибутов.

Таблица «Экстремально высокое загрязнение поверхностных вод» (extreme_pollution.csv)

Атрибут Описание Количество пропусков (NaN), шт. (%) Единица измерения

ОКЕИ Формат

id

ID наблюдения в рамках набора данных

integer

period

Последний день отчетного периода (месяца)

0 (0%)


date

subject

Наименование субъекта Российской Федерации, в котором зафиксирован случай загрязнения

0 (0%)

string

municipality

Наименование муниципального образования Российской Федерации, в котором зафиксирован случай загрязнения

347 (4%)

string

settlement

Наименование населенного пункта, в котором или вблизи которого произошло загрязнение

161 (2%)



string

oktmo

Значение кода ОКТМО для населенного пункта.

Код ОКТМО населенных пунктов состоит из четырех частей и 11 знаков:

2 знака — «код региона»;

3 знака — «код района/города МО»;

3 знака — «код поселения МО»;

3 знака — «код населенного пункта МО»

347 (4%)



string

water_body

Наименование водного объекта, в котором зафиксировано загрязнение

Например, «вдхр. Аргазинское», «оз. Большое Островное», «р. Колос-Йоки»

0 (0%)



string

indicator

Загрязняющее вещество, по которому превышен ПДК, или иной показатель, значение которого не соответствует нормативу, что характеризует ситуацию как экстремально высокое загрязнение. Например, «Аммоний-ион», «Взвешенные вещества», «БПК5», «Водородный показатель (pH)»

0 (0%)



string

hazard_class

Класс опасности загрязняющего вещества:

1-й класс — чрезвычайно опасные;

2-й класс — высоко опасные;

3-й класс — опасные;

4-й класс — умеренно опасные;

4-й Э — «экологический» подкласс 4 класса.

Для иных индикаторов, которые не являются загрязняющими веществами (например, запах, БПК5 или pH), класс опасности не указан, так как не имеет смысла

0 (0%)



integer

cnt_cases

Количество случаев загрязнения, зафиксированных в данном месте в данном месяце

0 (0%)



integer

value_min

Минимальная измеренная концентрация загрязняющего вещества или минимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время

1 (0%)



numeric

value_max

Максимальная измеренная концентрация загрязняющего вещества или максимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время

1 (0%)



numeric

unit

Единица измерения значения, указанного в полях value_min, value_max:

  • ПДК — число раз, в которое зафиксированная концентрация загрязняющего вещества превышает его ПДК, действующий в данном месяце данного года. Иначе говоря, это частное от деления измеренной концентрации загрязняющего вещества на его ПДК;

  • мг/л — миллиграммы на литр;

  • pH — единицы pH;

  • балл — условная характеристика интенсивности запаха

0 (0%)



string

Таблица «Высокое загрязнение поверхностных вод» (high_pollution.csv)

Атрибут Описание Количество пропусков (NaN), шт. (%) Единица измерения ОКЕИ Формат

id

ID наблюдения в рамках набора данных

 

 

 

integer

period

Последний день отчетного периода (месяца)

0 (0%)

 

 

date

subject

Наименование субъекта Российской Федерации, в котором произошло загрязнение

0 (0%)

 

 

string

okato

Код ОКАТО субъекта Российской Федерации, в котором произошло загрязнение

0 (0%)

 

 

string

river_basin

Название крупной реки, в речном бассейне которой зафиксировано загрязнение, либо указание на то, что загрязнение произошло в малой реке, озере, водохранилище или морской акватории.

Например, «р. Амур», «малые реки, озера, водохранилища» и др.

0 (0%)

 

 

string

indicator

Загрязняющее вещество, по которому превышен ПДК, или иной показатель, значение которого не соответствует нормативу, что характеризует ситуацию как высокое загрязнение.

Например, «Аммоний-ион», «Взвешенные вещества», «БПК5», «Водородный показатель (pH)»

0 (0%)

 

 

string

hazard_class

Класс опасности загрязняющего вещества:

1-й класс — чрезвычайно опасные;

2-й класс — высоко опасные;

3-й класс — опасные;

4-й класс — умеренно опасные;

4-й Э — «экологический» подкласс 4 класса.

Для иных индикаторов, которые не являются загрязняющими веществами (например, запах, БПК5 или pH), класс опасности не указан, так как не имеет смысла

0 (0%)

 

 

integer

cnt_cases

Количество случаев загрязнения, зафиксированных в данном месте в данном месяце

0 (0%)

 

 

integer

value_min

Минимальная измеренная концентрация загрязняющего вещества или минимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время

0 (0%)

 

 

numeric

value_max

Максимальная измеренная концентрация загрязняющего вещества или максимальное зафиксированное значение иного индикатора из всех случаев, зафиксированных в данном месте в данное время

0 (0%)

 

 

numeric

unit

Единица измерения значения, указанного в полях value_min, value_max:

  • ПДК — число раз, в которое зафиксированная концентрация загрязняющего вещества превышает его ПДК, действующий в данный месяц данного года. Иначе говоря, это частное от деления измеренной концентрации загрязняющего вещества на его ПДК;

  • мг/л — миллиграммы на литр;

  • pH — единицы pH

0 (0%)

 

 

string

Таблица «Справочная информация по ПДК загрязняющих веществ» (pdk.csv)

Атрибут Описание Количество пропусков (NaN) (шт/%) Единица измерения ОКЕИ Формат

ingredient

Название загрязняющего вещества (нормализованное)

0 (0%)



string

ingredient_npa

Название загрязняющего вещества (исходное из нормативно-правового акта)

0 (0%)



string

hazard_class

Класс опасности загрязняющего вещества:

1-й класс — чрезвычайно опасные;

2-й класс — высоко опасные;

3-й класс — опасные;

4-й класс — умеренно опасные;

4-й Э — «экологический» подкласс 4 класса

1 (0%)



string

value

Предельно допустимая концентрация (ПДК)

0 (0%)

мг/л


numeric

lpv

Лимитирующий показатель вредности (ЛПВ):

  • токc — токсикологический (прямое токсическое действие веществ на водные биологические ресурсы);

  • сан-токс — санитарно-токсикологический (действие вещества на водные биологические ресурсы и санитарные показатели водных объектов рыбохозяйственного значения);

  • общ — общесанитарный;

  • орг — органолептический (образование пленок и пены на поверхности воды водных объектов рыбохозяйственного значения, появление посторонних привкусов и запахов в воде водных объектов рыбохозяйственного значения, выпадение осадка, появление опалесценции, мутности и взвешенных веществ, изменение цвета воды водных объектов). При этом указывается расшифровка характера изменения органолептических свойств воды водных объектов рыбохозяйственного значения:

    • рыб-хоз — рыбохозяйственный (изменение товарных качеств видов водных биологических ресурсов, отнесенных к объектам промышленного и прибрежного рыболовства: появление неприятных и посторонних привкусов и запахов);

    • зап. — изменяет запах воды;

    • мутн. — увеличивает мутность воды;

    • окр. — придает воде окраску,

    • пена — вызывает образование пены;

    • пл. — образует пленку на поверхности воды;

    • привк. — придает воде привкус

0 (0%)



string

formula

Формула вещества

24 (11%)



string

n_cas

Регистрационный номер CAS

92 (43%)



string

npa

Сокращенное название нормативно-правового акта (НПА), из которого взята информация

0 (0%)



string

date_start

Дата начала действия нормативно-правового акта, указанного в поле npa

0 (0%)



date

date_end

Дата завершения действия нормативно-правового акта, указанного в поле npa

0 (0%)



date

Известные ограничения данных

Полнота данных

  • В датасете pdk.csv не указана справочная информация по некоторым индикаторам: БПК5, ХПК, взвешенные вещества, запах, минерализация, водородный показатель (pH), растворенный кислород. Это связано с тем, что данные показатели загрязняющими веществами не являются, но контролируются как важные критерии уровня загрязнения водоема.
  • У ряда индикаторов не указан класс опасности (поле hazard_class): БПК5, ХПК, взвешенные вещества, запах, минерализация, водородный показатель (pH), растворенный кислород. Отсутствие класса опасности объясняется тем, что перечисленные индикаторы не являются загрязняющими веществами. Некоторые из этих показателей иногда условно относят к четвертому (наименьшему) классу опасности, однако было решено не указывать условный класс, чтобы не усложнять набор данных.
  • В таблице по экстремально высокому загрязнению присутствует одно наблюдение, у которого в первоисточнике в качестве концентрации указано «аналитическое отсутствие». Поскольку аналитическое отсутствие означает, что концентрация растворенного кислорода была ниже порога обнаружения, но при этом ее точное значение установить невозможно, в полях value_min и value_max указано пропущенное значение (NaN).

Описание проведенных проверок и их результатов

  • Для атрибутов осуществлялись проверки на реалистичность представленных в наборе значений. В частности, проверялось, попадают ли значения концентраций загрязняющих веществ в диапазоны, соответствующие высокому и экстремально высокому загрязнению (диапазоны указаны в определениях, см. раздел 5 документации). Было выявлено 97 случаев, в которых значения не попадают в диапазоны. Из этих 97 случаев в 74 индикатором являются «Сульфиды и сероводород», а сами значения в источнике, видимо, содержат ошибку при указании единиц измерения или конкретных значений, устранить которую невозможно.
  • Проведена проверка соответствия между нормализованным названием индикатора и его единицей измерения. Ожидается, что у каждого индикатора должна быть ровно одна единица измерения. Однако был выявлен ряд индикаторов с разными единицами измерения:
    • экстремально высокое загрязнение (extreme_pollution):
Индикатор Единица измерения Кол-во наблюдений

БПК5

ПДК

189

БПК5

мг/л

6

Сульфиды и сероводород

мг/л

27

Сульфиды и сероводород

ПДК

15

    • высокое загрязнение (high_pollution):
Индикатор Единица измерения Кол-во наблюдений

БПК5

ПДК

703

БПК5

мг/л

41

Взвешенные вещества

ПДК

1732

Взвешенные вещества

мг/л

3

Сульфиды и сероводород

мг/л

43

Сульфиды и сероводород

ПДК

17

ХПК

ПДК

244

ХПК

мг/л

5

Данные случаи оставлены без изменений, потому что в наборе данных отсутствует дополнительная информация, которая позволяла бы привести все наблюдения к одинаковой единице измерения.

  • В пяти случаях у индикатора «Водородный показатель (pH) указана неправильная единица измерения: ПДК (1 случай) или мг/л (4 случая). Поскольку pH не может измеряться в миллиграммах на литр или относительно ПДК, то было решено, что в источнике единица измерения указана ошибочно, в связи с чем в наборе данных единица измерения была заменена на pH.

Внесенные в набор данных изменения по сравнению с источниками

  • Атрибуты из первоисточника по экстремально высокому загрязнению, связанные с территориальными единицами (названия субъектов РФ, муниципалитетов, населенных пунктов), были нормализованы согласно эталонному набору «Населенные пункты России: численность населения и географические координаты», опубликованному в каталоге ИНИД (https://data.rcsi.science/data-catalog/datasets/160/).
    При этом:
    • населенный пункт «г. Северский» (Свердловская область) нормализован как «г. Полевской»
      (г. Северский включен в состав г. Полевской Свердловской области в 1942 году);
    • населенный пункт «пос. Молоканка» (Забайкальский Край) нормализован как «c. Абагайтуй»
      («Молоканка» — это территориальный пункт, входящий в состав села Абагайтуй).

В случае если сопоставить данные не удалось, наименование бралось из первоисточника с приведением формата к близкому к эталонному (например, с помощью удаления лишних пробелов). По некоторым наблюдениям не удалось восстановить код ОКТМО. Это связано с тем, что в первоисточнике есть населенные пункты, находящиеся в разных муниципальных образованиях, но на территории одного субъекта, и поскольку в наборе нет указания на муниципальное образование, возникает неоднозначность в идентификации принадлежности населенного пункта.

  • В первоисточнике по экстремально высокому загрязнению встречались наблюдения, в которых зафиксировано несколько случаев загрязнения конкретным веществом в конкретном населенном пункте за отчетный период. В таблице ниже приведены три типовых ситуации.

Река, пункт

Регион

Ингредиент

Концентрация (ПДК)

р. Вязьма, г. Вязьма

Смоленская область

Кислород

0,2, 20 случаев

р. Омь, г. Омск

Омская область

Кислород, 4 случая

1,78; 2 по 0,93 и 0,46

р. Чапаевка, г. Чапаевск

Самарская область

Гексахлорциклогексан (ГХЦГ), 6 случаев

5—10

В первой ситуации строки разбивались на 20 наблюдений, значение 0,2 относилось и в value_min, и в value_max, при этом cnt_cases у каждого наблюдения заполнялось «1», т.е. один случай.

Во второй ситуации строки разбивались на 4 наблюдения; в первом из них value_min и value_max заполнялись значением 1,78, во втором и третьем — значением 0,93, в четвертом — 0,46; при этом cnt_cases у каждого наблюдения заполнялось «1», т.е. один случай.

Третья ситуация, поскольку в ней количество значений не совпадает с количеством случаев, оставлено одной строкой, при этом cnt_cases заполнялась значением «6», а value_min и value_max значениями «5» и «10» соответственно.

В наблюдениях, где зафиксирован единичный случай (таких подавляющее большинство), cnt_cases заполнялся значением «1», концентрация записывалась и в value_min, и в value_max. Как следствие, если cnt_cases равняется 1, то value_min = value_max.

  • Набор данных дополнен таблицей, содержащей сведения о предельно допустимых концентрациях и классах опасности загрязняющих веществ согласно следующим нормативно-правовым актам:
    • Приказ Госкомрыболовства РФ от 28.04.1999 № 96 «О рыбохозяйственных нормативах» (Госкомрыболовство-99);
    • Приказ Росрыболовства от 18.01.2010 № 20 «Об утверждении нормативов качества воды водных объектов рыбохозяйственного значения, в том числе нормативов предельно допустимых концентраций вредных веществ в водах водных объектов рыбохозяйственного значения» (Росрыболовство-2010);
    • Приказ Минсельхоза России от 13.12.2016 № 552 «Об утверждении нормативов качества воды водных объектов рыбохозяйственного значения, в том числе нормативов предельно допустимых концентраций вредных веществ в водах водных объектов рыбохозяйственного значения» (Минсельхоз-2016);
    • «СанПиН 2.1.5.980-00. 2.1.5. Водоотведение населенных мест, санитарная охрана водных объектов. Гигиенические требования к охране поверхностных вод. Санитарные правила и нормы» (утв. Главным государственным санитарным врачом РФ 22.06.2000) (СанПиН-2000);
    • Постановление Главного государственного санитарного врача РФ от 30.04.2003 № 78 «О введении в действие ГН 2.1.5.1315-03» (вместе с «ГН 2.1.5.1315-03. Предельно допустимые концентрации (ПДК) химических веществ в воде водных объектов хозяйственно-питьевого и культурно-бытового водопользования. Гигиенические нормативы», утв. Главным государственным санитарным врачом РФ 27.04.2003) (СанПиН-2003);
    • Постановление Главного государственного санитарного врача РФ от 28.01.2021 № 2 «Об утверждении санитарных правил и норм СанПиН 1.2.3685-21 «Гигиенические нормативы и требования к обеспечению безопасности и (или) безвредности для человека факторов среды обитания» (вместе с «СанПиН 1.2.3685-21. Санитарные правила и нормы...») (СанПиН-2021).
  • При извлечении информации из указанных выше нормативно-правовых актов было сделано следующее:
    • ПДК для нитрит-иона, нитрат-иона и аммоний-иона пересчитаны на чистый азот. Например, для нитрит-иона (NO2-) ПДК составляет 0,08 мг/л. С учетом массовой доли азота в нитрит-ионе, которая приблизительно равна 0,3, ПДК в пересчете на азот составит после округления 0,02 мг/л;
    • для фосфатов из трех доступных значений — для эвтрофных, мезотрофных и олиготрофных водоемов — выбрано значение ПДК для эвтрофных водоемов;
    • в качестве значения ПДК для ДДЭ (дихлордифенилдихлорэтилен) взято значение ПДК для позиции «Хлорорганические токсиканты, ДДТ и его метаболиты, ПХБ, альдрин, линдан и др.», так как ДДЭ является продуктом распада ДДТ;
    • для лигносульфонатов при анализе источника «Госкомрыболовство-99» в качестве значения ПДК было взято среднее значение ПДК для лигносульфонатов магния и лигносульфонатов натрия, так как отдельной позиции по лигносульфанатам в данном нормативно-правовом акте нет; класс опасности среди них был выбран более «жесткий» (3, а не 4).
  • Наименования загрязняющих веществ и иных индикаторов загрязнения были нормализованы. Для нормализации названий использовались указанные выше нормативно-правовые акты, а также ежегодники «Качество поверхностных вод Российской Федерации», подготавливаемые Гидрохимическим институтом Росгидромета.
  • Классы опасности загрязняющих веществ были проверены и уточнены по указанным выше нормативно-правовым актам. Если класс опасности был указан в нескольких одновременно действующих нормативно-правовых актах, то выбиралось значение из того, в котором была указана меньшая (более жесткая) предельно допустимая концентрация. Если ПДК были одинаковыми, то выбиралось меньшее (более жесткое) значение класса опасности. Класс опасности сульфатов (4) взят из ежегодника Гидрохимического института «Качество поверхностных вод Российской Федерации» за 2010 г., так как ни в одном нормативно-правовом акте он не указан.

Источники данных

Атрибут Значение

Полное наименование источника данных

Ежемесячные отчеты Росгидромета об аварийном, экстремально высоком и высоком загрязнении окружающей среды, а также радиационной обстановке на территории России

Сокращенное наименование источника данных

Отсутствует

Владелец источника данных

Федеральная служба по гидрометеорологии и мониторингу окружающей среды

Краткое описание источника данных

Отчеты размещены на официальном сайте Росгидромета. Отчет представляет собой один или несколько файлов в формате docx. В каждом отчете есть текстовая информация и таблицы. Среди таблиц есть одна с перечнем случаев экстремально высокого загрязнения поверхностных вод и одна с перечнем случаев высокого загрязнения поверхностных вод

Ссылка на источник данных

http://www.meteorf.ru/product/infomaterials/99/

Перечень используемых классификаторов

Нет

Понятия, используемые в источнике

Высокое загрязнение (ВЗ) — состояние воды в водном объекте, соответствующее любому из следующих критериев:

  • максимальное разовое содержание для нормируемых веществ 1—2-й класса опасности в концентрациях, превышающих ПДК от 3 до 5 раз, для веществ 3—4-й класса опасности — от 10 до 50 раз (для нефтепродуктов, фенолов, соединений меди, железа и марганца — от 30 до 50 раз);

  • величина биохимического потребления кислорода (БПК5) от 10 до 40 мг/л;

  • снижение концентрации растворенного кислорода до значений от 3 до 2 мг/л;

  • покрытие пленкой (нефтяной, масляной или другого происхождения) от 1/4 до 1/3 поверхности водного объекта при его обозримой площади до 6 кв. км;

  • покрытие пленкой поверхности водного объекта на площади от 1 до 2 кв. км при его обозримой площади более 6 кв. км.

Экстремально высокое загрязнение (ЭВЗ) — состояние воды в водном объекте, соответствующее любому из следующих критериев:

  • максимальное разовое содержание для нормируемых веществ 1—2-й класса опасности в концентрациях, превышающих ПДК в 5 и более раз, для веществ 3—4-й класса опасности — в 50 и более раз;

  • увеличение биохимического потребления кислорода (БКП5) свыше 40 мг/л;

  • снижение содержания растворенного кислорода до значения 2 мг/л и менее;

  • покрытие пленкой (нефтяной, масляной или другого происхождения) более 1/3 поверхности водного объекта при его обозримой площади до 6 кв. км;

  • покрытие пленкой поверхности водного объекта на площади 2 и более кв. км при его обозримой площади более 6 кв. км;

  • появление запаха вод интенсивностью более 4-х баллов и не свойственного воде ранее;

  • массовая гибель моллюсков, раков, лягушек, рыб, других водных организмов и водной растительности.

Предельно допустимая концентрация (ПДК) — максимальная концентрация вредного вещества, при которой в водном объекте не возникает последствий, снижающих его рыбохозяйственную ценность или возможность использования для хозяйственно-питьевых целей. Можно выделить две разновидности ПДК: рыбохозяйственные и санитарно-гигиенические. Первые устанавливаются для водных объектов рыбохозяйственного значения, вторые — для водных объектов хозяйственно-питьевого и культурно-бытового назначения. Если для одного и того же вещества установлены разные ПДК, то при мониторинге окружающей среды используется наиболее «жесткое», то есть наименьшее, значение.

Класс опасности — условная величина, характеризующая вредное воздействие вещества на здоровье человека или экологические системы. Есть четыре класса опасности:

  • 1-й класс — чрезвычайно опасные вещества;

  • 2-й класс — высоко опасные;

  • 3-й класс — опасные;

  • 4-й класс — умеренно опасные.

Кроме того, при мониторинге окружающей среды в четвертом классе выделяют «экологический» подкласс 4-э. Он означает, что действие вещества проявляются в изменении экологических условий в водоеме.

Лимитирующий признак вредности в воде — признак, характеризующийся наименьшей безвредной концентрацией вещества в воде

Методология и изменения методологии для источника данных

Порядок представления информации об аварийных выбросах вредных веществ установлен в Приказе Росгидромета от 31.10.2000 № 156 «О введении в действие Порядка подготовки и представления информации общего назначения о загрязнении окружающей природной среды»

Ссылки на методологию

https://docs.cntd.ru/document/901791258

Ответственные за набор данных

Ответственный 1

Гостева Инесса Игоревна

i.gosteva@cpur.ru

Ответственный 2

Сёмин Павел Олегович

p.semin@cpur.ru

 

ФИО ответственного лица Электронная почта ответственного лица

1.

Гостева Инесса Игоревна

i.gosteva@cpur.ru

2.

Сёмин Павел Олегович

p.semin@cpur.ru