Прогнозирование окружающей среды
Как новые методы машинного обучения могут улучшить прогнозирование окружающей среды
Алгоритмы машинного обучения ежедневно выполняют для нас большую работу – отправляют нежелательные e-mail в папку «Спам», предупреждают нас, если машина вот – вот во что – то врежется, и дают рекомендации какое ТВ-шоу нам смотреть дальше. Теперь мы все чаще используем эти алгоритмы для выполнения прогнозов окружающей среды.
Команда исследователей из Университета Миннесоты, Университета Питтсбурга и Геологической службы США, недавно опубликовала новое исследование по прогнозированию расхода и температуры в речных сетях на Международной конференции Общества промышленной и прикладной математики (SIAM) 2021 года по интеллектуальному анализу данных (SDM21).
"Машинное обучение часто критикуют за отсутствие физического смысла в прогнозах. То есть алгоритмы просто находят корреляции между входами и выходами, и иногда эти корреляции могут быть «ложными» или давать ложные результаты. Модель часто не справляется с ситуацией, когда изменяется соотношение между входами и выходами".
Исследование демонстрирует новый метод машинного обучения, где алгоритм «обучается» правилам внешнего мира, чтобы делать более точные прогнозы и направлять алгоритм к физически значимым отношениям между входами и выходами.

В исследовании представлена модель, которая может сделать более точные прогнозы температуры рек и проточных вод, даже когда данных мало, что характерно для большинства водоемов. Модель также может лучше обобщать разные периоды времени.

«Температура воды в проточных водах является главной переменной для большинства водных систем, включая пригодность водных систем обитания, скорость испарения, обмен парниковых газов и эффективность производства термоэлектрической энергии», - сказал Сяовэй Цзя, ведущий автор исследования, и доцент кафедры компьютерных наук Университета Питтсбурга.

Credit: CC0 Public Domain
Новый метод, опубликованный Цзя, который с 2020 года является доктором философии, выпускником факультета компьютерных наук и инженерии Университета Миннесоты в Колледже науки и инженерии, и его коллеги используют «машинное обучение, управляемое процессами или знаниями». Этот метод применяется к варианту использования прогноза температуры воды в бассейне реки Делавэр (DRB) и предназначен для преодоления некоторых распространенных ошибок прогнозирования с использованием машинного обучения. Этот метод информирует модель машинного обучения с помощью относительно простого процесса - корреляции во времени, пространственных связей между потоками и уравнений баланса энергии.

Разрозненность данных и изменчивость динамики температуры в проточных водах характерны не только для бассейна реки Делавэр. По сравнению с большей частью континентальной части Соединенных Штатов, в бассейне реки Делавэр хорошо контролируется температура воды. Таким образом, этот водоем является идеальным местом для разработки новых методов прогнозирования температуры в проточных водах.

Интерактивное визуальное объяснение, выпущенное Геологической службой США, подчеркивает эти разработки моделей и важность прогнозов температуры воды в бассейне реки Делавэр. Визуализация демонстрирует потребность общества в прогнозировании температуры воды, когда водохранилища обеспечивают питьевой водой более 15 миллионов человек, но также имеют конкурирующие потребности в воде для поддержания потоков вниз по течению и среды обитания в холодной воде для важных видов промысловых рыб. Управляющие водохранилищами могут выпускать холодную воду, когда они ожидают, что температура превысит критические пороговые значения, и наличие точных температурных прогнозов является ключом к использованию ограниченных водных ресурсов только по необходимости.

Недавнее исследование основано на сотрудничестве между учеными – водниками Геологической службы США и компьютерными специалистами Университета Миннесотских городов-побратимов в лаборатории профессора Випина Кумара на факультете компьютерных наук и инженерии Научно-инженерного колледжа, где ученые разрабатывают техники машинного обучения, основанные на знаниях.

«Эти техники, основанные на знаниях, существенно более эффективны, чем традиционные механистические модели и стандартные подходы к машинному обучению, используемые научным сообществом для решения экологических проблем», - говорит Кумар.
Методы машинного обучения нового поколения, финансируемые программой Государственного научного фонда Harnessing the Data Revolution Program, используются для решения множества экологических проблем, таких как улучшение прогнозов температуры в озерах и проточных водах.

В другой работе по прогнозированию динамики температуры воды в неконтролируемых озерах, исследователи показывают, как модели машинного обучения, основанные на знаниях, использовались для решения одной из самых сложных задач прогнозирования окружающей среды – прогнозирования в неконтролируемых экосистемах.

Модели были перенесены из хорошо наблюдаемых озер в озера с небольшим количеством наблюдений или без таковых, что привело к точным прогнозам даже в тех водоемах, где нет наблюдений за температурой. Исследователи говорят, что их подход легко распространяется на тысячи озер, демонстрируя, что метод (со значимыми переменными-предикторами и высококачественными моделями источников) является многообещающим подходом для многих видов неконтролируемых систем и переменных окружающей среды в будущем.

Авторы статьи Университет Миннесоты, источник оригинальной публикации TechXplore