Пропагација таласа у отвореном каналу

Управљање водним ресурсима захтева алате за дугорочно и краткорочно предвиђање различитих хидролошких феномена. Предвиђање је значајно у областима управљања ризиком од поплава, управљања хидро-електранама, унутрашње пловидбе, водоснабдевања, итд. Бројни задаци у вези са предвиђањем хидролошких података успешно су обрађени коришћењем приступа предвиђања заснованог на класичном нумеричком моделовању. Иако овај приступ даје задовољавајуће резултате, још увек има много проблема које треба решити. У многим случајевима, време израчунавања је параметар који може ограничити примену физички заснованих хидролошких и хидрауличких модела у реалној примени. Поред тога, физички засновани модели су недовољно флексибилни у случајевима инверзних проблема, идентификације параметара, асимилације мерених података итд.

Модели предвиђања засновани на неуронским мрежама примењени су у моделовању падавина и отицаја Chadalawada et al. [CHB20], системима раног упозорења на поплаве Duncan et al. [DCK+13], као и моделовању урбаних водоводних мрежа Garzón et al. [GarzonKLT22]. Ови приступи захтевају велику количину података за обуку, што може створити проблеме уколико нема довољно података. Поред тога, може се приметити да ова врста модела није у стању да испоручи добре резултате када улазни подаци излазе изван опсега података који се користе за обуку. У овим случајевима, модели засновани на неуронским мрежама могу произвести физички немогуће резултате. У последњих неколико година, убрзано се уводи НМПФЗ приступ и у овој области. У наредном примеру ћемо сагледати потенцијал употребе НМПФЗ у једнодимензионом проблему пропагације поплавног таласа у отвореним каналима спајањем физичког закона са почетним и граничним условима описаним кинематичком једначином пропагације таласа.

Усмеравање поплава - физички закони

Простирање поплавног таласа у отвореним каналима је описано помоћу две једначине, и то једначином континуитета (28) и законом одржања количине кретања (29). Ова једначина садржи утицаје трења, гравитације, силе притиска, као и локалног и конвективног убрзања. У овом примеру, простирање таласа у правоугаоном каналу је представљено кинематичким таласом који поједностављује динамичку једначину, узимајући само утицај трења и гравитације:

(28)\[\frac{\partial h(x,t)}{\partial t} + c \frac{\partial h(x,t)}{\partial x} = 0\]

(29)\[Q(x,t) = \frac{1}{n} \cdot B \cdot h(x,t)^\frac{5}{3} \cdot \sqrt{I_d},\]

где \(h \, [m]\) представља дубину воде, \(t \, [s]\) је време, \(x \, [m]\) просторну координату, \(c \, [m/s]\) брзину пропагације поремећаја, \(Q [m^3/s]\) проток, \(n [m^{-\frac{1}{3}}s]\) репрезентује Манингову храпавост, \(B \, [m]\) ширину попречног пресека и \(I_d\) нагиб по уздужној оси.

Циљ моделовања простирања таласа је процена промене дубине воде дуж канала \(h(x,t)\) која је изазвана поплавним таласом представљеним хидрограмом тока \(Q_{in}(t) = Q(0,t)\) на узводном крају канала.

Конструкција функције губитка

Ако се осврнемо на општи израз за функцију губитка (2), видимо три компоненте, и то губитак који потиче од резидуалне мреже, губитак који потиче од почетних услова и губитак који потиче од граничних услова. Кренимо редом. Компонента функције губитка која потиче од диференцијалне једначине (28) дефинисана је десном страном исте једначине. Компонента почетних услова се дефинише као:

\[h(x,t=0) = h_0\]

Поред тога, потребан нам је и гранични услов који дефинише вредност висине таласа на почетку моделованог домена, тј. на \(x=0\) одакле талас долази. Тај гранични услов изводимо из динамичке једначине (29):

\[h(0,t) = \left( \frac{Q_{in}(t) \cdot n}{B \cdot \sqrt{I_d}} \right)^\frac{3}{5}.\]

Уколико као меру грешке усвојимо средњу квадратну грешку (Mean Squared Error - MSE), композитна функција губитка изгледаће овако:

\[MSE = MSE_r + MSE_0 + MSE_b,\]

где су:

\[\begin{split}MSE_r = \frac{1}{N_{x_f,t_f}} \sum \left| r(x_f, t_f) \right|^2, \\ MSE_0 = \frac{1}{N_{x_0,t_0}} \sum \left| \tilde{h}(x_0,0)-h(x_0,0) \right|^2, \\ MSE_b = \frac{1}{N_{x_b,t_b}} \sum \left| \tilde{h}(0,t_b)-h(0,t_b) \right|^2.\end{split}\]

Овде су \(N_{x_f,t_f}\), \(N_{x_0,t_0}\) и \(N_{x_b,t_b}\) укупни бројеви колокационих тачака у унутрашњости моделованог домена, за почетне и за граничне услове, респективно.

Тест пример и имплементација

Пример на коме ћемо тестирати ваљаност нашег НМПФЗ приступа за моделовање ширења поплавног таласа је пропагација таласа дуж канала дугог 1600 метара, облика призме и правоугаоног попречног пресека широког 15 метара, као на Сл. 32.

../_images/poplavni1.png — Сл. 32 Поставка проблема пропагације поплавног таласа у времену.

Манингова храпавост има вредност од \(n = 0,015 m^{-\frac{1}{3}}s\), нагиб је постављен на \(I_d=0,005\), a брзина пропагације на \(c=15 \, m/s\). Циљ је израчунати промене дубине и протока воде дуж канала, изазване поплавним таласом генерисаним као узводни гранични услов на \(x=0\):

\[Q_{in}(t) = Q(0,t) = 180 \cdot \left[ 1 + \left( -\frac{sgn(t-600)}{2} + \frac{1}{2} \right) \cdot \sin \left( \frac{\pi t}{600} \right) \right].\]

Поред овог услова, ту је и почетни услов Дирихлеовог типа, а то је да је висина воде у каналу \(h(x,t=0)=1,751m\). Интересантни делови решења приказани су на Листинг 7.

Листинг 7 Решење проблема пропагације поплавног таласа коришћењем DeepXDE оквира

import deepxde as dde
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from deepxde.backend import tf

c = 15 # brzina propagacije talasa
n = 0.015 # hrapavost kanala
Id = 0.005 # nagib dna kanala
B = 15 # poprecni presek
length = 1600
total_time = 1000.0

# Hiperparametri
layers = [2] + [30] * 4 + [1]
activation = 'tanh'
initializer = 'Glorot uniform'
optimizer = 'rmsprop'
batch_size = 128
num_of_epochs = 20000
learning_rate = 0.001
loss = 'mse'

# Jednacina kontinuiteta
def pde(x, h):
    dh_t = dde.grad.jacobian(h, x, i = 0, j = 1)
    dh_x = dde.grad.jacobian(h, x, i = 0, j = 0)
    return dh_t + c * dh_x

# Da li je t=0?
def initial_h(x, on_boundary):
    return on_boundary and np.isclose(x[1], 0)

# Da li je x=0?
def boundary_hx0(x, on_boundary):
    return on_boundary and np.isclose(x[0], 0)

# Pocetni uslov za visinu vode x(t=0)
def func_init_h(x):
    return 1.751

# Dirihleov granicni uslov - Profil poplavnog talasa u vremenu
def func_hx0(x):
    t = x[:, 1:2]

    Qin = 180 * (1 + (-(np.sign(t - 600) / 2) + 0.5) * np.sin(t *  np.pi / 600))
    a = Qin * n
    b = B * np.sqrt(Id)
    c = a / b
    return custom_pow(c, 3/5)

time_domain = dde.geometry.TimeDomain(0, total_time)
geom_domain = dde.geometry.Interval(0, length)
geotime = dde.geometry.GeometryXTime(geom_domain, time_domain)

# Realizacija granicnog i pocetnog uslova
bc = dde.icbc.DirichletBC(geotime, func = func_hx0, on_boundary = boundary_hx0)
ic = dde.icbc.IC(geotime, func = func_init_h, on_initial = initial_h)

# Konstrukcija modela i definisanje kolokacionih tacaka
data = dde.data.TimePDE(geotime, pde, [bc, ic], num_domain = 16000, num_boundary = 1000,
      num_initial = 100, train_distribution = 'uniform')
net = dde.nn.FNN(layers, activation, initializer)
model = dde.Model(data, net)

# Treniranje RMSProp metodom
model.compile(optimizer = optimizer, loss = loss, lr = learning_rate)
loss_history, train_state = model.train(epochs = num_of_epochs, display_every = 1000, batch_size = batch_size)

# Dodatno treniranje L-BFGS-B metodom posle RMSprop optimizacije
model.compile("L-BFGS-B")
loss_history, train_state = model.train()

У овој скрипти одмах на почетку дефинишемо и физичке параметре проблема и хипер-параметре модела. Погледом на групу хипер-параметара одмах може да се примети значајно већи број епоха за тренинг, као и оптимизатор RMSProp уместо стандардног Adam оптимизатора. Adam оптимизатор приликом рачунања градијента користи и први и други извод (момент), док RMSProp користи само други извод. Током експериментисања са различитим хипер-параметрима, испоставило се да за овај конкретан пример RMSProp заиста нешто брже конвергира. Такође, показало се да је пример у неким сценаријима осетљив чак и на избор batch_size и иницијализатора тежина. Пракса је показала да је уз активационе функције као што су sigmoid или tanh боље користити Glorot иницијализатор, док уз активациону функцију relu боље иде He, по Katanforoosh and Kunin [KK19].

На жалост, око избора хипер-параметара не постоје строга правила. Све зависи од самог примера, па се избор оптималних хипер-параметара за неки конкретан проблем углавном своди на мануелну, временски захтевну процедуру. Помоћу алата као што је Tensorflow/Keras може се донекле умањити овај проблем једноставним алгоритмима као што је насумична претрага (Random Grid Search), која захтева огромне рачунарске ресурсе да би се добили иоле употребљиви резултати. С друге стране, постоји неколико алата који ову претрагу чине ефикаснијом паметнијим приступом оптимизацији. На пример, алат Blackfox користи дистрибуирани генетски алгоритам, а проблем хардверских ресурса решава дистрибуираном обуком на локалном Kubernetes кластеру или кластеру постављеном на неком клауд провајдеру.

Следи поставка почетног Дирихлеовог услова за ниво воде у каналу и нешто сложенијег граничног услова за висину воде \(h\) који се мења у времену по једначини (29). Овде само треба нагласити да се код DeepXDE улази \(x\) и \(t\) задају као један двоколонски тензор, у коме је:

x[:, 0:1] # ulaz x
x[:, 1:2] # ulaz t

Како је у питању динамички проблем који покрива релативно велики просторни и временски домен, тј. прати се линија од 1,6 km током приближно 17 минута, потребан је и већи број колокационих тачака него у неким проблемима које смо раније обрађивали. Модел се поставља као:

data = dde.data.TimePDE(geotime, pde, [bc, ic], num_domain = 16000, num_boundary = 1000,
  num_initial = 100, train_distribution = 'uniform')

Бројност колокационих тачака за почетне и граничне услове прати бројност тачака унутар домена. Након стандардног тренирања методом RMSProp примећујемо још једну специфичност у односу на једноставније примере. Наиме, након што се обави „глобална” претрага, алгоритам Limited Memory Broyden-Fletcher-Goldfarb-Shanno има прилику да се додатно приближи оптималном решењу према Markidis [Mar21]:

model.compile("L-BFGS-B")
loss_history, train_state = model.train()

Примећујемо да се овде не наводи број епоха, већ се алгоритам ослања на аутоматску детекцију конвергенције. График функције губитка се може видети на Сл. 33, где до 20.000. епохе, као што је већ речено, тече RMSProp, а онда се у локалној околини наставља са L-BFGS-B. Веома је уочљив раст перформанси тренирања, тј. пад вредности функције губитка у том делу.

../_images/poplavni-loss2.png — Сл. 33 Почетно тренирање методом *RMSProp* у 20.000 епоха и додатно тренирање методом *L-BFGS-B* до детектоване конвергенције

Што се самог процеса тренирања ове НМПФЗ тиче, треба нагласити да је за оволику количину података, тј. колокационих тачака, тај процес далеко брже ради на графичком процесору него на стандардном процесору. Слободна процена је да је тренирање на Tesla T4 графичком процесору више од 10 пута брже него на процесору Intel Xeon Silver 4208 @ 2.10GHz.

Коначно долазимо и до резултата. Висина воденог стуба у више контролних тачака (0, 400m, 800m, 1200m, 1600m) приказана је на Сл. 34. Ова решења се добро поклапају са решењима које даје метода коначних разлика, али то поређење овде нећемо приказивати.

../_images/poplavni-rezultati.png — Сл. 34 Висина воденог таласа у неколико тачака током времена

Инверзни проблем

Пошто смо успешно решили директни проблем, хајде да замислимо ситуацију да нам није познат параметар \(n\) који репрезентује Манингову храпавост, али да смо посматрањем кретања таласа утврдили да је његов врх висине 2,65m прошао кроз контролне тачке (0, 400m, 800m, 1200m, 1600m) у следећим тренуцима:

x [m]	0	400	800	1200	1600
t [s]	300	320	360	380	400

Ове опсервације чине могућим креирање PointSet граничног услова који смо већ користили, а то се код DeepXDE оквира ради на следећи начин:

bc_x = np.array([[0,300],[400,320],[800,360],[1200,380],[1600,400]]).reshape(5,2)
bc_y = np.array([2.65,2.65,2.65,2.65,2.65]).reshape(5,1)
ic3 = dde.icbc.PointSetBC(bc_x, bc_y, component=0)

Резултати висине воденог стуба су приказани на Сл. 35, док је вредност параметра \(n\) током обуке приказана на Сл. 36.

../_images/poplavni-inv-rezultati.png — Сл. 35 Висина воденог стуба код инверзног проблема

../_images/parametar-n.png — Сл. 36 Вредност непознатог параметра \(n\) током обуке

Видимо да се НМПФЗ и у овом проблему доста добро сналази са инверзном поставком. Још једном ваља нагласити да се код НМПФЗ директни и инверзни приступ методолошки уопште не разликују и да захтевају исту количину рачунарских ресурса. Насупрот томе, класичне нумеричке методе као МКЕ су у стању да реше искључиво директне проблеме. За индентификацију параметара код МКЕ морају да се користе методе за конвексну или чешће, неконвексну оптимизацију које су у реалним применама рачунарски веома захтевне, а понекад и нерешиве.

Наравно, ни НМПФЗ није идеалан. Успешност обуке и овом примеру много зависи од избора хипер-параметара, а често се дешава да услед стохастичког карактера саме обуке ни исти хипер-параметри не доводе до решења баш у сваком тренингу. Поред хипер-параметара, овде имамо и почетну вредност непознатог физичког параметра (или више параметара), па се неретко дешава да оптимизација за неке почетне вредности уопште не конвергира, задржавајући се у неком локалном минимуму.