Strojno učenje u seizmologiji

O strojnom učenju

Primjena strojnog učenja u seizmologiji revolucionira našu sposobnost analize seizmičkih signala. Algoritmi strojnog učenja pokazali su se iznimno učinkovitima u obradi velike količine seizmoloških podataka. Ovi algoritmi mogu automatski analizirati seizmološke podatke kako bi razlikovali seizmičke signale od pozadinske buke te detektirali  vremena dolaska različitih seizmičkih faza, poput P-vala i S-vala, pružajući precizne informacije o podrijetlu potresa i magnitudi. Ove metode ne samo da poboljšava brzinu i točnost detekcije potresa, već i minimiziraju ljudsku pristranost u analizi. Naime, kada postoji samo nekoliko postaja u mreži, jedna osoba može lako analizirati podatke, no kada se mreža sastoji od više desetaka postaja, tradicionalni pristup može biti vremenski vrlo zahtjevan i mora ga obaviti više osoba. Svaki analitičar tada unosi svoje vlastitu pristranost pri detekciji signala, pa je ideja da to računalo obavi s uniformnom nesigurnošću vrlo privlačna  Rezultat je snažniji i učinkovitiji sustav seizmičkog praćenja, ključan za sustave ranog upozoravanja i procjenu opasnosti. Na primjeru jednog lokalnog potresa koji je zabilježen na postajama CRONOS (9H) i Du-Net (DN) mreže, objasnit ćemo neke prednosti ali i (trenutne) mane korištenja strojnog učenja u seizmologiji.

O algoritmima strojnog učenja

U analizi potresa pomoću strojnog učenja, nekoliko ključnih čimbenika je važno za uspješne rezultate. Prije svega, pristup visokokvalitetnim seizmičkim podacima od presudne je važnosti. Količina i kvaliteta podataka izravno utječu na performanse modela strojnog učenja. Sa našom progušćenom mrežom možemo reći da je taj uvjet ispunjen. Dodatno, odabir najboljih algoritama te posebno skupova podataka za obuku tih algoritama znatno utječe na sposobnost modela da točno otkrije seizmičke događaje i faze. U ovoj analizi koristit ćemo model za strojno učenje EQTransformer (Mousavi et al., 2021) koji je treniran na INSTANCE (Michelini et al., 2021) skupu podataka. INSTANCE skup podataka sadži 1,159,249 seizmograma od 54,008 lokalnih potresa (epicentralna udaljenost < 300 km) i 132,330 zapisa pozadinske buke zabilježenih na 620 stanica u Italiji. 

EQTransformer koristi takozvanu “Transformer” neuronsku mrežu, vrstu umjetne inteligencije koja je vrlo dobra u prepoznavanju uzoraka u podacima. Zamislite da gledate kompleksnu seriju valova na zaslonu – neki od ovih signala su samo pozadinska buka (kao od prometa ili vjetra), ali drugi su stvarni seizmički valovi potresa. EQTransformer je obučen da razlikuje navedene tipove signala. Prije no što može to učiniti, EQTransformer trenira sa mnogo primjera seizmičkih podataka (u ovom slučaju INSTANCE skupu podataka). Pomoću tog trening skupa podataka, koji su označeni i analizirani ručnom metodom, on nauči kako izgledaju karakteristični zapisi potresa. Zatim, dok analizira podatke, algoritam traži specifične karakteristike koje ukazuju na potres. Te karakteristike temelje se na oblicima, veličinama i vremenima valova u seizmičkim podacima (Slika 1.).

Slika 1. Primjer kako EQTransformer pridodaje pažnju različitim aspektima seizmoloških podataka. Neuronska mreža sa svojim različitim slojevima fokusira se na različite dijelove zapisa potresa te tako definira što je potres (a) i kada počinju P faza (b) i S faza (c). Slika preuzeta iz Mousavi et al. (2020).

Primjer analize

Kao primjer koristimo nedavni potres lokalne magnitude ML4.3 sa epicentrom 10 km jugozapadno od Metkovića na dubini od 4 km. Slika 2. prikazuje vertikalnu komponentu brzine gibanja tla zabilježenu na stanicama CRONOS i Du-Net mreža.

Slika 2. (lijevo) Mapa privremenih seizmoloških mreža CRONOS (plavi trokuti) i DuFault projekta (zeleni trokuti). Crvena zvjezdica označava epicentar potresa. (desno) Zapis vertikalne komponente brzine gibanja tla potresa sa epicentrom 10 km jugozapadno od Metkovića koji se dogodio u 17:01 23. rujna 2023. na seizmološkim postajama projekta CRONOS (oznaka HRXX) u Sjevernoj i Srednjoj Dalmaciji te projekta DuFAULT (Du-Net mreža, oznaka DFXX) u širem dubrovačkom području. Postaje su poredane po epicentralnoj udaljenosti.

Kako bi procijenili uspješnost detekcije faza potresa napravljena je analiza ovog potresa na tradicionalni način – ručnim detektiranjem nailaska P i S valova. Naša iskusna analitičarka odradila je taj dio posla i njene detekcije za 4 postaje (HR10A, HR12A, DF02 i DF06) možemo vidjeti na sljedećoj slici (Slika 3).

Slika 3. Detekcija P i S vala za 4 postaje (HR10A, HR12A, DF06 i DF02) ručnom metodom. Svijetlo plavom bojom označeno vrijeme dolaska P vala, a narančastom vrijeme dolaska S vala.

Sada kada imamo ručno određene vremena nailazaka P i S faze za sve stanice korištene u analizi, možemo upogoniti automatske detektore i pogledati kako oni obavljaju ovaj dio posla.

Slika 4. Usporedba ručne metode i automatske detekcija potresa pomoću EQTransformera.

Slika 4. prikazuje automatsku detekciju potresa i seizmičkih faza i usporedbu sa ručnom metodom za četiri odabrane seizmološke postaje u blizini epicentra. Slika za svaku od postaja je podijeljena u dva dijela. Gornja slika prikazuje seizmogram sa označenim nailascima faza ručnom metodom (svijetlo plave i narančaste linije) i koristeći EQTransformer (plave i crvene linije). Donji dio slike prikazuje koliku težinu, tj. vjerojatnost EQTransformer daje svojim rezultatima. Plavom linijom je označeno što EQTransformer smatra potresom, zelenom krivuljom vrijeme i vjerojatnost nailaska P vala, a crvenom krivuljom S vala. Tu već vidimo jednu prednost ove metode, a to je kvantificirana sigurnost izbora vremena nailaska pojedinog vala. 

Naime, kao što smo i spomenuli u uvodu, u slučaju serije potresa zabilježene na desecima stanica, detektiranje potresa i različitih faza je mukotrpan i dugotrajan postupak, pogotovo ako cijelu analizu radi jedan analitičar. Zato najčešće cijeli tim ljudi obavlja taj posao, tim u kojem se nalaze ljudi sa različitim radnim iskustvom. Iskusan seizmolog će svoj dio podataka analizirati možda savršeno dok će onaj manje iskusan svoj dio odraditi nešto lošije. U krajnjem katalogu potresa, svi odabiri vremena nailaska faza imaju jednake težine i krajnji korisnik tih podataka ne zna kolike su nesigurnosti bile pri odabiru tih vremena. Metode strojnog učenja omogućavaju nam baš tu kvantifikaciju sigurnosti pri odabiru faza. 

Glavno pitanje je mogu li metode strojnog učenja već sada zamijeniti ručne metode. Kao što je i obećano u uvodu, tu dolazimo do (trenutnih) mana ovih metoda. Slika 5. prikazuje vertikalnu komponentu stanice HR10A. Na slici je uvećan dio seizmograma oko vremena  nailaska P vala, te vidimo razliku između odabira ručnom metodom i odabir EQTransformera. Dva su problema vidljiva na ovoj slici. Prvi, onaj očigledni, je razlika u 0.2 s između dva odabira. Možda vam to ne zvuči kao nekakva velika razlika, ali uzmemo li u obzir da se P val (u gornjih 10 km Zemljine kore) širi brzinom od otprilike 5 km/s, razlika u odabiru vremena od 0.2 s dovodi do pogreške u lokaciji potresa od 1 km. Drugi problem vidljiv je na Slici 5b, a to je polaritet prvog pomaka (odabranog) P vala. Smjer prvog pomaka P-vala upotrebljava se za određivanje žarišnog mehanizma koje nam opisuje izvor potresa tj. pomake na rasjedu. To je jedan od naših uvida u sami izvor potresa i od iznimne nam je važnosti točno odrediti polaritet prvog pomaka. Na ovom primjeru, ne možemo sa sigurnošću znati je li taj prvi pomak prema gore ili dolje.

Slika 5. Uvećani prikaz dolaska P vala na vertikalnoj komponenti stanice HR10A.

Odgovor na pitanje mogu li metode strojnog učenja već sada sigurno zamijeniti tradicionalne metode je – još uvijek ne. No, ako nastavimo trenirati naše modele sa ažuriranim podatcima, kreiramo lokalne/regionalne skupove podataka za treniranje modela, ovaj odgovor bi se u bližoj budućnosti mogao i promijeniti. 

Literatura:

Michelini, A., Cianetti, S., Gaviano, S., Giunchi, C., Jozinović, D., & Lauciani, V. (2021). INSTANCE – The Italian Seismic Dataset For Machine Learning. Istituto Nazionale di Geofisica e Vulcanologia (INGV).

Mousavi, S.M., Ellsworth, W.L., Zhu, W., Chuang, L.Y., Beroza, G.C., “Earthquake Transformer: An Attentive Deep-learning Model for Simultaneous Earthquake Detection and Phase Picking “. Nature Communications, (2020).

Pripremio: dr.sc. Dinko Šindija