Bearbetning av data – så går det till

Sveriges vattenmiljö har ambitionen att ge en bred men samtidigt detaljrik bild av miljötillståndet i såväl sötvatten som kust- och utsjövatten. För att få bästa möjliga rumsliga täckning hämtas data som rapporterats in till de nationella datavärdarna från både nationell och regional miljöövervakning. Ett annat mål är att bidra till en ökad användning av miljöövervakningsdata genom att gynna både kvalitetssäkring och att miljödata blir tillgängliga i en användbar form. För att bearbetningen av denna stora mängd data skall bli väl dokumenterad och reproducerbar baseras den på skript i välkända programvaror och standardiserade statistiska metoder och grafer. Speciellt läggs stor vikt vid att skapa tydliga dataflöden från utförare av miljöövervakning till presentation på webben. Vidare granskas alla data på ett systematiskt sätt innan de sammanställs i form av tidsserier och läggs ut på webben.

All rådata laddas ner och granskas

Bearbetningen av data inleds normalt med att rådata laddas ner från berörda datavärdar. När det gäller data från svensk akvatisk miljöövervakning är dessa SMHI, SLU (Sveriges lantbruksuniversitet) och SGU (Sveriges geologiska undersökning). I samband med importen sker även en granskning av att all data som förväntas vara med i nedladdningen faktiskt har lagts in i datavärdens databas. Vidare justeras vissa dataformat för att underlätta fortsatt dataanalys med valfri statistisk programvara.

I några fall hämtas även bearbetade data från datavärd eller utförare av miljöövervakning. Detta gäller till exempel miljögifter i biota, där datavärdens databas håller på att omorganiseras, och uppskattningarna av fiskbeståndens storlek, där hanteringen av rådata bedömdes kräva särskild expertkompetens.

En grundläggande kvalitetsgranskning av enskilda mätvärden förutsätts ha skett hos utförare och datavärd. Inom Sveriges vattenmiljö inriktas därför granskningen på att undersöka om variationen i tid och rum är rimlig. För detta ändamål genereras i statistikprogrammen SAS och R ett stort antal tidsseriegrafer som sedan granskas visuellt. Vidare utnyttjas ett geografiskt informationssystem (QGIS) för att kontrollera, komplettera och sammanställa kopplingar av mätvärden till vattenförekomster och bedömningsområden. Fördjupade analyser av datakvalitet utförs om det finns indikationer på allvarliga kvalitetsproblem. Detta gäller speciellt beräkningarna av kvalitetsindex (BQI) för bottenfauna i marina miljöer.

Ett exempel på hur det kan se ut. Här klorofyll-a i kustvattenförekomsten Gullmarn centralbassäng.

Presenteras som tidsseriegrafer

Presentationen av data på webben bygger på tidsseriegrafer av årsvärden per vattenförekomst eller bedömningsområde enligt de principer som fastlagts inom vattenförvaltningsförordningen. Dessa grafer visar numeriska värden i form av koncentrationer, mängder, antal mm. Ursprunget av data (nationell eller regional miljöövervakning) markeras i anslutning till respektive graf. De formella statusklassningarna av vattenförekomsterna, där sådana finns, görs tillgängliga genom länk till VISS (Vatteninformationssystem Sverige).

Om inget annat sägs visas endast tidsseriegrafer för de variabler och vattenförekomster där det finns minst 10 årsvärden. Denna begränsning gäller också de statistiska trendanalyserna. För att avgöra om det finns en uppåt- eller nedåtgående trend under den tidsperiod som visas på grafen utförs så kallade Mann-Kendalltester som enbart utnyttjar rangordningen mellan de observerade värdena och därför inte är så känsliga för enstaka starkt avvikande mätvärden. För att tydliggöra pucklar och andra icke-linjära trender anpassas också mjukt varierande trendkurvor till årsvärdena. Detta sker med hjälp av så kallade GAM-modeller. Skript för trendanalyserna finns tillgängliga i statistikprogrammet SAS och programmeringsspråket R.

Samtliga årsvärden som utnyttjas för grafer eller trendanalyser görs tillgängliga för nedladdning. Även graferna i sig går att ladda ner eller skriva ut. I samband med graferna kommer den berörda variabeln också att beskrivas i text, som förklarar varför denna är intressant att följa över tid och vad det kan säga om miljötillståndet.