Samverkan om metadatahantering

Metadata (beskrivningar) kan hjälpa dig att hitta, förstå och använda datamängder och API:er, bland annat på Sveriges dataportal. Det är viktigt att arbetet med strukturer för metadata sker i samverkan för att fånga upp behov från olika dataområden och typer av organisationer. Det är också viktigt att det nationella arbetet hänger ihop med det europeiska för att öka möjligheten för data att kunna flöda mellan, och kunna hittas, förstås och användas, i olika länder och av olika sektorer.

DCAT-AP-SE 3.0

Data Catalogue Vocabulary (DCAT) har tagits fram inom standardiseringsorganet World Wide Web Consortium (W3C) för öka interoperabiliteten mellan datakataloger som är publicerade på webben. Den europeiska dataportalen använder en europeisk variant, DCAT-AP som tas fram i samverkan inom EU kommissionens SEMIC support center. 

I Sverige håller Digg en svensk version med förtydliganden, översättningar och rekommendationer för svensk kontext. DCAT-AP-SE är strukturen för den metadata som samlas i den nationella förteckningen på Sveriges dataportal och som hämtas av den europeiska dataportalen. 

Just nu pågår en uppdatering av specifikationen DCAT-AP-SE 2.2 till version 3.0. 

En referensgrupp kommer att arbeta med detta under våren. Repot som kommer att uppdateras och därefter användas är:

https://github.com/diggsweden/DCAT-AP-SE

Värdefulla datamängder

DCAT-AP-SE 2.2 är en uppdatering av 2.0 med utgångspunkt i infångade behov från datasamverkan inom Ena - Sveriges digitala infrastruktur. Stöd som har tagits fram är: 

  1. En uppdaterad specifikation, DCAT-AP-SE 2.2
  2. Rekommendation om värdefulla datamängder
  3. Ett sökfilter för värdefulla datamängder vid sökning på Sveriges dataportal

Beständiga identifierare

För att få en samlad bild av ett objekt eller en företeelse (ting) kan information behöva hämtas från flera källor. Den samlade bilden kan hållas uppdaterad på ett effektivt sätt om det är lätt att hitta informationen från respektive källa. Varje ting, både fysiskt och digitalt, kan ha en unik identifierare för att vara identifierbart. Detta förutsätter att identifieraren inte pekar mot flera ting eller med tiden börjar peka fel. Därför behöver identifieraren vara unik och beständig över tid, vi kallar detta beständiga identifierare. 

Med beständiga identifierare kan den samlade bilden hållas aktuell maskinellt. Eftersom datorer inte kan dra slutsatser utifrån kontext krävs det att identifieraren inte behöver tolkas utifrån sitt sammanhang. Detta eftersom sammanhang kan förändras, organisationer kan byta system eller genomgå organisationsförändringar. Därför används webbens infrastruktur för att skapa stabila identifierare via webbadresser. 

En referensgrupp tog 2023 fram en profil för beständiga identifierare.  Själva profilen finns publicerad i en första version under Stöd och verktyg på Sveriges dataportal. Den består av regler kring utformning och uppslagning av beständiga identifierare. 

Underlag och dokumentation ligger på Github. Här hittar du bakgrund och behovsbild, vägledande mönster för uppslagning av informationsresurser, vägledande mönster för uppslagning av företeelser, definitioner/begreppslista, rekommendationer/praxis, användningsfall, användning i API:er (ej klar), konfiguration av webbservrar samt referenser.

Profilen har tagits fram i samverkan mellan 16 organisationer, förvaltas av Digg och kommer att uppdateras med utgångspunkt i användningsfall.