Plan zarządzania danymi badawczymi, czyli Data Management Plan (DMP)

Przykładowe odpowiedzi na pytania zawarte we wniosku NCN znajdą Państwo pod wyjaśnieniami pojęć, w materiałach do pobrania

Zapraszamy do zapoznania się z praktycznymi informacjami na temat planu zarządzania danymi badawczymi. Dokument ten jest coraz częściej wymagany przez instytucje i agencje przyznające środki finansowe na badania naukowe:

  • Narodowe Centrum Nauki
  • Komisja Europejska (Horizon2020)
  • European Research Council
  • National Science Foundation
  • Research Councils UK
  • Biotechnology and Biological Sciences Research Council
  • Wellcome Trust i inni

Co to jest Data Management Plan?

Plan zarządzania danymi badawczymi to dokument precyzyjnie opisujący czynności wykonywane na każdym etapie pracy naukowej z wykorzystaniem danych badawczych. DMP powinien powstać już na wstępnym etapie badań naukowych, ponieważ ma za zadanie określić sposób zarządzania danymi badawczymi zarówno podczas projektu badawczego, jak i po jego zakończeniu.

Czym są dane badawcze?

Danymi badawczymi nazywamy wszelkie zarejestrowane materiały o charakterze faktograficznym, powszechnie uznawane przez społeczność naukową za niezbędne do oceny wyników badań naukowych, dane zebrane, zaobserwowane lub wytworzone jako materiał do analizy, w celu uzyskania oryginalnych wyników naukowych. Uogólniając – wszystko co zostało wyprodukowane lub wytworzone w ramach prowadzonych badań:

  • dane liczbowe,
  • dokumenty tekstowe, notatki,
  • kwestionariusze, ankiety, wyniki badań ankietowych, kwerendy,
  • nagrania audio i wideo, fotografie,
  • zawartość baz danych (video, audio, teksty, obrazy),
  • oprogramowanie (pliki wejściowe, skrypty), wyniki symulacji komputerowych,
  • modele matematyczne, algorytmy
  • protokoły laboratoryjne, opisy metodologiczne
  • próbki, artefakty, obiekty… i inne

Co to jest Fair Data?

Fair Data to zasady opisywania, publikowania i przechowywania danych badawczych, które służą jako wytyczne do umożliwienia ponownego wykorzystania danych w wyraźnie opisanych warunkach.

FAIR jest akronimem od:
Findable – łatwo znajdowane i wyszukiwane.
Accessible – dostępne dla wszystkich.
Interoperable – interoperacyjne, tak aby można było je połączyć z innymi danymi.
Reusable – wielokrotnego użytku.

Więcej o Fair Data

Jak przygotować plan zarządzania danymi badawczymi?

Narodowe Centrum Nauki przygotowało szczegółowe wytyczne określające sposób stworzenia DMP, które dostępne są w języku polskim oraz w języku angielskim.

Strony do tworzenia Data Management Plan

  • DMP Tool – narzędzie przygotowujące szablony DMP dostosowane do wymagań amerykańskich grantodawców
  • DMP online – narzędzie bardzo podobne do DMPtool zawierające jednak bazę instytucji finansującej naukę z Wielkiej Brytanii
  • The Data Curation Center – na stronie można znaleźć gotowe plany zarządzania danymi, szablony, przewodniki, wytyczne, a także informacje na temat formatów zamieszczanych danych, metadanych, w zależności od dyscypliny oraz lista kontrolna Checklist for a Data Management Plan dotycząca zawartości DMP, która pozwala szybko określić, jakich informacji może brakować w przygotowywanym DMP.

Więcej o danych badawczych:

Udostępnianie danych badawczych

Biblioteka Uniwersytecka UJK wprowadziła możliwość deponowania otwartych danych badawczych na platformie Repozytorium UJK. Informacji na ten temat udziela Oddział Informacji Naukowej BU UJK (biblioteka.oin@ujk.edu.pl; tel.: 41 349 7177)

Bazy indeksujące repozytoria

  • RE3DATA
    Wiarygodna i szeroko polecana międzynarodowa baza indeksująca repozytoria danych badawczych dotyczących wszystkich dziedzin wiedzy prowadzona przez German Research Fundation. Umożliwia wyszukiwanie repozytoriów według dziedziny wiedzy oraz kraju, w którym dane repozytorium jest prowadzone.
  • OpenDOAR
    Międzynarodowa baza indeksująca biblioteki cyfrowe, repozytoria instytucjonalne i repozytoria danych badawczych wysokiej jakości. Baza umożliwia wyszukiwanie samych repozytoriów jak i przeszukiwanie ich zasobów.
  • można skorzystać także z wyszukiwarki repository finder tool rozwijanej przez zespoły DataCite i re3data.org, w ramach projektu: AGU’s Enabling FAIR Data Project.

Warto poszukać repozytorium, które gromadzi takie same dane badawcze, jak te, które gromadzimy w naszych badaniach, ponieważ deponowanie takich danych może być bardzo wygodne a zarazem znajdziemy się w gronie badaczy o podobnych zainteresowaniach.

Naukowcy pracujący w Polsce mają możliwość przechowywania i udostępniania danych badawczych w ogólnych, dziedzinowych, instytucjonalnych repozytoriach danych badawczych. Poniżej zamieszczono krótkie informacje na temat repozytoriów.

Repozytoria ogólnego przeznaczenia

  • Zenodo
    Repozytorium opracowane dzięki inicjatywie OpenAIRE i CERN międzynarodowe repozytorium danych badawczych umożliwiające naukowcom zajmującym się wszystkimi dziedzinami wiedzy proste archiwizowanie i dzielenie się opracowanymi przez siebie danymi badawczymi. Przeznaczone dla tzw. małych danych.
  • RepOD
    Repozytorium Otwartych Danych opracowane przez ICM UW w ramach działań Platformy Otwartej Nauki archiwizujące i udostępniające wszystkie dane wytworzone, zebrane i opracowane na potrzeby badań naukowych. Przeznaczone dla tzw. małych danych.
  • Figshare
  • Mendeley
    Ogólnodostępny, bezpłatny program do zarządzania literaturą (menedżer bibliografii) oraz portal społecznościowy i repozytorium danych badawczych. Moderowane dane zostają opatrzone stosownymi metadanymi oraz nadawany jest im numer DOI. Repozytorium przeznaczone jest dla tzw. małych danych.
  • Repozytoria danych badawczych NIH
    Amerykański National Institutes of Health współtworzy i promuje wiele specjalistycznych repozytoriów danych badawczych, spośród których wiele udostępnia tzw. duże dane zebrane w ramach konkretnych projektów. Na stronie NIH znajduje się tabela opisująca poszczególne repozytoria, informująca o ich stopniu otwartości i procedurach umieszczania w nich danych.
  • MOST DANYCH
    Przedsięwzięcie, w ramach którego na Politechnice Gdańskiej utworzono instytucjonalne repozytorium otwartych danych badawczych, które służyć będzie nie tylko PG, ale także konsorcjantom: Uniwersytetowi Gdańskiemu oraz Gdańskiemu Uniwersytetowi Medycznemu. Możliwe będzie rozszerzenie dostępu do platformy na inne uczelnie w regionie i kraju.

Przykładowe repozytoria dziedzinowe

  • DRYAD
    nauki medyczne, ścisłe i przyrodnicze
  • ARCHEOLOGY DATA SERVICES
    University of York,
    archeologia
  • EARTHCHEM
    Lamont-Doherty Earth Observatory, Columbia University
    geochemia, petrologia, geochronologia
  • CRYSTALLOGRAPHY OPEN DATABASE
    Baza danych struktur krystalicznych, otwarta i w trybie pełnego dostępu. Dostępna także dla zarejestrowanych użytkowników, którzy mogą publikować swoje zbadane struktury w tej bazie danych. Baza zawiera dane CIF wg standardu Międzynarodowej Unii Krystalografii (IUCr).

Repozytoria instytucjonalne

Repozytoria instytucjonalne gromadzą dane badawcze wytworzone i opracowanie przez pracowników konkretnej instytucji lub granto-biorców realizujących finansowane przez nią badania. Dla szukających danych naukowców mogą być przydatne zwłaszcza wtedy, gdy prowadząca repozytorium instytucja specjalizuje się w określonym obszarze.

Przykładowe repozytoria instytucjonalne

Przeszukiwanie wszystkich zasobów polskich otwartych repozytoriów umożliwia Agregator Centrum Otwartej Nauki.

Wyszukiwarki danych badawczych

Nie przechowują danych, tylko indeksują zasoby innych serwisów.

Standardy metadanych dla różnych dziedzin wiedzy

Jeśli nie wiesz, jak opisać swoje dane badawcze – sprawdź poniżej jakie standardy powinny być stosowane i czy wybrane przez Ciebie repozytorium je stosuje ; powinno to być opisane w ogólnych informacjach o repozytorium.

Poniżej zamieszczamy adresy internetowe zaufanych instytucji, które wyjaśniają, jakie standardy są stosowane w przypadku różnych repozytoriów:

Na całym świecie powstają inicjatywy mające na celu sformalizowanie specyfikacji metadanych, aby umożliwić łatwe ponowne wykorzystanie danych. Przykładami takich inicjatyw są: Research Data Alliance (RDA) OpenAire i Metadata 2020.

Standardy metadanych mają na celu usystematyzowanie sposobu opisu danych. Metadane przygotowane według standardu posiadają stałą strukturę opisu o wyraźnie zdefiniowanych polach, dzięki czemu opis jest zawsze zrozumiały zarówno dla ludzi jak i programów komputerowych.

Występuje wiele standardów metadanych. Wyszczególnić można standardy ogólne, dziedzinowe i instytucjonalne. Ogólne standardy metadanych to Dublin Core i Data Cite, czy też Data Documentation Initiative (DDI). Są one uniwersalne dziedzinowo i powszechnie stosowane. Wybrane standardy metadanych wykorzystuje się także w różnych dziedzinach i instytucjach np.: DC (nauki o życiu), EML (ekologia), SDMX (ECB, EUROSTAT, IMF, OECD, UN), SAFE (ESA), INSPIRE ISO 19139 (nauki o ziemi), Project Open Data Metadata Schema v1.1 (Agencje federalne USA), TEI i CDWA (dyscypliny humanistyczne).

Metadane to także opis zmiennych, codebook i słownik danych (controlled vocabulary) zawierający:

  • Nazwy zmiennych (skrócone i pełne, np. AGE i Age of the respondent);
  • Jednostki miar (np. mm);
  • Dozwolone wartości (np. zakres od 0 do 100);
  • Definicje zmiennych (np. Age=Age of the respondent in years).

Przykładowe słowniki danych:

  • Biologia – Convention of Biological Diversity Controlled Vocabulary (CBDVoc)
  • Ekonomia i nauki społeczne – Central Europe Glossary (CEG)
  • Medycyna – Unified Medical Dictionary (UMD)
  • Edukacja, nauki społeczne – UNESCO thesaurus

Zapisywanie metadanych możliwe jest w: pliku txt, arkuszu kalkulacyjnym, pliku XML.

KURSY ONLINE PRZYDATNE DO NAUKI TWORZENIA DMP:

  • MANTRA
    Darmowy kurs online skierowany do studentów, pracowników naukowych i bibliotekarzy z zakresu zarządzania danymi badawczymi. Stworzony i stale aktualizowany na Uniwersytecie w Edynburgu przez tamtejszych Data Librarians.
  • Research Data Management and Sharing
    Pięciotygodniowy bezpłatny kurs dostępny na platformie Coursera prowadzony przez pracowników The University of North Carolina on Chapel Hill i University of Edinburgh. W ramach zaliczenia należy samodzielne wykonać kompletny DMP oceniany następnie przez innych uczestników kursu. Co jakiś czas otwierana jest kolejna jego edycja.

Wykorzystaj data journals – recenzowane czasopisma z artykułami na temat zbiorów danych badawczych. Publikowane w nich artykuły (data descriptors) mogą zawierać załączniki z omawianymi danymi lub wskazywać miejsca przechowywania tych danych – zwykle repozytoria. W zależności od dziedziny nauki lub przyjętych przez redakcję wytycznych publikacje mogą ponadto zawierać takie elementy, jak: ilościowe i jakościowe informacje o zbiorach danych, opis ich źródła lub metodologii ich pozyskiwania, opis ich znaczenia, a także informacje na temat warunków korzystania z danych (rodzaju licencji). Zwykle data journals udostępniają też listy rekomendowanych repozytoriów, z których korzystać mogą naukowcy publikujący dane badawcze. Listy te mogą być pomocne również w wyszukiwaniu danych, zwłaszcza kiedy czasopismo specjalizuje się w określonym obszarze badawczym.

Przykłady data journals:

Najczęściej zadawane pytania

Odpowiedzi na najczęściej zadawane pytania dotyczące planów zarządzania danymi badawczymi opublikowane przez Narodowe Centrum Nauki

Materiały do pobrania: