Plan zarządzania danymi badawczymi, czyli Data Management Plan (DMP)
Przykładowe odpowiedzi na pytania zawarte we wniosku NCN znajdą Państwo pod wyjaśnieniami pojęć, w materiałach do pobrania
Zapraszamy do zapoznania się z praktycznymi informacjami na temat planu zarządzania danymi badawczymi. Dokument ten jest coraz częściej wymagany przez instytucje i agencje przyznające środki finansowe na badania naukowe:
- Narodowe Centrum Nauki
- Komisja Europejska (Horizon2020)
- European Research Council
- National Science Foundation
- Research Councils UK
- Biotechnology and Biological Sciences Research Council
- Wellcome Trust i inni
Co to jest Data Management Plan?
Plan zarządzania danymi badawczymi to dokument precyzyjnie opisujący czynności wykonywane na każdym etapie pracy naukowej z wykorzystaniem danych badawczych. DMP powinien powstać już na wstępnym etapie badań naukowych, ponieważ ma za zadanie określić sposób zarządzania danymi badawczymi zarówno podczas projektu badawczego, jak i po jego zakończeniu.
Czym są dane badawcze?
Danymi badawczymi nazywamy wszelkie zarejestrowane materiały o charakterze faktograficznym, powszechnie uznawane przez społeczność naukową za niezbędne do oceny wyników badań naukowych, dane zebrane, zaobserwowane lub wytworzone jako materiał do analizy, w celu uzyskania oryginalnych wyników naukowych. Uogólniając – wszystko co zostało wyprodukowane lub wytworzone w ramach prowadzonych badań:
- dane liczbowe,
- dokumenty tekstowe, notatki,
- kwestionariusze, ankiety, wyniki badań ankietowych, kwerendy,
- nagrania audio i wideo, fotografie,
- zawartość baz danych (video, audio, teksty, obrazy),
- oprogramowanie (pliki wejściowe, skrypty), wyniki symulacji komputerowych,
- modele matematyczne, algorytmy
- protokoły laboratoryjne, opisy metodologiczne
- próbki, artefakty, obiekty… i inne
Co to jest Fair Data?
Fair Data to zasady opisywania, publikowania i przechowywania danych badawczych, które służą jako wytyczne do umożliwienia ponownego wykorzystania danych w wyraźnie opisanych warunkach.
FAIR jest akronimem od:
Findable – łatwo znajdowane i wyszukiwane.
Accessible – dostępne dla wszystkich.
Interoperable – interoperacyjne, tak aby można było je połączyć z innymi danymi.
Reusable – wielokrotnego użytku.
Jak przygotować plan zarządzania danymi badawczymi?
Narodowe Centrum Nauki przygotowało szczegółowe wytyczne określające sposób stworzenia DMP, które dostępne są w języku polskim oraz w języku angielskim.
Strony do tworzenia Data Management Plan
- DMP Tool – narzędzie przygotowujące szablony DMP dostosowane do wymagań amerykańskich grantodawców
- DMP online – narzędzie bardzo podobne do DMPtool zawierające jednak bazę instytucji finansującej naukę z Wielkiej Brytanii
- The Data Curation Center – na stronie można znaleźć gotowe plany zarządzania danymi, szablony, przewodniki, wytyczne, a także informacje na temat formatów zamieszczanych danych, metadanych, w zależności od dyscypliny oraz lista kontrolna Checklist for a Data Management Plan dotycząca zawartości DMP, która pozwala szybko określić, jakich informacji może brakować w przygotowywanym DMP.
Więcej o danych badawczych:
- Selekcja i przygotowanie danych badawczych do udostępniania – broszura ICM UW
- Jak korzystać z zasobów w repozytoriach danych – broszura ICM UW
- Prawne aspekty otwierania danych badawczych – poradnik ICM UW
Udostępnianie danych badawczych
Biblioteka Uniwersytecka UJK wprowadziła możliwość deponowania otwartych danych badawczych na platformie Repozytorium UJK. Informacji na ten temat udziela Oddział Informacji Naukowej BU UJK (biblioteka.oin@ujk.edu.pl; tel.: 41 349 7177)
Bazy indeksujące repozytoria
- RE3DATA
Wiarygodna i szeroko polecana międzynarodowa baza indeksująca repozytoria danych badawczych dotyczących wszystkich dziedzin wiedzy prowadzona przez German Research Fundation. Umożliwia wyszukiwanie repozytoriów według dziedziny wiedzy oraz kraju, w którym dane repozytorium jest prowadzone. - OpenDOAR
Międzynarodowa baza indeksująca biblioteki cyfrowe, repozytoria instytucjonalne i repozytoria danych badawczych wysokiej jakości. Baza umożliwia wyszukiwanie samych repozytoriów jak i przeszukiwanie ich zasobów. - można skorzystać także z wyszukiwarki repository finder tool rozwijanej przez zespoły DataCite i re3data.org, w ramach projektu: AGU’s Enabling FAIR Data Project.
Warto poszukać repozytorium, które gromadzi takie same dane badawcze, jak te, które gromadzimy w naszych badaniach, ponieważ deponowanie takich danych może być bardzo wygodne a zarazem znajdziemy się w gronie badaczy o podobnych zainteresowaniach.
Naukowcy pracujący w Polsce mają możliwość przechowywania i udostępniania danych badawczych w ogólnych, dziedzinowych, instytucjonalnych repozytoriach danych badawczych. Poniżej zamieszczono krótkie informacje na temat repozytoriów.
Repozytoria ogólnego przeznaczenia
- Zenodo
Repozytorium opracowane dzięki inicjatywie OpenAIRE i CERN międzynarodowe repozytorium danych badawczych umożliwiające naukowcom zajmującym się wszystkimi dziedzinami wiedzy proste archiwizowanie i dzielenie się opracowanymi przez siebie danymi badawczymi. Przeznaczone dla tzw. małych danych. - RepOD
Repozytorium Otwartych Danych opracowane przez ICM UW w ramach działań Platformy Otwartej Nauki archiwizujące i udostępniające wszystkie dane wytworzone, zebrane i opracowane na potrzeby badań naukowych. Przeznaczone dla tzw. małych danych. - Figshare
- Mendeley
Ogólnodostępny, bezpłatny program do zarządzania literaturą (menedżer bibliografii) oraz portal społecznościowy i repozytorium danych badawczych. Moderowane dane zostają opatrzone stosownymi metadanymi oraz nadawany jest im numer DOI. Repozytorium przeznaczone jest dla tzw. małych danych. - Repozytoria danych badawczych NIH
Amerykański National Institutes of Health współtworzy i promuje wiele specjalistycznych repozytoriów danych badawczych, spośród których wiele udostępnia tzw. duże dane zebrane w ramach konkretnych projektów. Na stronie NIH znajduje się tabela opisująca poszczególne repozytoria, informująca o ich stopniu otwartości i procedurach umieszczania w nich danych. - MOST DANYCH
Przedsięwzięcie, w ramach którego na Politechnice Gdańskiej utworzono instytucjonalne repozytorium otwartych danych badawczych, które służyć będzie nie tylko PG, ale także konsorcjantom: Uniwersytetowi Gdańskiemu oraz Gdańskiemu Uniwersytetowi Medycznemu. Możliwe będzie rozszerzenie dostępu do platformy na inne uczelnie w regionie i kraju.
Przykładowe repozytoria dziedzinowe
- DRYAD
nauki medyczne, ścisłe i przyrodnicze - ARCHEOLOGY DATA SERVICES
University of York,
archeologia - EARTHCHEM
Lamont-Doherty Earth Observatory, Columbia University
geochemia, petrologia, geochronologia - CRYSTALLOGRAPHY OPEN DATABASE
Baza danych struktur krystalicznych, otwarta i w trybie pełnego dostępu. Dostępna także dla zarejestrowanych użytkowników, którzy mogą publikować swoje zbadane struktury w tej bazie danych. Baza zawiera dane CIF wg standardu Międzynarodowej Unii Krystalografii (IUCr).
Repozytoria instytucjonalne
Repozytoria instytucjonalne gromadzą dane badawcze wytworzone i opracowanie przez pracowników konkretnej instytucji lub granto-biorców realizujących finansowane przez nią badania. Dla szukających danych naukowców mogą być przydatne zwłaszcza wtedy, gdy prowadząca repozytorium instytucja specjalizuje się w określonym obszarze.
Przykładowe repozytoria instytucjonalne
- DATACAT: THE RESEARCH DATA CATALOGUE
University of Liverpool - OPEN DATA LMU
Ludwig-Maximilians-Universität München - CALTECHDATA
California Technical Institute of Technology
Przeszukiwanie wszystkich zasobów polskich otwartych repozytoriów umożliwia Agregator Centrum Otwartej Nauki.
Wyszukiwarki danych badawczych
Nie przechowują danych, tylko indeksują zasoby innych serwisów.
Standardy metadanych dla różnych dziedzin wiedzy
Jeśli nie wiesz, jak opisać swoje dane badawcze – sprawdź poniżej jakie standardy powinny być stosowane i czy wybrane przez Ciebie repozytorium je stosuje ; powinno to być opisane w ogólnych informacjach o repozytorium.
Poniżej zamieszczamy adresy internetowe zaufanych instytucji, które wyjaśniają, jakie standardy są stosowane w przypadku różnych repozytoriów:
Na całym świecie powstają inicjatywy mające na celu sformalizowanie specyfikacji metadanych, aby umożliwić łatwe ponowne wykorzystanie danych. Przykładami takich inicjatyw są: Research Data Alliance (RDA) OpenAire i Metadata 2020.
Standardy metadanych mają na celu usystematyzowanie sposobu opisu danych. Metadane przygotowane według standardu posiadają stałą strukturę opisu o wyraźnie zdefiniowanych polach, dzięki czemu opis jest zawsze zrozumiały zarówno dla ludzi jak i programów komputerowych.
Występuje wiele standardów metadanych. Wyszczególnić można standardy ogólne, dziedzinowe i instytucjonalne. Ogólne standardy metadanych to Dublin Core i Data Cite, czy też Data Documentation Initiative (DDI). Są one uniwersalne dziedzinowo i powszechnie stosowane. Wybrane standardy metadanych wykorzystuje się także w różnych dziedzinach i instytucjach np.: DC (nauki o życiu), EML (ekologia), SDMX (ECB, EUROSTAT, IMF, OECD, UN), SAFE (ESA), INSPIRE ISO 19139 (nauki o ziemi), Project Open Data Metadata Schema v1.1 (Agencje federalne USA), TEI i CDWA (dyscypliny humanistyczne).
Metadane to także opis zmiennych, codebook i słownik danych (controlled vocabulary) zawierający:
- Nazwy zmiennych (skrócone i pełne, np. AGE i Age of the respondent);
- Jednostki miar (np. mm);
- Dozwolone wartości (np. zakres od 0 do 100);
- Definicje zmiennych (np. Age=Age of the respondent in years).
Przykładowe słowniki danych:
- Biologia – Convention of Biological Diversity Controlled Vocabulary (CBDVoc)
- Ekonomia i nauki społeczne – Central Europe Glossary (CEG)
- Medycyna – Unified Medical Dictionary (UMD)
- Edukacja, nauki społeczne – UNESCO thesaurus
Zapisywanie metadanych możliwe jest w: pliku txt, arkuszu kalkulacyjnym, pliku XML.
KURSY ONLINE PRZYDATNE DO NAUKI TWORZENIA DMP:
- MANTRA
Darmowy kurs online skierowany do studentów, pracowników naukowych i bibliotekarzy z zakresu zarządzania danymi badawczymi. Stworzony i stale aktualizowany na Uniwersytecie w Edynburgu przez tamtejszych Data Librarians. - Research Data Management and Sharing
Pięciotygodniowy bezpłatny kurs dostępny na platformie Coursera prowadzony przez pracowników The University of North Carolina on Chapel Hill i University of Edinburgh. W ramach zaliczenia należy samodzielne wykonać kompletny DMP oceniany następnie przez innych uczestników kursu. Co jakiś czas otwierana jest kolejna jego edycja.
Wykorzystaj data journals – recenzowane czasopisma z artykułami na temat zbiorów danych badawczych. Publikowane w nich artykuły (data descriptors) mogą zawierać załączniki z omawianymi danymi lub wskazywać miejsca przechowywania tych danych – zwykle repozytoria. W zależności od dziedziny nauki lub przyjętych przez redakcję wytycznych publikacje mogą ponadto zawierać takie elementy, jak: ilościowe i jakościowe informacje o zbiorach danych, opis ich źródła lub metodologii ich pozyskiwania, opis ich znaczenia, a także informacje na temat warunków korzystania z danych (rodzaju licencji). Zwykle data journals udostępniają też listy rekomendowanych repozytoriów, z których korzystać mogą naukowcy publikujący dane badawcze. Listy te mogą być pomocne również w wyszukiwaniu danych, zwłaszcza kiedy czasopismo specjalizuje się w określonym obszarze badawczym.
Przykłady data journals:
- Biodiversity Data Journal (Pensoft), od 2013
- Data in Brief (Elsevier), od 2014
- Earth System Science Data (Copernicus Publications), od 2009
- (Wiley), od 2012
- Geoscience Data Journal (Ubiquity Press), od 2011
- Journal of Open Psychology Data (Ubiquity Press)
- Research Data Journal for the Humanities and Social Sciences (Brill) od 2016
- Scientific Data (Nature), od 2013
Najczęściej zadawane pytania
Materiały do pobrania:
- Komunikat „Plany NCN w zakresie zarządzania danymi naukowymi” z dnia 3 kwietnia 2019 roku
- Wytyczne dla wnioskodawców do uzupełnienia planu zarządzania danymi badawczymi w języku polskim
- Wytyczne dla wnioskodawców do uzupełnienia planu zarządzania danymi badawczymi w języku angielskim
- Wytyczne dla wnioskodawców do uzupełnienia planu zarządzania danymi badawczymi – przykłady odpowiedzi (oprac. UJK)
- Plan zarządzania danymi – przykład wypełnienia w języku polskim
- Propozycja budowy struktury katalogowej do gromadzenia dokumentacji (oprac. UJK)
- Praktyczny przewodnik dotyczący ujednoliconych europejskich praktyk związanych z zarządzaniem danymi naukowymi (Science Europe)
- Przewodnik opracowany przez europejskie konsorcjum CESSDA
- Przewodnik po naukach humanistycznych, rzetelne udostępnianie danych w naukach humanistycznych (Raport ALLEA)
- Webinarium Zarządzanie Danymi Badawczymi (na podstawie wytycznych NCN) Karolina Wicha
- ABC… sporządzania planu zarządzania danymi badawczymi (na podstawie wytycznych NCN) – prezentacja Karoliny Wichy
- Ustawa z 11 sierpnia 2021 r. o otwartych danych i ponownym wykorzystywaniu informacji sektora publicznego (Dz.U. z 2021 r. poz. 1641)