Korzyści z otwartych danych

Aby otwarte udostępnianie danych badawczych stało się w nauce powszechną praktyką, potrzebna jest kulturowa zmiana – przekonuje w kolejnym odcinku Rozmów Otwartej Nauki dr Kevin Ashley, dyrektor Data Curation Centre, organizacji wspierającej brytyjskie instytucje naukowe w zakresie zabezpieczania danych. Dodaje zarazem, że zmianę taką może przyspieszyć rozwój nowych technologii. Ashley wskazuje na astronomię, w której unowocześnienie aparatury badawczej (przede wszystkim teleskopów) doprowadziło nie tylko do zmiany formatu zapisu danych, ale również do modyfikacji samych praktyk badawczych. W ostatniej dekadzie w astronomii liczba badań powstałych w oparciu o cudze obserwacje jest większa od liczby tych, które opierają się na obserwacjach własnych. Ashley podkreśla, że nowy model badawczy nie wywołuje już zastrzeżeń ze strony samych badaczy. Po prostu w jednym pokoleniu dokonała się zmiana kulturowa i w jej trakcie pojawiały się jeszcze pewne obawy. Jednak teraz właściwie wszyscy zdają sobie sprawę, że nauce wyszło to na dobre i niczyja kariera nie doznała uszczerbku.

Dzięki otwartemu udostępnianiu danych możemy prowadzić lepsze badania i bardziej zbliżyć się do prawdy, ponieważ dysponujemy większą ilością danych – dodaje dyrektor DCC. Badania odbywają się szybciej. Także postęp odbywa się szybciej, bo dzięki wielkiej ilości danych spada koszt prowadzenia badań. Tak więc możemy albo szybciej przeprowadzić więcej badań za te same pieniądze, albo – jeśli środki się zmniejszą – wciąż osiągnąć te same efekty co wcześniej. Istnieją też korzyści innego typu, których wartość trudniej jest określić pod względem ekonomicznym, ale jest ona bezdyskusyjna. Jedna z nich dotyczy integralności badań. Niemal każdy przypadek oszustwa lub błędu w badaniach znany z przeszłości mógłby być wykryty o wiele wcześniej, gdyby dysponowano dostępem do danych leżących u podstaw tych badań.

Zapraszamy do obejrzenia całego wywiadu z dr. Kevinem Ashleyem.

Rezultaty brytyjskiej polityki Open Access

W 2013 r. brytyjskie agencje grantowe skupione w Research Councils UK (RCUK) wprowadziły politykę otwartego dostępu, zobowiązując naukowców korzystających z dotacji (corocznie ok. 3 mld GBP) do otwartego udostępniania publikacji będących efektem ich badań. Tzw. drugi raport Finch z października 2013 r. zawierał rekomendację dotyczącą regularnego monitorowania postępów we wdrażaniu otwartości przez RCUK.

W odpowiedzi na tę rekomendację powołano University UK Open Access Coordination Group. W sierpniu 2015 r. grupa opublikowała swój pierwszy raport: Monitoring the Transition to Open Access. Podsumowuje on przemiany, jakie w latach 2013–2015 zaszły w Wielkiej Brytanii w zakresie otwartego udostępniania publikacji naukowych, a jednocześnie stanowi punkt odniesienia dla kolejnych materiałów.

Autorzy raportu starają się odpowiedzieć na pytania o to, ile czasopism, w których publikują brytyjscy naukowcy, umożliwia którąś z form otwartego dostępu, oraz jakie opcje otwartości oferują wydawcy (droga złota z APC, droga złota bez APC, czasopisma hybrydowe, dostęp po okresie embargo). Analizują dane dotyczące samych czasopism oraz artykułów. Wiele uwagi poświęcają aspektom finansowym: wysokości APC (article processing charges – koszty publikacji ponoszone przez autorów) w zależności od modelu, stabilności finansowej uniwersytetów oraz towarzystw naukowych.

Z powodu braku danych w raporcie nie udało się określić szczegółów demograficznych dotyczących użytkowników, a przede wszystkim zabrakło informacji, w jakim stopniu otwarte publikacje znajdują czytelników poza środowiskiem akademickim.

Otwarte dane wymagają nowego modelu myślenia

Dane nie są statyczne, dlatego nie powinno się o nich myśleć jak o stałym i jednorodnym obiekcie. To raczej nieustannie zmieniający się strumień. Przyjęcie takiej dynamicznej perspektywy może pomóc w zarządzaniu danymi, przekonuje w kolejnym odcinku Rozmów Otwartej Nauki Mark Parsons z Research Data Alliance

Jeśli chodzi o sposoby zachęty naukowców do udostępniania danych, to – zdaniem amerykańskiego eksperta – możliwość cytowania odgrywa tu istotną rolę. Takie rozwiązanie ogranicza jednak widoczność danych do publikacji naukowych. Gdyby natomiast opatrywać dane stałymi identyfikatorami, możliwe stałoby się śledzenie ich zastosowania w dowolnej dziedzinie. Niestety, podejście to nie cieszy się obecnie wystarczającą popularnością, by można było liczyć na jego rychłe upowszechnienie. 

Otwartość to dopiero pierwszy krok. Zapewnienie danym funkcjonalności, a także umożliwienie ich ponownego wykorzystania, to zadania znacznie bardziej skomplikowane – zauważa Parsons. W tym kontekście często mówi się o objętości, szybkości i różnorodności. Od strony technicznej poradzimy sobie z objętością i prędkością, jednak różnorodność będzie wymagała znacznie większej zmiany. Nie tylko z technicznego punktu widzenia, ale także ze względu na samych badaczy i ich sposoby zbierania i prezentowania danych.

Zapraszamy do obejrzenia całego wywiadu z Markiem Parsonsem, jak również do zapoznania się z pozostałymi rozmowami w cyklu.

Przepis Holendrów na repozytorium danych

DANS, czyli Data Archiving and Networked Services, to holenderski instytut zajmujący się archiwizacją i udostępnianiem danych naukowych. O przyjętych w nim rozwiązaniach rozmawialiśmy z jego dyrektorem – Peterem Doornem.

Peter Doorn,  dyrektor DANS (Data Archiving and Networked Services)

DANS funkcjonuje od 10 lat i, co podkreśla Doorn, zainteresowanie deponowaniem i ponownym wykorzystywaniem danych wzrasta z roku na rok. Zwraca jednak uwagę, że świadomość korzyści z udostępniania danych jest wśród badaczy różna w zależności od tego, jaką dyscyplinę naukową reprezentują. Z kolei za najważniejsze wyzwanie w przypadku otwartych danych uważa przekonanie naukowców do tej praktyki. Doorn dostrzega również skuteczność promowania otwartości wśród grantodawców – tak krajowych, jak i europejskich.

Zapytany o optymalne rozwiązania na szczeblu krajowym, odpowiada: Nie chcę twierdzić, że jedno konkretne rozwiązanie – scentralizowane lub zdecentralizowane – jest najlepsze.

Promujemy „federacyjną” infrastrukturę danych, w której różni gracze mają do wypełnienia różne role i różne obowiązki na różnych szczeblach.

Otwarte dane badawcze w nauce i gospodarce

Dane badawcze są dziś coraz częściej udostępniane przez światowe ośrodki naukowe, znajdując zastosowanie zarówno w samej nauce, jak i w obszarze komercyjnym. Do wzrostu zainteresowania nimi przyczyniła się popularność Big Data – wielkich zbiorów danych przetwarzanych na niespotkaną dotąd skalę i będących siłą napędową licznych innowacyjnych rozwiązań w biznesie i gospodarce.

W domenie nauki otwarte dane, oprócz możliwości lepszej weryfikacji wyników badań oraz zwiększenia ich interdyscyplinarnego potencjału, pozwalają również na bardziej precyzyjną ewaluację dorobku badaczy. Podobnie jak w przypadku artykułów publikowanych w otwartym dostępie, których oddziaływanie mierzy się za pomocą alternatywnych metryk, także w odniesieniu do otwartych danych możliwe jest zastosowanie nowych technik pomiaru pokazujących zainteresowanie konkretnym zbiorem. O to, co jest konieczne, by otwarte dane stały się trwałym elementem procesu badawczego, zapytaliśmy w kolejnym odcinku Rozmów Otwartej Nauki Marka Thorleya – specjalistę z zakresu danych badawczych w brytyjskiej Natural Environment Research Council.

W erze cyfrowej badania naukowe zasadniczo różnią się od badań w tradycyjnym sensie – zauważa Thorley.

Additional information