Sdílení dat v sociálním výzkumu

SDA - Sociologický datový archiv

Úvod do problematiky sdílení dat v sociálním výzkumu. Připravil Jindřich Krejčí

Sdílení dat v sociálním výzkumu

Způsob práce s daty ze sociálněvědních výzkumných šetření se významně změnil, protože:

  • Vzrůstá objem dat, které má sociálněvědní výzkum k dispozici. Nejen, že se zvýšila např. produkce výběrových šetření, ale ve společnosti všeobecně dochází k překotné digitalizaci.
  • Zároveň dochází k rozvoji a zavádění nových informačních technologií umožňujících nové způsoby práce s daty, jejich přenos a sdílení. 
  • Charakter současné výzkumné práce je hodně ovlivňován formami spolupráce založenými na sdílení výzkumných dat mezi výzkumnými týmy. Na této praxi stojí např. současný rozvoj mezinárodního komparativního výzkumu.
  • Objem a dostupnost datových zdrojů a nové typy dat pak mají také značný dopad na rozvoj metod analýzy a jejich zavádění zpětně generuje další požadavky na vytváření dat a podobu jejich zpracování.

Zpracování a analýza dat se v řadě aspektů zrychlila, zlevnila a zjednodušila. Vzhledem k objemu dat, ale často zbývá na jejich zpracování méně prostoru. Díky tomu rostou nároky na systematický přístup k datům.

Otevřený přístup k výzkumným datům

Výměna znalostí podmiňuje rozvoj současného vědeckého výzkumu, a to platí i pro sdílení sociálněvědních dat, protože:

  • dostupnost dat a možnost kombinovat různé datové zdroje přispívá k řešení mnoha výzkumných úloh,
  • je důležitým východiskem pro mezinárodní komparace a studium vývoje v čase,
  • umožňuje využití reálných výzkumných dat ve výuce,
  • znalost datových výstupů předchozích projektů je oporou pro formulaci nových výzkumných projektů, koncepcí jejich řešení a redukuje potřebu empirická šetření opakovat,
  • přispívá k ověřitelnosti výsledků a transparentnosti vědeckého výzkumu.

Data vznikají za velkých nákladů z veřejných zdrojů. Hodnotu zpět ovšem nezískáváme pouhým vznikem databáze, ale teprve s jejím využitím. Využitelná informační hodnota přitom obvykle přesahuje jednotlivý projekt - proto je logické požadovat, aby recipient veřejné podpory umožnil důsledné využití databáze a pokud tomu nebrání povaha dat, výzkumného projektu nebo jiné specifické okolnosti, po skončení využití databáze v rámci daného projektu je zpřístupnil pro další, sekundární výzkum.

V akademickém výzkumu, v případě, že je podporován z veřejných zdrojů a za účelem vzniku veřejně přístupných výsledků a znalostí a pokud tomu nebrání charakter dat nebo specifické okolnosti jejich vzniku, je proto vyžadováno široké a efektivní sdílení výzkumných dat založené na vytváření „otevřeného přístupu“.

Otevřenost v tomto kontextu „znamená přístup za rovných podmínek pro mezinárodní vědeckou komunitu za nejnižší možnou cenu, nejlépe nepřesahující mezní náklady distribuce. Otevřený přístup k výzkumným datům z veřejného financování by měl být snadný, časově nenáročný, uživatelsky přívětivý a nejlépe založený na Internetu.” (OECD 2007).

Ne všechna data lze zpřístupnit, požadavek otevřeného přístupu se netýká např. výzkumu na základě veřejných zakázek nebo pro účely komercionalizace atp. Důvodem omezení přístupu může být též specifická uspořádání vlastnických vztahů, ochrana osobních údajů, ochrana duševního vlastnictví, národní bezpečnost, obchodní tajemství nebo možnost narušení legálních procesů. Legitimní jsou i další důvody, např. technické bariéry otevření přístupu nebo mezinárodní závazky atp.

Rámec pravidel pro sdílení dat

>>> Rámec pravidel - schéma <<<

Nároky na veřejný přístup k výzkumným datům pořízeným z veřejných prostředků zakládají úmluvy vlád zemí OECD a EU:

Možnosti a postupy sdílení dat významným způsobem vymezují legální rámce ošetření autorských práv (intelectual property rights - IPR, IP; aktéři: depozitor, autor, majitel práv, sponzor - výzkumník, instituce, respondent).

Zásadní limity sdílení a využívání dat vyplývají z legislativy na ochranu osobních údajů. To vyplývá z Direktivy EU 95/46/EC z roku 1994, která je v ČR implementována prostřednictvím Zákona 101/2000 Sb. o ochraně osobních údajů. Dozor nad jeho dodržováním provádí Úřad na ochranu osobních údajů - viz informační server tohoto úřadu (http://www.uoou.cz).

Pravidla sdílení dat vyplývají též z pravidel výzkumné etiky. Přehled viz např. Freed-Taylor: Ethical considerations in European cross-national research: http://www.unesco.org/most/ethissj.htm

ČSDA vypracoval návrh na implementaci pravidel otevřeného přístupu k výzkumným datům vzniklým za podpory veřejných zdrojů - klikněte ZDE.

přiložené soubory
top

Sekundární analýza dat v sociálněvědním výzkumu

Díky rostoucímu objemu dat a rozšíření sdílení dat mezi výzkumnými tými je stále větší část výzkumu založená na tzv. sekundární analýze.

Sekundární analýza je analýza dat, která byla pořízena pro jiný výzkumný záměr, než v jehož rámci jsou právě používána. To mimo jiné znamená, že analytik nebo tým analytiků provádějících sekundární analýzu se nepodílel na vytvoření původního datového souboru.Důsledkem nejsou jen výhody, ale i nová rizika.

Výhody:

  • rozsah dostupných zdrojů dat, komplexnější přístup k tématu, nízké náklady, nižší organizační náročnost, nové možnosti analýzy...

Rizika:

  • (ne)dostupnost „vhodných dat“ dat a potřeba úpravy záměrů;
  • (ne)dostatečná dokumentace původního výzkumu a datového souboru;
  • (ne) znalost původního konceptu výzkumu, (ne)znalost kontextu výzkumu, (ne) znalost průběhu sběru dat, (ne)srozumitelnost modifikací provedených v datech, (ne)kompatibilita kombinovaných datových zdrojů atp.;
  • (ne)srovnatelnost konceptů a/nebo proměnných;
  • (ne)transparentnost kvality dat;
  • (ne)kompatibilita formátů.

Sekundární analýza dat proto není rutinní úloha!

  • vypracování koncepce sekundární analýzy a její integrace do celkové koncepce výzkumu;
  • vyhledání, identifikace a získání vhodných dat;
  • studium metadat a širšího kontextu původního výzkumu;
  • prozkoumání dat, zhodnocení a verifikace;
  • úpravy dat, transformace proměnných;
  • analýza;
  • interpretace;
  • dokumentace použitých dat při publikaci výsledků.

 ------------------------------

Dokument Sdílení dat v sociálněvědním výzkumu byl připraven v rámci projektu COMPDAT – Zdroje dat, výzkum standardů, kvality dat a metody harmonizace dat pro mezinárodní sociální komparativní výzkum a integraci do sítě CESSDA sponzorovaného MŠMT v programu INGO pod reg. č. LA09010.

top