Vítejte na stránkách věnovaných nástroji OpenRefine,
na kterých najdete všechny potřebné a důležité informace.
openrefine@getfound.cz
0 Sdílení 0 Sdílení ×

Základní pracovní plocha každého projektu v OpenRefine sestává ze 4 základních částí.

 

1. Filtrace a změny na projektu

V části filtrace budete později pracovat s Facety a textovou filtrací projektu. Facety (ploché části diamantu – z loga OpenRefine) v našem případě seskupení dat na základě zvoleného segmentu. Textovou filtrací můžete buď na základě regulárního výrazu nebo fráze filtrovat odpovídající obsah projektu.

 

Důležité:

V případě jakékoli filtrace dat je třeba si uvědomit, že operace, prováděné na sloupcích či buňkách budou vždy aplikovány pouze na aktuálně zvolený dataset.

Druhou částí jsou změny projektu, tedy sekce Undo/Redo (Zpět/Vpřed). V této sekci naleznete veškeré provedené kroky na projektu a můžete se v nich libovolně vracet zpět nebo vpřed. Postup na projektu bude zachován i při exportu celého projektu, tedy kdokoli kdo poté celý projekt importuje, uvidí veškeré podniknuté kroky a může s nimi libovolně pracovat.

Sekce Undo/Redo zároveň obsahuje dvě důležité funkce a to Extract…(vytáhni) a Apply…(aplikuj). Tyto funkce vám dovolují kdykoli postup na projektu přes Extract vyexportovat do textového souboru a aplikovat na jakýkoli jiný projekt za pomoci Apply. Některé postupy v sekci příkladů jsou takto demonstrovány a můžete je aplikovat na své projekty stažením souboru a  vložením jeho obsahu do Apply.

 

2. Data projektu

V datové části naleznete náhledy dat, které obsahuje projekt a možnost práce s nimi. Šipky u sloupců slouží jako menu funkcí na ně aplikovatelných.

 

Důležité:

V případě zvolení šipky u sloupce se aplikuje daná funkce/filtrace pouze na sloupec, který jste zvolily.

 

Zvláštní funkci plní sloupec úplně vlevo, jehož funkce jsou aplikovány na celý projekt. Jednotlivé řádky je pro pozdější filtraci možno označit buď pomocí vlajky nebo hvězdičky a potom s daným segmentem pracovat tak, že si vytvoříte Facet podle vlajky nebo hvězdičky.

O funkcích, aplikovatelných na jednotlivé sloupce se budeme bavit v dalších kapitole sloupce a práce s nimi.

 

3. Základní informace o projektu

Jednoduchý a přehledný panel o počtu řádků, záznamů s možností nastavení počtu řádků, které se vám v náhledu dat projektu budou zobrazovat.

 

Rozdíl mezi Row a Record:

Row = Řádek

Record = Záznam

Pokud v projektu se 7000 řádky budete mít seřazená data a smažete například přes funkci Blank Down duplicitní řádky, budete mít stále 7000 řádků, ale například 6000 záznamů (1000 bylo duplicitních).

 

4. Export a nápověda

V pravém horním rohu naleznete možnost otevření projektu, nápovědy a především jeho exportu. Exportovat můžete do formátů, které můžete zároveň importovat do OpenRefine. Zajímavou funkcí exportu je především Custom tabular exporter, ve kterém si nejen můžete zvolit, jaké sloupce chcete exportovat, ale je zde i možnost, v případě propojení s vaším Google účtem, exportovat projekt do Google Spreadsheetu.

 

© 2013 Openrefine
0 Sdílení Twitter 0 Google+ 0 Facebook 0 0 Sdílení ×