Vítejte na stránkách věnovaných nástroji OpenRefine,
na kterých najdete všechny potřebné a důležité informace.
openrefine@getfound.cz

Filtrace dat

0 Sdílení 0 Sdílení ×

Filtrace dat nám pomáhá vytyčit určitý segment dat, na který se chceme buď podívat nebo přímo s ním pracovat. OpenRefine má tu výhodu, že při filtraci dat pracujete vždy pouze s vybraným segmentem dat, tedy pokud aplikujete jakoukoli funkci, aplikuji se pouze na aktuálně vyfiltrovaná data.

 

Textová filtrace

Filtrace textová

Základním typem filtrace, je filtrace textová. Na základě zadaného řetězce vyhledá buňky v daném sloupci, které jej obshaují.

Po zatržení je možné použít regulární výrazy nebo zajistit, aby byl řetězec case sensitive (rozlišoval malá a velká písmena).

 

Facety

Facet

Facety jsou seskupení dat na základě zvoleného klíče. To znamená, že při zvolení textového facetu se bude snažit OpenRefine dávat do jednoho segmentu k filtraci obsahově stejné buňky.

K dispozici máte řadu různých obecně definovaných facetů, od textových, přes numerické po přizpůsobené v sekci Customized facets.

 

Poznámka:

Za zmínku stojí především přizpůsobený s názvem Word facet. Tento facet vám zobrazí četnost výskytu slov ve sloupci. Hodí se především při tvorbě analýzy klíčových frází a po stažení HTML kódu z cizích stránek a jejich analýzy.

 

Jedinou výjimkou je tzv. Scatterplot facet, což není ani tak facet, jako vizualizace 2D grafu vztahu označeného sloupce s jiným sloupcem. To znamená, že pokud u některého sloupce dáte Scatterplot facet, objeví se vám obrazovka, na které můžete určit se kterým sloupcem má/může být promítnut.

OpenRefine má tuto funkci poněkud nedokončenou. Na grafu chybí například měřítko hodnot a nedá se s ním téměř vůbec pracovat.

 

Další tutorialy:

© 2013 Openrefine
0 Sdílení Twitter 0 Google+ 0 Facebook 0 0 Sdílení ×