Vše o souborech DjVu
DjVu (vyslovuje se: Déjà-Vu) je formát komprese obrázků vyvinutý speciálně pro naskenované dokumenty. Na rozdíl od formátu PDF, který je optimalizován zejména pro text a vektorovou grafiku, DJVU ukládá komprimované pixelové obrázky. To je ideální pro skenování knih, časopisů nebo historických dokumentů. Největší výhodou je ve srovnání s PDF obzvláště malá velikost souboru. DjVu byl vyvinut v letech 1996 až 2001 v AT&T Labs.
Jak funguje komprese u souborů DjVu?
DjVu rozděluje každou stránku na vrstvy: popředí (text a čáry), pozadí (struktura papíru a obrázky) a masku. Každá vrstva je komprimována vlastním algoritmem optimalizovaným pro tento úkol:
Text je zpracován algoritmem JB2. Ten rozpoznává opakující se vzory. Tak je například písmeno „a“, pokud se opakuje ve stejném fontu a velikosti, uloženo pouze jednou. Každý další výskyt tohoto písmene je od té chvíle uložen pouze jako reference. To šetří značné množství úložného prostoru. Úroveň pozadí používá algoritmus IW44 založený na vlnkové transformaci, podobný JPEG 2000. Výsledkem je, že soubory DjVu mohou být 5-10krát menší než soubory PDF srovnatelné kvality.
Historie a rozšíření DjVu
Na počátku 21. století byl DjVu považován za vážného konkurenta formátu PDF. Projekt Million Book Project, jeden z největších digitalizačních projektů na světě, používal DjVu od roku 2002 jako jeden ze svých výstupních formátů. Na DjVu se spoléhaly také univerzitní knihovny, Wikisource a některé vědecké archivy. Vrchol popularity skončil kolem roku 2015, kdy prohlížeče přestaly podporovat určité pluginy a Java applety. V roce 2016 Internet Archive nakonec oznámil, že již nebude vytvářet nové soubory DjVu, protože se jako standard prosadil formát PDF.
Navzdory poklesu počtu nově vytvořených souborů DjVu existují na internetu stále miliony souborů DjVu. Aby bylo možné tyto soubory otevírat bez obtíží a ve vysoké kvalitě na všech zařízeních, je vhodné je převést do formátu PDF. Jedinou nevýhodou je o něco větší velikost souboru po převodu. Dnes je však o něco větší velikost souboru většinou přijatelná.
Zdroje
Archive.org: Diskuse o konci vytváření DjVu
Archive.org: Ohlédnutí za 20 lety projektu Million Book Project
Eldakar, Y., El Gammal, K., Adly, N. et al.: The Million Book Project at Bibliotheca Alexandrina. Journal of Zhejiang University-SCIENCE A 6(11), 1327–1340 (2005). https://doi.org/10.1631/jzus.2005.A1327
Konvertovat, otevřít a editovat soubory DjVu
Detaly o souborech DjVu
- Software pro otevření souborů DjVu
- Software pro editování souborů DjVu
- MIME-typ pro DjVu
Žádné komentáře