Kódování
(Rozdíly mezi verzemi)
(→Komprese dat: Kompresní poměr - změna jednotek z Mb na MB) |
(→Samodetekující kódy: rozšíření) |
||
Řádka 43: | Řádka 43: | ||
== Samodetekující kódy == | == Samodetekující kódy == | ||
* slouží k jednoduchému ověření správnosti zadaných dat | * slouží k jednoduchému ověření správnosti zadaných dat | ||
− | * zadaná data jsou (buď rovnou, nebo po určité matematické operaci) dělitelná daným číslem | + | * princip je založen na tom, že zadaná data jsou (buď rovnou, nebo po určité matematické operaci) dělitelná daným číslem, nejčastěji bývá voleno 11 (tzv. ''jedenáctkový samodetekující kód'') |
*'''daný dělitel by měl splňovat několik kritérií:''' | *'''daný dělitel by měl splňovat několik kritérií:''' | ||
** dvoucifernost (aby se dala vždy odhalit chyba zadaná v jedné cifře) | ** dvoucifernost (aby se dala vždy odhalit chyba zadaná v jedné cifře) | ||
** prvočíselnost | ** prvočíselnost | ||
* čím vyšší dělitel se zvolí, tím větší bude pravděpodobnost odhalení chyby (ale o to delší kód) | * čím vyšší dělitel se zvolí, tím větší bude pravděpodobnost odhalení chyby (ale o to delší kód) | ||
− | * | + | * příklady |
+ | ** EAN-13 (čárový kód) | ||
+ | ** rodná čísla vytvořená od roku 1986 (jsou dělitelná jedenácti - poslední čtyři číslice jsou voleny tak, aby každé rodné číslo tuto vlastnost splňovalo) | ||
+ | ** ISBN (jedinečná identifikace knižního titulu), ISSN (jedinečná identifikace periodických publikací - noviny, časopisy, včetně těch vycházejících online) | ||
+ | ** čísla bankovních účtů a kreditních karet | ||
+ | * '''nedostatky''' | ||
+ | ** je možné ověřit správnost zadání, při chybě ale není možné zjistit původní informaci | ||
+ | ** tento nedostatek bývá odstraněn pomocí redundance informace u samoopravných kódů | ||
+ | |||
+ | Redundance znamená informační nebo funkční nadbytek, například větší množství informace, prvků nebo zařízení než je nezbytné. Zejména zápisy čísel, kódů a programů mají velmi nízkou redundanci, která se často plánovitě zvyšuje například paritou, kontrolní číslicí nebo kontrolním součtem, které umožňují aspoň odhalení části chyb. Ještě daleko složitější a nákladnější redundance se užívají v podobě tzv. „samoopravného kódování“ (samodetekující kódy), které dovoluje automatickou opravu jedné nebo i více chyb. | ||
Verze z 24. 4. 2012, 09:35
- co to je kódování (obecně)
- komprese dat
- samodetekující kód (příklady)
- přenosové kódování (MIME)
- kódové stránky (jednobytové a vícebytové)
- kodek
Obsah |
Kódování
- záznam informace pomocí pevně stanovené znakové tabulky nebo znakové sady (např. melodie je zapsaná v notách)
- kódování často znamená také převod již kódované informace do jiného kódu, jako je například transliterace textu do jiné abecedy nebo převod elektronické informace do jiného kódu či normy
- zvláštní význam má převod „otevřené“ informace do kódu, který je znám jen určitým osobám, čili šifrování (kryptografie)
- převod kódované informace do obecně přístupného tvaru je dekódování nebo dešifrování.
Komprese dat
- speciální postup, při ukládání nebo transportu dat
- úkolem komprese dat je zmenšit datový tok
- vhodné např. pro archivaci nebo pro přenos dat přes síť s omezenou rychlostí (snížení doby nutné pro přenos)
- komprese může být také nutná při omezené datové propustnosti (mobilní telefony komprimují hovor pro přenos přes GSM síť)
Lze rozdělit do 2 základních kategorií:
- komprese ztrátová
- některé informace jsou nenávratně ztraceny a nelze je zpět rekonstruovat
- používá se tam, kde je možné ztrátu některých informací tolerovat a kde nevýhoda určitého zkreslení je bohatě vyvážena velmi výrazným zmenšením souboru
- používá se pro kompresi zvuku a obrazu, kde si člověk do určité míry chybějících údajů nevšimne nebo si je dokáže domyslet (je využíváno nedokonalostí lidského zraku a sluchu)
- např. JPEG, MPEG, MP3, ...
- komprese bezeztrátová
- obvykle není tak účinná jako ztrátová komprese
- komprimovaný soubor lze opačným způsobem rekonstruovat do původní podoby (ale ztráta jediného znaku může znamenat nenávratné poškození souboru)
- např. FLAC, GIF, PNG, soubory ZIP, RAR, apod.
- Kompresní poměr je podíl velikosti původních dat ku velikosti dat komprimovaných
- Při kompresi 10MB souboru do 2MB souboru je kompresní poměr 5 : 1 (pětkrát zmenšeno), úspora je tedy 80%
- Kompresní poměr je ovlivněn volbou kompresního algoritmu i typem komprimovaných dat
- Například nekomprimované skladby na audio CD mají datový tok přibližně 1,35Mb/s, zatímco komprimované zvukové soubory (MP3, AAC) mají datový tok 128Kb/s
Samodetekující kódy
- slouží k jednoduchému ověření správnosti zadaných dat
- princip je založen na tom, že zadaná data jsou (buď rovnou, nebo po určité matematické operaci) dělitelná daným číslem, nejčastěji bývá voleno 11 (tzv. jedenáctkový samodetekující kód)
- daný dělitel by měl splňovat několik kritérií:
- dvoucifernost (aby se dala vždy odhalit chyba zadaná v jedné cifře)
- prvočíselnost
- čím vyšší dělitel se zvolí, tím větší bude pravděpodobnost odhalení chyby (ale o to delší kód)
- příklady
- EAN-13 (čárový kód)
- rodná čísla vytvořená od roku 1986 (jsou dělitelná jedenácti - poslední čtyři číslice jsou voleny tak, aby každé rodné číslo tuto vlastnost splňovalo)
- ISBN (jedinečná identifikace knižního titulu), ISSN (jedinečná identifikace periodických publikací - noviny, časopisy, včetně těch vycházejících online)
- čísla bankovních účtů a kreditních karet
- nedostatky
- je možné ověřit správnost zadání, při chybě ale není možné zjistit původní informaci
- tento nedostatek bývá odstraněn pomocí redundance informace u samoopravných kódů
Redundance znamená informační nebo funkční nadbytek, například větší množství informace, prvků nebo zařízení než je nezbytné. Zejména zápisy čísel, kódů a programů mají velmi nízkou redundanci, která se často plánovitě zvyšuje například paritou, kontrolní číslicí nebo kontrolním součtem, které umožňují aspoň odhalení části chyb. Ještě daleko složitější a nákladnější redundance se užívají v podobě tzv. „samoopravného kódování“ (samodetekující kódy), které dovoluje automatickou opravu jedné nebo i více chyb.
Přenosné kódování (MIME)
- internetový standart, který umožňuje rozšíření internetové pošty
- podpora textu psaného ve znakových sadách jiných než US-ASCII
- podpora příloh (obrázky, zvuky, atp.)
- vícedílné zprávy
- informace v hlavičce v jiné znakové sadě než ASCII
Kodek
- zkratka dvou slov KOder + DEKoder
- zařízení nebo počítačový program, který dokáže transformovat datový proud nebo signál
- software, který se používá ke kompresi a dekompresi digitálního mediálního souboru, například skladby nebo filmu. Program Windows Media Player a další programy používají kodeky k přehrávání a vytváření digitálních mediálních souborů
- počítačový program nebo hardwarové zařízení, které kóduje a dekóduje video do/z určitého formátu, zpravidla za účelem zmenšení objemu dat.; takový video proud se pak běžně ukládá do tzv. multimediálního kontejneru, který umožňuje kombinovat různé multimediální datové proudy (audio, video, titulky) do jednoho souboru
- kodeky se dají rozdělit několika způsoby; základním je dělení na bezeztrátové a ztrátové
bezeztrátové:
- Huffyuv – využívá Huffmanova kódování, které je založeno na různé četnosti znaků
- výhodou je rychlá komprese a dekomprese
ztrátové:
- DivX
- používá standardní kompresi MPEG-4 ASP, nikoli vlastní formát videa (je kompatibilní s ostatními MPEG-4 ASP kodeky)