Kódování

(Rozdíly mezi verzemi)

Přejít na: navigace, hledání

Verze z 24. 4. 2012, 09:35

co to je kódování (obecně)
komprese dat
samodetekující kód (příklady)
přenosové kódování (MIME)
kódové stránky (jednobytové a vícebytové)
kodek

Obsah

1 Kódování
2 Komprese dat
3 Samodetekující kódy
4 Přenosné kódování (MIME)
5 Kodek

Kódování

záznam informace pomocí pevně stanovené znakové tabulky nebo znakové sady (např. melodie je zapsaná v notách)
kódování často znamená také převod již kódované informace do jiného kódu, jako je například transliterace textu do jiné abecedy nebo převod elektronické informace do jiného kódu či normy
zvláštní význam má převod „otevřené“ informace do kódu, který je znám jen určitým osobám, čili šifrování (kryptografie)
převod kódované informace do obecně přístupného tvaru je dekódování nebo dešifrování.

Komprese dat

speciální postup, při ukládání nebo transportu dat
úkolem komprese dat je zmenšit datový tok
vhodné např. pro archivaci nebo pro přenos dat přes síť s omezenou rychlostí (snížení doby nutné pro přenos)
komprese může být také nutná při omezené datové propustnosti (mobilní telefony komprimují hovor pro přenos přes GSM síť)

Lze rozdělit do 2 základních kategorií:

komprese ztrátová
- některé informace jsou nenávratně ztraceny a nelze je zpět rekonstruovat
- používá se tam, kde je možné ztrátu některých informací tolerovat a kde nevýhoda určitého zkreslení je bohatě vyvážena velmi výrazným zmenšením souboru
- používá se pro kompresi zvuku a obrazu, kde si člověk do určité míry chybějících údajů nevšimne nebo si je dokáže domyslet (je využíváno nedokonalostí lidského zraku a sluchu)
- např. JPEG, MPEG, MP3, ...

komprese bezeztrátová
- obvykle není tak účinná jako ztrátová komprese
- komprimovaný soubor lze opačným způsobem rekonstruovat do původní podoby (ale ztráta jediného znaku může znamenat nenávratné poškození souboru)
- např. FLAC, GIF, PNG, soubory ZIP, RAR, apod.

Kompresní poměr je podíl velikosti původních dat ku velikosti dat komprimovaných
- Při kompresi 10MB souboru do 2MB souboru je kompresní poměr 5 : 1 (pětkrát zmenšeno), úspora je tedy 80%
- Kompresní poměr je ovlivněn volbou kompresního algoritmu i typem komprimovaných dat
- Například nekomprimované skladby na audio CD mají datový tok přibližně 1,35Mb/s, zatímco komprimované zvukové soubory (MP3, AAC) mají datový tok 128Kb/s

Samodetekující kódy

slouží k jednoduchému ověření správnosti zadaných dat
princip je založen na tom, že zadaná data jsou (buď rovnou, nebo po určité matematické operaci) dělitelná daným číslem, nejčastěji bývá voleno 11 (tzv. jedenáctkový samodetekující kód)
daný dělitel by měl splňovat několik kritérií:
- dvoucifernost (aby se dala vždy odhalit chyba zadaná v jedné cifře)
- prvočíselnost
čím vyšší dělitel se zvolí, tím větší bude pravděpodobnost odhalení chyby (ale o to delší kód)
příklady
- EAN-13 (čárový kód)
- rodná čísla vytvořená od roku 1986 (jsou dělitelná jedenácti - poslední čtyři číslice jsou voleny tak, aby každé rodné číslo tuto vlastnost splňovalo)
- ISBN (jedinečná identifikace knižního titulu), ISSN (jedinečná identifikace periodických publikací - noviny, časopisy, včetně těch vycházejících online)
- čísla bankovních účtů a kreditních karet
nedostatky
- je možné ověřit správnost zadání, při chybě ale není možné zjistit původní informaci
- tento nedostatek bývá odstraněn pomocí redundance informace u samoopravných kódů

Redundance znamená informační nebo funkční nadbytek, například větší množství informace, prvků nebo zařízení než je nezbytné. Zejména zápisy čísel, kódů a programů mají velmi nízkou redundanci, která se často plánovitě zvyšuje například paritou, kontrolní číslicí nebo kontrolním součtem, které umožňují aspoň odhalení části chyb. Ještě daleko složitější a nákladnější redundance se užívají v podobě tzv. „samoopravného kódování“ (samodetekující kódy), které dovoluje automatickou opravu jedné nebo i více chyb.

Přenosné kódování (MIME)

internetový standart, který umožňuje rozšíření internetové pošty
- podpora textu psaného ve znakových sadách jiných než US-ASCII
- podpora příloh (obrázky, zvuky, atp.)
- vícedílné zprávy
- informace v hlavičce v jiné znakové sadě než ASCII

Kodek

zkratka dvou slov KOder + DEKoder
zařízení nebo počítačový program, který dokáže transformovat datový proud nebo signál
software, který se používá ke kompresi a dekompresi digitálního mediálního souboru, například skladby nebo filmu. Program Windows Media Player a další programy používají kodeky k přehrávání a vytváření digitálních mediálních souborů
počítačový program nebo hardwarové zařízení, které kóduje a dekóduje video do/z určitého formátu, zpravidla za účelem zmenšení objemu dat.; takový video proud se pak běžně ukládá do tzv. multimediálního kontejneru, který umožňuje kombinovat různé multimediální datové proudy (audio, video, titulky) do jednoho souboru

kodeky se dají rozdělit několika způsoby; základním je dělení na bezeztrátové a ztrátové

bezeztrátové:

Huffyuv – využívá Huffmanova kódování, které je založeno na různé četnosti znaků
- výhodou je rychlá komprese a dekomprese

ztrátové:

DivX
- používá standardní kompresi MPEG-4 ASP, nikoli vlastní formát videa (je kompatibilní s ostatními MPEG-4 ASP kodeky)

@@ Řádka 43: / Řádka 43: @@
 == Samodetekující kódy ==
 * slouží k jednoduchému ověření správnosti zadaných dat
-* zadaná data jsou (buď rovnou, nebo po určité matematické operaci) dělitelná daným číslem
+* princip je založen na tom, že zadaná data jsou (buď rovnou, nebo po určité matematické operaci) dělitelná daným číslem, nejčastěji bývá voleno 11 (tzv. ''jedenáctkový samodetekující kód'')
 *'''daný dělitel by měl splňovat několik kritérií:'''
 ** dvoucifernost (aby se dala vždy odhalit chyba zadaná v jedné cifře)
 ** prvočíselnost
 * čím vyšší dělitel se zvolí, tím větší bude pravděpodobnost odhalení chyby (ale o to delší kód)
-* např. EAN-13 (čárový kód)
+* příklady
+** EAN-13 (čárový kód)
+** rodná čísla vytvořená od roku 1986 (jsou dělitelná jedenácti - poslední čtyři číslice jsou voleny tak, aby každé rodné číslo tuto vlastnost splňovalo)
+** ISBN (jedinečná identifikace knižního titulu), ISSN (jedinečná identifikace periodických publikací - noviny, časopisy, včetně těch vycházejících online)
+** čísla bankovních účtů a kreditních karet
+* '''nedostatky'''
+** je možné ověřit správnost zadání, při chybě ale není možné zjistit původní informaci
+** tento nedostatek bývá odstraněn pomocí redundance informace u samoopravných kódů
+Redundance znamená informační nebo funkční nadbytek, například větší množství informace, prvků nebo zařízení než je nezbytné. Zejména zápisy čísel, kódů a programů mají velmi nízkou redundanci, která se často plánovitě zvyšuje například paritou, kontrolní číslicí nebo kontrolním součtem, které umožňují aspoň odhalení části chyb. Ještě daleko složitější a nákladnější redundance se užívají v podobě tzv. „samoopravného kódování“ (samodetekující kódy), které dovoluje automatickou opravu jedné nebo i více chyb.

Kódování

Verze z 24. 4. 2012, 09:35

Obsah

Kódování

Komprese dat

Samodetekující kódy

Přenosné kódování (MIME)

Kodek

Osobní nástroje

Jmenné prostory

Varianty

Zobrazení

Akce

Hledat

Navigace

Nástroje