Kódování

(Rozdíly mezi verzemi)
Přejít na: navigace, hledání
(+ nadpis Kódové stránky)
(Kódové stránky (jednobytové a vícebytové): +, +ascii)
Řádka 73: Řádka 73:
  
 
== Kódové stránky (jednobytové a vícebytové) ==
 
== Kódové stránky (jednobytové a vícebytové) ==
 +
Kódová stránka (znaková sada nebo také kódování) je kód, který páruje sekvence znaků z dané množiny (abecedy) s jejich jinou reprezentací, jako je sekvence přirozených čísel, bajtů nebo elektrických pulzů, za účelem ukládání textu v počítači nebo přenosu textu telekomunikačními sítěmi.
 +
 +
Může se jednat např. o Morseovu abecedu, v prostředí počítačů o znakovou sadu '''ASCII'''. Kódování je také prostředkem pro kompresi (tj. zmenšení) anebo šifrování (tj. utajování) dat.
 +
 +
* '''ASCII''' - standard z roku 1963, kóduje 128 znaků americké abecedy (společně s číslicemi a dalšími symboly) jako 7bitová čísla
 +
** jedná se o základní kódování, z kterého vychází v euro-americkém prostoru ostatní standardy
 +
** drtivá většina osmibitových (jednobytových) znakových sad pouze rozšiřuje ASCII tím, že přidávají významy kódům 128-255, které se v ASCII nepoužívají
 +
  
  

Verze z 26. 4. 2012, 09:03

  • co to je kódování (obecně)
  • komprese dat
  • samodetekující kód (příklady)
  • přenosové kódování (MIME)
  • kódové stránky (jednobytové a vícebytové)
  • kodek


Obsah

Kódování

  • záznam informace pomocí pevně stanovené znakové tabulky nebo znakové sady (např. melodie je zapsaná v notách)
  • kódování často znamená také převod již kódované informace do jiného kódu, jako je například transliterace textu do jiné abecedy nebo převod elektronické informace do jiného kódu či normy
  • zvláštní význam má převod „otevřené“ informace do kódu, který je znám jen určitým osobám, čili šifrování (kryptografie)
  • převod kódované informace do obecně přístupného tvaru je dekódování nebo dešifrování.


Komprese dat

  • speciální postup, při ukládání nebo transportu dat
  • úkolem komprese dat je zmenšit datový tok
  • vhodné např. pro archivaci nebo pro přenos dat přes síť s omezenou rychlostí (snížení doby nutné pro přenos)
  • komprese může být také nutná při omezené datové propustnosti (mobilní telefony komprimují hovor pro přenos přes GSM síť)


Lze rozdělit do 2 základních kategorií:

  • komprese ztrátová
    • některé informace jsou nenávratně ztraceny a nelze je zpět rekonstruovat
    • používá se tam, kde je možné ztrátu některých informací tolerovat a kde nevýhoda určitého zkreslení je bohatě vyvážena velmi výrazným zmenšením souboru
    • používá se pro kompresi zvuku a obrazu, kde si člověk do určité míry chybějících údajů nevšimne nebo si je dokáže domyslet (je využíváno nedokonalostí lidského zraku a sluchu)
    • např. JPEG, MPEG, MP3, ...
  • komprese bezeztrátová
    • obvykle není tak účinná jako ztrátová komprese
    • komprimovaný soubor lze opačným způsobem rekonstruovat do původní podoby (ale ztráta jediného znaku může znamenat nenávratné poškození souboru)
    • např. FLAC, GIF, PNG, soubory ZIP, RAR, apod.


  • Kompresní poměr je podíl velikosti původních dat ku velikosti dat komprimovaných
    • Při kompresi 10MB souboru do 2MB souboru je kompresní poměr 5 : 1 (pětkrát zmenšeno), úspora je tedy 80%
    • Kompresní poměr je ovlivněn volbou kompresního algoritmu i typem komprimovaných dat
    • Například nekomprimované skladby na audio CD mají datový tok přibližně 1,35Mb/s, zatímco komprimované zvukové soubory (MP3, AAC) mají datový tok 128Kb/s


Samodetekující kódy

  • slouží k jednoduchému ověření správnosti zadaných dat
  • princip je založen na tom, že zadaná data jsou (buď rovnou, nebo po určité matematické operaci) dělitelná daným číslem, nejčastěji bývá voleno 11 (tzv. jedenáctkový samodetekující kód)
  • daný dělitel by měl splňovat několik kritérií:
    • dvoucifernost (aby se dala vždy odhalit chyba zadaná v jedné cifře)
    • prvočíselnost
  • čím vyšší dělitel se zvolí, tím větší bude pravděpodobnost odhalení chyby (ale o to delší kód)
  • příklady
    • EAN-13 (čárový kód)
    • rodná čísla vytvořená od roku 1986 (jsou dělitelná jedenácti - poslední čtyři číslice jsou voleny tak, aby každé rodné číslo tuto vlastnost splňovalo)
    • ISBN (jedinečná identifikace knižního titulu), ISSN (jedinečná identifikace periodických publikací - noviny, časopisy, včetně těch vycházejících online)
    • čísla bankovních účtů a kreditních karet
  • nedostatky
    • je možné ověřit správnost zadání, při chybě ale není možné zjistit původní informaci
    • tento nedostatek bývá odstraněn pomocí redundance informace u samoopravných kódů

Redundance znamená informační nebo funkční nadbytek, například větší množství informace, prvků nebo zařízení než je nezbytné. Zejména zápisy čísel, kódů a programů mají velmi nízkou redundanci, která se často plánovitě zvyšuje například paritou, kontrolní číslicí nebo kontrolním součtem, které umožňují aspoň odhalení části chyb. Ještě daleko složitější a nákladnější redundance se užívají v podobě tzv. „samoopravného kódování“ (samodetekující kódy), které dovoluje automatickou opravu jedné nebo i více chyb.


Přenosné kódování (MIME)

  • internetový standard, jedná se o rozšíření internetové pošty
  • umožňuje:
    • zasílat zprávy s diakritikou (podpora textu psaného ve znakových sadách jiných než US-ASCII)
    • podpora příloh (obrázky, zvuky, atp.)
    • vícedílné zprávy
    • využít funkci digitálního podpisu
    • informace v hlavičce v jiné znakové sadě než ASCII
  • v současné době používán i dalšími protokoly (např. HTTP)


Kódové stránky (jednobytové a vícebytové)

Kódová stránka (znaková sada nebo také kódování) je kód, který páruje sekvence znaků z dané množiny (abecedy) s jejich jinou reprezentací, jako je sekvence přirozených čísel, bajtů nebo elektrických pulzů, za účelem ukládání textu v počítači nebo přenosu textu telekomunikačními sítěmi.

Může se jednat např. o Morseovu abecedu, v prostředí počítačů o znakovou sadu ASCII. Kódování je také prostředkem pro kompresi (tj. zmenšení) anebo šifrování (tj. utajování) dat.

  • ASCII - standard z roku 1963, kóduje 128 znaků americké abecedy (společně s číslicemi a dalšími symboly) jako 7bitová čísla
    • jedná se o základní kódování, z kterého vychází v euro-americkém prostoru ostatní standardy
    • drtivá většina osmibitových (jednobytových) znakových sad pouze rozšiřuje ASCII tím, že přidávají významy kódům 128-255, které se v ASCII nepoužívají


Kodek

  • zkratka dvou slov KOder + DEKoder (respektive komprese, dekomprese)
  • zařízení nebo počítačový program, který dokáže transformovat datový proud nebo signál
  • software, který se používá ke kompresi a dekompresi digitálního mediálního souboru, například skladby nebo filmu. Program Windows Media Player a další programy používají kodeky k přehrávání a vytváření digitálních mediálních souborů
  • počítačový program nebo hardwarové zařízení, které kóduje a dekóduje video do/z určitého formátu, zpravidla za účelem zmenšení objemu dat.; takový video proud se pak běžně ukládá do tzv. multimediálního kontejneru, který umožňuje kombinovat různé multimediální datové proudy (audio, video, titulky) do jednoho souboru
  • kodeky se dají rozdělit několika způsoby; základním je dělení na bezeztrátové a ztrátové
    • bezeztrátové:
      • Huffyuv – využívá Huffmanova kódování, které je založeno na různé četnosti znaků
        • výhodou je rychlá komprese a dekomprese
    • ztrátové:
      • DivX
        • používá standardní kompresi MPEG-4 ASP, nikoli vlastní formát videa (je kompatibilní s ostatními MPEG-4 ASP kodeky)
Osobní nástroje
Jmenné prostory
Varianty
Akce
Navigace
Nástroje