Monday, October 28, 2013

Bitva o mediální kodeky

Kdo byl a je vítězem na poli mediálních kodeků? Co se stalo s MP3 a proč je pravděpodobně tak populární? A zvítězí nakonec audio nebo video? Který kodek povede svou skupinu do boje?

Pokusím se rozvést základní myšlenky obsažené v mé prezentaci Bitva o kodek.

Trocha teorie: kontejner a kodek

Multimediální obsah se (jak název trochu napovídá) skládá typicky z několika médií. Představme si například videoklip. Obraz je jedním médiem a zvuk druhým. Je tedy potřeba, aby tato jednotlivá média byla společně zabalena do jednoho balíčku - kontejneru.

Z principu přenosu informace je pak potřeba, aby jednotlivá média byla nějak kódovaná a na straně příjemce dekódovaná. K tomu se používá buď kus software nebo hardware, ale vždy se nazývá kodérem, respektive dekodérem. Ale aby to nebylo vše tak složité, používá se pro oba protikusy složené slovo kodek.

Jak zakódovat zvuk a obraz

Asi ihned nás napadne nejjednodušší způsob: vzít v nějakém daném pořadí jednotlivé informace a seskládat je za sebe. Na tomto principu funguje například kodek PCM pro kódování zvuku: 44100 krát za vteřinu změříme aktuální hlasitost, převedeme na n-bitové číslo a uložíme.
Ale stejně tak nás i hned napadne zásadní problém: takto získaných dat bude nechutně mnoho.

A tak se různé laboratoře zabývaly tím jak zvuk a video kódovat lépe, případně jak jej komprimovat bez ztráty přesnosti na dekódovací straně.

Pak přišel objev psycho-akustického modelu a principu maskování frekvencí a špiček hlasitosti. A bylo možné zvuk komprimovat výrazně chytřeji. Sice se ztrátou přesnosti, ale člověk tuto ztrátu vůbec nepoznal.

Obrazová sekvence je problém složitější. Lidský zrak se na rozdíl od sluchu nenechá tak snadno ošálit. U videa se tak muselo uchýlit k vyhledávání podobných bloků mezi snímky a vektorů mezi nimi. U videa jsou stále velké části polí neoraných a objektivně posoudit kvalitu videa je velmi těžké. Až tak, že se tím zabývají největší univerzity na světě.

Když je na "vše" patent

Abych nebyl úplně nepřesný, otevřené a volné kodeky existují.

Nepatentovaných video kodeků ale existuje málo a až na Theoru a VP8 asi nestojí úplně za řeč.

Částečně i z důvodu větší jednoduchosti problematiky je pak více otevřených kodeků v oblasti audia. A to skoro dvě desítky a většina z nich stojí alespoň za zmínku.
Většina z nich je pak zaměřena na kódování hlasu, fungují dobře a jsou používány hojně i v průmyslu.
Kódováním hudby se zabývá menší skupina otevřených kodeků a mají společné to, že nabídly dobrou kvalitu pozdě a "ujel jim vlak".

Vysoko nad všemi ostatními byl, je a v dohledné době bude kodek MP3. Až natolik, že se tato zkratka pro MPEG layer 3 stala synonymem pro zvukové soubory i přenosné přehrávače hudby. Pravděpodobně základní kámen úspěchu? Byl první - začátky specifikace se objevovaly v roce 1991 a ve stejném roce byly základní principy patentovány.

O vytvoření MP3, který je i do dnešních dnů především standardem, nikoliv exaktním algoritmem, se postaraly především dvě společnosti: AT&T Bell Laboratories a Fraunhoferova společnost.

Bellovy laboratoře využily princip psychoakustického modelu pro sestrojení prvního kodeku. Ten byl přesný, ale celkem náročný. Výraznějšího posunu dosáhl institut pro integrované obvody - Fraunhofer IIS, který mnoho věcí zanedbal a při dobré kvalitě zvuku na výstupu výrazně zmenšil náročnost.

A tak existovaly vedle sebe dvě verze kodeku MP3. A základ pro soudní spory - boje o kodeky.

AT&T oddělilo Bellovy laboratoře v roce 1996 pod značku Lucent, od roku 2006 je pak Lucent součástí francouzské společnosti Alcatel-Lucent. Fraunhofer IIS existuje do dnešních dnů.

Kodeková válka

V roce 2002 spustila právě společnost Alcatel-Lucent válku o vlastnictví patentu. A to s jediným důvodem: patenty zapsané do roku 1995 platily ve spojených státech jen 17 let s tím, že mohly být prodlouženy. Ovšem k tomu je potřeba vyřešit jeho vlastnictví. A Alcatel-Lucent i jako pokračovatel Bellových laboratoří tušil příležitost.

Podal tedy žalobu na společnosti Dell a Gateway. A v roce 2003 se do bitvy dobrovolně zapojil i Microsoft, který prohlašoval patenty za své. Velmi zajímavé čtení o soudních sporech je k dispozici na portále leagle.com. Z toho je možné se dočíst, že žaloby na Dell i Gateway byly zamítnuty.

Od toho momentu se sněhová koule nabalovala a mnoho firem se žalovalo navzájem za porušování různých patentů.

Microsoft podporoval formát MP3 v přehrávači Windows Media Player dlouhou dobu. Ale měl na to licenci? Takovou otázku si položil i Alcatel-Lucent a zvedl hlas proti Microsoftu, po kterém požadoval 4,5 miliardy dolarů. Alcatel-Lucent spor vyhrál s částkou 1,52 miliard dolarů, ale Microsoft se odvolal. Vlastnil totiž v té době licenci od Fraunhofer IIS, která ho stála 16 milionů dolarů. Druhý soud v roce 2008 Microsoft vyhrál s tím, že Fraunhofer vyvíjel formát MP3 společně s Bellovými laboratořemi a je tedy i spoluvlastníkem patentu. Licence Microsoftu tak byla platná a patentová válka skončila smírem.

Z patentových válek, které se nabalily na formát MP3 ale přece jen Alcatel-Lucent jednu vyhrál. Microsoft používal na svých Tablet PC techniku gest patentovanou původně společností GO Corp., která byla koupena AT&T a následně zděděna společností Alcatel-Lucent. Microsoft se stal chudším o 512 milionů...

MP3 dnes

Formát MP3 je nutné pro komerční užití licencovat u společnosti Technicolor, faktického zástupce Fraunhofer IIS. Tedy alespoň se tak tváří na stránkách s informacemi o licencování MP3. Zásadní otázka ale je, zda to tak opravdu je a zda se stále MP3 takto licencuje, na mailové zprávy neodpovídají.

Každopádně dobrou zprávou ale je, že otevřené dekodéry nikdy nebudou podle Fraunhofer zpoplatněny.

A sami si projděte svou hudební kolekci. Jaký jiný formát zvuku, kromě MP3, používáte? A proč? Podělte se v komentářích.

A co to video?

Boje o mediální kodeky na poli videa se příliš nevedly a pravděpodobně ani nepovedou. Je to hodně způsobeno tím, že video kodek je záležitostí výrazně složitější, není možné principy tak jednoduše kopírovat a navíc jsou video kodeky úzce spjaté s konkrétním výrobcem nebo produktem.

Jen pro názornost. Profesionální kamery a střižny používají formáty rodiny ProRes, streamovaný obsah Flash Video nebo H.264, video publikované na webu čím dál častěji VP8. DVD používá kodeky MPEG, na DVD-rip se používal DivX a disky Blue-ray používají MPEG4 AVC (H.264).

Budoucnost

Na poli kodeků se věci mění celkem pomalu, protože uživatel si zvykne zpracovávat jeden formát (v jedné aplikaci) a úkroky stranou se dělají těžce.

MP3 je synonymem hudby. Na tom se nic v dohledné době změnit nemůže. Občas sice vystrkuje růžky kodek Vorbis a v profesionálním prostředí se nepoužívá téměř nic jiného než AAC, AC-3 nebo Apple Lossless.

Standardem pro video je H.264 a nějakou dobu jím ještě bude. Tento kodek si musel své místo na slunci tvrdě vybojovat, ale díky velkému vizionářství je dnes jedním z nejpoužívanějších kodeků vůbec.

Na paty mu ale šlape o trochu novější kodek VP8, synonymum pro formát WebM. Tento kodek má díky podpoře tagu <video> v HTML5 velký potenciál k růstu. I když stejně je v některých prohlížečích podporován právě kodek H.264.

Závod je to zatím celkem nerozhodný. Vimeo i YouTube používají interně H.264. YouTube používá i VP8, což ale nemusí být úplně směrodatné vzhledem k tomu že YouTube i VP8 vlastní Google. Podle mého názoru ale technologie Flash přehrávačů prožije útlum i díky používání tagu <video> v HTML5. A tak se dostane VP8 ve světě Internetu a SaaS do popředí ještě o trochu více než dnes.

Závod bude určitě pokračovat dál, už dnes se mluví o H.265 a VP9. Ale už je to závod, ne boj o pár patentů.

Zdroje

No comments:

Post a Comment