9 května 2017

Dataanalýza: píše MAFRA pro Babiše?

Kvůli uniklým rozhovorům Babiše a “novináře” Přibila se teď přetřásá, zda AB kontroluje obsah svých médií, případně do jaké míry. Protože se k tématu děje až příliš dojmologie, případně se z jednotlivců, co berou Andreje jako svého šéfa, dovozuje morální profil všech novinářů, rozhodl jsem se si o dovolené trochu pohrát s Newtonem a podrobit šestici kauz z poslední doby kvantitativní analýze.

Kauzy jsem se snažil vybírat tak, aby dvě byly “pro Babiše”, dvě “proti” a dvě co nejvíc neutrální. Pro-babišovské zde zastupují uniklé e-maily Bohuslava Sobotky a loňská policejní reforma, kterou ANO tlačilo jako Chovancův nástroj politického boje. Proti Babišovi jsem vybral kauzu Čapí hnízdo a korunové dluhopisy. A konečně neutrální témata tu zastupuje okleštění registru smluv a zatýkání kolem zneužívání dotací v ROP Severozápad.

Kvantitativní analýzou je míněn postup, kdy jsem si vytáhnul všechny články obsahující určité kličové slovo (takové, které se v článcích dané kauzy vyskytuje prakticky vždy) a podíval se, kolik článků a kolik znaků (tedy jak dlouhé ty články byly) tomu jednotlivá média věnovala. Analýza tedy nikde neřeší “tón”, to je práce pro kvalitativní analýzu, která již vyšla v Deníku referendum.

U každého grafu je pár statistik: celkový počet článků a napsaných znaků. Číslo v závorce pak značí kolik to je relativně k průměru všech médií k dané kauze. V grafech je zachycen i časový vývoj, tedy zda se tomu média věnovala průběžně, nárazově, nebo se zpožděním. Od časové osy nahoru jde počet zpráv, a naopak dolů se zvyšuje počet znaků.

Obecně tedy platí, že čím víc “barevné” plochy, tím víc pozornosti médium tématu věnovalo. Pokud je graf výrazně asymetrický směrem nahoru, tak se psaly spíš kratší, povrchnější zprávy (hodně zpráv, malý počet znaků). Pokud výraznější plocha začíná až v prostředku grafu, tak téma noviny nějakou chvíli ignorovaly. Najetím myší nad graf se zobrazí tooltip s konkrétním článkem, který odpovídá dané x-ové pozici.

S teorií za námi pojďme na neutrální kauzy. Na těch by měl být vidět relativní “výtlak” jednotlivých médií - dá se čekat, že specializované Hospodářky a iHNed budou trochu menší, než MF Dnes nebo novinky.

Výrazně malý počet zpráv iDNES bude pravděpodobně spíš chyba metody, články nejspíš vycházely mimo rubriku Zprávy.

U obou kauz je vidět spíš velký rozptyl médií než jakékoliv pravidlo. Lze ale odhadovat, že MF, iDNES, Právo a novinky budou mít na podobná témata zhruba podobné počty článků. LN a Lidovky budou v závěsu a produkty Economie mají výtlak spíš nižší. Pojďme na pro-Babišovské kauzy.

Policejní reformě se nadstandardně věnovaly LN, zbytek byl tak nějak stejně.

Mail hacknutý nacisty z White-Media byl ve většině produktů Mafry propírán podrobněji, zbytek se tématu věnoval průměrně, iHNed o něm prakticky nereportoval.

A teď to nejzajímavější: jak vypadají kauzy proti majiteli Mafry?

Dluhopisy se v MF a LN začaly probírat s výrazným zpožděním za ostatními médii (i internetovými odnožemi těchto deníků), papírové noviny vůbec nereportovaly o lednové anonymní žalobě, která celou aféru spustila. MF se pak “chytla” a psala srovnatelným tempem jako konkurence (byť jejich “náskok” pochopitelně nestáhla), LN se tématu věnovaly nejméně. Na druhou stranu sesterské Lidovky.cz byly veskrze průměrné, a dalece tak překonaly Aktuálně.

Kauza Čapí hnízdo je podobná dluhopisům, Mafra papír (zejména MF) o ní v době kdy to ještě nebylo “moc velké” nepsal. Pak se však deníky probudily a psaly vcelku srovnatelně s ostatními, kromě Práva s Novinkami, které kauzu dřenilo výrazně nadprůměrně (natolik nadprůměrně, že žádné další médium se nedostalo nad celostátní průměr, nejblíž mu bylo Aktuálně a Lidovky s 97 %).

Závěrem

Co z toho plyne? Pokud se kriticky podíváme na všechny kauzy, je vidět, které jsou kterým deníkům vlastní a ve kterých se spíš jen vezou. Netroufl bych si ale na základě těchto dat říct, že by Mafra témata aktivně dusila. Z vlastní zkušenosti (půl roku sedím v redakci Lidovek) můžu s klidem prohlásit, že jsem ani neslyšel o nějakém odrazování od Babišových bolístek, naopak jsem párkrát zaslechl povzbuzení typu “a co že je náš majitel, psát o něm budeme”. To je tedy jen za Lidovky a LN, u “červených” může být vše jinak, je to zcela jiná redakce a obsahově kromě sportovní rubriky de facto konkurence.

Nicméně i s přihlédnutím k předchozímu odstavci je fakt, že Mafra, která v ČR vždy investigativu vedla (prakticky jako jediná) nemá na Andreje jedinou “vlastní” kauzu. Subjektivní tip čím to je? Vlastní kauzu redaktor nedostane zadanou, ta ho musí zajímat, musí za ní sám jít. A lidi, kteří chtějí Andreje “sundat” pro něj nepracují z principu, odešli - pokud byli normální do Reportéra, ostatní do Echa.

Tudíž redakci není třeba ovlivňovat, od “nepohodlných” se pročistila z logiky věci sama (byť tomu asi Plesl s Nachtigallem svým přístupem dost pomohli). A bohužel žádné jiné médium nemá sílu nastolovat témata takovou, jako MF.

Zdrojová data jsou na GitHubu: https://github.com/veproza/mafra-babis-newton (export z Newtonu je ořezaný, protože autorská práva). Ocením návrhy dalších kauz, na kterých by se daly rozdíly dobře prezentovat, zatím je dat příliš málo na to, aby přebily přirozený rozptyl.