9 května 2017

Dataanalýza: píše MAFRA pro Babiše?

Kvůli uniklým rozhovorům Babiše a “novináře” Přibila se teď přetřásá, zda AB kontroluje obsah svých médií, případně do jaké míry. Protože se k tématu děje až příliš dojmologie, případně se z jednotlivců, co berou Andreje jako svého šéfa, dovozuje morální profil všech novinářů, rozhodl jsem se si o dovolené trochu pohrát s Newtonem a podrobit šestici kauz z poslední doby kvantitativní analýze.

Kauzy jsem se snažil vybírat tak, aby dvě byly “pro Babiše”, dvě “proti” a dvě co nejvíc neutrální. Pro-babišovské zde zastupují uniklé e-maily Bohuslava Sobotky a loňská policejní reforma, kterou ANO tlačilo jako Chovancův nástroj politického boje. Proti Babišovi jsem vybral kauzu Čapí hnízdo a korunové dluhopisy. A konečně neutrální témata tu zastupuje okleštění registru smluv a zatýkání kolem zneužívání dotací v ROP Severozápad.

Kvantitativní analýzou je míněn postup, kdy jsem si vytáhnul všechny články obsahující určité kličové slovo (takové, které se v článcích dané kauzy vyskytuje prakticky vždy) a podíval se, kolik článků a kolik znaků (tedy jak dlouhé ty články byly) tomu jednotlivá média věnovala. Analýza tedy nikde neřeší “tón”, to je práce pro kvalitativní analýzu, která již vyšla v Deníku referendum.

U každého grafu je pár statistik: celkový počet článků a napsaných znaků. Číslo v závorce pak značí kolik to je relativně k průměru všech médií k dané kauze. V grafech je zachycen i časový vývoj, tedy zda se tomu média věnovala průběžně, nárazově, nebo se zpožděním. Od časové osy nahoru jde počet zpráv, a naopak dolů se zvyšuje počet znaků.

Obecně tedy platí, že čím víc “barevné” plochy, tím víc pozornosti médium tématu věnovalo. Pokud je graf výrazně asymetrický směrem nahoru, tak se psaly spíš kratší, povrchnější zprávy (hodně zpráv, malý počet znaků). Pokud výraznější plocha začíná až v prostředku grafu, tak téma noviny nějakou chvíli ignorovaly. Najetím myší nad graf se zobrazí tooltip s konkrétním článkem, který odpovídá dané x-ové pozici.

S teorií za námi pojďme na neutrální kauzy. Na těch by měl být vidět relativní “výtlak” jednotlivých médií - dá se čekat, že specializované Hospodářky a iHNed budou trochu menší, než MF Dnes nebo novinky.

Výrazně malý počet zpráv iDNES bude pravděpodobně spíš chyba metody, články nejspíš vycházely mimo rubriku Zprávy.

Registr smluv

Klíčové slovo v Newtonu registr smluv, časové rozmezí od 1.2.2017 do 8.3.2017

Hospodářské novinyCelkem zpráv: 3 (35 %)Celkem znaků: 11 758 (34 %)iHNed.czCelkem zpráv: 10 (117 %)Celkem znaků: 45 794 (133 %)aktualne.czCelkem zpráv: 8 (94 %)Celkem znaků: 26 410 (76 %)PrávoCelkem zpráv: 9 (105 %)Celkem znaků: 38 655 (112 %)novinky.czCelkem zpráv: 10 (117 %)Celkem znaků: 49 602 (144 %)Mladá fronta DNESCelkem zpráv: 12 (140 %)Celkem znaků: 45 302 (131 %)zpravy.iDNES.czCelkem zpráv: 12 (140 %)Celkem znaků: 48 692 (141 %)Lidové novinyCelkem zpráv: 6 (70 %)Celkem znaků: 18 740 (54 %)lidovky.czCelkem zpráv: 7 (82 %)Celkem znaků: 26 046 (75 %)

U obou kauz je vidět spíš velký rozptyl médií než jakékoliv pravidlo. Lze ale odhadovat, že MF, iDNES, Právo a novinky budou mít na podobná témata zhruba podobné počty článků. LN a Lidovky budou v závěsu a produkty Economie mají výtlak spíš nižší. Pojďme na pro-Babišovské kauzy.

Policejní reforma

Klíčové slovo v Newtonu reforma policie, časové rozmezí od 1.6.2016 do 30.8.2016

Hospodářské novinyCelkem zpráv: 36 (53 %)Celkem znaků: 183 713 (70 %)iHNed.czCelkem zpráv: 55 (82 %)Celkem znaků: 215 567 (82 %)aktualne.czCelkem zpráv: 46 (68 %)Celkem znaků: 149 845 (57 %)PrávoCelkem zpráv: 70 (104 %)Celkem znaků: 296 931 (113 %)novinky.czCelkem zpráv: 86 (128 %)Celkem znaků: 279 080 (106 %)Mladá fronta DNESCelkem zpráv: 78 (116 %)Celkem znaků: 300 965 (114 %)zpravy.iDNES.czCelkem zpráv: 78 (116 %)Celkem znaků: 284 335 (108 %)Lidové novinyCelkem zpráv: 94 (139 %)Celkem znaků: 450 980 (171 %)lidovky.czCelkem zpráv: 64 (95 %)Celkem znaků: 212 464 (81 %)

Policejní reformě se nadstandardně věnovaly LN, zbytek byl tak nějak stejně.

R.O.P. Severozápad

Klíčové slovo v Newtonu ROP severozápad, časové rozmezí od 13.12.2016 do 31.1.2017

Hospodářské novinyCelkem zpráv: 6 (38 %)Celkem znaků: 28 120 (52 %)iHNed.czCelkem zpráv: 7 (44 %)Celkem znaků: 28 043 (52 %)aktualne.czCelkem zpráv: 10 (63 %)Celkem znaků: 29 026 (54 %)PrávoCelkem zpráv: 21 (132 %)Celkem znaků: 56 428 (104 %)novinky.czCelkem zpráv: 17 (107 %)Celkem znaků: 50 322 (93 %)Mladá fronta DNESCelkem zpráv: 33 (208 %)Celkem znaků: 121 871 (225 %)zpravy.iDNES.czCelkem zpráv: 4 (25 %)Celkem znaků: 12 601 (23 %)Lidové novinyCelkem zpráv: 24 (151 %)Celkem znaků: 75 968 (140 %)lidovky.czCelkem zpráv: 21 (132 %)Celkem znaků: 85 481 (158 %)

Mail hacknutý nacisty z White-Media byl ve většině produktů Mafry propírán podrobněji, zbytek se tématu věnoval průměrně, iHNed o něm prakticky nereportoval.

A teď to nejzajímavější: jak vypadají kauzy proti majiteli Mafry?

Dluhopisy

Klíčové slovo v Newtonu babiš dluhopisy, časové rozmezí od 3.1.2017 do 28.2.2017

Hospodářské novinyCelkem zpráv: 20 (85 %)Celkem znaků: 105 986 (120 %)iHNed.czCelkem zpráv: 41 (175 %)Celkem znaků: 161 855 (183 %)aktualne.czCelkem zpráv: 15 (64 %)Celkem znaků: 47 324 (53 %)PrávoCelkem zpráv: 29 (124 %)Celkem znaků: 115 804 (131 %)novinky.czCelkem zpráv: 33 (141 %)Celkem znaků: 122 771 (139 %)Mladá fronta DNESCelkem zpráv: 15 (64 %)Celkem znaků: 50 488 (57 %)zpravy.iDNES.czCelkem zpráv: 21 (90 %)Celkem znaků: 74 320 (84 %)Lidové novinyCelkem zpráv: 11 (47 %)Celkem znaků: 31 238 (35 %)lidovky.czCelkem zpráv: 26 (111 %)Celkem znaků: 87 913 (99 %)

Dluhopisy se v MF a LN začaly probírat s výrazným zpožděním za ostatními médii (i internetovými odnožemi těchto deníků), papírové noviny vůbec nereportovaly o lednové anonymní žalobě, která celou aféru spustila. MF se pak “chytla” a psala srovnatelným tempem jako konkurence (byť jejich “náskok” pochopitelně nestáhla), LN se tématu věnovaly nejméně. Na druhou stranu sesterské Lidovky.cz byly veskrze průměrné, a dalece tak překonaly Aktuálně.

Čapí hnízdo

Klíčové slovo v Newtonu čapí hnízdo babiš, časové rozmezí od 25.11.2015 do 30.4.2016

Hospodářské novinyCelkem zpráv: 41 (83 %)Celkem znaků: 164 771 (89 %)iHNed.czCelkem zpráv: 43 (87 %)Celkem znaků: 186 710 (101 %)aktualne.czCelkem zpráv: 48 (97 %)Celkem znaků: 169 596 (92 %)PrávoCelkem zpráv: 90 (182 %)Celkem znaků: 378 848 (205 %)novinky.czCelkem zpráv: 71 (144 %)Celkem znaků: 240 502 (130 %)Mladá fronta DNESCelkem zpráv: 34 (69 %)Celkem znaků: 96 598 (52 %)zpravy.iDNES.czCelkem zpráv: 31 (63 %)Celkem znaků: 128 353 (69 %)Lidové novinyCelkem zpráv: 38 (77 %)Celkem znaků: 163 105 (88 %)lidovky.czCelkem zpráv: 48 (97 %)Celkem znaků: 133 944 (73 %)

Kauza Čapí hnízdo je podobná dluhopisům, Mafra papír (zejména MF) o ní v době kdy to ještě nebylo “moc velké” nepsal. Pak se však deníky probudily a psaly vcelku srovnatelně s ostatními, kromě Práva s Novinkami, které kauzu dřenilo výrazně nadprůměrně (natolik nadprůměrně, že žádné další médium se nedostalo nad celostátní průměr, nejblíž mu bylo Aktuálně a Lidovky s 97 %).

Závěrem

Co z toho plyne? Pokud se kriticky podíváme na všechny kauzy, je vidět, které jsou kterým deníkům vlastní a ve kterých se spíš jen vezou. Netroufl bych si ale na základě těchto dat říct, že by Mafra témata aktivně dusila. Z vlastní zkušenosti (půl roku sedím v redakci Lidovek) můžu s klidem prohlásit, že jsem ani neslyšel o nějakém odrazování od Babišových bolístek, naopak jsem párkrát zaslechl povzbuzení typu “a co že je náš majitel, psát o něm budeme”. To je tedy jen za Lidovky a LN, u “červených” může být vše jinak, je to zcela jiná redakce a obsahově kromě sportovní rubriky de facto konkurence.

Nicméně i s přihlédnutím k předchozímu odstavci je fakt, že Mafra, která v ČR vždy investigativu vedla (prakticky jako jediná) nemá na Andreje jedinou “vlastní” kauzu. Subjektivní tip čím to je? Vlastní kauzu redaktor nedostane zadanou, ta ho musí zajímat, musí za ní sám jít. A lidi, kteří chtějí Andreje “sundat” pro něj nepracují z principu, odešli - pokud byli normální do Reportéra, ostatní do Echa.

Tudíž redakci není třeba ovlivňovat, od “nepohodlných” se pročistila z logiky věci sama (byť tomu asi Plesl s Nachtigallem svým přístupem dost pomohli). A bohužel žádné jiné médium nemá sílu nastolovat témata takovou, jako MF.

Zdrojová data jsou na GitHubu: https://github.com/veproza/mafra-babis-newton (export z Newtonu je ořezaný, protože autorská práva). Ocením návrhy dalších kauz, na kterých by se daly rozdíly dobře prezentovat, zatím je dat příliš málo na to, aby přebily přirozený rozptyl.