čtvrtek 10. září 2015

Analýza dat z internetové diskuze o uprchlících

Obecně panuje rozšířený názor, že diskuze pod články na zpravodajských webech jsou hnůj a svinstvo. Pokud někomu řeknete, že se v diplomce zabýváte politickými diskuzemi na internetu, spatříte v jeho očích většinou soucit. A diskuze o uprchlících je svinstvo na druhou.

Lze se na to podívat ale taky z jiné stránky. Pokud máme odvahu se do diskuze ponořit, můžeme z ní získat užitečné informace o současné debatě. Pročítat ale všechny komentáře je přinejmenším zoufale neefektivní. Lepší je všechna potřebná data stáhnout pomocí počítačového programu a pro analýzu využít statistické zpracování dat a hlavně analýzu sociálních sítí - analýzu grafů složených z bodů a vazeb. Konkrétně budeme analyzovat diskuzi na zpravodajském serveru idnes.cz. Ten má tu výhodnou vlastnost, že jako přihlášený uživatel vidíte, kdo lajkuje a dislajkuje komentáře ostatních uživatelů. Vzniká tím pádem síť vztahů mezi jednotlivými diskutujícími. Z téhle sítě pak jdou zjišťovat různé zajímavé informace o skupinách, výrazných osobnostech nebo třeba osobách, které spojují různé názorové skupiny.

Informací v takové diskuzi je uloženo neuvěřitelné množství a možností, jakým způsobem se na ně podívat, je nepřeberně. Je proto lepší začít zvolna a nedávat si příliš velké cíle. Podíváme se proto pro dnešek pouze na srpnovou debatu a její základní popis.

Jak velké je velké téma

Nikdo nepochybuje, že uprchlická tématika posledních několik měsíců hýbe naší veřejnou diskuzí. Jak to ale vypadá, když debata na idnesu vře?

Za celý srpen se na idnesu z klasických zpráv (nepočítá se Technet, Ona a další rubriky) věnovalo 13 % článků uprchlické krizi, Islámu, terorismu nebo uprchlíkům. Respektive u nich byl umístěn alespoň jeden z tagů "Islámský stát", "Příliv uprchlíků do Evropy", "Terorismus", "Terorismus, teroristické útoky", "Islám", "Uprchlíci". Ze všech 230 973 srpnových komentářů přibližně třetina byla u těchto článků. Na počet reakcí je poměr ještě o něco vyšší, kdy se z přibližně milionu lajků a dislajků, které v diskuzi na idnes.cz diskutující v srpnu udělili, téměř 40 % objevuje pod články se zkoumaným tématem.

Takže takhle to vypadá, když nějaké téma lidi opravdu zajímá - u 13 % článků je 40 % aktivity. Pro srovnání nejčastějším tagem "Krimi / Černá kronika" je označeno 11 % článků, komentářů je u tagu 12 % a lajků a dislajků 12,5 %. V tomto příspěvku se nedostaneme k podrobnějšímu srovnání s více tématy ani k vývoji v čase, protože se budeme věnovat zajímavějšímu tématu a tím je rozdělení na diskuzní skupiny.

Dvě názorové skupiny

Na uvedeném grafu vidíte znázornění vztahů nejvíce aktivních diskutujících. Každý bod představuje jednoho diskutujícího. Čím je bod větší, tím dostal diskutující od ostatních více lajků. Čím je čára mezi dvěma diskutujícími širší tím je mezi nimi výraznější pozitivní vztah. Pomocí algoritmu jsou v grafu stanoveny skupiny, kde jsou uživatelé spolu propojeny hodně vztahy a každá skupina má jednu barvu.

Vztahy aktivních diskutujících (uprchlíci, srpen 2015)

Aktivní diskutující jsou vybráni proto, že by graf se všemi komentujícími byl extrémně nepřehledný a navíc je na to potřeba větší výpočetní výkon počítače. Ze stejného důvodu se v grafu počítá jenom s lajky a dislajky jsou vyřazeny. Aktivní diskutující zde konkrétně znamená, že osoba má vztah alespoň k jednomu jinému uživateli nejméně deset lajků. Díky tomu si taky můžeme být celkem jistí, že vztah je opravdu významný a nejde jen o náhodné lajknutí. Z celkových 11 466 diskutujících je tak na grafu zobrazeno necelých 400.

Na první pohled je zřejmé, že jsou zde dvě výrazné názorové skupiny s velmi odlišným názorem. Algoritmus také našel několik dalších menších skupin, které v tuto chvíli zanedbáme. Na to, abychom zjistili, jaký mají dvě hlavní skupiny názor, se podíváme, které komentáře členové těchto skupin za srpen nejvíce lajkovali. Vybrány jsou dva nejoblíbenější příspěvky skupin:

Červená skupina

Turkům a Řekům je to jedno, Makedonci postavili plot a zátarasy, Srbové už to taky stopli, Maďaři postavili plot, Slováci všechny odmítli, Němci chtějí pozastavit platnost Schengenské dohody a pro jistotu pálí potenciální ubytovny, ale Rakušáci se jako obvykle pustí do nás. Už chybí jen zmínka o jaderné elektrárně, aby to bylo komplet.

Článek: Rakouský kancléř kritizuje Česko kvůli běžencům. Bez kvót to nejde, míní (25.8.2015)

Ještě si vzpomínám jak po vstupu do slavné EU blokovali roky pracovní trh kvůli nám a Polákům, nebo vlastně celkově lidí z Evropy a teď jim nevadí milion kulturně odlišných a nekvalifikovaných Afričanů?

Článek: Jste neúnosně pomalí, vyčítá Berlín kvůli migrantům Evropské unii (23.8.2015)

Modrá skupina

Jsem myslel, že to byla demonstrace a vono to sjezd amatersky genetiku. Pokud bych jejich genofond zanikl vůbec by to nevadilo.

Článek: Imigrace zničí naše geny, hřímal řečník v Praze. Odvedla ho policie (8.8.2015)

ani pan "válečný hrdina" neumí rozlišovat mezi fanatickými islamisty a těmi, kteří prchají před hrůzami války.

Článek: Ve jménu Alláha vraždí kdekoliv na světě, varoval nový šéf Úsvitu Lidinský (8.8.2015)

Interpretace je velmi snadná. Červená skupina je jasně protiuprchlická zatímco modrá prouprchlická. Za spíše zajímavost můžeme považovat to, že nejoblíbenější příspěvky protiuprchlické aktivní skupiny jsou celkem dlouhé a poměrně jasně argumentují. Naopak oblíbené příspěvky prouprchlické jsou dost krátké a oba obsahují osobní útoky. Patrně se jedná o náhodu a na nějaký závěr by byla potřeba rozsáhlejší analýza, ale rozhodně to je podnět pro liberálně orientované diskutující, kteří bývají často přesvědčeni o své intelektuální nadřazenosti.

Co víme o skupinách

Jak je vidět z následující tabulky červená protiuprchlická skupina tvoří přibližně 80 % všech aktivně diskutujících. Prouprchlická skupina ale vytváří poměrně o 8 % více komentářů než je počet jejich členů. Můžeme tedy říct, že jde o skupinu v diskuzi mírně aktivnější než je skupina protiuprchlická. Možná je to způsobeno tím, že liberální prouprchlická část veřejnosti je obecně více angažovaná.

Když se ale podíváme na další čísla, zjistíme, že prouprchlická skupina je velmi neoblíbená u méně aktivních diskutujících. A to dokonce takovým způsobem že aktivní diskutující, kteří jsou uprchlíkům nakloněni, dostali v srpnu devětkrát méně lajků než druhá skupina. Navíc prouprchlická skupina dostala přes 70 % dislajků. Naladění drtivé části návštěvníků idnesu je tedy více než jasné.

Tento fakt způsobuje mimo jiné i to, že pokud diskuzi na idnesu jenom rozkliknete, tak v podstatě nemáte šanci zaregistrovat, že by zde nějaká prouprchlická skupina existovala. Musíte se diskuzí podrobněji probírat, abyste na prouprchlické postoje narazili, protože v doporučených příspěvcích budete mít jenom nejlajkovanější protiuprchlické názory.

Co z toho vyplývá? I když je diskuze na idnesu opravdu velmi jednostranná, není pravda, že by tu neexistovalo více názorů a všichni jednohlasně odsuzovali uprchlíky. Je zde menší (značně neoblíbená) skupina, která aktivně diskutuje a brání prouprchlické pozice. Výsledky tedy působí, že docela dobře kopírují realitu mimo internet. Diskuze na internetu v tomto smyslu není katalyzátorem nenávisti, která zatemňuje mysl lidí. Naopak na internetu máme možnost vystoupit ze své sociální bubliny a při podrobnějším zkoumání zjistit, jak se věci skutečně mají. Jestli by ale šlo používat diskuzi z idnesu jako nástroj k měření veřejného mínění je otázkou, která by vyžadovala výrazně podrobnější zkoumání.

8 komentářů:

  1. Davam jsem tento komentar, abyste mi ho mohli likovat :) Jinak hezka analyza. Zajimalo by me, zda maji ty dve site i jine parametry, jako je centralita a hustota.

    OdpovědětVymazat
    Odpovědi
    1. Díky :-)

      Červená
      Hustota: 0.023, Centralita: 0.3


      Modrá
      Hustota: 0.042, Centralita: 0.63

      Červená má podle mě větší centralitu a hustotu, protože má více okrajových členů. Ale nějak do hloubky jsem to neřešil.

      Vymazat
  2. I me by zajimala interpretace te hustoty. Je jasne videt, ze cervena skupina zastava konsistentnejsi nazor nez modra skupina. Osobne z toho usuzuju, ze modra skupina nepodleha rychlym nazorum a radeji hleda vlastni nazor nez aby jen lajkovala dany uzus.

    OdpovědětVymazat
    Odpovědi
    1. Zdá se, že větší hustotu a centralitu má červená skupina jenom na obrázku a ne v přesném výpočtu. Viz výše. Zatím se mi zdá, že diskuze i ze strany "prouprchlíků" je dost emociální a hraje také na první signální, takže bych s vaším odahdem nesouhlasil.

      Vymazat
  3. Páni, skvělá práce. Narazila jsem na váš post jen náhodou a zírám, to je přece banda užitečných dat, která jste zpracoval jen tak mimochodem. To by se mělo někde nějak víc šířit! Taky máte zřejmě dobré kompetence do budoucna. Prostě za mě palec hore a pěkný den přeji ;)

    OdpovědětVymazat
  4. Vážně brilantní analýza, Vás by měli zaměstnat na ministerstvu.

    OdpovědětVymazat
  5. Krátké komentáře bez argumentace a jejich vysoká četnost v přepočtu na přispěvatele svědčí o tom, že nejde o normální diskutující, ale o trolly, s vysokou mírou pravděpodobnosti placené a působící pod mnohočetnými identitami.

    OdpovědětVymazat