Fake news a statystyka     Home
Jak myślenie ilościowe, liczbowe, statystyczne pomaga krytycznie patrzeć na informację.

Tematy:     Czystość powietrza     Stopy na metry     3.5    


Czystość powietrza

Infromacja: Kraków w środę był drugim najbardziej zanieczyszczonym miastem świata.

Jak o tym myśleć? Świat jest duży (miast powyżej miliona jest 500), aż taką ekstremą bylibyśmy? Googlujemy "most polluted cities", czy jakoś tak. Otrzymujemy tabelę, nie całkiem aktualną, ale w ciągu paru lat takie rzeczy się nie zmieniają radykalnie. Dominują Chiny, Indie. Pierwsze polskie miasto na pozycji 370, Kraków 400 (może pomylili z pozycją UJ między światowymi uniwersytetami?). Ta tabela wygląda sensownie - to subiektywne odczucie, ale nie całkiem zakazane przy poszukiwaniu prawdy. W zasadzie mamy odpowiedź. ALE statystyk musi zauważyć, że tabela dotyczy średniego zanieczyśzczenia, zapewne w ciągu roku, a w newsie była mowa o jednym dniu! Ponadto, nie był to przypadkowy, losowy dzień, był on WYBRANY jako ekstremalny, inaczej nie byłoby newsa. Ale żeby przeskoczyć z pozycji 400 na srebrny medal!
Może jeszcze rzut oka na jakąś mapę dotyczącą zanieczyszczenia krakowskiego powietrza?
Co nas powinno tu zastanowić (i podważyć wiarygodność przekazu)? Mamy 8 punktów pomiarowych, 8 wyników różnych pomiarów. A tylko dwie wartości: 129 i 101. Gdyby to było 4 i 3, w porządku, po lewej gorzej, po prawej trochę lepiej. Ale żeby 5 razy otrzymać 129! Dlaczego nie 128, 130, 131, 125, choć raz? Powiedzmy, że stężenie było gdzieś między 120 i 140. Jakie jest prawdopodobieństwo wylosowania z tego zakresu pięciu takich samych wartości (całkowitych)? p = (1/20)4 = 0.000006. Dlaczego do potęgi 4, a nie 5?

Jaka może być przyczyna? Najprostsza jest taka. Mamy tylko dwa pomiary: 129 i 101, a mamy 8 punktów na mapie... . Poważniejsza przyczyna mogłaby być taka. Wyniki pomiarów były 4, 4, 4, 4, 4, 3, 3, 3, ale z jakiegoś powodu przeliczono je na inną skalę, tak, że 4 → 129, 3 → 101. Kwestia przeliczania jest tematem następnego punktu.


Stopy na metry

Połowa naszego zglobalizowanego świata używa systemu miar SI, a połowa nie. Duża część jeździ lewą stroną. Itp. Dziennikarz przetłumaczył news:
Nowy rekord wysokości balonu na ogrzane powietrze: 70 tysięcy stóp.
Szef poważnie go strofuje, że w Polsce nie ma stóp, tylko metry. Jaki problem, mówi dziennikarz wyciągając smartfon. I poprawia wiadomość:
Nowy rekord wysokości balonu na ogrzane powietrze: 21336,259 m.
W końcu uzgodnili, że będzie 21336 m. Jednak, to i tak jest źle przetłumaczona wiadomość. W oryginale było "ale wysoko", a w tłumaczeniu jest: "jakaś skomplikowana liczba, ale dokładnie zmierzyli". Jak powinno być? Nie wszyscy się zgodzą, ale powinno być 20 km (pójdźmy na ustępstwa, 21 km).

Każdy wynik pomiaru (np. wysokości balonu) jest niepewny. Prawie zawsze wiemy jaka jest ta niepewność. Albo znamy ją względnie dokładnie, albo orientacyjnie. Od tego jak duża jest niepewnośc pomiarowa zależy, z jaką dokładnością należy podać wynik pomiaru. Tu jest krótki tekst na ten temat.


3.5

Ten punkt nie jest o fake news, tylko o liczbach. Konkretnie o ocenach: 3, 3.5, 4, 4.5, 5. Jest pięć ocen (pomińmy brak zaliczenia). O co chodzi? O to, że 3 jest (z konieczności) bardzo rozciągliwe. Obejmuje: "nie powinienem tego zaliczyć, ale...", "ostatecznie, dostatecznie", "=3 = 3 na szynach", "-3", "minimum", ale też "nie najgorzej, ale nie na 3.5".

Natomiast 3.5 oznacza wyraźnie lepiej niż minimum. Od 3.5 do 5 skala jest liniowa. Niestety 3 też należy do tej "liniowej" skali. Co oznacza słowo liniowa?

Oznacza to, że jak liczymy średnią ocen, to 3 wchodzi jako 3. Średnia z 3, 3.5, 4 jest 3.5 - jasne. Taka sama średnia jest przy 3.5, 3.5, 3.5. Tymczasem, owszem ten pierwszy student raz osiągnął 4, ale raz osiągnął dno (niemal dno). Zdaniem autora, 3 powinno wchodzić do średniej jako 0, no może 1, a nawet 2, ale nie jako 3! Bo to jest tak:   3         3.5  4  4.5  5.