Potrzeba czy marnotrawstwo lub o liczbie parlamentarzystów

Potrzeba czy marnotrawstwo lub o liczbie parlamentarzystów

Piotr Sobczyk
Mamy kolejne wybory, tym razem europejskie. Czy ponad 700 parlamentarzystów których wybiorą Europejczycy to duża liczba? Jak ma się ona do krajowych parlamentów w Polsce i na świecie? Czy analizując dane dla wszystkich tego typu zgromadzeń można doszukać się jakichś prawidłowości? Na początek sprawdźmy rzecz oczywistą: im więcej ludności, tym więcej parlamentarzystów. Powody są co najmniej dwa: duże państwa mają więcej spraw, którymi chcą się zająć, oraz potrzebują większej liczby posłów, aby pojedynczy reprezentant nie przypadał na zbyt dużą liczbę ludności.
Bogaty Polak jak biedny Niemiec. O różnicach w zarobkach

Bogaty Polak jak biedny Niemiec. O różnicach w zarobkach

Piotr Sobczyk
W ostatnich latach mamy w Polsce bardzo niskie bezrobocie iszybki wzrost płac. Przyjrzyjmy się temu, na ile struktura wynagrodzeń jest u nas podobna do pozostałych krajów europejskich. Czy Polsce udaje się zmniejszyć dystans do najbardziej rozwiniętych i porównywalnych z nami krajów UE. Bardzo często porównując dobrobyt w poszczególnych krajach patrzymy na PKB na mieszkańca. Okazuje się jednak, że przez wiele lat nasza produktywność (rozumiana jako PKB na mieszkańca) rosła szybciej niż wynagrodzenia, o czym już kiedyś Szychta pisała.
Czy Wielka Brytania jest uzależniona od Europy lub Brexit (cz. 1)

Czy Wielka Brytania jest uzależniona od Europy lub Brexit (cz. 1)

Piotr Sobczyk
Brexit zbliża się wielkimi krokami. Niektórzy wieszczą katastrofę podczas gdy inni się cieszą. Wydaje się, że w Polsce trudno znaleźć powody do zadowolenia z tego wydarzenia. Jednak zamiast szermować ideologicznymi frazesami sprawdźmy czego na temat relacji Wielkiej Brytanii i Unii Europejskiej da się dowiedzieć patrząc na dane. Wyjście Wielkiej Brytanii z Unii będzie miało oczywiście wiele konsekwencji i nie próbujemy nawet sugerować, że weźmiemy je wszystkie pod uwagę. Ale przez najbliższe tygodnie spróbujemy nieco przybliżyć sytuację gospodarczą, demograficzną i polityczną u progu tego wydarzenia.
Koszty obsługi długu lub o tym kto bogatemu zabroni

Koszty obsługi długu lub o tym kto bogatemu zabroni

Piotr Sobczyk
Dług długowi nierówny. Kredyt jest innym obciążeniem dla osoby majętnej niż dla ubogiej. Także na inny procent pożycza się bogaczowi, a na inny osobie biednej. Kusi aby powiedzieć, że ta sama zasada odnosi się do krajów, ale okazuje się, że stosowanie tej analogii do pożyczek zaciąganych przez państwa jest sporym nadużyciem. Zacznijmy od tego, że koszty obsługi długu wcale nie są największe dla krajów najbardziej zadłużonych. Wynika to oczywiście z dużego zróżnicowania oprocentowania pożyczek jakie są zaciągane.
Wykresy Unplugged

Wykresy Unplugged

Piotr Sobczyk
Już jest! Jakiś czas temu czytelnicy Szychty tłumnie zgłosili się do czytania wersji roboczej, a teraz książeczka jest wydana, dostępna i czeka na chętnych ;) Zawiera ćwiczenia i szczyptę teorii dotyczącej wizualizacji danych. Kto nie boi się wyzwań, kredek i miłego wieczoru (lub kilku) niech się długo nie zastanawia. Statystyczna odpowiedź na styczniowy splin Czym są Wykresy unplugged? Jest to zeszyt składający się z ćwiczeń do wyrysowania. Przedstawiamy 8 typów wykresów wraz z elementami teorii dotyczącej technik wizualizacji.
Powtarzalna unikalność lub o nazwiskach w Polsce

Powtarzalna unikalność lub o nazwiskach w Polsce

Piotr Sobczyk
Każdy z nas myśli o sobie jako o kimś unikalnym. Jednym z przejawów tej naszej ,,unikalnej” tożsamości są nasze imię i nazwisko. Pod wieloma względami jesteśmy jednak do siebie bardzo podobni. Między innymi dzięki temu statystycy mają pracę ;) Sprawdźmy, które nazwiska są w Polsce najbardziej popularne, a które występują bardzo rzadko, jedynie na małym obszarze Polski? Na początku kilka faktów o naszym zbiorze danych. Nazwiska są znacznie bardziej ,,rozproszone” niż imiona, o czym każdy mógł się przekonać w szkole.
Dług publiczny lub o tym jak przedstawiać skalowanie powierzchni

Dług publiczny lub o tym jak przedstawiać skalowanie powierzchni

Piotr Sobczyk
Przerażający, niebezpieczny, konieczny? Opinie co do tego, co powinniśmy sądzić o długu publicznym są bardzo podzielone. Od licznika Balcerowicza do opinii, że jest on w gruncie rzeczy pozytywny, a pomiędzy nimi brak głębszej refleksji. Jak wygląda dług publiczny na świecie i jak można go zwizualizować? Naszym głównym celem jest stworzenie wykresu zwanego anamorfozą, który przedstawia obszary ,,w krzywym zwierciadle”. Zakrzywienie zwierciadła zależy od wielkości pewnej zmiennej, takiej jak PKB lub liczba ludności.
Nowa ordynacja w wyborach do Parlamentu Europejskiego lub

Nowa ordynacja w wyborach do Parlamentu Europejskiego lub

Piotr Sobczyk
Przez Parlament przeszła nowelizacja ordynacji wyborczej w wyborach do Parlamentu Europejskiego. W skrócie sprawia ona, że małym partiom trudniej zdobyć mandat, a wybory przestają być proporcjonalne. Została ona skrytykowana przez wiele środowisk, w tym rzecz jasna małe partie polityczne. Zerknijmy w dane i zobaczmy o co tyle hałasu. W styczniu tego roku CBOS opublikował sondaż poparcia dla partii politycznych w województwach. W oparciu o ten dane policzymy na ile mandatów mogą liczyć poszczególne partie.
Czy 500+ przestało działać lub o dzieciach i dzietności

Czy 500+ przestało działać lub o dzieciach i dzietności

Piotr Sobczyk
W Polsce w pierwszym półroczu 2018 urodziło się mniej dzieci niż w tym samym okresie rok wcześniej. Czy to porażka programu 500+ czy zwykła statystyka? Czego możemy się spodziewać w najbliższych latach?Na temat dzietności Szychta pisała już kilkukrotnie. Najpierw o tym czego można się spodziewać po 500+ i jak drogi jest to program. Potem na temat współczynnika dzietności kobiet i jak może się on zmienić do roku 2030-tego, a także tego jak zmieniła się w Polscestruktura urodzeń (pierwsze lub kolejne dziecko).

Quantile summary using dplyr

Piotr Sobczyk
R
Say you want to compute quantile summary for multiple variables. require(dplyr) require(tidyr) require(broom) As an example let us use mtcars dataset. glimpse(mtcars) ## Observations: 32 ## Variables: 11 ## $ mpg <dbl> 21.0, 21.0, 22.8, 21.4, 18.7, 18.1, 14.3, 24.4, 22.8, 19.... ## $ cyl <dbl> 6, 6, 4, 6, 8, 6, 8, 4, 4, 6, 6, 8, 8, 8, 8, 8, 8, 4, 4, ... ## $ disp <dbl> 160.