Kontynuujemy temat tworzenia wysokiej jakości oprogramowaniu w kontekście przetwarzania danych. W tym wpisie porównamy jak R i Python radzą sobie ze wspomaganiem użytkownika w pisaniu przejrzystego, dobrego kodu. Temat jest szeroki, skupimy się na 4 zagadnieniach: Jak powinien wyglądać szablon projektu Data Science? Dlaczego konwencje nazewnictwa mają znaczenie i czym linter? Dlaczego ważna jest ujednolicone formatowania kodu? Czym jest CI/CD i jak wykorzystywać go do tworzenia wysokiej jakości oprogramowania? Python Zacznijmy od poezji: Zen of Python - PEP20.

Kontynuuj czytanie

W ciągu najbliższych tygodni na Szychcie pojawi się seria wpisów, które mają przybliżyć tworzenie dobrej jakości kodu w kontekście przetwarzania danych. Wpisy będą techniczne, nie będzie wykresów i narracji zbudowanych na danych. Jednocześnie jest to dobra okazja do porównania dwóch języków programowania R i Pythona, z czego skorzystamy. Który język będzie górą? Czy filozofia, która za nimi stoi jest zbliżona? Która społeczność kładzie większy nacisk na tworzenie wysokiej jakości kodu?

Kontynuuj czytanie

Uwaga, wpis techniczny! Kilka miesięcy temu została wypuszczona nowa wersja Pythona 3.9. Ponieważ dwa lata temu R przestał być językiem, w którym programuję ,,na co dzień" nowości Pythona mnie ciekawią i postanowiłem, że oprócz wykresów i analiz danych warto dzielić się także nieco bardziej technicznymi aspektami. To pierwsza odsłona nowej, technicznej twarzy Szychty :) Co znajdziemy w nowej wersji Pythona? Zestawień nowości jest w internecie bardzo dużo, choćby tutaj. Chciałbym się skupić na tej, która najbardziej mnie zainteresowała czyli uproszczenie typowania funkcji.

Kontynuuj czytanie

Dlaczego warto przenieść blog a z Wordpressa do Hugo, statycznego generatora stron internetowych? Szybsza strona, mocniej zintegrowana z eRowym kodem, a do tego darmowy hosting na Githubie. A jak to zrobić? W internecie znajduje się trochę tutoriali na ten temat, ale jak to zwykle bywa diabeł tkwi w szczegółach. Z pokaźnej liczby tutoriali dotyczących przenoszenia blogów z Wordpressa do Hugo z czystym sumienieniem mogę polecić ten. Niestety jest w nim kilka rzeczy, które mi się nie podobają i które rozwiązałem inaczej.

Kontynuuj czytanie

Spróbujmy poszukać w danych odpowiedzi na 5 pytań, które mogą się narzucać osobie przygladającej się polskiej scenie politycznej. Obserwujac media społecznościowe trudno nie oprzeć się wrażeniu, że inflacja dotknęła w ostatnim czasie także rynek powyborczych analiz danych :) Wobec tego tym razem podsumowanie ,,Szychty" będzie bez map i doszukiwania się rozbiorów… 1. Czy Polskę można podzielić na pół i odseparować zwolenników PiS od PO? Oczywiście, źe się nie da :) Spór polityczny jaki widzimy nie ma charakteru regionalnego.

Kontynuuj czytanie

Kto odniósł sukces, a kto porażkę? Które ugrupowania umocnił czas pandemii i na ile płynne są przepływy elektoratu w Polsce? Jak zmienia się geografia tego jak głosują Polacy? Jako blog o wyborczej proweniencji mamy przyjemność zaprezentować wyniki pierwszej tury wyborów prezydenckich. Kto jest zwycięzcą? Oprócz prostej odpowiedzi, że kandydat, który zdobył największą liczbę głosów myślę, że należy bardzo mocno podkreślić niezwykle wysoką frekwencję. Niemal 65% jest wynikiem, po raz pierwszy od 1989 roku, zbliżonym do tego co obserwujemy w europejskich demokracjach.

Kontynuuj czytanie

Cóż innego mogłoby być tematem bloga dotyczącego analizy danych jak nie oczywiście koronawirus? Odpowiadając na prośby najwierniejszych czytelników Szychty (czyli żony i taty), dzisiaj krótko o tym czemu nie pisałem nic na ten temat i o przewadze milczenia nad słowem pisanym. Powód pierwszy Banalny - nie znam się na epidemiologii :) Kilka kursów z równań różniczkowych (w tym modelowania deterministycznego), znajomość procesów gałązkowych czy ogólne obycie w analizie danych nie oznacza, że ktoś zna się na pandemiach.

Kontynuuj czytanie

Rządy lewicowe zwykle charakteryzuje dążenie do zrównywania dochodów, podczas gdy prawica, a już na pewno liberalne partie, prowadzą politykę, która powoduje wzrost nierówności. Ale nie w Polsce… Być może czytelnicy Szychty mieli okazję czytać książkę ,,To nie jest kraj dla pracowników" Rafała Wosia. Jeśli nie to gorąco polecam! Wyłania się z niej smutny obraz rynku pracy w Polsce. Dla mnie zwłaszcza w kontekście istnienia osób, całych regionów i grup społecznych, spychanych na margines, wyłączonych z podziału wzrostu gospodarczego.

Kontynuuj czytanie

W Polsce zaczyna brakować rąk do pracy. Powodem jest szybki rozwój gospodarczy połączony z niekorzystnymi zmianami demograficznymi. Od wielu lat zmniejsza się dopływ nowych, mało doświadczonych pracowników - absolwentów szkół i uniwersytetów. Wiele osób wyjechało zagranicę. Mamy więc rekordowo niskie bezrobocie, jedno z najniższych w Europie. Pomijając potencjalnie negatywne aspekty tego zjawiska, czy rzeczywiście sytuacja na rynku pracy jest u nas lepsza niż w większości krajów europejskich? Czy może jest to jedynie optyczne złudzenie z powodu przyłożenia niewłaściwej soczewki?

Kontynuuj czytanie

Zdjęcie autora

Szychta w danych

Blog o poznawaniu świata za pomocą danych

Piotr Sobczyk