Python, R – StatSoft Polska

Data Science w Python – szybki start

Data science to dziedzina łącząca w sobie informatykę, statystykę, uczenie maszynowe i praktyczną umiejętność rozwiązywania problemów ze świata rzeczywistego (wiedzę domenową). Umiejętności data science są bardzo poszukiwane i cenne na rynku. Szkolenie ma umożliwić jego uczestnikom zapoznanie się z data science, zrozumienie jego podstaw i praktyczne rozwiązywanie zadań data science w środowisku Python – najpopularniejszym ekosystemie data science. Szkolenie może stanowić pierwszy krok na drodze do zastania mistrzem danych (ang. data scientist) – a stanowisko to zostało nazwane najseksowniejszą pracą w XXI wieku!

Dowiedz się więcej

Podstawy analizy danych w środowisku R

W trakcie szkolenia zostaną omówione zasady pracy w środowisku R, rodzaje najczęściej wykorzystywanych obiektów oraz przykłady ilustrujące pracę z tym pakietem.

Podczas kursu wykorzystywać będziemy RStudio, czyli zestaw zintegrowanych narzędzi zaprojektowanych z myślą o zwiększeniu wydajności pracy z R.

Dowiedz się więcej

Uczenie maszynowe w Python – szybki start

Celem szkolenia jest wprowadzenie uczestników w zagadnienia uczenia maszynowego (machine learning) oraz w środowisko Python w uczeniu maszynowym. Zostanie omówiona główna idea uczenia maszynowego oraz podstawowy zestaw metod.

Algorytmy modelowania będą przedstawione na poziomie pozwalającym na prawidłowy dobór narzędzi, świadome korzystanie z metod oraz prawidłową ocenę wyników. Uczenie odbędzie się poprzez rozwiązywanie przykładowych zadań w środowisku Python, przy czym nacisk zostanie położony na metody modelowania, a nie na kodowanie.

Dowiedz się więcej

Eksploracja, wizualizacja i przygotowanie danych w Python – szybki start

Częścią nieomal każdego projektu Data Science jest eksploracja danych w celu zapoznania się z ich strukturą, wykrycia problemów z jakością, a wynikom tabelarycznym zazwyczaj towarzyszą rozmaite wizualizacje. Na szkoleniu przedstawimy zarówno ogólne zasady eksploracji i wizualizacji danych, jak i sposób wykonywania ich w środowisku Python.

Uwaga szkolenie zakłada podstawową znajomość ekosystemu data science Python: zdecydowanie zalecamy wcześniejszy udział w szkoleniu „Data Science w Python – szybki start”

Dowiedz się więcej

Podstawy wizualizacji danych w R z wykorzystaniem pakietu ggplot2

Środowisko R jest przeznaczone nie tylko do analizy danych i skomplikowanych obliczeń statystycznych, ale także umożliwia tworzenie różnorodnych wizualizacji. Najczęściej wykorzystywany do tego celu jest pakiet ggplot2 – zaawansowany i elastyczny pakiet umożliwiający utworzenie praktycznie dowolnego wykresu.

Podczas szkolenia zaprezentowane zostaną podstawowe, a zarazem najważniejsze elementy umożliwiające uczestnikowi samodzielne tworzenie wizualizacji w środowisku R.

Dowiedz się więcej

Prognozowanie metodami uczenia maszynowego w Python

Prognozowanie jest jednym z najczęstszych zadań analizy danych: w końcu któż nie chciałby wiedzieć co będzie w przyszłości? Jednocześnie prognozowanie wydaje się trudne: w tworzeniu prognoz i stosowaniu ich w praktyce napotykamy wiele problemów, takich jak: specjalne zdarzenia, braki danych dla pewnych okresów, zmiany zachodzące w przewidywanym zjawisku i jego otoczeniu oraz skomplikowane zależności. Jednak spokojnie: na kursie poznasz techniki i narzędzia pozwalające radzić sobie z trudnościami i uzyskiwać użyteczne prognozy.

Szkolenie poświęcone jest narzędziom prognozowania szeregów czasowych dostępnym w środowisku Python. Przedstawione zostaną podstawowe i zaawansowane narzędzia prognozowania: od prognoz naiwnych, po specjalistyczne architektury głębokich sieci neuronowych (deep learning). Dużo uwagi poświęcimy pakietowi Prophet, który umożliwia tworzenie praktycznych modeli uwzględniających zdarzenia specjalne, zmiany trendu i wiele innych czynników. Wszystkie narzędzia zostaną omówione z naciskiem na ich praktyczne stosowanie, zrozumienie ich zalet i ograniczeń, na przykładach z wykorzystaniem rzeczywistych danych z różnych dziedzin.

Dowiedz się więcej

Analizy wielowymiarowe w R

Podczas kursu zaprezentowane zostaną najpopularniejsze metody wielowymiarowe, które znajdują zastosowanie w analizie zjawisk złożonych, opisanych za pomocą dużej liczby zmiennych. Uczestnicy poznają bardziej zaawansowane techniki związane z analizą skupień oraz redukcją wymiaru.

Dowiedz się więcej

Wykrywanie anomalii w procesach z wykorzystaniem uczenia maszyn (machine learning)

Wykrywanie anomalii w danych opisujących procesy ma wiele praktycznych zastosowań: anomalia może sygnalizować zaistniałą lub zbliżającą się awarię urządzeń, zmianę w przebiegu procesu, problem z systemem pomiarowym, atak cybernetyczny, próbę nadużycia. Na szkoleniu zajmiemy się metodami uczenia maszynowego w środowisku Python, umożliwiającymi wykrywanie anomalii, zarówno wtedy gdy dysponujemy danymi oznakowanymi jako anomalia, jak i wtedy gdy mamy wyłącznie dane o przebiegu „dobrych” procesów.

Dowiedz się więcej