GGPlot2 – jak zrobić wykres

W poprzednich postach dowiedzieliśmy się jak manipulować danymi. Dzisiaj zapoznamy się z biblioteką ggplot2 do prezentacji danych na wykresach. Zainicjujmy bibliotekę:

Wykresy punktowe

Przygotujmy dane do pierwszej wizualizacji. Będzie to lista współrzędnych poszukiwań na polu o kształcie kwadratu, gdzie znaleźliśmy 1000 obiektów:

Korzystając z biblioteki ggplot wyświetlimy ich współrzędne na wykresie puktowym z użyciem geom_point:

W kilku miejscach znaleźliśmy kilka obiektów, więc mają te same współrzędne. Do prezentacji dublujących się danych lepiej jest użyć geom_jitter, który nieznacznie zmienia wartości pozwalająć na „rozstrzelenie” punktów:

Wykres jest bardziej czytelny. Do prezentacji nakładających się danych wykorzystać można jeszcze inne narzędza ggplot, ale ich poszukiwania pozostawiamy Wam.

Do wyświetlenia histogramów służy funkcja geom_histogram, dla której możemy określić szerokość zakresu (binwidth). Zobaczmy, gdzie w kierunku na północ było najwięcej obiektów:

Wykresy słupkowe

Innym typem często używanych wykresów są wykresy słupkowe. Przygotujmy dane zawierające imiona i dystans jakie poszczególne osoby przebiegły w ciągu czterech tygodni:

Dystanse z pojedynczego tydzienia wyświetlamy na wykresie korzystając z geom_bar:

Za pomocą atrybutów color i fill możemy zmienić wygląd słupków:

Xlab, ylab zmieni opisy osi, a ggtitle doda nazwę do wykresu:

Wygląd wykresu szybko zmienimy korzystając z domyślnych szablonów, np. theme_grey, theme_light:

Na wykresach słupkowych możemy grupować dane np. po imieniu. Najpierw jednak musimy je przeformatować korzystając z narzędzia gather z biblioteki tidyr:

Tak przygotowane dane możemy wyświetlić na wykresie słupkowym:

Powyżej na wykresie dystanse z tygodni przyrastają, ale zmieniając atrybut postition na „dodge” – słupki dla poszczególnych tygodni będą prezentowane obok siebie:

Opisy osi i nazwę wykresu dodajemy lub zmieniamy używając labs:

Położenie legendy zmienimy theme:

Box plots

Na koniec zrobimy jeszcze box ploty na nowych danych. Wygenerujmy dystanse przebiegnięte przez 8 osób w 30 dniach:

I wyświetlmy je na boxplocie:

Zapis wykresów do pliku

Do zapisu naszych wykresów do zewnętrznego pliku („eps”, „ps”, „tex”, „pdf”, „jpeg”, „tiff”, „png”, „bmp”, „svg” „wmf”) używamy ggsave:

Domyślnie funkcja zapisuje ostatni wyświetlony wykres. Zapis konkretnego wykresu odbywa się poprzez przypisanie go do zmiennej i wstawienie jej do funkcji ggsave:

Biblioteka ggplot ma wiele funkcji i opisujących je atrybutów. Wszystkie te narzędzia pozwalają tworzyć zaawasowane wykresy. Poszukiwanie bardziej złożonych rozwiązań pozostawiamy Wam. Podstawy już macie.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

Translate using Google Translate»
Social media & sharing icons powered by UltimatelySocial

Podoba Ci się nasza strona? Odwiedź nasz profil