• SQL dla analityków danych. Tworzenie zbiorów danych dla początkujących

Język SQL zwykle służy do pracy z bazami danych. Poprawnie napisany kod SQL przetwarza z dużą szybkością potężne zbiory danych, dlatego stanowi wymarzone narzędzie dla analityków danych. Tymczasem wielu z nich zleca wykonywanie raportów z baz czy hurtowni danych innym osobom. Taki sposób pracy jest nieefektywny - o wiele lepszym rozwiązaniem jest opanowanie języka SQL i samodzielne projektowanie oraz wyodrębnianie potrzebnych zbiorów danych.

Podtytuł SQL dla analityków danych. Tworzenie zbiorów danych dla początkujących
Tytuł oryginalny SQL for Data Scientists: A Beginner's Guide for Building Datasets for Analysis
Autor Renée M. P. Teate
Rok wydania 2023
Oprawa Miękka
Format 165x235
Stron 248
Wydawnictwo Helion
69.00 44.85
Do końca promocji pozostało:
Najniższa cena z 30 dni przed promocją:
46.92
szt. Do przechowalni
Wysyłka w ciągu 24 godziny
ISBN 978-83-283-9744-6

Język SQL zwykle służy do pracy z bazami danych. Poprawnie napisany kod SQL przetwarza z dużą szybkością potężne zbiory danych, dlatego stanowi wymarzone narzędzie dla analityków danych. Tymczasem wielu z nich zleca wykonywanie raportów z baz czy hurtowni danych innym osobom. Taki sposób pracy jest nieefektywny - o wiele lepszym rozwiązaniem jest opanowanie języka SQL i samodzielne projektowanie oraz wyodrębnianie potrzebnych zbiorów danych.
Ten przystępny przewodnik jest przeznaczony dla analityków danych, którzy chcą dobrze poznać proces tworzenia analitycznego zbioru danych i samodzielnie pisać kod niezbędny do uzyskania zamierzonego wyniku. Przedstawiono w nim składnię języka SQL oraz zasady budowania szybko działających zapytań do dużych zbiorów danych. Dokładnie wyjaśniono reguły stosowania poszczególnych instrukcji SQL, korzystania z funkcji agregujących i okienkowych, a także techniki eksploracyjnej analizy danych oraz tworzenia zbiorów danych na potrzeby raportów analitycznych. Omówiono również trudniejsze zagadnienia, takie jak zaawansowane zapytania SQL czy tworzenie zbiorów danych na potrzeby uczenia maszynowego. W książce znalazły się też fachowe porady na temat wnioskowania na podstawie danych i liczne ćwiczenia ułatwiające naukę.

Najciekawsze zagadnienia:
• składnia SQL i projektowanie efektywnych zapytań
• eksploracyjna analiza danych
• tworzenie zbiorów danych z istniejących baz danych
• projektowanie zbiorów danych na potrzeby uczenia maszynowego
• zaawansowane elementy języka SQL
• tworzenie tabel i widoków do przechowywania wyników zapytań

SQL: tak przygotujesz swój zbiór danych do analizy!

O autorce
O korektorze merytorycznym
Podziękowania
Wprowadzenie

Rozdział 1. Źródła danych
Źródła danych
Narzędzia do łączenia się ze źródłami danych i edycji zapytań SQL
Relacyjne bazy danych
Hurtownie danych
Pytania dotyczące źródła danych
Wprowadzenie do bazy danych Farmer's Market
Uwaga dotycząca terminologii stosowanej w uczeniu maszynowym
Ćwiczenia

Rozdział 2. Instrukcja SELECT
Instrukcja SELECT
Podstawowa składnia zapytania SELECT
Wybieranie kolumn i ograniczanie liczby zwracanych wierszy
Sortowanie wyników za pomocą klauzuli ORDER BY
Wprowadzenie do prostych obliczeń inline
Więcej przykładów obliczeń typu inline - zaokrąglanie
Więcej przykładów obliczeń inline - konkatenacja łańcuchów znaków
Ocena wyniku zapytania
Podsumowanie instrukcji SELECT
Ćwiczenia

Rozdział 3. Klauzula WHERE
Klauzula WHERE
Filtrowanie wyników z zapytania SELECT
Filtrowanie według wielu warunków
Wielokolumnowe filtrowanie warunkowe
Więcej sposobów filtrowania
BETWEEN
IN
LIKE
IS NULL
Ostrzeżenie na temat porównań z wartościami NULL
Filtrowanie za pomocą podzapytań
Ćwiczenia

Rozdział 4. Instrukcja CASE
Składnia instrukcji CASE
Tworzenie flag binarnych za pomocą CASE
Grupowanie wartości ciągłych za pomocą CASE
Kodowanie wartości kategorialnych za pomocą CASE
Podsumowanie instrukcji CASE
Ćwiczenia

Rozdział 5. Złączenia w SQL-u
Relacje w bazie danych i złączenia
Pułapka często pojawiająca się podczas filtrowania połączonych danych
Złączenie więcej niż dwóch tabel
Ćwiczenia

Rozdział 6. Agregacja wyników na potrzeby analizy
Składnia GROUP BY
Statystyki podsumowujące grupy
Obliczenia wewnątrz funkcji agregujących
Minimum i maksimum
COUNT i COUNT DISTINCT
Średnia
Filtrowanie za pomocą HAVING
Instrukcje CASE wewnątrz funkcji agregujących
Ćwiczenia

Rozdział 7. Funkcje okienkowe i podzapytania
ROW_NUMBER
RANK i DENSE_RANK
NTILE
Agregujące funkcje okienkowe
LAG i LEAD
Ćwiczenia

Rozdział 8. Funkcje związane z datą i czasem
Ustawianie wartości w polu typu datetime
EXTRACT i DATE_PART
DATE_ADD i DATE_SUB
DATEDIFF
TIMESTAMPDIFF
Funkcje do obsługi dat w obliczeniach na zagregowanych danych i funkcjach okienkowych
Ćwiczenia

Rozdział 9. Eksploracyjna analiza danych w języku SQL
Eksploracyjna analiza danych z użyciem języka SQL
Eksploracja tabeli product
Eksploracja potencjalnych wartości w kolumnach
Badanie zmian w czasie
Eksploracja wielu tabel naraz
Stan a sprzedaż
Ćwiczenia

Rozdział 10. Tworzenie zbiorów danych na potrzeby raportów analitycznych
Wymagania stawiane zbiorom danych do analizy
Korzystanie z własnych analitycznych zbiorów danych - wspólne wyrażenia tablicowe i widoki
Wykorzystanie SQL-a do tworzenia bardziej zaawansowanych raportów
Ćwiczenia

Rozdział 11. Bardziej zaawansowane zapytania
Operator UNION
Samozłączenie w celu określenia, czy dana wartość ustanowiła rekord
Nowi i powracający klienci według tygodni
Podsumowanie
Ćwiczenia

Rozdział 12. Tworzenie zbiorów danych na potrzeby uczenia maszynowego
Zbiory danych dla modeli szeregów czasowych
Zbiory danych do klasyfikacji binarnej
Tworzenie zbioru danych
Poszerzanie zbioru cech
Inżynieria cech
Kolejne kroki
Ćwiczenia

Rozdział 13. Przykłady tworzenia analitycznych zbiorów danych
Jakie czynniki wpływają na sprzedaż świeżych produktów?
Jak zmienia się sprzedaż w zależności od kodu pocztowego klienta, odległości od targowiska oraz danych demograficznych?
Jak rozkład cen produktów wpływa na sprzedaż?

Rozdział 14. Przechowywanie i modyfikowanie danych
Przechowywanie zbiorów danych w postaci tabel i widoków
Dodawanie kolumny ze znacznikiem czasu
Dodawanie wierszy i aktualizowanie wartości w tabelach
Korzystanie z SQL-a wewnątrz skryptów
Na zakończenie
Ćwiczenia

Dodatek A. Odpowiedzi

Renée M.P. Teate od 2004 r. zajmuje się pracą na danych. Angażowała się w projektowanie relacyjnych baz danych, raportowanie i analizę oraz naukę o danych. Teate regularnie zabiera głos na konferencjach i publikuje w czasopismach branżowych. Jest również twórczynią podcastu Becoming a Data Scientist. Jej zdaniem znajomość SQL jest niezwykle potrzebna analitykom danych.

Nie ma jeszcze komentarzy ani ocen dla tego produktu.

Polub nas na Facebooku