Sunday, July 05, 2020

Kurs Hurtownie danych prowadzony jest w formie laboratoriów komputerowych.

  1. W ramach zajęć studenci przygotowują rozwiązania list zadań oraz opracowują indywidualny projekt hurtowni danych.
  2. Sprawozdanie zawierające rozwiązane zadania należy przesłać do prowadzącego przed zajęciami, na których będzie przedstawiane.
  3. Obecność na zajęciach jest obowiązkowa.
  4. Nieobecność nie zwalnia z obowiązku przesłania sprawozdania.
    Na ocenę z przedmiotu składają się:
  1. Oceny ze sprawozdań:
    • Listy 1-6 oceniane w skali w skali 0-1
    • Kolejne listy, stanowiące elementy przygotowania projektu, oceniane w skali 0-5
  2. Ocena z projektu w skali uniwersyteckiej.

Uaktualnienie

Na prośbe Pana Mateusza B. wyrażam zgodę na wybranie przez każdego studenta jednej listy (nr 1-6), która nie zostanie zrealizowana i oceniona.

Listy

  1. Hurtownie danych - lista 1.pdf - termin 8.03.2020
  2. Hurtownie danych - lista 2.pdf - termin 15.03.2020
  3. Hurtownie danych - lista 3.pdf - termin 22.03.2020

  4. Hurtownie danych - lista 4.pdf - termin 05.04.2020
  5. Hurtownie danych - lista 5.pdf - termin 19.04.2020
  6. Hurtownie danych - lista 6.pdf - termin 26.04.2020

(Hurtownie danych - sprawozdanie.pdf)

Proszę pamiętać o prawidłowym nazywaniu przesyłanych plików.

Najlepiej, aby nazwa zbudowana była na przykład w taki sposób:

{nazwisko}_{dzien}_{godzina}_{lista}_{wersja}.pdf

gdzie:

  • {nazwisko} - identyfikator jednostki odziedziczony w procesie rejestracji urzędowej po rodzicu,
  • {dzien} - jedno lub dwuliterowe oznaczenie dnia tygodnia ze zbioru P, W, S, C, Pt, Sb, N
  • {godzina} - dwucyfrowe oznaczenie godziny
  • {sprawozdanie} - identyfikator listy lub sprawozdania
  • {wersja} - numer kolejny wersji opracowania

np. Wojtkiewicz_N_20_lista1_wersja1.pdf

Przesyłanie rozwiązań

Zajęcia online

ZOOM meeting

Zajęcia zdalne odbywają się w:

  • poniedziałki: 11:15-12:15
  • wtorki: 17:05-18:05

W pozostałe dni (zajęcia) jestem dostępny i udzielam konsultacji poprzez chat zoom'a oraz email.

Projekt

Wymagania projektowe

Podstawowym wymogiem projektowym jest wyznaczenie 2 heterogenicznych źródeł danych

Zgłoszenie tematu projektu

Zgłoszone tematy

Daty:

  • I część - termin 10.05.2020
  • II część - termin 17.05.2020
  • III cześć - termin 24.05.2020
  • prezentacje - Rezerwacja terminu prezentacji (dokumentację należy przesłać przed prezentacją)

Terminy prezentacji projektów

Oceny

Wstępne oceny

Oprogramowanie wykorzystywane podczas zajęć

  • MS SQL Server 2016 Enterprise:
    • Integration Services, Analysis Services, Reporting Services, Data Quality Services
    • SQL Server Data Tools (Integration, Analysis oraz Reporting)
    • Data Quality Client, Master Data Services
  • MS SQL Server Management Studio
  • Visual Studio
  • Power BI Desktop
  • Bazy danych: AdventureWorks OLTP, AdventureWorksDW

Literatura podstawowa

@book{doi:10.2200/S00299ED1V01Y201009DTM009, author = {Jensen, Christian S. and Pedersen, Torben Bach and Thomsen, Christian}, title = {Multidimensional Databases and Data Warehousing}, series = {Synthesis Lectures on Data Management}, volume = {2}, number = {1}, pages = {1-111}, year = {2010}, doi = {10.2200/S00299ED1V01Y201009DTM009}, URL = {https://doi.org/10.2200/S00299ED1V01Y201009DTM009}, eprint = {https://doi.org/10.2200/S00299ED1V01Y201009DTM009} }

@book{book, author = {Rainardi, V}, year = {2008}, month = {01}, pages = {1-523}, title = {Building a data warehouse: With examples in SQL server}, doi = {10.1007/978-1-4302-0528-9} } @book{harinath2012professional, title={Professional Microsoft SQL Server 2012 Analysis Services with MDX and DAX}, author={Harinath, S. and Pihlgren, R. and Lee, D.G.Y. and Sirmon, J. and Bruckner, R.M.}, isbn={9781118237083}, lccn={2012933620}, series={ITPro collection}, url={https://books.google.pl/books?id=_YUkhcSCrtcC}, year={2012}, publisher={Wiley} } @Book{193909, author = "Russo, Marco and Ferrari, Alberto", editor = "", title = "Microsoft SQL Server 2016 Analysis Services: Modelowanie tabelaryczne", publisher = "Promise", year = 2018, address = "Warszawa", url="http://libra.acceptance.ibuk.pl/book/193909" } @book{Inmon:2002:BDW:560407, author = {Inmon, W. H.}, title = {Building the Data Warehouse,3rd Edition}, year = {2002}, isbn = {0471081302}, edition = {3rd}, publisher = {John Wiley \& Sons, Inc.}, address = {New York, NY, USA}, url="https://dl.acm.org/citation.cfm?id=560407" } @book{Kimball:2004:DWE:1201627, author = {Kimball, Ralph and Caserta, Joe}, title = {The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming and Delivering Data}, year = {2004}, isbn = {0764567578}, publisher = {John Wiley \& Sons, Inc.}, address = {USA}, url="https://dl.acm.org/citation.cfm?id=1201627" }

Literatura uzupełniająca

@book{Aspin:2012:SSD:2480926, author = {Aspin, Adam}, title = {SQL Server 2012 Data Integration Recipes: Solutions for Integration Services and Other ETL Tools}, year = {2012}, isbn = {1430247916, 9781430247913}, edition = {1st}, publisher = {Apress}, address = {Berkely, CA, USA}, } @book{Leonard:2014:SSI:2728723, author = {Leonard, Andy and Masson, Matt and Mitchell, Tim and Moss, Jessica and Ufford, Michelle}, title = {SQL Server Integration Services Design Patterns}, year = {2014}, isbn = {1484200837, 9781484200834}, edition = {2nd}, publisher = {Apress}, address = {Berkely, CA, USA}, } @book{imhoff2003mastering, title={Mastering data warehouse design: relational and dimensional techniques}, author={Imhoff, C. and Galemmo, N. and Geiger, J.G.}, isbn={9780471324218}, lccn={2003010879}, series={Timely, practical, reliable}, url={https://books.google.pl/books?id=ut5QAAAAMAAJ}, year={2003}, publisher={Wiley Pub.} } @book{maclennan2011data, title={Data Mining with Microsoft SQL Server 2008}, author={MacLennan, J. and Tang, Z.H. and Crivat, B.}, isbn={9781118080009}, url={https://books.google.pl/books?id=_EmNz6z66vIC}, year={2011}, publisher={Wiley} }

Do końca semestru pozostało