Apache Cassandra

Cele

Uczestnicy szkolenia zdobędą ogólną wiedzę na temat baz danych NoSQL, ich funkcji, zastosowań i ograniczeń. Szkolenie koncentruje się na bazie danych Apache Cassandra.

Uczestnicy szkolenia:

  • zapoznają się z teoretycznym zapleczem rozproszonego systemu baz danych i jego implementacją w bazie danych Cassandra;
  • dowiedzą się, jakie dane są przechowywane i w jaki sposób zapewniony jest fizyczny dostęp do danych.
  • zapoznają się z mechanizmami zapewniającymi wysoką dostępność i wydajność oraz związanymi z tym kompromisami,
  • oraz z modelowaniem danych i budową skalowalnych aplikacji opartych na Cassandrze.

Informacje

Kurs przeznaczony jest na 3 dni wykładów i warsztatów, z naciskiem na warsztaty. Podczas warsztatów, oprócz prostych ćwiczeń, uczestnicy będą wdrażać pełną aplikację bazową Cassandra.

Plan

  1. Wprowadzenie do baz danych NoSQL
  • Wprowadzenie do baz danych NoSQL
  • Twierdzenie dotyczące WPR
  • Podstawowe parametry baz danych NoSQL
  • NoSQL vs. RDBMS
  • Aplikacje Cassandra i przypadki biznesowe
  1.  Modelowanie danych
  • Klastry, bazy danych, tabele, wiersze, kolumny
  • Natywny model danych
  • Model danych CQL
  • Partycjonowanie i klucze grupowania
  • Mapowanie CQL do natywnego modelu danych
  • rodzane danych
  • Polecenia CQL
  • Budowanie modeli danych za pomocą poleceń CQL: transakcje rozproszone, wykresy baz danych, pozyskiwanie zdarzeń
  • Najlepsze praktyki
  1. Architektura
  • Podstawowe elementy: węzeł, centrum danych, klaster, rejestr commit log, sstable
  • Dystrybucja i replikacja danych
  • Partycjonowanie
  • Integralność danych
  • Transakcje Lightweight
  • Odczyt, zapis, usuwanie
  1. Administracja
  • Skrzynka narzędziowa: nodetool, cqlsh, ccm, OpsCenter
  • Dodaj/usuń/wymień węzeł
  • Bilansowanie klastra
  • Konfiguracja
  • Replikacja konfiguracji
  • Konserwacja
  1. Optymalizacja
  • Modelowanie danych i wydajność
  • Analiza opóźnień
  • Optymalizacja I/O
  • JVM i pamięć
  • Kompaktowanie

Poznaj instruktorów

Maciej

CEO Semantive, manager, software engineer, instruktor. Posiada wieloletnie doświadczenie w realizacji dużych projektów z zakresu danych i Data Science. Multidyscyplinarny umysł, który uwielbia poznawać świat wokół niego. Posiada tytuł magistra informatyki i zarządzania telekomunikacją Politechniki Warszawskiej. Szczęśliwy ojciec dwójki dzieci. Wolny czas lubi spędzać na rowerze szosowym lub z książką, z której może się dowiedzieć czegoś nowego o historii lub kognitywistyce.

Amadeusz

Architekt oprogramowania zajmujący się przetwarzaniem big data oraz uczeniem maszynowym. Ma doświadczenie w projektowaniu, opracowywaniu i wdrażaniu różnorodnych rozwiązań: począwszy od uczenia maszynowego dla danych strumieniowych po  isolated software sandbox. Amadeusz prowadzi szkolenia z Apache Cassandra i Apache Spark, jest inżynierem informatyki oraz posiada certyfikat Apache Spark Developer.

Apache Cassandra

Zapisz się