Building Data Analytics Solutions Using Amazon Redshift
- Code training GK7379
- Duur 1 dag
Andere trainingsmethoden
Methode
Deze training is in de volgende formats beschikbaar:
-
Klassikale training
Klassikaal leren
-
Op locatie klant
Op locatie klant
-
Virtueel leren
Virtueel leren
Vraag deze training aan in een andere lesvorm.
Trainingsbeschrijving
Naar bovenData
Naar bovenDoelgroep
Naar bovenDeze cursus is bedoeld voor datawarehouse-engineers, dataplatform-engineers en architecten en operators die data-analysepijplijnen bouwen en beheren.
Trainingsdoelstellingen
Naar bovenIn deze cursus leer je:
- Vergelijk de functies en voordelen van datawarehouses, data lakes en moderne data-architecturen
- Ontwerp en implementeer een datawarehouse-analyseoplossing
- Identificeer en pas de juiste technieken, waaronder compressie, toe om de gegevensopslag te optimaliseren
- Selecteer en implementeer de juiste opties om gegevens op te nemen, te transformeren en op te slaan
- Kies de juiste instantie- en knooppunttypen, clusters, automatisch schalen en netwerktopologie voor een bepaald zakelijk gebruiksscenario
- Begrijp hoe gegevensopslag en -verwerking van invloed zijn op de analyse- en visualisatiemechanismen die nodig zijn om bruikbare zakelijke inzichten te verkrijgen
- Gegevens beveiligen in rust en tijdens overdracht
- Bewaak analyseworkloads om problemen te identificeren en op te lossen
- Best practices voor kostenbeheer toepassen
Inhoud training
Naar bovenModule A: Overzicht van data-analyse en de datapijplijn
- Gebruiksscenario's voor gegevensanalyse
- De gegevenspijplijn gebruiken voor analyses
Module 1: Amazon Redshift gebruiken in de Data Analytics-pijplijn
- Waarom Amazon Redshift voor datawarehousing?
- Overzicht van Amazon Redshift
Module 2: Inleiding tot Amazon Redshift
- Amazon Redshift-architectuur
- Interactieve demo 1: Rondleiding door de Amazon Redshift-console
- Amazon Redshift-functies
- Praktijklab 1: Gegevens laden en opvragen in een Amazon Redshift-cluster
Module 3: Opname en opslag
- Inname
- Interactieve demo 2: Uw Amazon Redshift-cluster verbinden met behulp van een Jupyter-notebook met Data API
- Distributie en opslag van gegevens
- Interactieve demo 3: Semi-gestructureerde gegevens analyseren met behulp van het gegevenstype SUPER
- Gegevens opvragen in Amazon Redshift
- Praktijklab 2: Data-analyse met behulp van Amazon Redshift Spectrum
Module 4: Verwerken en optimaliseren van data
- Transformatie van gegevens
- Geavanceerd opvragen
- Praktijklab 3: Gegevenstransformatie en query's in Amazon Redshift
- Beheer van middelen
- Interactieve demo 4: Gemengd werklastbeheer toepassen op Amazon Redshift
- Automatisering en optimalisatie
- Interactieve demo 5: Amazon Redshift-cluster waarvan de grootte wordt gewijzigd van het dc2.large- naar ra3.xlplus-cluster
Module 5: Beveiliging en monitoring van Amazon Redshift Clusters
- Het Amazon Redshift-cluster beveiligen
- Amazon Redshift-clusters bewaken en problemen oplossen
Module 6: Oplossingen voor datawarehouse-analyse ontwerpen
- Beoordeling van gebruiksscenario's voor datawarehouses
- Activiteit: Een workflow voor datawarehouse-analyse ontwerpen
Module B: Moderne data-architecturen ontwikkelen op AWS
- Moderne data-architecturen
Voorkennis
Naar bovenStudenten met minimaal een jaar ervaring in het beheren van datawarehouses zullen baat hebben bij deze cursus.
We raden deelnemers aan deze cursus aan om:
- AWS Technical Essentials of Architecting op AWS voltooid
- Voltooide Building Data Lakes op AWS