WEBVTT

00:00:00.000 --> 00:00:02.745
>> Velké datové clustery poskytují

00:00:02.745 --> 00:00:05.640
způsob, jak udržet cluster
spolehlivé, povolením

00:00:05.640 --> 00:00:08.460
vysoká dostupnost pro kritické
složky a Mihaela je

00:00:08.460 --> 00:00:12.120
aby nám řekl všechno o
dnes na údajích vystavených.

00:00:12.120 --> 00:00:23.400
HUDBY

00:00:23.400 --> 00:00:26.475
>> Ahoj, Vítejte na jiném
epizodu exponovaných dat.

00:00:26.475 --> 00:00:30.480
Jsem váš hostitel Jeroen a dnes
Máme s sebou Mihaelu, abychom si promluvili

00:00:30.480 --> 00:00:32.265
o velkých datových clusterech a potom

00:00:32.265 --> 00:00:34.970
konkrétně vysoké
dostupnosti.

00:00:34.970 --> 00:00:37.655
Tak Vítej zpátky. To musí
je čas, který si myslím.

00:00:37.655 --> 00:00:39.560
>> Ano. Děkuju. Děkuji vám
tě, abys mě tu měl.

00:00:39.560 --> 00:00:40.985
>> Ano. Stáváš se sondou.

00:00:40.985 --> 00:00:43.550
Takže většina témat, o kterých mluvíte

00:00:43.550 --> 00:00:46.445
o je velké datové clustery
a dnes se neliší.

00:00:46.445 --> 00:00:48.345
Ale potom vysoká dostupnost, že?

00:00:48.345 --> 00:00:50.780
>> Ano. Takže jsou
spoustu věcí na

00:00:50.780 --> 00:00:53.360
mluvit o tom, kdy přijde
k vysoké dostupnosti.

00:00:53.360 --> 00:00:54.155
>> Dobře.

00:00:54.155 --> 00:00:57.590
>> Projdeme si nějaké
z těchto aspektů v tomto videu.

00:00:57.590 --> 00:00:59.785
>> Dobře. Cool. Teď začneme.

00:00:59.785 --> 00:01:05.745
>> Takže když mluvíme o datech
zejména databáze,

00:01:05.745 --> 00:01:07.800
Chceme zajistit, aby
data trvalost.

00:01:07.800 --> 00:01:09.110
Takže chci jen začít s

00:01:09.110 --> 00:01:13.430
Tato vysoká dostupnost řeči
s recapu úložiště.

00:01:13.430 --> 00:01:13.650
>> Dobře.

00:01:13.650 --> 00:01:14.850
>> Takže různé vrstvy v

00:01:14.850 --> 00:01:17.840
velký datový cluster má
různé možnosti ukládání.

00:01:17.840 --> 00:01:20.180
Buď můžete provést místní úložiště, nebo

00:01:20.180 --> 00:01:23.150
dálkové ovládání a bylo to zrnité jako

00:01:23.150 --> 00:01:25.970
Můžete se rozhodnout pro místní nebo vzdálené

00:01:25.970 --> 00:01:28.895
v závislosti na tom, zda chcete
ukládání dat nebo protokolů.

00:01:28.895 --> 00:01:33.680
Takže záznamy, které nechcete
nutně, aby byla nadbytečná

00:01:33.680 --> 00:01:36.865
protože ho budete potřebovat pro

00:01:36.865 --> 00:01:40.930
Poradce při potížích, ale potom
Nechci je navždy udržet.

00:01:41.090 --> 00:01:42.190
>> [neslyšitelný].

00:01:42.190 --> 00:01:44.840
>> Přesně. Takže, když
mluvíme o protokolech je

00:01:44.840 --> 00:01:48.140
většinou chcete zachovat
je v místním úložišti

00:01:48.140 --> 00:01:52.355
zvláště proto, že jsme mluvili
v posledním videu, které jsme

00:01:52.355 --> 00:01:54.590
součástí clusterů, které jsou

00:01:54.590 --> 00:01:57.410
sběr těchto protokolů a
jejich spuštění v elastickém vyhledávání.

00:01:57.410 --> 00:02:01.615
Takže už máte
závislost na tomto aspektu.

00:02:01.615 --> 00:02:04.410
Pokud jde o data,
různé součásti

00:02:04.410 --> 00:02:08.270
mají rozdílné požadavky
podle toho, jak

00:02:08.270 --> 00:02:10.730
důležitá je mise, a pokud je

00:02:10.730 --> 00:02:15.140
všechna uživatelská data uložená
v aplikaci pro data, například

00:02:15.140 --> 00:02:20.030
Hlavní server nebo úložiště serveru SQL
fond jako data HDFS.

00:02:20.030 --> 00:02:22.955
Chcete zachovat
redundanci.

00:02:22.955 --> 00:02:28.445
Ale výpočetní bazén nebo jiskra,

00:02:28.445 --> 00:02:30.695
není žádný stát.

00:02:30.695 --> 00:02:33.380
Je to jen computes.
Takže nemá smysl

00:02:33.380 --> 00:02:36.560
Chcete-li přidat další
redundanci úložiště.

00:02:36.560 --> 00:02:38.225
>> Přesně. Takže si můžete vybrat místní.

00:02:38.225 --> 00:02:39.470
>> Takže si povídáme o

00:02:39.470 --> 00:02:42.260
různé možnosti, které
musíte zajistit

00:02:42.260 --> 00:02:44.810
spolehlivost těchto služeb

00:02:44.810 --> 00:02:46.400
Pokud jde o Trvalost dat.

00:02:46.400 --> 00:02:47.620
>> Dobře.

00:02:47.620 --> 00:02:51.575
>> Tam budeme pokračovat
s volbami HA, správně?

00:02:51.575 --> 00:02:55.985
V případě hlavního serveru SQL Server, pokud
text v datech místně,

00:02:55.985 --> 00:02:57.725
musíte zajistit, že přidáváte

00:02:57.725 --> 00:02:59.675
dodatečná záloha na tuto

00:02:59.675 --> 00:03:01.340
se skupinami dostupnosti
a budeme

00:03:01.340 --> 00:03:04.160
v brzké době vidět, jak je to povoleno.

00:03:04.160 --> 00:03:05.990
Pokud jde o fond dat,

00:03:05.990 --> 00:03:13.970
používáte PVs v kombinátorech k
Zkontrolujte, zda jsou data trvalá.

00:03:13.970 --> 00:03:15.350
>> Takže je to jen PVs, že?

00:03:15.350 --> 00:03:16.505
Je tu spousta zkratek.

00:03:16.505 --> 00:03:17.240
>> Ano.

00:03:17.240 --> 00:03:21.110
>> EG PV, HA, vše co je PV?

00:03:21.110 --> 00:03:25.175
>> Navrhuje PVs
koncepce Kubernetes

00:03:25.175 --> 00:03:28.250
která abstruje vrstvu úložiště

00:03:28.250 --> 00:03:32.090
Kubernetes a zajistíte, že budete
použití trvalých svazků.

00:03:32.090 --> 00:03:35.270
Představa je tedy přetrvávání dat.

00:03:35.270 --> 00:03:37.010
Pokud tedy používáte
trvalý svazek je

00:03:37.010 --> 00:03:38.840
znamená, že Kubernetes zajišťuje, že

00:03:38.840 --> 00:03:42.440
data uložena na tomto úložišti.

00:03:42.440 --> 00:03:43.580
>> Dobře. Jasně.

00:03:43.580 --> 00:03:46.655
>>, To není nutné zajistit

00:03:46.655 --> 00:03:49.435
vysoká dostupnost pro výpočet
protože je bez státní příslušnosti.

00:03:49.435 --> 00:03:52.110
Má kritické komponenty

00:03:52.110 --> 00:03:53.870
v zásobníku Hadoop
správně, když jde o

00:03:53.870 --> 00:03:56.600
HDFS NameNode a některé z jisker sdílených

00:03:56.600 --> 00:04:00.545
služby, které potřebujete
umožnit vysokou dostupnost,

00:04:00.545 --> 00:04:03.020
a velmi důležité
Chcete zde zvýraznit

00:04:03.020 --> 00:04:09.000
Řídicí službu, kterou je nutné
mít nejen trvalý svazek,

00:04:09.000 --> 00:04:11.490
potřebujete přidat
redundanci tohoto příběhu.

00:04:11.490 --> 00:04:14.135
Takže to musí být nějaký
vzdálené redundantní úložiště.

00:04:14.135 --> 00:04:16.940
Neuchovávejte ovládací prvek [neslyšitelný]

00:04:16.940 --> 00:04:21.410
místně, protože pokud
uzel je zde poslední,

00:04:21.410 --> 00:04:23.960
skoro celý cluster je
.

00:04:23.960 --> 00:04:28.130
>> Dobře. Takže ovládací prvek má
PVs ve vzdáleném úložišti?

00:04:28.130 --> 00:04:29.270
>> Vzdálený a redundantní.

00:04:29.270 --> 00:04:31.100
Takže musíte udělat
jisti, že přidávají

00:04:31.100 --> 00:04:33.005
určitou redundanci této vrstvy.

00:04:33.005 --> 00:04:34.710
>> Dobře. Poznamenal.

00:04:34.710 --> 00:04:37.290
>> Takže teď se podíváme
Co to znamená pro

00:04:37.290 --> 00:04:41.085
Hlavní server SQL a
povolení AG.

00:04:41.085 --> 00:04:45.095
Toto je tedy schéma nebo

00:04:45.095 --> 00:04:50.045
způsob rozložení různých služeb
které tvoří server SQL,

00:04:50.045 --> 00:04:55.190
vrstva s vysokou dostupností
Serveru SQL Server.

00:04:55.190 --> 00:04:57.020
Opět máme primární, který

00:04:57.020 --> 00:05:00.785
je nejméně dva sekundáři
synchronní,

00:05:00.785 --> 00:05:04.670
a vybudovali jsme součásti, které

00:05:04.670 --> 00:05:08.985
zajišťují, že
je automatické sledování,

00:05:08.985 --> 00:05:11.370
automatické převzetí služeb při selhání
a orchestrace.

00:05:11.370 --> 00:05:12.960
Pokud se něco stane s primárním,

00:05:12.960 --> 00:05:17.675
dojde k automatickému
není třeba nic dělat.

00:05:17.675 --> 00:05:20.330
Jednu věc, kterou chci
zde zvýraznit, je

00:05:20.330 --> 00:05:23.870
pro velký datový cluster
pouze v tomto okamžiku,

00:05:23.870 --> 00:05:27.755
také jsme povolili, čemu říkáme
Obsahovala skupinu dostupnosti,

00:05:27.755 --> 00:05:30.920
To znamená, že nyní objekty, které

00:05:30.920 --> 00:05:33.920
ukládáte v předloze jako například

00:05:33.920 --> 00:05:40.190
přihlášení jsou také replikována
na druhé, že?

00:05:40.190 --> 00:05:40.380
>> Dobře.

00:05:40.380 --> 00:05:43.880
>> Takže až do teď je to
společně nás posílají z

00:05:43.880 --> 00:05:45.770
našim zákazníkům, aby
jisti, že přihlášení

00:05:45.770 --> 00:05:47.930
jsou také replikovány jinak,

00:05:47.930 --> 00:05:49.610
Existuje mnoho obvinění a

00:05:49.610 --> 00:05:51.935
Ruční replikaci, kterou museli udělat.

00:05:51.935 --> 00:05:55.290
Přímo nyní automaticky
o všechno je postaráno.

00:05:55.290 --> 00:05:57.060
Od nasazení tedy od přidání

00:05:57.060 --> 00:05:59.130
databáze do skupin dostupnosti,

00:05:59.130 --> 00:06:05.330
přidání této předlohy replikované
skupin dostupnosti databáze.

00:06:05.330 --> 00:06:08.555
Je tedy málo, pokud nikdo

00:06:08.555 --> 00:06:13.130
mezi provozním řízením

00:06:13.130 --> 00:06:16.620
skupiny dostupnosti.
To je fakt úžasný.

00:06:16.620 --> 00:06:18.660
>> Ano. To je opravdu
Děs. Chtěl jsem ti to říct.

00:06:18.660 --> 00:06:21.230
Takže jste se zmínil o
skupiny dostupnosti, je to tak?

00:06:21.230 --> 00:06:21.390
>> Ano.

00:06:21.390 --> 00:06:24.330
>> To je normální?

00:06:24.330 --> 00:06:27.200
>> Ano. Je to přesně
stejnou funkci, kterou jsme

00:06:27.200 --> 00:06:30.050
Všichni vědí ze serveru SQL Server 2012, že?

00:06:30.050 --> 00:06:30.605
>> Ano.

00:06:30.605 --> 00:06:33.440
>> Jedna věc, která
je to velmi důležité.

00:06:33.440 --> 00:06:35.960
Neexistuje žádná jiná technologie clusteru.

00:06:35.960 --> 00:06:39.365
budeš muset
nasadit nebo integrovat s.

00:06:39.365 --> 00:06:41.445
O všechno je postaráno,

00:06:41.445 --> 00:06:44.590
služby, které nasazují
se dohlížitelem HA,

00:06:44.590 --> 00:06:45.730
Provozovatel a

00:06:45.730 --> 00:06:49.840
kurz úzce integrující s
V tomto případě se Kubernetes písemně ubrání.

00:06:49.840 --> 00:06:52.560
Takže využíváme
těchto platforem.

00:06:52.560 --> 00:06:54.100
>> Takže žádná další technologie clusterů.

00:06:54.100 --> 00:06:56.650
To je skvělé pro zvládnutí.

00:06:56.650 --> 00:07:00.510
Takže teď věřím pánovi
instance jsou v pořádku.

00:07:00.510 --> 00:07:02.250
Ale do záložního řadiče domény je víc, že?

00:07:02.250 --> 00:07:03.965
Neděláme pouze SQL Server,

00:07:03.965 --> 00:07:05.980
Děláme to [neslyšitelně]
příbuzné věci.

00:07:05.980 --> 00:07:07.510
Tak mi to řekni.

00:07:07.510 --> 00:07:10.230
>> Takže se podíváme, co jsme
pro Hadoop, pro hbp.

00:07:10.230 --> 00:07:13.690
HDFS NameNode musí být také v

00:07:13.690 --> 00:07:16.540
vysoce dostupná konfigurace
protože je to důležité

00:07:16.540 --> 00:07:20.035
pro Hadoop Stack,

00:07:20.035 --> 00:07:23.205
a to, co vidíme, že
zákazník nám říká, ' ' Oh,

00:07:23.205 --> 00:07:26.395
Chci replikaci pro NameNode ' ',

00:07:26.395 --> 00:07:28.640
by také nasazovali Zookeeper, který

00:07:28.640 --> 00:07:31.430
je technologie otevřeného zdrojového clusteru.

00:07:31.430 --> 00:07:35.750
To je součást, která bude
se postarat o koordinaci

00:07:35.750 --> 00:07:39.800
sledování a převzetí služeb při selhání, pokud

00:07:39.800 --> 00:07:44.970
potřebné NameNode
na sekundární úsporný režim.

00:07:44.970 --> 00:07:45.070
>> Dobře.

00:07:45.070 --> 00:07:47.330
>> Takže nasazení další repliky

00:07:47.330 --> 00:07:49.985
a Zookeeper se stará o
na orchestrační aspekt.

00:07:49.985 --> 00:07:50.675
>> Dobře.

00:07:50.675 --> 00:07:55.235
>> Současně
podílí se také na

00:07:55.235 --> 00:07:58.580
udržování vysoké dostupnosti pro

00:07:58.580 --> 00:08:03.679
Některé součásti pro sdílení jisker
jako správce zdrojů příze,

00:08:03.679 --> 00:08:07.520
a v tomto smyslu pro
Jiskra nasazujeme také

00:08:07.520 --> 00:08:12.200
více replik pro služby
jako historie jisker, historie práce.

00:08:12.200 --> 00:08:15.515
Aby se ujistil, že pokud se něco

00:08:15.515 --> 00:08:19.900
v aplikaci OneNote, které
Tyto služby jsou hostovány,

00:08:19.900 --> 00:08:23.495
[Neslyšitelný] by byl vyzvedl
nebo další repliky.

00:08:23.495 --> 00:08:24.790
>> Cool.

00:08:24.790 --> 00:08:28.490
>> Tak se podíváme, jak je snadné

00:08:28.490 --> 00:08:32.570
Konfigurace vysoké dostupnosti
pro různé komponenty.

00:08:32.570 --> 00:08:33.530
>> Řekni mi, že je to snadný.

00:08:33.530 --> 00:08:35.510
>> Je to super snadný.

00:08:35.510 --> 00:08:38.280
>> Cool. Mám rád klid.

00:08:38.470 --> 00:08:42.740
>> Mluvili jsme naposled o tom, jak
ke konfiguraci nasazení.

00:08:42.740 --> 00:08:43.820
>> Ano. To si pamatuju.

00:08:43.820 --> 00:08:47.270
>> Existuje cluster
konfigurační soubory

00:08:47.270 --> 00:08:49.675
nebo šablony nasazení
,

00:08:49.675 --> 00:08:52.280
a pamatuj, že jsme
hovořit o

00:08:52.280 --> 00:08:55.700
složky pro sdílení jisker.

00:08:55.700 --> 00:08:56.210
>> Ano.

00:08:56.210 --> 00:08:59.975
>> Jen říkám, že chci jen dvě
jejich repliky a tak.

00:08:59.975 --> 00:09:02.060
Postaráme se o
odtamtud.

00:09:02.060 --> 00:09:03.020
>> To je všechno?

00:09:03.020 --> 00:09:04.610
>> The Zookeeper. Takže,

00:09:04.610 --> 00:09:08.450
Musíme projít všemi
součástí, které jsme prošli.

00:09:08.450 --> 00:09:12.980
Zookeeper budeme potřebovat
tři repliky k zajištění kvora.

00:09:12.980 --> 00:09:16.145
Pak jsme také zmíníme mistra,

00:09:16.145 --> 00:09:19.465
Instance hlavního serveru SQL Server
a co tady dělám?

00:09:19.465 --> 00:09:22.755
Jen bych řekl, že jsem
Chcete tři repliky,

00:09:22.755 --> 00:09:26.930
a protože SQL Server
skupiny dostupnosti

00:09:26.930 --> 00:09:28.985
umožňuje také čtení druhotníků,

00:09:28.985 --> 00:09:31.640
vám poskytne možnost

00:09:31.640 --> 00:09:36.440
nasadit službu, která
slouží k vystavení koncového bodu.

00:09:36.440 --> 00:09:39.920
na službu vzdálené pracovní vytížení

00:09:39.920 --> 00:09:41.780
ze sekundárního
a musíš jen

00:09:41.780 --> 00:09:44.015
v tomto případě zadejte port.

00:09:44.015 --> 00:09:47.900
>> Správně. Takže ty děláš vysokou
dostupnost a v rámci této části

00:09:47.900 --> 00:09:49.980
Můžete také provést
jen pro čtení, [neslyšitelný]

00:09:49.980 --> 00:09:51.365
>> Přesně. Ano.

00:09:51.365 --> 00:09:54.290
>> Cool. Takhle jsi četla tohle
stejně jako jedna linka [neslyšitelná]?

00:09:54.290 --> 00:09:57.470
>> Ano. Stačí zadat
počet replik, které

00:09:57.470 --> 00:10:02.480
Neboj se o aranžování,

00:10:02.480 --> 00:10:05.900
nasazení dalších
součásti jako když řeknete

00:10:05.900 --> 00:10:09.545
nám, že chci tři repliky
pro předlohu serveru SQL Server,

00:10:09.545 --> 00:10:10.820
nasazujeme operátora,

00:10:10.820 --> 00:10:12.260
nasadili jsme dozorce, který je

00:10:12.260 --> 00:10:14.030
sledování
a všechno ostatní.

00:10:14.030 --> 00:10:17.180
Takže všechno je za
scény a

00:10:17.180 --> 00:10:21.380
je minimální orchestrace
pro jeho nastavení.

00:10:21.380 --> 00:10:23.840
Pro lidi, kteří jsou
velmi obeznámen s tím, jak

00:10:23.840 --> 00:10:27.905
ke konfiguraci dostupnosti
skupiny myslím, že je to

00:10:27.905 --> 00:10:32.090
nejméně čtyři nebo pět
Příkazy T-SQL

00:10:32.090 --> 00:10:34.970
a koncové body pro připravuji
a podobné věci.

00:10:34.970 --> 00:10:37.355
Tak se to pomodly.

00:10:37.355 --> 00:10:39.830
Bere to náklad z YouTube na

00:10:39.830 --> 00:10:42.415
zaměření na skutečně běžící
Co je na těch velkých údajích?

00:10:42.415 --> 00:10:44.940
>> Správně. Už se to
jednoduché, že?

00:10:44.940 --> 00:10:45.420
>> Je.

00:10:45.420 --> 00:10:48.350
>> Jeden řádek a pak samozřejmě, pokud
hlavní instanci, pokud chcete

00:10:48.350 --> 00:10:52.430
více řádků pouze pro čtení, ale
Ano, to je opravdu působivé.

00:10:52.430 --> 00:10:54.740
Cool. Tak kde můžu
Další informace?

00:10:54.740 --> 00:10:56.385
Jak začít?

00:10:56.385 --> 00:11:00.920
>> Takže vám to určitě ukážu

00:11:00.920 --> 00:11:03.915
přesně některé odkazy
které můžete využít

00:11:03.915 --> 00:11:07.140
pro nasazení,
pro konfiguraci.

00:11:07.140 --> 00:11:11.749
Najdete zde další informace o
v naší dokumentační platformě

00:11:11.749 --> 00:11:14.000
ale máme také hodně
vzorků tam venku

00:11:14.000 --> 00:11:16.460
o konfiguraci věcí.

00:11:16.460 --> 00:11:18.500
Jak spustit pracovní vytížení,

00:11:18.500 --> 00:11:21.380
a všechno, co jste
může pokračovat v používání

00:11:21.380 --> 00:11:24.350
Tyto odkazy a jejich využití pro
Co chceš dělat.

00:11:24.350 --> 00:11:25.490
Budete našimi clustery.

00:11:25.490 --> 00:11:28.550
>> Cool. No, ještě jednou díky za
sdílení a mluvení.

00:11:28.550 --> 00:11:30.260
To je velmi působivé.

00:11:30.260 --> 00:11:32.555
Líbí se mi, jak se to vytváří.

00:11:32.555 --> 00:11:32.760
>> Ano.

00:11:32.760 --> 00:11:34.700
>> To je zjevně spousta práce.

00:11:34.700 --> 00:11:36.695
>> Pěkně super. Ano. Děkuju.

00:11:36.695 --> 00:11:39.410
>> Dobře, díky. Děkuji vám
tě na pozorování.

00:11:39.410 --> 00:11:41.525
Přihlaste se, prosím,
Zanechte poznámku,

00:11:41.525 --> 00:11:43.830
a doufat, že tě uvidím
příště. Dík.

00:11:43.830 --> 00:11:55.690
HUDBY

