WEBVTT

00:00:00.000 --> 00:00:02.745
>> Klastry Big Data zapewniają

00:00:02.745 --> 00:00:05.640
sposób utrzymywania klastra
niezawodne, umożliwiając

00:00:05.640 --> 00:00:08.460
Wysoka dostępność dla krytycznych
komponenty i Mihaela jest

00:00:08.460 --> 00:00:12.120
tutaj, aby opowiedzieć nam o
go dzisiaj na Data Exposed.

00:00:12.120 --> 00:00:23.400
MUZYKI

00:00:23.400 --> 00:00:26.475
>> Witam i zapraszam na inny
odcinek danych narażonych.

00:00:26.475 --> 00:00:30.480
Jestem gospodarzem Jeroen i dziś
Mamy Mihaela z nami, aby porozmawiać

00:00:30.480 --> 00:00:32.265
klastrów danych Big Data, a następnie

00:00:32.265 --> 00:00:34.970
szczególnie wysokie
dostępność dla nich.

00:00:34.970 --> 00:00:37.655
Więc Witamy z powrotem. Musi to być
być następnym razem myślę.

00:00:37.655 --> 00:00:39.560
>> tak. Dziękuję. Dziękuję
o mnie tutaj.

00:00:39.560 --> 00:00:40.985
>> tak. Stajesz się sondą.

00:00:40.985 --> 00:00:43.550
Więc Większość tematów mówisz

00:00:43.550 --> 00:00:46.445
o to klastry dużych zbiorów danych
i dziś nie jest inaczej.

00:00:46.445 --> 00:00:48.345
Ale potem wysoka dostępność, prawda?

00:00:48.345 --> 00:00:50.780
>> tak. Tak więc istnieją
wiele rzeczy do

00:00:50.780 --> 00:00:53.360
rozmawiać o tym, kiedy przychodzi
do wysokiej dostępności.

00:00:53.360 --> 00:00:54.155
>> Okay.

00:00:54.155 --> 00:00:57.590
>> Mamy zamiar przejść przez niektóre
tych aspektów w tym filmie.

00:00:57.590 --> 00:00:59.785
>> Okay. Cool. Teraz zacznijmy.

00:00:59.785 --> 00:01:05.745
>> Więc kiedy mówimy o danych
zwłaszcza i baz danych,

00:01:05.745 --> 00:01:07.800
chcemy mieć pewność, że
danych jest trwałość.

00:01:07.800 --> 00:01:09.110
Więc po prostu chcę zacząć

00:01:09.110 --> 00:01:13.430
Dyskusja o wysokiej dostępności
z recap pamięci.

00:01:13.430 --> 00:01:13.650
>> Okay.

00:01:13.650 --> 00:01:14.850
>> Więc różne warstwy w

00:01:14.850 --> 00:01:17.840
klaster dużych zbiorów danych
różne opcje przechowywania.

00:01:17.840 --> 00:01:20.180
Możesz też zrobić lokalną pamięć masową lub

00:01:20.180 --> 00:01:23.150
i zrobiliśmy to tak ziarniste jak

00:01:23.150 --> 00:01:25.970
Możesz zdecydować się na lokalne lub zdalne

00:01:25.970 --> 00:01:28.895
w zależności od tego, czy chcesz
przechowywania danych lub dzienników.

00:01:28.895 --> 00:01:33.680
Więc logi nie chcesz
koniecznie, aby był zbędny

00:01:33.680 --> 00:01:36.865
ponieważ może być potrzebny

00:01:36.865 --> 00:01:40.930
rozwiązywania problemów, ale
nie chcą trzymać ich na zawsze.

00:01:41.090 --> 00:01:42.190
>> [niesłyszalny].

00:01:42.190 --> 00:01:44.840
>> Dokładnie. Więc kiedy
mówimy o logach jest

00:01:44.840 --> 00:01:48.140
głównie chcesz zachować
na lokalnym dysku

00:01:48.140 --> 00:01:52.355
zwłaszcza dlatego, że rozmawialiśmy
w ostatnim filmie, który mamy

00:01:52.355 --> 00:01:54.590
komponenty w klastrach, które są

00:01:54.590 --> 00:01:57.410
zbierania tych dzienników i są
rozpoczęciem wyszukiwania elastycznego.

00:01:57.410 --> 00:02:01.615
Więc masz już jakieś
zależności od tego aspektu.

00:02:01.615 --> 00:02:04.410
Jeśli chodzi o dane,
różne komponenty

00:02:04.410 --> 00:02:08.270
mają różne wymagania
w zależności od tego, jak

00:02:08.270 --> 00:02:10.730
Misja jest kluczo-

00:02:10.730 --> 00:02:15.140
dane użytkownika, które są przechowywane
dla danych na przykład,

00:02:15.140 --> 00:02:20.030
Wzorzec lub magazyn programu SQL Server
jak dane HDFS są przechowywane.

00:02:20.030 --> 00:02:22.955
Chcesz zachować
nadmiarowości.

00:02:22.955 --> 00:02:28.445
Ale puli obliczeniowej lub Spark,

00:02:28.445 --> 00:02:30.695
nie ma stanu.

00:02:30.695 --> 00:02:33.380
Jest po prostu oblicza.
Więc nie ma sensu

00:02:33.380 --> 00:02:36.560
, aby dodać dodatkowe
nadmiarowości do pamięci masowej.

00:02:36.560 --> 00:02:38.225
>> Dokładnie. Więc można wybrać lokalne.

00:02:38.225 --> 00:02:39.470
>> Więc mówimy tu o

00:02:39.470 --> 00:02:42.260
różne opcje, które
musisz zapewnić

00:02:42.260 --> 00:02:44.810
wiarygodność tych usług

00:02:44.810 --> 00:02:46.400
Jeśli chodzi o trwałość danych.

00:02:46.400 --> 00:02:47.620
>> Okay.

00:02:47.620 --> 00:02:51.575
>> To gdzie kontynuujemy
z opcjami HA, prawda?

00:02:51.575 --> 00:02:55.985
Więc dla wzorca programu SQL Server, jeśli
historię w danych lokalnie,

00:02:55.985 --> 00:02:57.725
należy się upewnić, że dodajesz

00:02:57.725 --> 00:02:59.675
dodatkową nadmiarowość do tego

00:02:59.675 --> 00:03:01.340
z grupami dostępności
i zamierzamy

00:03:01.340 --> 00:03:04.160
Zobacz wkrótce jak to jest włączone.

00:03:04.160 --> 00:03:05.990
Jeśli chodzi o pulę danych,

00:03:05.990 --> 00:03:13.970
korzystasz z PVs w kombinatorach, aby
zapewnienia, że dane są trwałe.

00:03:13.970 --> 00:03:15.350
>> Więc to tylko PVs, prawda?

00:03:15.350 --> 00:03:16.505
Tu jest dużo akronimów tutaj.

00:03:16.505 --> 00:03:17.240
>> tak.

00:03:17.240 --> 00:03:21.110
>> EG PV, HA, wszystko PV jest?

00:03:21.110 --> 00:03:25.175
>> Sugeruje PVs to
koncepcja Kubernetes

00:03:25.175 --> 00:03:28.250
która Abstracts warstwa magazynowania

00:03:28.250 --> 00:03:32.090
Kubernetes i zapewnia, jeśli jesteś
przy użyciu woluminów trwałych.

00:03:32.090 --> 00:03:35.270
Więc pojęcie jest trwałość danych.

00:03:35.270 --> 00:03:37.010
Więc jeśli używasz
trwała objętość jest

00:03:37.010 --> 00:03:38.840
oznacza, że Kubernetes gwarantuje, że

00:03:38.840 --> 00:03:42.440
dane są zachowywane w tym magazynie.

00:03:42.440 --> 00:03:43.580
>> Okay. Mam.

00:03:43.580 --> 00:03:46.655
>> Ponownie, to nie jest konieczne, aby zapewnić

00:03:46.655 --> 00:03:49.435
Wysoka dostępność dla obliczeń
ponieważ jest bezpaństwowców.

00:03:49.435 --> 00:03:52.110
Posiada krytyczne komponenty

00:03:52.110 --> 00:03:53.870
w stosie Hadoop
prawo, jeśli chodzi o

00:03:53.870 --> 00:03:56.600
HDFS NameNode i niektóre Spark udostępniane

00:03:56.600 --> 00:04:00.545
usług, które należy
zapewnić wysoką dostępność,

00:04:00.545 --> 00:04:03.020
i bardzo ważne i
chcesz wyróżnić tutaj

00:04:03.020 --> 00:04:09.000
Usługi kontroli, którą należy
mają nie tylko stałą objętość,

00:04:09.000 --> 00:04:11.490
należy dodać kilka
nadmiarowości do tej historii.

00:04:11.490 --> 00:04:14.135
Więc to musi być pewne
magazynu zdalnego nadmiarowego.

00:04:14.135 --> 00:04:16.940
Nie trzymaj pilota [niesłyszalny]

00:04:16.940 --> 00:04:21.410
lokalnie, ponieważ jeśli
węzeł jest ostatni tutaj,

00:04:21.410 --> 00:04:23.960
dość dużo całego klastra jest
nie w bardzo ograniczony.

00:04:23.960 --> 00:04:28.130
>> Okay. Więc kontrola mają
PVs na zdalnym magazynie?

00:04:28.130 --> 00:04:29.270
>> Zdalny i nadmiarowy.

00:04:29.270 --> 00:04:31.100
Więc trzeba zrobić
upewnić się, że dodają

00:04:31.100 --> 00:04:33.005
pewną nadmiarowość tej warstwy.

00:04:33.005 --> 00:04:34.710
>> Okay. Zauważyć.

00:04:34.710 --> 00:04:37.290
>> Więc teraz Zobaczmy
Co to oznacza dla

00:04:37.290 --> 00:04:41.085
Wzorzec programu SQL Server i
umożliwiając AG.

00:04:41.085 --> 00:04:45.095
Jest to schemat lub

00:04:45.095 --> 00:04:50.045
jak układ różnych usług
które tworzą program SQL Server,

00:04:50.045 --> 00:04:55.190
Warstwa o wysokiej dostępności
dla SQL Server wzorca.

00:04:55.190 --> 00:04:57.020
Znowu mamy podstawowe, które

00:04:57.020 --> 00:05:00.785
jest co najmniej dwóch pomocnicze bazy danych
prawo synchroniczne,

00:05:00.785 --> 00:05:04.670
i zbudowaliśmy komponenty, które

00:05:04.670 --> 00:05:08.985
zapewniają
jest automatyczne monitorowanie,

00:05:08.985 --> 00:05:11.370
automatyczny tryb failover
i aranżacji.

00:05:11.370 --> 00:05:12.960
Jeśli coś się dzieje z podstawowym,

00:05:12.960 --> 00:05:17.675
dzieje się to automatycznie,
nie trzeba nic robić.

00:05:17.675 --> 00:05:20.330
Jedna rzecz, którą chcę
podkreślić tutaj jest

00:05:20.330 --> 00:05:23.870
że dla klastra dużych zbiorów danych
tylko w tym czasie,

00:05:23.870 --> 00:05:27.755
Umożliwiamy również to, co nazywamy
Zamkniętego grupy dostępności,

00:05:27.755 --> 00:05:30.920
co oznacza, że teraz obiekty, które

00:05:30.920 --> 00:05:33.920
można przechowywać w Master na przykład jak

00:05:33.920 --> 00:05:40.190
logowania są również replikowane
do Secondaries, prawda?

00:05:40.190 --> 00:05:40.380
>> Okay.

00:05:40.380 --> 00:05:43.880
>> Więc do tej pory jest to
razem wysyłają nas z

00:05:43.880 --> 00:05:45.770
nasi klienci robią
upewnić się, że logowanie

00:05:45.770 --> 00:05:47.930
są również replikowane w inny sposób,

00:05:47.930 --> 00:05:49.610
Istnieje wiele oskarżenia i

00:05:49.610 --> 00:05:51.935
ręcznej replikacji.

00:05:51.935 --> 00:05:55.290
Teraz automatycznie
wszystko jest pod opieką.

00:05:55.290 --> 00:05:57.060
Więc od wdrożenia, od dodawania

00:05:57.060 --> 00:05:59.130
baz danych do grup dostępności,

00:05:59.130 --> 00:06:05.330
dodanie tego wzorca zreplikowanego
grup dostępności bazy danych.

00:06:05.330 --> 00:06:08.555
Więc jest niewiele, jeśli żaden

00:06:08.555 --> 00:06:13.130
między zarządzaniem operacyjnym

00:06:13.130 --> 00:06:16.620
grupy dostępności.
To całkiem niesamowite.

00:06:16.620 --> 00:06:18.660
>> tak. To naprawdę
Niesamowite. Miałem zamiar powiedzieć.

00:06:18.660 --> 00:06:21.230
Tak, ale wspomniał
grupy dostępności teraz, prawda?

00:06:21.230 --> 00:06:21.390
>> tak.

00:06:21.390 --> 00:06:24.330
>> Jest to, że regularne?

00:06:24.330 --> 00:06:27.200
>> tak. Jest dokładnie
tej samej funkcji, którą

00:06:27.200 --> 00:06:30.050
wszystko znać z SQL Serwer 2012, prawy?

00:06:30.050 --> 00:06:30.605
>> tak.

00:06:30.605 --> 00:06:33.440
>> Jedna rzecz, która
to bardzo ważne.

00:06:33.440 --> 00:06:35.960
Nie ma innych technologii klastrowych

00:06:35.960 --> 00:06:39.365
że będziesz musiał
wdrożyć lub zintegrować z.

00:06:39.365 --> 00:06:41.445
Jego wszystko pod opieką,

00:06:41.445 --> 00:06:44.590
usługi, które są wdrażane
z przełożonym HA,

00:06:44.590 --> 00:06:45.730
operatora i

00:06:45.730 --> 00:06:49.840
Oczywiście ścisnąć integrację z
Kubernetes na piśmie w tym przypadku.

00:06:49.840 --> 00:06:52.560
Więc jesteśmy wykorzystując
tych platform.

00:06:52.560 --> 00:06:54.100
>> Więc nie więcej technologii klastrowej.

00:06:54.100 --> 00:06:56.650
Więc to jest wielki dla masteringu.

00:06:56.650 --> 00:07:00.510
Więc teraz ufam mistrzu
wystąpienia jest w porządku.

00:07:00.510 --> 00:07:02.250
Ale jest więcej do BDC, prawda?

00:07:02.250 --> 00:07:03.965
Nie robimy tylko programu SQL Server,

00:07:03.965 --> 00:07:05.980
robimy [niesłyszalne]
związanych z nimi rzeczy.

00:07:05.980 --> 00:07:07.510
Więc powiedz mi.

00:07:07.510 --> 00:07:10.230
>> Więc spójrzmy na to, co jesteśmy
dla usługi Hadoop dla systemu plików HDFS.

00:07:10.230 --> 00:07:13.690
Więc HDFS NameNode musi być również w

00:07:13.690 --> 00:07:16.540
wysoce dostępnej konfiguracji
ponieważ to krytyczne

00:07:16.540 --> 00:07:20.035
dla stosu Hadoop,

00:07:20.035 --> 00:07:23.205
i co widzimy, że
Klient mówi nam: "Och,

00:07:23.205 --> 00:07:26.395
Chcę replikację dla NameNode ' ',

00:07:26.395 --> 00:07:28.640
również wdrożenie Zookeeper, który

00:07:28.640 --> 00:07:31.430
to technologia klastrów Open Source.

00:07:31.430 --> 00:07:35.750
To jest komponent, który będzie
dbać o koordynację

00:07:35.750 --> 00:07:39.800
monitorowania i pracy awaryjnej, jeśli

00:07:39.800 --> 00:07:44.970
potrzeby NameNode
do zapasowego trybu gotowości.

00:07:44.970 --> 00:07:45.070
>> Okay.

00:07:45.070 --> 00:07:47.330
>> Więc wdrażanie dodatkowej repliki

00:07:47.330 --> 00:07:49.985
i Zookeeper jest dbanie
aspekt aranżacji.

00:07:49.985 --> 00:07:50.675
>> Okay.

00:07:50.675 --> 00:07:55.235
>> W tym samym czasie
jest również zaangażowany w

00:07:55.235 --> 00:07:58.580
utrzymywanie wysokiej dostępności dla

00:07:58.580 --> 00:08:03.679
Niektóre składniki udziału Spark
jak Menedżer zasobów YARN,

00:08:03.679 --> 00:08:07.520
i w tym sensie do
Spark wdrażamy również

00:08:07.520 --> 00:08:12.200
wiele replik usług
jak historia Spark, historia zadań.

00:08:12.200 --> 00:08:15.515
Więc, aby upewnić się, że jeśli coś jest

00:08:15.515 --> 00:08:19.900
dzieje się w programie OneNote,
te usługi są hostowane,

00:08:19.900 --> 00:08:23.495
[Niesłyszalny] zostanie odebrany
lub dodatkowe repliki.

00:08:23.495 --> 00:08:24.790
>> Cool.

00:08:24.790 --> 00:08:28.490
>> Więc Zobaczmy, jak łatwo jest

00:08:28.490 --> 00:08:32.570
Konfigurowanie wysokiej dostępności
dla różnych komponentów.

00:08:32.570 --> 00:08:33.530
>> Powiedz mi, że to proste.

00:08:33.530 --> 00:08:35.510
>> To jest bardzo proste.

00:08:35.510 --> 00:08:38.280
>> Cool. Lubię to łatwe.

00:08:38.470 --> 00:08:42.740
>> Rozmawialiśmy ostatni raz o tym, jak
, aby skonfigurować wdrożenia.

00:08:42.740 --> 00:08:43.820
>> Tak. Pamiętam.

00:08:43.820 --> 00:08:47.270
>> Klaster
Pliki konfiguracyjne

00:08:47.270 --> 00:08:49.675
lub szablony wdrożeniowe
że masz,

00:08:49.675 --> 00:08:52.280
i pamiętaj, że jesteśmy
mówienie wcześniej o

00:08:52.280 --> 00:08:55.700
składników udziału Spark.

00:08:55.700 --> 00:08:56.210
>> tak.

00:08:56.210 --> 00:08:59.975
>> Mówię tylko, że chcę dwóch
ich repliki i to jest to.

00:08:59.975 --> 00:09:02.060
Dbamy o
podniesienie stamtąd.

00:09:02.060 --> 00:09:03.020
>> Jest to, że wszystko?

00:09:03.020 --> 00:09:04.610
>> Zookeeper. Więc znowu,

00:09:04.610 --> 00:09:08.450
musimy przejść przez wszystkie
elementów, które przebyliśmy.

00:09:08.450 --> 00:09:12.980
Zookeeper mamy zamiar potrzebować
trzy repliki, aby zapewnić kworum.

00:09:12.980 --> 00:09:16.145
Następnie wspominaliśmy także mistrza,

00:09:16.145 --> 00:09:19.465
Wystąpienie główne programu SQL Server
i co mam tu zrobic?

00:09:19.465 --> 00:09:22.755
Chciałbym tylko powiedzieć, że
ma trzy repliki,

00:09:22.755 --> 00:09:26.930
a ponieważ SQL Server
grupy dostępności

00:09:26.930 --> 00:09:28.985
umożliwia także odczytanie Secondaries,

00:09:28.985 --> 00:09:31.640
da Ci możliwość

00:09:31.640 --> 00:09:36.440
wdrożyć usługę, która
naraża punkt końcowy

00:09:36.440 --> 00:09:39.920
do pracy zdalnej obciążenia

00:09:39.920 --> 00:09:41.780
z wtórnego
i po prostu trzeba

00:09:41.780 --> 00:09:44.015
w tym przypadku należy określić port.

00:09:44.015 --> 00:09:47.900
>> W prawo. Więc robisz wysoki
dostępności i w ramach tego

00:09:47.900 --> 00:09:49.980
można również zrobić
tylko do odczytu, [niesłyszalny]

00:09:49.980 --> 00:09:51.365
>> Dokładnie. Tak.

00:09:51.365 --> 00:09:54.290
>> Cool. Czy to, jak czytasz ten
tylko jako jeden wiersz [niesłyszalny]?

00:09:54.290 --> 00:09:57.470
>> tak. Wystarczy określić
ile replik

00:09:57.470 --> 00:10:02.480
nie martw się o orkiestrację,

00:10:02.480 --> 00:10:05.900
wdrażanie dodatkowych
komponentów, takich jak

00:10:05.900 --> 00:10:09.545
nam, że chcę trzy repliki
dla wzorca programu SQL Server,

00:10:09.545 --> 00:10:10.820
Wdrażamy operatora,

00:10:10.820 --> 00:10:12.260
wdrożyli przełożonego, który jest

00:10:12.260 --> 00:10:14.030
monitorowanie
i wszystko inne.

00:10:14.030 --> 00:10:17.180
Więc wszystko jest za
sceny i że

00:10:17.180 --> 00:10:21.380
jest minimalny aranżacji
do ustawiania rzeczy.

00:10:21.380 --> 00:10:23.840
Dla ludzi, którzy są
bardzo dobrze zaznajomieni z

00:10:23.840 --> 00:10:27.905
, aby skonfigurować dostępność
grup Myślę, że to

00:10:27.905 --> 00:10:32.090
co najmniej cztery lub pięć
Instrukcje języka T-SQL

00:10:32.090 --> 00:10:34.970
Plus prepping punktów końcowych
i takie rzeczy.

00:10:34.970 --> 00:10:37.355
Więc to kolcząco zapytał.

00:10:37.355 --> 00:10:39.830
To biorąc, że obciążenie z YouTube do

00:10:39.830 --> 00:10:42.415
skupić się na faktycznie uruchomione
co ' u ten wielki dane.

00:10:42.415 --> 00:10:44.940
>> W prawo. Nie dostaniesz więcej
proste niż to, prawda?

00:10:44.940 --> 00:10:45.420
>> To jest.

00:10:45.420 --> 00:10:48.350
>> Jedna linia, a następnie oczywiście, jeśli
wystąpienia głównego, jeśli chcesz

00:10:48.350 --> 00:10:52.430
więcej wierszy tylko do odczytu, ale
tak to naprawdę imponujące.

00:10:52.430 --> 00:10:54.740
Cool. Więc gdzie mogę
dowiedzieć się więcej na ten temat?

00:10:54.740 --> 00:10:56.385
Jak zacząć?

00:10:56.385 --> 00:11:00.920
>> Więc na pewno pokażę ci

00:11:00.920 --> 00:11:03.915
dokładnie kilka linków
że można wykorzystać

00:11:03.915 --> 00:11:07.140
do wdrożenia,
dla konfiguracji.

00:11:07.140 --> 00:11:11.749
Możesz więc usłyszeć więcej o
w naszej platformie dokumentacji

00:11:11.749 --> 00:11:14.000
ale mamy też wiele
próbek tam

00:11:14.000 --> 00:11:16.460
na temat konfiguracji rzeczy.

00:11:16.460 --> 00:11:18.500
Jak uruchamiać obciążeń,

00:11:18.500 --> 00:11:21.380
i wszystko, co
można śmiało używać

00:11:21.380 --> 00:11:24.350
te linki i wykorzystać je do
Co robić co chcesz zrobić.

00:11:24.350 --> 00:11:25.490
Będziesz naszych klastrów.

00:11:25.490 --> 00:11:28.550
>> Cool. Cóż, jeszcze raz dziękujemy za
dzielenie się i mówienie mimo to.

00:11:28.550 --> 00:11:30.260
Jest to bardzo imponujące.

00:11:30.260 --> 00:11:32.555
Lubię łatwość tworzenia tego.

00:11:32.555 --> 00:11:32.760
>> tak.

00:11:32.760 --> 00:11:34.700
>> To jest ewidentnie dużo pracy.

00:11:34.700 --> 00:11:36.695
>> Całkiem niesamowite. Tak. Dziękuję.

00:11:36.695 --> 00:11:39.410
>> Cóż, dzięki. Dziękuję
do oglądania.

00:11:39.410 --> 00:11:41.525
Podobać się podobny, subskrypcja,
Zostaw komentarz,

00:11:41.525 --> 00:11:43.830
i mam nadzieję, że do zobaczenia
następnym razem. Dzięki.

00:11:43.830 --> 00:11:55.690
MUZYKI

