WEBVTT

00:00:00.000 --> 00:00:02.745
• 大数据集群提供

00:00:02.745 --> 00:00:05.640
保持群集的方法
通过启用

00:00:05.640 --> 00:00:08.460
高可用性，适用于关键
组件和米哈伊拉是

00:00:08.460 --> 00:00:12.120
在这里告诉我们所有关于
它今天在数据暴露。

00:00:12.120 --> 00:00:23.400
[音乐]

00:00:23.400 --> 00:00:26.475
• 嗨，欢迎来到另一个
一集数据暴露。

00:00:26.475 --> 00:00:30.480
我是你的东道主杰琳，今天
我们有米哈伊拉和我们谈谈

00:00:30.480 --> 00:00:32.265
关于大数据集群，然后

00:00:32.265 --> 00:00:34.970
特别是高
可用性。

00:00:34.970 --> 00:00:37.655
所以欢迎回来。这是必须的
是第四次我想。

00:00:37.655 --> 00:00:39.560
* 是的。谢谢。谢谢
你把我留在这里

00:00:39.560 --> 00:00:40.985
* 是的。你正在成为一个探测器。

00:00:40.985 --> 00:00:43.550
所以大多数你谈论的话题

00:00:43.550 --> 00:00:46.445
关于大数据集群
今天也不例外。

00:00:46.445 --> 00:00:48.345
但是高可用性，对吗？

00:00:48.345 --> 00:00:50.780
* 是的。所以有
很多事情

00:00:50.780 --> 00:00:53.360
谈论它何时到来
高可用性。

00:00:53.360 --> 00:00:54.155
"好的。

00:00:54.155 --> 00:00:57.590
• 我们将经历一些
这些方面在本视频中。

00:00:57.590 --> 00:00:59.785
"好的。酷。现在让我们开始吧。

00:00:59.785 --> 00:01:05.745
[ ] 所以当我们谈论数据时
特别是和数据库，

00:01:05.745 --> 00:01:07.800
我们想确保
数据是持久性。

00:01:07.800 --> 00:01:09.110
所以我只想从

00:01:09.110 --> 00:01:13.430
这种高可用性的谈话
与存储回顾。

00:01:13.430 --> 00:01:13.650
"好的。

00:01:13.650 --> 00:01:14.850
• 使中的图层不同

00:01:14.850 --> 00:01:17.840
大数据群集具有
不同的存储选项。

00:01:17.840 --> 00:01:20.180
您可以执行本地存储，或者

00:01:20.180 --> 00:01:23.150
远程，我们把它作为粒度

00:01:23.150 --> 00:01:25.970
您可以选择本地或远程

00:01:25.970 --> 00:01:28.895
取决于如果你想
存储数据或日志。

00:01:28.895 --> 00:01:33.680
所以，你不想要的日志
必然使其冗余

00:01:33.680 --> 00:01:36.865
因为你可能需要它

00:01:36.865 --> 00:01:40.930
故障排除，但随后您
不想永远留着它们

00:01:41.090 --> 00:01:42.190
[ 听不到]。

00:01:42.190 --> 00:01:44.840
* 确切地说。所以当
我们谈论的日志是

00:01:44.840 --> 00:01:48.140
主要是你想保持
他们在本地存储

00:01:48.140 --> 00:01:52.355
特别是因为我们在谈论
在最后一个视频中，我们有

00:01:52.355 --> 00:01:54.590
群集中的组件

00:01:54.590 --> 00:01:57.410
收集这些日志，并
在弹性搜索中启动它们。

00:01:57.410 --> 00:02:01.615
所以你已经有了一些
依赖这一方面。

00:02:01.615 --> 00:02:04.410
当涉及到数据时，
各种组件

00:02:04.410 --> 00:02:08.270
有不同的要求
取决于如何

00:02:08.270 --> 00:02:10.730
任务关键是，如果有

00:02:10.730 --> 00:02:15.140
存储的任何用户数据
例如，对于数据，

00:02:15.140 --> 00:02:20.030
SQL 服务器主机或存储
池，如 HDFS 数据被保留。

00:02:20.030 --> 00:02:22.955
您确实希望维护
冗余。

00:02:22.955 --> 00:02:28.445
但计算池或火花，

00:02:28.445 --> 00:02:30.695
没有状态。

00:02:30.695 --> 00:02:33.380
它只是计算。
所以没有意义

00:02:33.380 --> 00:02:36.560
以添加其他
冗余到存储。

00:02:36.560 --> 00:02:38.225
* 确切地说。所以，你可以选择本地。

00:02:38.225 --> 00:02:39.470
• 因此，我们在这里讨论的

00:02:39.470 --> 00:02:42.260
不同的选项，
你必须确保

00:02:42.260 --> 00:02:44.810
这些服务的可靠性

00:02:44.810 --> 00:02:46.400
当涉及到数据持久性时。

00:02:46.400 --> 00:02:47.620
"好的。

00:02:47.620 --> 00:02:51.575
• 这就是我们继续
与HA选项，对不对？

00:02:51.575 --> 00:02:55.985
因此，对于 SQL Server 主机，如果
在本地数据中的故事，

00:02:55.985 --> 00:02:57.725
你必须确保你添加

00:02:57.725 --> 00:02:59.675
一些额外的冗余，

00:02:59.675 --> 00:03:01.340
与可用性组
我们要

00:03:01.340 --> 00:03:04.160
稍后查看它是如何启用的。

00:03:04.160 --> 00:03:05.990
当涉及到数据池时，

00:03:05.990 --> 00:03:13.970
在组合器中使用 PV
确保数据是持久性的。

00:03:13.970 --> 00:03:15.350
只是PV，对吧？

00:03:15.350 --> 00:03:16.505
这里有很多首字母缩写词。

00:03:16.505 --> 00:03:17.240
* 是的。

00:03:17.240 --> 00:03:21.110
• 例如 PV，HA，所有光伏都是？

00:03:21.110 --> 00:03:25.175
* 建议PV
A 库贝内特斯概念

00:03:25.175 --> 00:03:28.250
抽象存储层

00:03:28.250 --> 00:03:32.090
Kubernetes，并确保您是否
使用持久卷。

00:03:32.090 --> 00:03:35.270
因此，概念是数据持久性。

00:03:35.270 --> 00:03:37.010
所以，如果你使用
持久卷是它

00:03:37.010 --> 00:03:38.840
意味着库贝内特斯确保

00:03:38.840 --> 00:03:42.440
数据将保留到该存储上。

00:03:42.440 --> 00:03:43.580
"好的。明白了。

00:03:43.580 --> 00:03:46.655
• 再次，这是没有必要确保

00:03:46.655 --> 00:03:49.435
高计算可用性
因为它是无国籍的

00:03:49.435 --> 00:03:52.110
它有关键组件

00:03:52.110 --> 00:03:53.870
在 Hadoop 堆栈中
正确的，当它涉及到

00:03:53.870 --> 00:03:56.600
HDFS 名称节点和一些火花共享

00:03:56.600 --> 00:04:00.545
您需要的服务
启用高可用性，

00:04:00.545 --> 00:04:03.020
和非常重要的我
想在这里突出显示

00:04:03.020 --> 00:04:09.000
您必须的控制服务
不仅具有持久性的体积，

00:04:09.000 --> 00:04:11.490
你需要添加一些
冗余的故事。

00:04:11.490 --> 00:04:14.135
因此，它必须是一些
远程冗余存储。

00:04:14.135 --> 00:04:16.940
不要保持你的控制[听不见]

00:04:16.940 --> 00:04:21.410
本地，因为如果
节点是最后一个在这里，

00:04:21.410 --> 00:04:23.960
几乎整个集群是
不在一个非常约束。

00:04:23.960 --> 00:04:28.130
"好的。因此，控制确实有
远程存储上的 PV？

00:04:28.130 --> 00:04:29.270
• 远程和冗余。

00:04:29.270 --> 00:04:31.100
所以，你必须使
确保他们添加

00:04:31.100 --> 00:04:33.005
该层有一些冗余。

00:04:33.005 --> 00:04:34.710
"好的。指出。

00:04:34.710 --> 00:04:37.290
[ ] 现在让我们看看
这意味着什么

00:04:37.290 --> 00:04:41.085
SQL 服务器主机和
启用 AG 的。

00:04:41.085 --> 00:04:45.095
因此，这是一个架构或

00:04:45.095 --> 00:04:50.045
各种服务的布局
形成 SQL 服务器，

00:04:50.045 --> 00:04:55.190
高可用性层
SQL Server 主机。

00:04:55.190 --> 00:04:57.020
同样，我们有一个主

00:04:57.020 --> 00:05:00.785
至少两个辅助数据库
右同步，

00:05:00.785 --> 00:05:04.670
我们构建了组件，

00:05:04.670 --> 00:05:08.985
正在确保有
是自动监控，

00:05:08.985 --> 00:05:11.370
自动故障转移
和编排。

00:05:11.370 --> 00:05:12.960
如果主数据库发生某些情况，

00:05:12.960 --> 00:05:17.675
它会自动发生，有
不需要做任何事情。

00:05:17.675 --> 00:05:20.330
一件事，我想要
要突出显示的是

00:05:20.330 --> 00:05:23.870
对于大数据群集
只在这个时候

00:05:23.870 --> 00:05:27.755
我们还启用我们称之为
包含可用性组，

00:05:27.755 --> 00:05:30.920
这意味着，现在的对象，

00:05:30.920 --> 00:05:33.920
您存储在主，例如像

00:05:33.920 --> 00:05:40.190
登录也复制
到二人，对不对？

00:05:40.190 --> 00:05:40.380
"好的。

00:05:40.380 --> 00:05:43.880
* 所以，直到现在这是
沿着发送我们从

00:05:43.880 --> 00:05:45.770
我们的客户使
确保登录

00:05:45.770 --> 00:05:47.930
也复制否则，

00:05:47.930 --> 00:05:49.610
有很多的指控和

00:05:49.610 --> 00:05:51.935
手动复制，他们必须做。

00:05:51.935 --> 00:05:55.290
现在自动
一切都被照顾好。

00:05:55.290 --> 00:05:57.060
因此，从部署，从添加

00:05:57.060 --> 00:05:59.130
数据库到可用性组，

00:05:59.130 --> 00:06:05.330
添加复制的主机
数据库可用性组。

00:06:05.330 --> 00:06:08.555
所以没有什么，如果没有

00:06:08.555 --> 00:06:13.130
在运营管理中

00:06:13.130 --> 00:06:16.620
可用性组。
太棒了

00:06:16.620 --> 00:06:18.660
* 是的。那真是
棒。我正想说

00:06:18.660 --> 00:06:21.230
所以你提到
可用性组，对不对？

00:06:21.230 --> 00:06:21.390
* 是的。

00:06:21.390 --> 00:06:24.330
* 是常规的吗？

00:06:24.330 --> 00:06:27.200
* 是的。它正是
相同的功能，我们

00:06:27.200 --> 00:06:30.050
所有人都知道从SQL Server 2012，对不对？

00:06:30.050 --> 00:06:30.605
* 是的。

00:06:30.605 --> 00:06:33.440
• 有一件事
这很重要。

00:06:33.440 --> 00:06:35.960
没有其他群集技术

00:06:35.960 --> 00:06:39.365
你将不得不
部署或集成。

00:06:39.365 --> 00:06:41.445
一切都被照顾好

00:06:41.445 --> 00:06:44.590
正在部署的服务
与医管局主管，

00:06:44.590 --> 00:06:45.730
运算符和

00:06:45.730 --> 00:06:49.840
课程紧密集成
库伯内特斯在写这个案子。

00:06:49.840 --> 00:06:52.560
因此，我们正在利用
这些平台。

00:06:52.560 --> 00:06:54.100
• 因此，无需再使用群集技术。

00:06:54.100 --> 00:06:56.650
因此，这是伟大的掌握。

00:06:56.650 --> 00:07:00.510
所以现在我相信主人
实例正常。

00:07:00.510 --> 00:07:02.250
但BDC还有更多，对吧？

00:07:02.250 --> 00:07:03.965
我们不仅做 SQL 服务器，

00:07:03.965 --> 00:07:05.980
我们正在做[听不见]
相关的东西。

00:07:05.980 --> 00:07:07.510
告诉我吧

00:07:07.510 --> 00:07:10.230
• 让我们来看看我们是什么
做哈多普，为HDFS。

00:07:10.230 --> 00:07:13.690
因此，HDFS 名称节点也必须在

00:07:13.690 --> 00:07:16.540
高度可用的配置
因为那很关键

00:07:16.540 --> 00:07:20.035
对于Hadoop堆栈，

00:07:20.035 --> 00:07:23.205
和我们看到的，
顾客告诉我们'哦，

00:07:23.205 --> 00:07:26.395
我想复制名称节点'，

00:07:26.395 --> 00:07:28.640
也将部署动物园管理员

00:07:28.640 --> 00:07:31.430
是一种开源集群技术。

00:07:31.430 --> 00:07:35.750
这就是将要发生的组件
负责协调

00:07:35.750 --> 00:07:39.800
监视和故障转移（如果

00:07:39.800 --> 00:07:44.970
需要的名称节点
到备用辅助数据库。

00:07:44.970 --> 00:07:45.070
"好的。

00:07:45.070 --> 00:07:47.330
• 因此，部署其他副本

00:07:47.330 --> 00:07:49.985
和动物园管理员正在照顾
业务流程方面。

00:07:49.985 --> 00:07:50.675
"好的。

00:07:50.675 --> 00:07:55.235
* 在同一时间
它也涉及

00:07:55.235 --> 00:07:58.580
保持高可用性

00:07:58.580 --> 00:08:03.679
一些 Spark 共享组件
像纱线资源管理器，

00:08:03.679 --> 00:08:07.520
并在这个意义上
火花，我们也部署

00:08:07.520 --> 00:08:12.200
服务的多个副本
像火花历史，工作历史。

00:08:12.200 --> 00:08:15.515
所以，为了确保，如果有什么是

00:08:15.515 --> 00:08:19.900
在 OneNote 中继续
这些服务被托管，

00:08:19.900 --> 00:08:23.495
[听不见的]将被挑选
或附加副本。

00:08:23.495 --> 00:08:24.790
• 冷却。

00:08:24.790 --> 00:08:28.490
• 因此，让我们看看这是多么容易

00:08:28.490 --> 00:08:32.570
配置高可用性
用于各种组件。

00:08:32.570 --> 00:08:33.530
告诉我这很容易。

00:08:33.530 --> 00:08:35.510
• 超级简单。

00:08:35.510 --> 00:08:38.280
• 冷却。我喜欢轻松。

00:08:38.470 --> 00:08:42.740
上次我们谈过
配置部署。

00:08:42.740 --> 00:08:43.820
* 是。我记得

00:08:43.820 --> 00:08:47.270
• 有群集
配置文件

00:08:47.270 --> 00:08:49.675
或部署模板
你有，

00:08:49.675 --> 00:08:52.280
记住我们
谈论早些时候

00:08:52.280 --> 00:08:55.700
Spark 共享组件。

00:08:55.700 --> 00:08:56.210
* 是的。

00:08:56.210 --> 00:08:59.975
我只是说我只想要两个
他们的复制品，这就是它。

00:08:59.975 --> 00:09:02.060
我们照顾
从那里拿起。

00:09:02.060 --> 00:09:03.020
就是这些吗？

00:09:03.020 --> 00:09:04.610
• 动物园管理员。所以，再次，

00:09:04.610 --> 00:09:08.450
我们必须通过所有
组件，我们经历了。

00:09:08.450 --> 00:09:12.980
动物园管理员，我们需要
三个副本，以确保仲裁。

00:09:12.980 --> 00:09:16.145
然后我们也提到主人

00:09:16.145 --> 00:09:19.465
SQL 服务器主实例
我在这里做什么？

00:09:19.465 --> 00:09:22.755
我只是说，我
想要三个副本

00:09:22.755 --> 00:09:26.930
因为 SQL 服务器
可用性组

00:09:26.930 --> 00:09:28.985
还支持可读的辅助数据库，

00:09:28.985 --> 00:09:31.640
会给你选择

00:09:31.640 --> 00:09:36.440
部署一项服务，
正在公开终结点

00:09:36.440 --> 00:09:39.920
执行远程工作负载

00:09:39.920 --> 00:09:41.780
从从从辅助
你只需要

00:09:41.780 --> 00:09:44.015
在这种情况下指定此处的端口。

00:09:44.015 --> 00:09:47.900
* 正确。所以你做了一个高
可用性，作为其中的一部分，

00:09:47.900 --> 00:09:49.980
您也可以做
只读，[听不见]

00:09:49.980 --> 00:09:51.365
* 确切地说。是的。

00:09:51.365 --> 00:09:54.290
• 冷却。你就是这样读的
就像一行[听不见]？

00:09:54.290 --> 00:09:57.470
* 是的。您只指定
有多少副本

00:09:57.470 --> 00:10:02.480
不用担心策划

00:10:02.480 --> 00:10:05.900
部署其他
组件，如当你告诉

00:10:05.900 --> 00:10:09.545
我们，我想要三个副本
对于 SQL 服务器主机，

00:10:09.545 --> 00:10:10.820
我们部署操作员，

00:10:10.820 --> 00:10:12.260
我们部署了主管，即

00:10:12.260 --> 00:10:14.030
做监控
和其他一切。

00:10:14.030 --> 00:10:17.180
所以一切都落后了
场景和

00:10:17.180 --> 00:10:21.380
是最小的业务流程
设置的东西。

00:10:21.380 --> 00:10:23.840
对于
非常熟悉如何

00:10:23.840 --> 00:10:27.905
配置可用性
团体，我认为这是

00:10:27.905 --> 00:10:32.090
至少四或五个
T-SQL 语句

00:10:32.090 --> 00:10:34.970
加上准备端点
和类似的东西。

00:10:34.970 --> 00:10:37.355
所以，这是刺耳的问。

00:10:37.355 --> 00:10:39.830
它从YouTube的负载

00:10:39.830 --> 00:10:42.415
专注于实际运行
大数据上的内容。

00:10:42.415 --> 00:10:44.940
* 正确。它没有得到更多
比这更简单，对吧？

00:10:44.940 --> 00:10:45.420
* 是。

00:10:45.420 --> 00:10:48.350
* 一行，然后当然，如果
主实例（如果需要）

00:10:48.350 --> 00:10:52.430
更多行用于只读，但
是的，那真是令人印象深刻。

00:10:52.430 --> 00:10:54.740
酷。那么，我在哪里可以
了解更多？

00:10:54.740 --> 00:10:56.385
如何开始？

00:10:56.385 --> 00:11:00.920
* 所以，我一定会告诉你

00:11:00.920 --> 00:11:03.915
正好一些链接
你可以利用

00:11:03.915 --> 00:11:07.140
进行部署，
配置。

00:11:07.140 --> 00:11:11.749
因此，您可以找到听到更多关于
在我们的文档平台中

00:11:11.749 --> 00:11:14.000
但我们也有很多
样品在那里

00:11:14.000 --> 00:11:16.460
有关如何配置内容。

00:11:16.460 --> 00:11:18.500
如何运行工作负载，

00:11:18.500 --> 00:11:21.380
和你一切
可以继续前进使用

00:11:21.380 --> 00:11:24.350
此链接，并利用他们
无论你想做什么

00:11:24.350 --> 00:11:25.490
你将成为我们的集群。

00:11:25.490 --> 00:11:28.550
• 冷却。再次感谢
分享和交谈，虽然这。

00:11:28.550 --> 00:11:30.260
这非常令人印象深刻。

00:11:30.260 --> 00:11:32.555
我喜欢创造这个的轻松。

00:11:32.555 --> 00:11:32.760
* 是的。

00:11:32.760 --> 00:11:34.700
• 这显然是一项工作。

00:11:34.700 --> 00:11:36.695
* 相当真棒。是的。谢谢。

00:11:36.695 --> 00:11:39.410
"谢谢谢谢
你看。

00:11:39.410 --> 00:11:41.525
请喜欢，订阅，
留下评论

00:11:41.525 --> 00:11:43.830
希望见到你
下次。谢谢。

00:11:43.830 --> 00:11:55.690
[音乐]

