WEBVTT

00:00:09.680 --> 00:00:10.780
>> [MUSICA].

00:00:10.780 --> 00:00:12.750
>> Ciao. Sono Vicki Arpa con
team del prodotto SQL Server.

00:00:12.750 --> 00:00:15.870
Sono qui oggi per mostrarvi
Blocchi appunti e Azure Data Studio.Notebooks and Azure Data Studio.

00:00:15.870 --> 00:00:18.825
Quindi i notebook sono un concetto in

00:00:18.825 --> 00:00:20.660
Data science che è stato

00:00:20.660 --> 00:00:22.940
usato per fare un sacco di
visualizzazione dei dati,

00:00:22.940 --> 00:00:25.010
l'esplorazione dei dati e il lavoro dei dati,

00:00:25.010 --> 00:00:26.855
principalmente nel linguaggio Python.

00:00:26.855 --> 00:00:28.760
Quando la gente parla
sui notebook,

00:00:28.760 --> 00:00:30.485
un sacco di volte stiamo parlando
su Giove Notebooks.

00:00:30.485 --> 00:00:32.660
Così l'implementazione di Notebook

00:00:32.660 --> 00:00:34.730
che abbiamo in Azure Data Studio è

00:00:34.730 --> 00:00:37.070
un taccuino Giove con un
front-end personalizzato che è

00:00:37.070 --> 00:00:40.430
meglio su misura per adattarsi all'interno del
Esperienza di Azure Data Studio.Azure Data Studio experience.

00:00:40.430 --> 00:00:45.450
Quindi, prima, ho intenzione di mostrare
un semplice Python Notebook.

00:00:45.450 --> 00:00:46.760
Questo è un notebook che ha

00:00:46.760 --> 00:00:49.250
Linguaggio Python e
si può vedere che abbiamo

00:00:49.250 --> 00:00:51.620
una sezione qui che è

00:00:51.620 --> 00:00:54.395
un testo leggibile dall'uomo e un
sezione qui che ha codice.

00:00:54.395 --> 00:00:56.149
Quindi, se colpisco correre su questo,

00:00:56.149 --> 00:00:58.010
questo particolare codice chiama a

00:00:58.010 --> 00:01:00.755
Internet e tira giù un
fotografia casuale di un cane.

00:01:00.755 --> 00:01:03.710
Per mostrarvi
Esperienza notebook,

00:01:03.710 --> 00:01:05.390
abbiamo un raccoglitore qui,

00:01:05.390 --> 00:01:06.770
possiamo scegliere la lingua.

00:01:06.770 --> 00:01:08.630
Quindi, in questo caso, sono
esecuzione di Python 3,

00:01:08.630 --> 00:01:10.475
e lo sto eseguendo
sulla mia macchina locale.

00:01:10.475 --> 00:01:13.460
Potrei invece passare a
la lingua SQL e poi

00:01:13.460 --> 00:01:16.430
scegliere quale server MySQL
macchine a cui voglio attaccare.

00:01:16.430 --> 00:01:18.605
Ho i server MySQL elencati qui.

00:01:18.605 --> 00:01:21.830
Quindi, per andare un po' oltre,

00:01:21.830 --> 00:01:24.230
Vi mostrerò un esempio
di come si potrebbe usare questo.

00:01:24.230 --> 00:01:28.025
Così qui ho un SQL Server
Cluster di grandi data 2019 che

00:01:28.025 --> 00:01:32.555
è in esecuzione SQL Server in Kubernetes
sia con SQL che con Spark.

00:01:32.555 --> 00:01:34.490
Quindi, qui nella mia sezione HDFS,

00:01:34.490 --> 00:01:38.040
Ho ottenuto questa directory
pieno di file CSV.

00:01:38.040 --> 00:01:40.890
Se lo guardo, lo visualizza in anteprima,

00:01:40.890 --> 00:01:42.260
si può vedere che è un sacco di

00:01:42.260 --> 00:01:44.780
informazioni sul cane
informazioni sulla licenza.

00:01:44.780 --> 00:01:46.970
Quindi questo è in realtà il Dump di dati di

00:01:46.970 --> 00:01:48.320
la Contea di Allegheny in Pennsylvania

00:01:48.320 --> 00:01:51.230
licenze per cani per il
ultimi anni.

00:01:51.230 --> 00:01:55.775
Quindi, usando la Scintilla
lingua e collegamento

00:01:55.775 --> 00:02:00.440
a Python usando Spark sul
Cluster di Big Data di SQL Server.

00:02:00.440 --> 00:02:02.045
Sono in grado di correre,

00:02:02.045 --> 00:02:05.780
codice per leggere quei file
direttamente dal file CSV.

00:02:05.780 --> 00:02:07.760
Allora posso fare qualche analisi.

00:02:07.760 --> 00:02:09.890
Quindi, in questo caso, ho intenzione di
ottenere il conteggio delle righe.

00:02:09.890 --> 00:02:15.645
Ho intenzione di elencare il distinto
lista dei soli nomi,

00:02:15.645 --> 00:02:17.215
quindi abbiamo 25.000 nomi.

00:02:17.215 --> 00:02:20.825
Poi ho intenzione di tirare un
nome casuale da quel cappello.

00:02:20.825 --> 00:02:22.550
Quindi abbiamo un nome qui.

00:02:22.550 --> 00:02:25.850
Ora, se stavo usando una Scintilla,

00:02:25.850 --> 00:02:29.120
se fossi molto abituato a usare
Python, sarebbe fantastico.

00:02:29.120 --> 00:02:30.770
Ma se sono più una persona SQL,

00:02:30.770 --> 00:02:33.320
allora forse voglio collegare
a quello stesso set di dati,

00:02:33.320 --> 00:02:36.040
Eseguirò cluster
utilizzando il linguaggio SQL.

00:02:36.040 --> 00:02:41.420
Qui, ho creato esterno
tabella su quel formato di file.

00:02:41.420 --> 00:02:43.870
Questo è qualcosa che si
può fare utilizzando una procedura guidata.

00:02:43.870 --> 00:02:45.250
Vado qui,

00:02:45.250 --> 00:02:46.930
creare una tabella esterna da file CSV.

00:02:46.930 --> 00:02:50.315
Poi, questo creerebbe questo
tabella esterna che sto usando.

00:02:50.315 --> 00:02:52.415
Ma in questo caso, ho
fatto usando il codice.

00:02:52.415 --> 00:02:56.500
Se colpisco le celle di corsa,

00:02:56.500 --> 00:02:59.765
si può vedere che sto anche usando SQL

00:02:59.765 --> 00:03:03.625
per accedere agli stessi dati che
Ho appena avuto accesso usando Spark.

00:03:03.625 --> 00:03:07.410
Ora, questi file sono
salvati come file IPYNB,

00:03:07.410 --> 00:03:10.970
che posso poi condividere con il mio
colleghi ed io possiamo correre di nuovo.

00:03:10.970 --> 00:03:14.465
Quindi, nel caso in cui io
voleva eseguire questo oggi,

00:03:14.465 --> 00:03:15.995
mandarlo al mio collega,

00:03:15.995 --> 00:03:18.950
potevano aprirlo
sul loro istante e

00:03:18.950 --> 00:03:20.480
collegarlo al proprio cluster o

00:03:20.480 --> 00:03:22.535
al mio stesso cluster ed eseguirlo di nuovo.

00:03:22.535 --> 00:03:24.800
Utilizziamo anche blocchi appunti
in altri modi.

00:03:24.800 --> 00:03:27.485
Qui, abbiamo qualcosa
chiamati libri di Giove.

00:03:27.485 --> 00:03:30.710
Questa è una lista di fondamentalmente Notebook

00:03:30.710 --> 00:03:34.130
che era stato compilato insieme
in un formato di pagina capitolo.

00:03:34.130 --> 00:03:37.775
Quindi qui abbiamo un SQL
corso sui servizi Server ML,

00:03:37.775 --> 00:03:40.985
che viene mostrato attraverso i blocchi appunti.

00:03:40.985 --> 00:03:43.070
Quindi abbiamo tutti i
documentazione presente.

00:03:43.070 --> 00:03:46.445
Abbiamo gli esempi di codice
qui e poi si può,

00:03:46.445 --> 00:03:47.780
alla fine di ogni capitolo,

00:03:47.780 --> 00:03:49.730
o ha colpito il prossimo
per passare alla

00:03:49.730 --> 00:03:52.400
uno o utilizzare questo capitolo
browser per selezionarlo.

00:03:52.400 --> 00:03:54.965
Abbiamo anche il
libro di supportabilità

00:03:54.965 --> 00:03:57.255
per SQL Server 2019
Cluster di Big Data.

00:03:57.255 --> 00:03:59.210
Se ho portato il
comando pilota e pick

00:03:59.210 --> 00:04:01.160
questo libro Giove 2019 guida,

00:04:01.160 --> 00:04:03.035
questo è quello che uso per aprire questo.

00:04:03.035 --> 00:04:05.960
Qui, abbiamo tutte le
informazioni che si potrebbe

00:04:05.960 --> 00:04:08.885
bisogno al fine di sostenere
il tuo nuovo Cluster di Big Data,

00:04:08.885 --> 00:04:11.585
un sacco di Comandi Kubernetes,
le informazioni sul cluster.

00:04:11.585 --> 00:04:13.565
Questo è qualcosa che si può correre,

00:04:13.565 --> 00:04:14.735
puoi inviare a qualcun altro,

00:04:14.735 --> 00:04:17.065
ed è possibile salvare e
fare quello che vuoi con.

00:04:17.065 --> 00:04:21.140
Quindi siamo molto entusiasti
Blocchi appunti in Azure Data Studio.Notebooks in Azure Data Studio.

00:04:21.140 --> 00:04:23.210
Pensiamo davvero che questo
è qualcosa che sarà

00:04:23.210 --> 00:04:26.210
molto utile alla nostra comunità.

00:04:26.210 --> 00:04:28.040
Siamo davvero interessati
nel scoprire come

00:04:28.040 --> 00:04:29.765
lo stai usando e
quello che vuoi da noi.

00:04:29.765 --> 00:04:32.800
Quindi, se siete interessati a
imparare di più, andare a GitHub,

00:04:32.800 --> 00:04:34.610
cercare Azure Data Studio e si

00:04:34.610 --> 00:04:37.120
può aprire la funzione
richiedere bug tra.

00:04:37.120 --> 00:04:39.470
È anche qui che
possibile scaricare sia il

00:04:39.470 --> 00:04:51.991
stabile e l'aggiunta di addetti ai lavori.
Grazie mille per il vostro tempo.

00:04:51.991 --> 00:04:57.040
>> [MUSICA]

