04 - Analyse: Daten analysieren

Download this episode

Download Video

Description

In diesem Video analysieren wir die extrahierten Tweets ganz im Hadoop-Style. Zunächst erstellen wir einen HDInsight-Cluster. Daraufhin gehen wir auf eine Komponente des großen Hadoop-Ökosystem: Hive. Mit Hive-Abfragen lässt es sich einfach strukturierte Tabellen aus den unstrukturierten JSON-Twitter-Rohdaten erstellen. Im Hintergrund sehen wir, wie MapReduce-Jobs angestoßen werden.

Tag:

Big Data

Embed

Format

Available formats for this video:

Actual format may change based on video formats available and browser capability.

    The Discussion

    Comments closed

    Comments have been closed since this content was published more than 30 days ago, but if you'd like to continue the conversation, please create a new thread in our Forums, or Contact Us and let us know.