SharePoint 文件庫大數據分析 - Hadoop + RBS

Play SharePoint 文件庫大數據分析 - Hadoop + RBS
Sign in to queue

Description

SharePoint 由於在文件管理上具有市場領先地位,因此被許多企業用來建置內部的文件管理平台,日積月累之下,有些企業所具有的文件庫容量已經達到了以 TB 計算大小的程度。
而相對於 SharePoint 在知識管理上的應用,知識庫的累積速度和大小遠低於文件庫,除了兩者目的不同之外,知識庫的內容重視質量並進,因此對於內容需要更結構化的資訊來達到知識再應用的目的。
然而,文件管理平台中的大量文件其實就是一個大金礦,隨著 Big Data 數據分析技術的大量應用,文件管理平台中的文件經過淬煉,就能成為對企業有價值的知識文件
本課程將介紹如何透過 Hadoop 的分散式運算大量非結構化資料的能力,把SharePoint文件庫中的文件根據關鍵字的計算結果進行分類,定義出各種知識文件的Metadata,將文件庫直接轉為知識庫
應用到的相關技術包含: Hortonworks Data Platform (HDP), SharePoint Remote Blob Storage (RBS)。

Download:

Slides

Day:

2

Level:

300

Session Type:

Breakout

Code:

OFC315

Embed

Download

Download this episode

Download:

The Discussion

Add Your 2 Cents