呈現數據背后的故事--典型BI可視化技術綜述

2020-06-14 08:43

商業智能(Business Intelligence,簡稱BI)從技術層面講就是綜合運用現代數據倉庫技術、線上分析處理技術、數據挖掘和數據展現技術等進行數據分析;從實際應用角度上看,它將企業內部或者競爭對手的數據收集整理、進行分析和處理,將其轉化成知識、分析和結論,從而幫助決策者做出正確決策,提升企業決策質量。因此,商業智能實質上是數據轉化為信息的過程,這一過程也可稱為信息供應鏈,其核心目的就是把初始的操作型數據變成決策所使用的商業信息。

然而,商業信息與各級決策者之間還存在一條認知理解的天塹,如何變通途,這就需要商業智能可視化技術。

隨著大數據的興起,在商務智能領域逐漸催生了幾類特征鮮明的信息類型,主要包括文本、網絡或圖及多維數據等。如何實現這些與大數據密切相關的信息類型可視化就成為當今商務智能可視化技術的研究熱點。

 

一、文本可視化

文本信息是非結構化數據類型的典型代表,是互聯網中最主要的信息類型。文本可視化的意義在于,能夠將文本中蘊含的語義特征(如詞頻與重要度、邏輯結構、主題聚類、動態演化規律等)直觀地展示出來。文本可視化的主要技術包括:

1. 基于詞匯的文本可視化--通過對文本中詞匯的不同呈現,展現文本的特征。

2. 基于篇章內容的文本可視化--在詞匯可視化的基礎上,通過標注、計算、統計、推斷等技術手段,發現文章中特定的隱含語義關系。

3. 基于時間序列的文本可視化--引入時間軸概念,針對文本的時間關系進行可視化研究。

4. 基于主體領域的文本可視化--從大規模文本中發現特定的一個或者多個主題領域,并反映主題領域之間的關系。

 

二、網絡可視化

網絡關聯關系是大數據中最常見的關系。層次結構數據也屬于網絡信息的一種特殊情況?;诰W絡節點和連接的拓撲關系,直觀地展示網絡中潛在的模式關系,例如節點或邊聚集性,是網絡可視化的主要內容之一。而大數據背景下對各類大規模復雜網絡如社會網絡和互聯網等的演化規律的探究,將推動復雜網絡的研究方法與可視化領域進一步深度融合?,F有的網絡可視化應用有600多種,可以采用不同指標對其進行分類,如任務主題、可視方法等。目前比較典型的分類方法是Ben Schneiderman 提出的按照網絡節點的布局方法進行分類:

1. 力導引布局--基本思想是將網絡看成一個頂點為鋼環、邊為彈簧的物理系統,系統被賦予某個初始狀態以后,彈簧彈力(引力和斥力)的作用會導致鋼環移動,這種運動直到系統總能量減少到最小值時停止。

2.地圖布局--該類方法能夠產生用戶極易理解的網絡布局,它以一幅世界(大洲、國家、省或市)地圖作為背景,根據網絡節點的地理坐標將其布局在背景圖上,然后根據節點間的連接關系繪制網絡邊。

3.圓形布局--該方法在圓心放置一個或一組節點,在同心圓周上按順序布局其余節點.它能利用通過圓心的十字線產生優良的布局。

4.相對空間布局--該方法以“參照體”的空間位置為基礎,根據網絡各節點與“參照體”的關系計算其坐標。

5.聚類布局--該方法根據節點的屬性及相互間的連接關系,通過人機交互或應用算法(如MDS、自組織網絡(SOM)和Sam/lion映射等)來聚類分組網絡節點。

6.時間布局--該方法的基本原理是根據節點的時間屬性對其進行排布,其典型布局是將歷史節點排列在屏幕頂(左)端,當前節點擺放在屏幕底(右)端。同一時間的節點放置在同一排(列)。

7.層布局--該方法首先根據節點的分類屬性將屏幕劃分為幾個區域,然后在對應的區域中布局網絡節點。

電話咨詢
服務類型
在線咨詢
QQ客服
久久一日本综合色鬼综合色