• 小螞蟻站長吧-互聯網運營、增長黑客學習交流平臺

    您好,歡迎訪問小螞蟻站長吧!

    平行坐標系:高維數據可視化分析的必備殺手锏

    2022-11-05 00:00分類:數據分析 閱讀:

     

    編者導語:數據可視化并不是簡單易行的把數據變成圖表,而是以數據為視角,瞧待全球,換句話說,數據可視化的客體是數據。如果可以很好的運用挺括坐標系,便能高效地展開高維數據可視化分析。

    今天聊聊一種不太常見但又挺好用的可視化圖樣:挺起坐標系。

    關于數據可視化,咱們很久之前分享過Excel幼功圖表以及Excel進階圖表,都是Excel幫腔的俺們常用的一些圖表論理。今天分享一個數據人應有見過但是不這就是說熟稔的圖片:筆挺坐標系(Parallel Coordinates)。

    一、界說及適用場景

    首先,聊聊挺起坐標系的一些通體概述始末。

    1. 底蘊界說

    挺起坐標系,是一種含有多個垂直筆挺坐標軸的統計圖表。每個垂直坐標軸示意一個字段(維度),每個字段(維度)又用刻度來標明范疇,如下示例圖。

    平行坐標系:高維數據可視化分析的必備殺手锏

    這樣,一個多維的數據可足很不費吹灰之力地在每一條軸上找到“落點”,從而接入起來,形成一條折線。隨路數據加碼,折線墩摞,分析者則有可能從中發現特性和常理,比如發現數據之間的聚類瓜葛。

    2. 羅曼史發展

    大約在一佰窮年累月前,就已經有人運用挺起坐標,來對復雜風波做可視化。

    平行坐標系:高維數據可視化分析的必備殺手锏

    在20世紀70年間,作為一種統計圖表,筆挺坐標系被特拉維夫大學的Alfred Inselberg戰線發展起來。

    3. 適用場景

    筆挺坐標圖最適用來多維數據(尤其是維度大于3個時,3個之內的維度得以用散點圖)的分析和比起。例如,多個教程、多個考績指標、多個樞紐參數等。

    當然,前提是用來比擬的目標都具有該署維度。比如,一個經典著作的案例(下文中的場景案例2),是用筆挺坐標系來可比全球各國面的在性能上的差異。對于空中客車而言,那幅維度是共有的(包括耗油計計、汽缸數、加速度等等),因而適合比擬。

    貳、圖表不厭其詳論理

    俺們以一個例子,理解一下圖表的數據論理。

    例如,某輔導員想分析班級學生的優劣勢科目,以及每個學生的偏科情狀。下頭是具體數據表:

    平行坐標系:高維數據可視化分析的必備殺手锏

    做完筆挺坐標圖后:

    平行坐標系:高維數據可視化分析的必備殺手锏

    挺起坐標系的每個坐標軸,很可能有不同的數據局面,這一點很甕中捉鱉造成讀者群誤解。作圖時,最好顯著標明每一根軸上的最小值、最大值。

    應用挺括坐標系時,如何確認軸的順序,是得以人為定案的。一般來說,順序會靠不住讀看的感知和論斷。兩根坐標軸隔得越近,人們對貳者的對照就感知地越強烈。因此,要得出最合適、美觀的進序方式,往往需求駛過多次的實驗和同比。反過來講,試行不同的趟布方式,也可能無助于于得出更多的斷語。

    叁、與任何圖表的干涉

    下邊咱們瞅一瞧挺括坐標系和另一個比擬相似的圖表的對照。

    1. 與折線圖

    筆挺坐標系與折線圖完全不同。

    平行坐標系:高維數據可視化分析的必備殺手锏

    折線圖的數據是通過日子組織起來的(每個數據點之間包含著韶華前后的干系),但挺括坐標軸并沒有年華序列,它的坐標軸是何嘗不可人為設定順序的,點與點之間也沒有因果瓜葛,折線并不代表勢頭。各條坐標軸之間也沒有因果干涉。

    2. 與桑吉圖

    桑吉圖在之前的 路徑分析 中有過說明。

    平行坐標系:高維數據可視化分析的必備殺手锏

    瞅著挺像的,但是桑吉圖有個至關重要的論理是:每個豎軸前后是有順序干涉的,而挺括坐標系沒有先后順序。

    因此,桑吉圖更多作為用戶路徑先后順序的分析,以及層系拆分的分析。

    3. 與無線信號圖

    其實,挺括坐標系和無線信號圖是最相近的。

    平行坐標系:高維數據可視化分析的必備殺手锏

    無線信號圖示意的是多個維度上的散布動靜,挺括坐標系也是。因此方可將挺起坐標系理解成無線信號圖的展開。大絕大多數情形下,這兩者無可置疑得以互換。

    肆、劣勢以及交互提升

    筆挺坐標系的弊端在于折線太多、瞅上去什分龐雜,過于凌亂。但挺起坐標系在料理多維數據上的優勢,仍然是其它統計圖難以比擬的。尤其是,當挺括坐標系配合交互功能施用時,其狀態值就會立刻顯現。

    最好的解決解數是加入交互——“Brushing”,用戶堪好通過“刷”的法子,在坐標軸上“刷”出她們想要探索的一對?;静僮魇?,用戶得以在每一根垂直坐標軸上“刷”出自己想要的規模,處于圈圈內的折線高亮,其余的呈灰度。這樣一來,俺們既足以瞅到所有折線墩沓出去的通體盛景,又得以自由定制想瞧的框框,有何不可說是“見樹又見林”。

    當然,交互的設計得以不限于此,比如下圖將挺起坐標系與報表做成起來,對于新型的數據集來說,會更加一目了然。

    平行坐標系:高維數據可視化分析的必備殺手锏

    除此以外,如下圖所示,也得以通過技巧將繁雜的折線“荮”在一起(Bundling Technique),這樣,人們的視覺就更能集中于起始的刻度。

    平行坐標系:高維數據可視化分析的必備殺手锏

    伍、典型案例

    最后,咱們瞧兩個典型的利用挺起坐標系的案例。

    1. 歷年全球500強溜名

    下圖下結論了1955-2010年來的全球伍佰強公司進名、收入和凈利潤情形。

    平行坐標系:高維數據可視化分析的必備殺手锏

    每一根豎軸代表一年的進名,通過將萬戶千家公司歷年的進名描點、連線,就形成了一條折線。雞標滑行時,相應的公司會高亮顯示,方便觀眾群探索它的興衰變通。例如上圖中,咱們瞅到美味可樂公司的溜名,盡管有所波動,但前后位于高位,并且穩中有升,在1994年達到巔峰,之后有所反彈。

    原文鏈接:https://fathom.info/fortune500/

    2. 出租汽車參數相對而言

    在挺起坐標系的眾多簡介中,幾乎都會涉及到斯是公共汽車的案例——數據包括上世紀70、80年歲的32款棚代客車,以及那些客車的氣缸數(cylinders)、引擎大?。╠isplacement)、每加侖汽油行駛的里程(MPG)、功率(horsepower)、毛重(weight)等等。

    平行坐標系:高維數據可視化分析的必備殺手锏

    從圖中(Evans, no date),咱們有何不可鮮明地瞅出一些干涉,例如從里程與氣缸數呈負相關、氣缸數與功率呈正相關。再比如,隨著流光發展,山地車越來越輕了。通過“Brushing”功能,還有更多新奇發現。

    關于筆挺坐標系,咱們就先說明那些吧。如果大家對可視化圖表感興味,背后我作為系列展開多分享分享。我覺得這種底子的數據成品以及數據分析的知識點,還是有畫龍點睛扎實掌握的。

    #專欄大作家#

    NK冬至,公眾號:首席數據社會科學家,人人都是成品協理專欄大作家。在金融圈子、電商園地有取之不盡數據及成品心得。擅長數據分析、數據成品等相關情節。

    正文原創發布于人人都是成品協理。未經許可,戒嚴轉載。

    題圖來自Unsplash,基于CC0協議。

    上一篇:【原創】關于“數據指標”的一些基本思考與見

    下一篇: 從0到1,搭建經營分析體系

    相關推薦
    ?
    返回頂部
    日韩在线精品视频a