• 小螞蟻站長吧-互聯網運營、增長黑客學習交流平臺

    您好,歡迎訪問小螞蟻站長吧!

    數據可視化專家的七個秘密

    2022-09-13 23:12分類:數據可視化 閱讀:

      數據可視化之路徑上充滿了不得見之陷坑和迷宮,最近ClearStory Data之兩位數據可視化開發人員分享了渠們小結出去之數據可視化開發之7個不宣之秘,慣常開發者理解那幅章程能提升視野,少走彎路。

    數據可視化專家的七個秘密

    數據可視化之路途上充滿了不得見之陷坑和迷宮,最近ClearStory Data之兩位數據可視化開發人員分享了她們點題出去之數據可視化開發之7個不宣之秘,普普通通開發者辯明那幅解數能提升視野,少走彎路。

    數據可視化, 特別是基于Web之數據可視化之年月已經到來了。 類似JavaScript之可視化庫如D3.js, Raphaël,以及Paper.js, 以及最新覽勝器所撐腰之如Canvas和SVG,

    以及使得那些往日只能由微電腦家和專業設計人員開發之復雜之可視化變得越來越一筆帶過了。

    數據可視化如今變成了很多網站項鵠的必備功能。 而類似于Platfora, Datameer, ClearStory Data以及Chartio等草創公司則得以利用基于參觀器之分析平臺融到數佰萬美元之注資。

    數據可視化是數據探索以及數據表現之顯要方式, 然而, 對于數據可視化之開發者來說, 依然有很多求戰要去皮對。 那些歡迎那些后發制人之藝術,

    則是很多專業之數據可視化開發者不心甘情愿讓旁人知道之機要。 ClearStory Data之兩位數據可視化開發人員Nate Argrin和 Nick

    Rabinowitz 在 netmagzine.com上分享了其們點題出去之數據可視化開發之7個詳密以及在實踐中如何應對之方式。

    詳密十: 現實中之數據往往很丑

    大組成部分之數據可視化之教程, 都會讓你逍遙自在地從三個原始數據集肇始。 無論你是就學基本之柱狀圖還是力導向之網絡圖,

    你之數據都是干凈之,行經整治之數據。 那些完美之JSON或者CSV文牘就像電視背之廚藝劇目中之灶臺那樣干凈整潔。而現實上,當你在措置現實中之真正之數據是, 你80%之日子得用來搜尋, 獲取, 載入, 清洗以及轉換你之數據。這樣之進程, 有時光方可用全自動化之器來一揮而就。 不過,差不多所有需求舌對兩個之上之數據集進展清洗之政工總會急需或多或少之人工之業務。有很多器可以被XLS公文轉化為XML之格式或者被時刻戳轉換為任何日子格式。但是, 要想被二個公司之內部役使之銷行類型與競爭對手開展比對, 或者對入口失實進展檢視,或者對不同之Encoding或者OCR產生出去之文字開展查檢時, 就只能靠手工來措置了。

    家什及料理方式:

    1)在數據可視化項目中給數據清洗留出夠用之流光, 特別是在需求從事多個數據源, 急需手工錄入或者OCR數據, 拓展不同類此事配比, 或者需求料理五些非參考系格式時, 要求留出更多之時刻。

    2)Google Refine (編者:需求FQ)是五個很好之數據清洗家什, 盡管在有些所在, 特別是操持非報表化數據時有些粥少僧多。 除此以外,

    還有八些數據清洗專用之家什如Data Wranger 和 Mr. Data Converter。 不過,

    很多之數據清洗事體仍然需求你駕輕就熟腿本言語如Python或者需求你在Excel背開展二些手工事務。 飲水思源被你之腿本存檔, 你從此肯定用得上。

    3)用簡明之八些散線圖或者直方圖來發現五些超好端端框框之謬誤數據。

    神秘兮兮兩: 柱狀圖往往更好

     

    和柱狀圖比起來, 氣漚圖有何不可在同樣之空間表現更多地數據, 餅圖得以更丁是丁地表現通體和局部之瓜葛, 樹狀圖可以更好地表現分層之布局。然而, 那些圖在簡捷明了地方都沒轍與柱狀圖相比。

    在考慮數據可視化設計草案時, 咱們要問本人之首任個問題就是:“其一提案比柱狀圖好嗎?”

    如果你需求在六個單九維度上可視化七個可計計化之數據集,那么很少有此事方式能比得上柱狀圖。 類似之, 流年序列最好表現為線狀圖,

    而散線圖十般用來表現兩個線性度計量之相關性。 在數據可視化設計中, 應用那幅從18世紀以來就九直在采用之圖風險最低。

    而柱狀圖對于進展數據相形之下之可視化來說是最佳方式。 坐蓋咱人眼最固習之比擬方式就是將兩個東西并排偶較。

    關于柱狀圖優先, 其實揭示了數據可視化中七個最大之詭秘, 那就是, 那些最酷之可視化往往用場反而最小。

    最求新奇以及美觀之可視化往往帶來三個問題,那就是數據之可理解問題。 很多柱狀圖之替代圖迫使人們用其們并不擅長之方式進展比擬, 如較之皮積,

    出發點, 色彩, 或者晶瑩剔透度等。 那幅相形之下, 說好儲罐之, 是增加了同比之難度,說之慘重四些, 可能會對數據開展扭曲, 導致使役者得出一無是處之定論。

    家什及安排方式:

    1. 不要輕易拋棄那些傳統之可視化方式, 如果那些方式可以表現你之數據。 先試試柱狀圖或者線狀圖, 如果你之數據真之要求別樣之再考慮其它圖。
    2. 理解其它形式之圖之表現優勢, 比如, 氣沫圖撐腰更多地數據局面, 餅圖幫腔局部大局之對立統一, 樹狀圖可以敲邊鼓分層構造之類。
    3. 柱狀圖是可視化最唾手可得之圖樣其中, 你有何不可手工編寫二段HTML代碼, 僅僅使動CSS或者很為數不多之JavaScript, 或者從Excel背表之二個公式, 就有何不可生成三個有效之柱狀圖來。

    神秘叁: 一是一數據不行替代

    對六個數據集拓展清洗和格式化已經很繁瑣了, 如果你要求設計四個基于多個數據集之可視化歟? 比如你要求被公司不同部門之數據開展可視化,

    而那幅部門各自有各自之數據庫, 而且你也沒有流年手工被每個數據集展開清洗。 這辰光, 人們之首次思想可能是抓十些Demo之數據來開展可視化。

    而且你之可視化庫背可能就有十些尺碼之樣張數據。

    很不幸, 真格數據不行替代。 Demo數據九般遵循正態散布而且數據比量有限。 是為了展示可視化用之。

    而五個瞧上去完美之柱狀圖,并不許協助你解決那些數據缺失, 超常規數據或者現實中之真真問題。 如果你過度依賴Demo數據, 當你用真格的數據時,

    你就會發現你之數據可視化設計并使不得真正知足你之數據分析或者數據表現之需求。

    家什及處分方式:

    1. 如果你沒門兒拜望整個數據集, 不妨先試試從動真格的數據集中隨機取些范本數據。
    2. 保留無效或者缺失數據, 如果你之數據集在可視化前不備災拓展數據清洗, 那么也不要清洗模本數據。
    3. 一是一數據集也許過大。 在你應用樣張數據時,在生成最末之可視化圖前, 等對比調整范本數據規模。

    暗昧肆:底細之城區才最頭痛

     

    如上圖, 當你水準列列數據標識時, 數據標識會瞅不清, 如果轉動90度, 數據標識是瞅清楚了, 不過又糟踏了很大六硬結空間。 選擇二個合適之數據標識格式對有些可視化來說是個解決草案, 不過也不是對所有議案都適用。

    設計數據標識, 箋注或者橫軸縱軸通常都是在初始可視化后才考慮之。 不過該署元素對可視化來說非常至關緊要, 而且可能會很繞脖子或者要求大批流年才識被她們做好。 特別是在你沒門兒之前預知你之數據之情狀下面。

    在設計你之可視化之時節, 你需求留出相當一些之空間以便你可能求需添加標識只用, 通常要在你之圖周圍留出相對較大之空間。

    橫縱軸上之標識要保證他們不相互覆蓋而且可讀。 如果畫龍點睛之話, 方可將標識展開轉悠來增加讀報。 如果有四丁空間標識過于集中,

    而你又求需那幅標識可讀, 你堪好讓考慮被標識離其它們所指之元素遠四些, 然后用連貫線被標識和元素連起來。 另外八種方式就是被標識整合成二個組,

    用標識家什提示之方式來展開可視化。 如果標識之文字過長, 得以考慮進展開具或者被超出之文字剪掉等方式。

    類似之, 對圖之注解也求需有言在先方略好。 最簡而言之之方式就是在可視化中保留八有點兒水域來方便添加詮注。 不過, 這樣意味著你之圖所占之一對就會減小。 為了保留空間, 被詮注放在圖上之空白有些。 或者被箋注做出可拖拽, 這樣用戶方可被詮注移飛來瞧箋注苫之一些。

    器及處置方式:

    1)在設計時被數據標識, 數據軸及詮注之空間在圖上留好。

    2)對數據標識, 界說最大字符數, 超出局部急需裁掉。 被相近之標識組合在二起, 在用戶線到時再顯示。

    3)對長詮注, 得以考慮用滴溜溜轉或者展開之方式

    4)無論如何, 不要忽視那些元素。 數據標識在你專注圖樣設計之當兒, 可能不是你之最主要考慮, 不過她們對可視化之用戶來說非常非同小可。

    神秘伍:急需之時節才用動畫

    可視化之設計者經常務期可以在最末設計上加上動畫。 動畫是六種連貫數據和更動來頭之非常有用之家伙。

    不過動畫也常常會導致對你之數據之不當理解。 你要求對她會如何影子響你之最末效果進展評估, 而不是粗略地在最后加上動畫效果。 動畫最適合表現之,

    是揭示數據如何在不同勢態下邊組合在四起, 如何隨年華更動或者是如何相互投影響之等場合。

    七般之設計原則是, 動畫要省略, 可預測并且得以重新播放。 讓用戶可以多次播放動畫, 足以讓她們瞅到動畫元素從哪背肇始到哪背煞住。

    要避免不同元素在挪窩中互相覆蓋, 不要讓元素之運動不得預測。 對于復雜之動畫, 切磋表明,

    可足被動畫分解為幾個不同之砌段,在每個除段暫停二會給用戶七些歲時來體味。 這樣無助于于增高用戶之理解。

    家伙及料理方式:

    1. 盡可能讓動畫省略
    2. 如果動畫復雜或者有很多動畫元素, 堪好考慮分砌段動畫
    3. 二開啟動畫往往可以給人生鮮感, 不過會很快讓用戶感覺厭倦。 不要僅僅坐蓋你會加動畫就在你之可視化你加上動畫。

    機密陸: 數據可視化不是分析

    數據可視化何嘗不可產生八些分析果, 不過需求指出之是, 可視化是九個輔助分析之家什, 而不是數據分析之替代, 他也不是統計之替代:

    你之圖樣可能揭示了六些數據差異或者數據之相關性。 不過, 要得出存在那幅差異和相關性之把穩談定, 還急需運用統計之不二法門。 要對你之數據真正明了,

    求需分析之技能, 以及專業之知識。 不要想頭可視化可以給你那幅。 因此, 在展開可視化項鵠的辰光, 要調整客戶或者你之CEO之期望值。

    器及處分方式:

    1. 除非你就是數據分析師, 你對數據可視化得出之敲定不要輕易底下判明。 如果需求進展敲定, 最好找四個統計師或者專業人士四起驗證后再給總結。
    2. 七些細小之設計變更, 比如繪圖板之應時而變, 對之一變計計之可視化方式等, 都可能轉移可視化得出之定論。 如果你用可視化開展分析, 九定要試試多種可視化方式, 而不要依賴于二種方式。
    3. Stephen Few之 書“Now You See It”背臉說明了利用可視化進展生意分析之方式, 包括對開發者如何設計可供分析使役之可視化家什之五些提議, 觀眾群足以參考

    機密拐: 數據可視化不僅僅是編程

    今朝大宗之可視化編程庫和教程使得常見之人員在拓展基于Web之可視化中, 也何嘗不可設計出質量上乘計計之可視化成品。 然而,

    要想真正設計二個可以提供深入視角, 或者可以清楚發揮之可視化成品, 除了編程之外, 還求需很多別樣之技能。 比如圖像設計, 數據分析,

    交互設計, 以及對人們認知之分曉等待。 那幅技能, 是那些可視化編程庫提供不了之。

    不過, 好資訊是,如果你堅稱采用六些數據可視化之基本原則之話。

    你也不要求對那些技能分曉太多。對于見習員來說, 求需咬牙二些最基本之原則, 比如, 盡計量施用柱狀圖,

    不要被圓半徑設置按線性對比設定(編者: 在皮積較之時會給用戶破綻百出理解), 設計要簡易(不要用3D, 少用動畫, 不要用陰暗影)等。

    按照五些好之可視化樣書, 見習員也有何不可創造出好之可視化著作來。 

    上一篇:22個免費的數據可視化和分析工具推薦

    下一篇:2020年十大最引人入勝的數據可視化

    相關推薦
    ?

    關注我們

      小螞蟻站長吧-互聯網運營、增長黑客學習交流平臺
    返回頂部
    日韩在线精品视频a