熱圖
熱圖(英語:heat map)在二維空間中以顏色的形式顯示一個現象的絕對量,是一種數據視覺化技術。顏色的變化可能是通過色調或強度,給讀者提供明顯的視覺提示,說明現象是如何在空間上聚集或變化的。熱圖有兩種完全不同的類別:聚集熱圖和空間熱圖。在聚集熱圖中,幅度被排列成一個固定儲存格大小的矩陣,其行和列是離散的現象和類別,行和列的排序是有意的,而且有些隨意,目的是暗示聚集或描繪出通過統計分析發現的聚集。儲存格的大小是任意的,但足夠大,可以清晰可見。相比之下,空間熱圖中某一量級的位置是由該量級在該空間中的位置所決定的,沒有單元的概念,現象被認為是連續變化的。
雖然「熱圖」是一個新興的詞彙,但是用明暗的矩陣來標示元素的方法已經有超過一世紀的歷史了。[1]
歷史
熱圖起源於數據矩陣中數值的二維顯示。較大的數值用深灰色或黑色的方格(像素)呈現,較小的數值用較淺的方格表示。Loua (1873)使用明暗矩陣來視覺化巴黎各區的社會統計數據。[1] Sneath (1957)通過將矩陣的行和列進行換位,將相似的數值按照聚類的方式放在彼此附近,來顯示聚類分析的結果。Jacques Bertin使用類似的表示方法來顯示符合累積量表的數據。將聚類樹連接到數據矩陣的行和列的想法起源於1973年的Robert Ling。Ling使用印表機上的字元來表示不同的灰度,每個像素一個字元寬度。Leland Wilkinson在1994年開發了第一個用高解像度彩色圖形繪製聚集熱圖的電腦程式(SYSTAT)。
軟件設計師Cormac Kinney在1991年註冊了「熱圖」一詞的商標,用來描述描述金融市場資訊的二維顯示。[2] 2003年收購Kinney發明的公司無意中讓該商標失效。[3]
類型
熱圖有不同的種類:
- 生物學熱圖在分子生物學中通常用於表示從DNA微陣列中獲得的許多基因在一些可比樣本(如不同狀態的細胞、不同患者的樣本)中的表達水平。
- 樹圖是數據的二維層次劃分,在視覺上類似於熱圖。
- 拼貼圖(Mosaic plot)是表示雙向或多向數據表的平鋪熱圖。與樹圖一樣,拼貼圖中的矩形區域是分層組織的。這意味着這些區域是矩形而不是正方形。Friendly (1994)調查了該圖的歷史和使用情況。
- 密度函數視覺化是一種用於表示地圖中點的密度的熱圖。它使人們能夠感知點的密度,而不受縮放係數的影響。Perrot et al. (2015)提出了一種使用密度函數的方法,利用Spark和Hadoop的大數據基礎設施來視覺化數十億和數十億的點。[5]
配色
可以使用許多不同的配色方案來說明熱圖,每種方案都有感知上的優勢和劣勢。彩虹色彩對映經常被使用,因為相比於灰度的差異,人類更容易感知色彩的明暗,據稱這將增加圖像中可感知的細節數量。然而,科學界的許多人並不鼓勵這樣做,原因如下:[6][7][8][9][10][11]
- 這些顏色缺乏在灰度或黑體光譜彩色圖中發現的自然感知排序。[6][11]
- 常見的色彩對映(如許多視覺化軟件套件中預設的「jet」色彩對映)在亮度方面的變化不受控制,這使得在顯示或印刷時無法有意義地轉換為灰度。這也會分散對實際數據的注意力,使黃色和青色區域看起來比實際最重要的數據區域更突出。[6][11]
- 顏色之間的變化也會導致人們感知到實際並不存在的漸變,使實際的漸變不那麼突出,這意味着彩虹色圖在很多情況下實際上會掩蓋細節,而不是增強細節。[6][10][11]
- 彩虹色彩對映中並不是所有的顏色都能被色覺障礙的讀者區分,這使得相當一部分人無法使用這些顏色方案的圖表。[11]
面量圖與熱圖的對比
面量圖有時被誤稱為熱圖。面量圖的特點是在地理邊界內有不同的陰影或圖案,以顯示感興趣的變數的比例,而熱圖(在地圖上)的顏色變化與地理邊界並不能對應上。[12]
軟件實現
有幾種熱圖軟件可免費使用:
- R是一個免費的統計計算和圖形軟件環境,它包含了幾個跟蹤熱圖的功能,[13][14] 包括互動式聚集熱圖[15](通過heatmaply (頁面存檔備份,存於互聯網檔案館) R語言套件)。
- Gnuplot是一個通用的免費命令列繪圖程式,可以跟蹤2D和3D熱圖。[16]
- Google Fusion Tables可以從Google Sheets電子試算表中生成熱圖,限制在1000點的地理數據。[17]
- Dave Green的'cubehelix'配色方案提供了一種配色方案的資源,這種配色方案可以在黑白postscript裝置上列印成單調增加的灰度。[18]
- Openlayers3可以在向量圖層中彩現所有地理特徵的選定屬性的熱圖層。[19]
- D3.js[20][21]、AnyChart[22][23]和Highcharts[24][25]是用於數據視覺化的JavaScript庫,它們提供了建立互動式熱圖圖表的能力,從基本的到高度客製化的,都是其解決方案的一部分。
- Qlik Sense允許在熱圖中以顏色模式顯示比較數據,這包含在其視覺化捆綁中。[26]
- MATLAB提供了熱圖視覺化的能力,具有多種組態選項。[27][28]
例子
參見
參考文獻
- ^ 1.0 1.1 Wilkinson L, Friendly M. The History of the Cluster Heat Map. The American Statistician. May 2009, 63 (2): 179–184. CiteSeerX 10.1.1.165.7924 . S2CID 122792460. doi:10.1198/tas.2009.0033.
- ^ United States Patent and Trademark Office, registration #75263259. 1993-09-01 [2019-08-14]. (原始內容存檔於2013-05-11).
- ^ Silhavy R, Senkerik R, Oplatkova ZK, Silhavy P, Prokopova Z. Software Engineering Perspectives and Application in Intelligent Systems. 2016-04-26 [2019-08-14]. ISBN 978-3-319-33622-0. (原始內容存檔於2021-01-20).
- ^ MH370 – Definition of Underwater Search Areas (PDF) (報告). Australian Transport Safety Bureau. 3 December 2015 [2021-04-04]. (原始內容存檔 (PDF)於2021-04-12).
- ^ Perrot A, Bourqui R, Hanusse N, Lalanne F, Auber D. Large interactive visualization of density functions on big data infrastructure (PDF). 2015 IEEE 5th Symposium on Large Data Analysis and Visualization (LDAV). 2015: 99–106 [2021-04-04]. ISBN 978-1-4673-8517-6. S2CID 4768931. doi:10.1109/LDAV.2015.7348077. (原始內容存檔 (PDF)於2019-05-03) (英語).
|journal=
被忽略 (幫助) - ^ 6.0 6.1 6.2 6.3 Borland D, Taylor MR. Rainbow color map (still) considered harmful. IEEE Computer Graphics and Applications. 2007, 27 (2): 14–7. PMID 17388198. doi:10.1109/MCG.2007.323435.
- ^ How NOT to Lie with Visualization (頁面存檔備份,存於互聯網檔案館) – Bernice E. Rogowitz and Lloyd A. Treinish – IBM Thomas J. Watson Research Center, Yorktown Heights, NY
- ^ Harrower M, Brewer CA. ColorBrewer.org: An Online Tool for Selecting Colour Schemes for Maps. Dodge M, Kitchin R, Perkins C (編). The Cartographic Journal. 2003: 27–37. ISBN 978-0-470-98007-1. S2CID 140173239. doi:10.1179/000870403235002042.
- ^ Green DA. A colour scheme for the display of astronomical intensity images. Bulletin of the Astronomical Society of India. 2011, 39: 289–95. Bibcode:2011BASI...39..289G. arXiv:1108.5083 .
- ^ 10.0 10.1 Borkin MA, Gajos KZ, Peters A, Mitsouras D, Melchionna S, Rybicki FJ, et al. Evaluation of artery visualizations for heart disease diagnosis. IEEE Transactions on Visualization and Computer Graphics. December 2011, 17 (12): 2479–88. CiteSeerX 10.1.1.309.590 . PMID 22034369. S2CID 2548700. doi:10.1109/TVCG.2011.192.
- ^ 11.0 11.1 11.2 11.3 11.4 Crameri F, Shephard GE, Heron PJ. The misuse of colour in science communication. Nature Communications. October 2020, 11 (1): 5444 [2021-04-04]. PMC 7595127 . PMID 33116149. doi:10.1038/s41467-020-19160-7. (原始內容存檔於2021-01-27).
- ^ Choropleth vs. Heat Map –. gretchenpeterson.com. [2021-04-04]. (原始內容存檔於2020-08-19).
- ^ Using R to draw a heat map from Microarray Data. Molecular Organisation and Assembly in Cells. 26 Nov 2009 [2021-04-04]. (原始內容存檔於2010-04-30).
- ^ Draw a Heat Map. R Manual. [2021-04-04]. (原始內容存檔於2020-04-18).
- ^ Galili T, O'Callaghan A, Sidi J, Sievert C. heatmaply: an R package for creating interactive cluster heatmaps for online publishing. Bioinformatics. May 2018, 34 (9): 1600–1602. PMC 5925766 . PMID 29069305. doi:10.1093/bioinformatics/btx657.
- ^ Gnuplot demo script: Heatmaps.dem. [2021-04-04]. (原始內容存檔於2017-11-07).
- ^ Fusion Tables Help - Create a heat map. Jan 2018 [2021-04-04]. (原始內容存檔於2019-11-16). support.google.com
- ^ Dave Green's 'cubehelix' colour scheme. [2021-04-04]. (原始內容存檔於2021-04-14).
- ^ ol/layer/Heatmap~Heatmap. OpenLayers. [2019-01-01]. (原始內容存檔於2020-04-18).
- ^ Heatmap. D3.js Graph Gallery. [25 July 2020]. (原始內容存檔於2021-03-09).
- ^ Most basic heatmap in d3.js. D3.js Graph Gallery. [25 July 2020]. (原始內容存檔於2020-07-25).
- ^ Heat Map Chart. AnyChart Documentation. [25 July 2020]. (原始內容存檔於2020-11-29).
- ^ Heat Map Charts - Gallery. AnyChart Gallery. [25 July 2020]. (原始內容存檔於2019-12-09).
- ^ Heatmap - Highcharts docs. Highcharts. [9 December 2019]. (原始內容存檔於2020-11-12).
- ^ Heat and tree maps - Highcharts demos. Highcharts. [9 December 2019]. (原始內容存檔於2021-04-01).
- ^ Heatmap chart - Qlik Sense on Windows. Qlik. [25 July 2020]. (原始內容存檔於2020-07-25).
- ^ Create heatmap chart. MATLAB. [25 July 2020]. (原始內容存檔於2021-01-20).
- ^ Heatmap Examples. MATLAB. [25 July 2020]. (原始內容存檔於2020-07-25).
延伸閱讀
- Bertin J. Sémiologie Graphique. Les diagrammes, les réseaux, les cartes [Graphic semiotics. Diagrams, networks, maps]. Gauthier-Villars. 1967. OCLC 2656278 (法語).
- Eisen MB, Spellman PT, Brown PO, Botstein D. Cluster analysis and display of genome-wide expression patterns. Proceedings of the National Academy of Sciences of the United States of America. December 1998, 95 (25): 14863–8. Bibcode:1998PNAS...9514863E. PMC 24541 . PMID 9843981. doi:10.1073/pnas.95.25.14863.
- Friendly M. Mosaic Displays for Multi-Way Contingency Tables. Journal of the American Statistical Association. March 1994, 89 (425): 190–200. JSTOR 2291215. doi:10.1080/01621459.1994.10476460.
- Ling RL. A computer generated aid for cluster analysis. Communications of the ACM. 1973, 16 (6): 355–361. S2CID 8033024. doi:10.1145/362248.362263.
- Sneath PH. The application of computers to taxonomy. Journal of General Microbiology. August 1957, 17 (1): 201–26. PMID 13475686. doi:10.1099/00221287-17-1-201 .
- Wilkinson L. Advanced Applications: Systat for DOS Version 6. SYSTAT. 1994. ISBN 978-0-13-447285-0.
- Barter RL, Yu B. Superheat: An R package for creating beautiful and extendable heatmaps for visualizing complex data. Journal of Computational and Graphical Statistics. 2018, 27 (4): 910–922. PMC 6430237 . PMID 30911216. arXiv:1512.01524 . doi:10.1080/10618600.2018.1473780.
外部連結
- Wilkinson L, Friendly M. The History of the Cluster Heat Map (PDF). [2021-04-04]. (原始內容存檔 (PDF)於2021-01-17).
- Albergotti R. Strava, Popular With Cyclists and Runners, Wants to Sell Its Data to Urban Planners. The Wall Street Journal. May 7, 2014 [2021-04-04]. (原始內容存檔於2019-11-02).