初學者往往會被格式五花八門的 GIS 數據文件,弄得一頭霧水,每個軟件(ArcGIS、SuperMap、MapGIS等等)也都喜歡自己整一套數據格式,更想讓自己開發的數據結構成為標準,這些廠商為瞭達到商業目的各自為陣,給我們這些學習和使用者帶來瞭很多麻煩,增加瞭學習成本,數據互操作困難,這個軟件編輯的數據,那個軟件打不開。
有意思的是這種格式間的壁壘,卻讓有心之人嗅到瞭商機,從而很多格式轉換工具被開發出來,比如著名的 FME(Feature Manipulate Engine),支持100多種不同 GIS 空間數據格式之間的轉換,自然正版價格不便宜。
透過現象看本質,數據模型決定數據結構,數據格式又是根據數據結構設計的。就矢量數據模型來說,需要描述的無非是幾何實體(點、線、面)、空間關系、空間索引、空間參考、一般屬性等內容,所以無論是什麼數據格式的文件,基本都是在和上面這些信息打交道,有的格式可能註重於讀寫效率、有的可能沒有保存拓撲關系、有的可能註重數據壓縮。
柵格數據是將空間分割成有規律的網格,每一個網格稱為一個單元(像素),並在各單元上賦予相應的屬性值來表示實體的一種數據形式,它的數據結構較於矢量數據更加簡單瞭。各種數據格式的差異主要體現在壓縮方式、讀寫效率、元數據等方面。
下面就著重介紹一下幾種常見的格式:
矢量數據格式,如文章開頭的導圖所示,種類繁多,這裡隻介紹幾種常見、常用的格式,這幾個格式中大部分都和 GIS 第一大廠 ESRI 脫不開關系。
shapefile 可能是大多學 GIS 接觸最多也是接觸最早的數據格式之一,它是ESRI 提出的一種矢量數據格式,也是最被廣泛使用的矢量數據格式。目前,它已經是地理信息軟件界開放標準格式,也是一種重要的交換格式,能夠在ESRI與其他公司的產品之間進行數據互操作,如果一個 GIS 軟件不支持 shp,肯定會貽笑大方。需要註意的是 shapefile 不能存儲拓撲關系
一個 shapefile 文件至少有三個文件:
除此之外,還有一些可選文件:
每個 shapefile 文件隻能存儲一種幾何類型(或點、或線、或面)的數據,在 ArcCatalog 中瀏覽 shp 數據文件夾可以看到,文件名左側圖標清晰的標識出該 shp 所存幾何實體的文件類型。
46392b0aebcebb028a32e324130032fb
Esri 創建的一種采用標準關系數據庫技術來表現地理信息的數據模型。其具有結構和性能上的優勢:快速的性能、多樣的數據關系、兼容存儲柵格數據、優化空間索引以及數據壓縮等。下圖可以看到,在ArcGIS 中創建數據庫時有三種選項:
File Geodatabse 不同於 Personal Geodatabase,File GeoDatabase 在存儲能力、平臺支持、讀寫速度、壓縮率等方面全面強於 Personal Geodatabse, 具體差異不在此贅述。Database Connection 連接的就是ArcSDE GeoDatabase,它通過 ArcSDE 使用大型數據庫 Oracle,SqlServer,DB2 等存儲空間數據,可以實現並發操作,不過需要單獨的用戶許可。
d93eb4f67b5d72b52f89d8f78a912c46
Coverage 也是 ESRI 提出的一種地理空間數據格式,現在已經很少使用,但畢竟是大廠出品,這裡還是說一下。它沒有擴展名,隻是一組文件夾。Coverage使用要素類來存儲點、弧、多邊形或註釋。tic是地理控制點,有助於確定覆蓋范圍。
後綴為E00的文件是Esri的一種通用交換格式文件。這種文件通過明碼的方式表達瞭幾乎所有的矢量格式以及屬性信息,廣泛應用於與其他軟件之間進行數據交換。
GeoJSON 是一種基於JSON的開源標準格式,其和 JSON 一樣數據結構簡單,可讀性強,前後端兼容性好,也特別適合在 Web 中使用。GeoJSON 的點數據結構說明如下,詳情請點擊「閱讀原文」瞭解。
由於 GeoJSON 結構簡單、使用靈活,許多輕量的前端地圖展現都采用 GeoJSON,比如前端圖表組件 EChart 中地圖顯示就是采用 GeoJSON 作為數據源。
在 web 地圖中,常常有這樣的需求:點擊或搜索某塊區域時,讓這塊區域能夠高亮顯示,來改善用戶體驗,這裡的高亮效果就可以通過 GeoJSON 來處理,後面會寫幾篇文章介紹如何制作、使用GeoJSON。
KML是標記語言(Keyhole Markup Language)的縮寫,最初由 Google 旗下 Keyhole 公司開發,是一種基於XML 語法與格式的、用於描述和保存地理信息(如點、線、圖像、多邊形和模型等)的編碼規范。KMZ 是一個經過ZIP格式壓縮過的 KML 文件,其文件自身可以包含圖標,影像和模型等。KMZ/KML 可以被 Google Earth、Google Map 和 ArcGIS Earth 等識別並顯示。
你可以通過 ArcGIS ToolBox 中「Layer to KML」工具將 *.lyr 文件轉為 kml 格式,然後打開google earth 添加查看:
4167d2a69a7f4f607c9e5bad33577426
DXF 是 AutoCAD 與其它軟件之間進行 CAD 數據交換的開放矢量數據文件格式,可以分為兩類:ASCII 格式和二進制格式;ASCII 具有可讀性好的特點,但占用的空間較大;二進制格式則占用的空間小、讀取速度快。由於 AutoCAD 現在是最流行的 CAD 系統,DXF 也被廣泛使用,成為事實上的標準。絕大多數 CAD 系統都能讀入或輸出 DXF 文件。
MapGIS 現在大多使用於國土、市政相關領域,應用范圍也挺廣,畢竟是國產軟件還是要支持一下的。
其數據文件主要包括工程文件文件和工程內各工作區的文件。工作區是MAPGIS提出的一個概念,簡單地說,工作區就是一個數據池,存放實體的空間數據、拓撲數據、圖形數據和屬性數據,每個工作區都對應於一個MAPGIS數據文件。數據文件主要有以下幾種:
GeoTIFF 已經成為 GIS 和衛星遙感應用的行業圖像標準文件。幾乎所有的GIS和圖像處理軟件包都具有 GeoTIFF 兼容性。GeoTIFF 包含的其他文件有:
Erdas Imagine是美國 ERDAS 公司開發的遙感圖像處理系統(ERDAS IMAGINE)使用的遙感影像格式。這種格式廣泛應用於遙感數據處理,因為它提供瞭一個用於整合來自多源傳感器數據的框架。該框架支持地理參考、地理編碼元數據、多波段、不同數據類型的數據的存儲,同時該格式基於瓦片的方式進行數據的存取,這樣加快瞭數據顯示和重采樣的速度。
ENVI 使用的是通用柵格數據格式,包含一個簡單的二進制文件和一個相關的ASCII(文本)的頭文件。這也保證瞭單個 ENVI 柵格文件沒有大小上限。ENVI 柵格文件必須包含這兩個文件,其中頭文件的後綴名為 .hdr,數據文件的後綴隨意,甚至可以不帶後綴名。這兩個文件是通過文件名來關聯,即數據文件和頭文件名稱一致。
HDF 格式是一種不必轉換格式就可以在不同平臺間傳遞的數據格式,由美國國傢高級計算應用中心(NCSA)研制,已經應用於 MODIS、MISR 等數據中。當前流行的版本是 HDF5。HDF 有6種主要數據類型:柵格圖像數據、調色板(圖像色譜)、科學數據集、HDF 註釋(信息說明數據)、Vdata(數據表)、Vgroup(相關數據組合)。HDF 采用分層式數據管理結構,並可以直接從嵌套的文件中獲得各種信息。因此,打開一個HDF文件,在讀取圖像數據的同時可以方便的查取到其地理定位、軌道參數、圖像屬性、圖像噪聲等各種信息參數。
到這裡常用的 GIS 常用的數據格式介紹完瞭,這裡給瞭矢量數據更多的篇幅,因為矢量數據結構更加復雜,在 GIS 中使用場景也更豐富靈活;而柵格數據就數據本身來說結構相對簡單許多,但其背後卻是一門遙感學科,牽扯到的關於影像的一系列知識,可絕不是作者隨便說幾句就能掰扯清楚的,咱們來日方長~~~
上一篇
下一篇
大傢好,我是 @silence,在19到21年做瞭3年的按摩椅線上銷售,在按摩椅選購方面,不懂的地方可以咨詢我!免費為大傢解答,助...
如何完全免費又合法使用0ffice軟件,免費激活後,不管是word、excel、PowerPoint等等。你都可以完全免費,合法正常使用。一、...