Journal of Geographic Information System, 2009, 1, 12-16
Published Online August 2009 in SciRes (http://www.SciRP.org/journal/jgis/).
Copyright © 2009 SciRes. JGIS
Metadata Extended Model Based On Geological
Domain Ontology
Ying HUANG1.2, Mingqiang GUO1.2, Xiangang LUO1.2, Zhong XIE1.2
1Faculty of Information Engineering, China University of Geosciences, Wuhan China
2GIS Software and Application Project Research Center of the Educational Department
Abstract: The current metadata modeling techniques can not meet the needs of knowledge conception ex-
pression, knowledge organization, and metadata semantic consistency in geological domain. This paper in-
troduces ontology and integrates this theory to geological domain metadata modeling. It adopts the first order
logic equivalent algorithm and defines the metadata extended model as a quaternion group which is consists
of geological term set, geological term definition set, attribute definition set and instance set. It also provides
the formal description of each set. Finally the five steps for building geological domain metadata extended
model are given. The result presents that this model not only provides the content standards for geological
domain knowledge representation and knowledge organization, but also provides the basis for geological do-
main multi-source data and historical data integration and application in semantic consistency.
Keywords: ontology; geological domain ontology; metadata; metadata extended model
基於地質領域本體的元資料擴展模型
1,2,郭明強1,2,羅顯剛1,2,謝 1,2
1. 中國地質大學資訊工程學院,湖北 武漢
2. 教育部地理資訊系統軟體及其應用工程研究中心,湖北 武漢
摘 要: 針對目前地質領域現有元資料建模技術無法滿足地質領域知識概念表示、知識組織體系及元資料語義一
致性等問題,借鑒本體思想,將本體理論引入到地質領域元資料建模中,採用一階邏輯等值演算方法,將元資料擴展模
型形式化定義為一個四元組,並給出各元組間相互關係的形式化描述.最後,提出了建立地質領域元資料擴展模型的
五步法來構建知識工程.將本體理論引入到地質領域元資料建模中來,可以把元資料模型中實體、屬性和聯繫隱含的
語義顯式的表達出來,不僅為地質領域知識概念的表示和知識組織體系提供了內容標準,也為地質領域專用元資料
標準的建立、地質領域多源資料的集成以及在語義一致性上解決歷史資料整合與應用等方面提供了基礎.
關鍵字: 本體;地質領域本體;元數據;元資料擴展模型
1. 前 言
元資料是關於資料的資料[1]。經過幾十年工作,
我國花費了大量人力、物力、財力獲取了各種地下、
地面的地質空間資訊, 但目前這些資訊零散地分佈在
各個部門、各個地區和各個單位,形成了資訊孤島
現狀[2]。同時,針對地質領域元資料,一直沒有一個系
統有效的定義,從而無法形成統一的語義描述,資訊在
不同的地域,以及不同電腦系統之間無法進行標準化
的交流,影響了地質資料的共用 .產生這些問題的主要
原因是現有元資料建模技術已經無法滿足地質領域知
識概念表示和知識組織體系方面的有關問題,也無法
保證地質領域元資料語義上的一致性.因此,本文將本
基金專案:十一五國家 863 計畫課題面向網路的三維空間資訊服務
技術研究與軟體發展
(
No. 2009AA12Z211
)
資助
METADATA EXTENDED MODEL BASED ON GEOLOGICAL DOMAIN ONTOLOGY 13
體理論引入到地質領域元資料建模研究中,建立地質
領域元資料描述框架,提供元資料建模規範,允許不同
用戶在統一的元資料模型下自定義元資料,形式化描
述元資料語義,從而使地質領域不同分類的元資料之
間相互理解成為可能.
2. 本體及地質領域本體
在哲學上,一般認為本體論就是存在的理論.
資訊科學領域,本體論最具有代表性的定義是:共用
概念模型的明確的形式化規範說明[3].地質領域本
體兼具哲學本體和資訊本體的雙重含義.其目標是建
立地質領域主題的、層次清晰的規範說明,形成公認
的形式化的知識表示體系和地質領域主題知識的內
容資訊組織,為地質領域資料模型的基本內容標準、
地質領域多源資料整合的編碼問題、在語義一致性
上解決歷史資料庫的整合與應用等方面提供基礎.
可以用五個基本建模元語[4] 來表示地質領域本
:GO={C,R,F,A,I},其中:
C表示地質類或概念的集合,比如地質領域本體
中地層領域包括地層研究和地層劃分,而地層劃分又
分為地層分類、國際年代地層單位及部分中國年代地
層單位;
R表示地質領域中概念之間的交互作用,比如地
質領域本體中礦產地質領域與礦產分類屬於從屬關係,
而金屬礦產與非金屬礦產屬於並列關係,具體的金屬
礦鈾與能源礦產又是一種相關的關係;
F表示函數:是一類特殊的關係,是關係的特定表
達方式.函數中規定的映射關係 ,可以使得推理從一個
概念指向另一個概念. instance-of(x,y) 就是一個函
數,表示 xy的一個實例.
A表示本體公理:通常都是一階謂詞邏輯的運算
,是無需再進行證明的邏輯永真式.如概念乙屬於概
念甲的範疇.
I表示實例:實例代表元素,從語義上講它表示的就
是物件,也稱個體.類是實例的類,實例是類的實例,實例
是本體中最小物件,它具有原子性,即不可再分性.如果
某個實例還可以再進行劃分,那麼它就是類,而不是實
.比如地層-地層劃分-國際年代地層單位及部分中國
年代地層單位-年代地層單位的等級-().
3. 元資料擴展模型設計原理
定義 1基於地質領域本體的元資料擴展模型可以
用一個四元組來表示,記作G=<GT,GTD,GAD,GEX >,
GT 表示地質術語集,GTD表示地質術語定義集,GAD
表示屬性定義集,GEX 表示地質實例集.模型圖如圖1
所示。
基於地質領域本體的元資料擴展模型旨在研究地
質領域元資料不同物件及其語義關係.其要素為地質
術語集、地質術語定義集、屬性定義集與實例集.它們
之間存在一些重要的語義關係:
·地質術語集與地質術語定義集:包含關係
(part-of)、繼承關係(kind-of)、等價關係(equal-of)、非
交關係(disjointness-of)
·地質術語集與實例集:實例關係(instance-of)
·地質術語集與屬性定義集:區分關係
(difference-of)
·實例集與屬性定義集:抽象關係(abstract-of)
語義形式化描述詳見 3.3.
類術語、屬性術語
地質術語集
實例集 屬性定義集
地質術語定義集
創建類實例、添加類
屬性
定義類實例、屬性分
类的定义及等级关系
instance-of difference-of
abstract-of
part-ofkind-ofequal-ofdisjointness-of
1. 基於地質領域本體的元資料擴展模型
Copyright © 2009 SciRes. JGIS
14 METADATA EXTENDED MODEL BASED ON GEOLOGICAL DOMAIN ONTOLOGY
Copyright © 2009 SciRes. JGIS
2.1 地質術語集
地質術語集 GT:由類術語與屬性術語構成.在本模
型中,類術語對應著現實世界中的地質實體,包括類的
定義和類的等級體系.屬性術語對應於實體間的各種
關係以及實體自身的特徵.
2.2 地質術語定義集
地質術語定義集 GTD:用來定義 GT中的術語所屬
類及類的等級體系.
完善一個等級體系有幾種可行的方法:
1)自頂向下法:由地質領域中最大的類開始,而後
再將這些類細化.
2)自底向上法:由底層最小類的定義開始,它們是
這個等級體系的細枝末節,然後將這些細化的類組織
在更加綜合的類之下.
3)綜合法:綜合以上兩種方法.首先定義大量重要
的類,然後分別將它們進行恰當地歸納和演繹.最後將
它們與一些中級類關聯起來.
無論選擇哪種方法,都要從的定義開始.
2.3 屬性定義集
屬性術語根據其取值的類型可分為兩種:一種是
地質類屬性,表示兩個地質類之間的關係;另一種是
屬性分面,表示類的特徵.一個屬性可能由多個分面
組成.一個屬性的分面”,就是屬性取值的類型、容許
的取值、取值個數和有關屬性取值的其他特徵.屬性
定義集 GAD的目的就是將屬性術語分配給類術語.
一旦定義好了一些地質類,就必須開始描繪類的
內在特徵.通常,有幾種屬性類型:
1)“內在屬性:如金屬鐵的顏色、密度等;
2)“外在屬性:如鐵的產地;
3)組成部分:如組成鐵的化學元素為 Fe
4)與其他個體的關係.此處的關係是指某個類中
的實例與其他類之間的關係.任何一個類的所有下位
類都會繼承其上位類的屬性.,鐵礦是黑色金屬礦產
的下位類,繼承了其上位類黑色金屬礦產的屬性.
2.4 實例集
類是為了描述物件而形成的概念,先有物 件後有
,而一旦形成類之後,便把物件歸屬在相應的類下,
時稱物件為類的實例.實例集定義類術語的下屬實例,
包括:確定一個類,創建該類的一個實例,以及添加這個
類的屬性值.
3. 元資料擴展模型形式化描述
3.1 元資料擴展模型關係綜述
包含關係(part- of)是地質術語集與地質術語定義
集之間部分與整體的關係.
等價關係(equal-of)即兩個地質術語完全相同.
繼承關係(kind-of)即子類與父類的關係.
非交關係(non-intersection-of )即在同一劃分層次
上的不同術語集間的互不相交關係.
抽象關係(abstract-of)是實例集與屬性定義集之間
的關係,是從實例集中抽取一個或多個實例基本屬性
的過程,即基本屬性與實例集之間的一對多關係.
實例關係(instance of)指地質術語集與實例集之間
的關係,即類和其實例之間的多對多映射關係.一個類
可實例化為多個物件,一個物件也可為多個物件的實
例化.
區分關係(differ ence- of)是 從屬 性定義集到術 語集
的一種映射,即屬性與類之間的關係.兩類之間總存在
差別,體現於其內涵,即基本屬性上.
基於地質領域本體五元語,對一階謂詞邏輯進行
了擴展,增加了相應的定義、關係、函數,對元資料擴
展模型語義進行解釋.
3.2 元資料擴展模型語法
經典一階謂詞邏輯語言 (BittnerT etc.,2004)L
:1) 個體變數:i,j 2) 個體常量:m,n3)5 個邏輯符號
(Masolo C,Borgo S,2005):
4)3 個輔助符
:,)(.為描述該擴展模型,一階語言 L可擴展為:1)兩個
二元謂詞原語:=( 等於)
(不等於)2) 三個函數定
:fins,fabs,fdiff.
3.3 元資料擴展模型形式化
給定 G=<GT,GTD, GAD, GEX >,語義解釋為一個
二元組:I=<
I,I>,其中
G的論域,GT,GTD,
GAD, GEX 是對論域的一種劃分,I 為解釋函數,包括
fins,fabs,fdiff,用於約束實例、抽象、區分等關係,有以下
語義形式化描述:
3.3.1 地質術語集與地質術語定義集
定義 2 GT1,GT2
GT,ga1,ga2GADGT1,GT2
屬性定義集,記為{ga11,ga12,ga13,...,ga1n}
{ga21,ga22, ga23,...,ga2n},R GT上的二元關係,
括等價、包含、繼承、非交等,則有:
1)術語具有非空二元關係:R
METADATA EXTENDED MODEL BASED ON GEOLOGICAL DOMAIN ONTOLOGY 15
2)ga1i ,ga2i (1 in),
{ga11,ga12,ga13,...,ga1n}={ga21,ga22,ga23...,ga2n},
GT1GT2,稱為 GT1RGT2為等價關係;
 
3)O=fins(GT1),OGT1的一個實例,O
GT2的所有屬性定義集 ga2 上均有真值,且值域是相關
,反之不成立,GT1語義包含 GT2,記為 GT2GT1
GT2GT1,GT1RGT2為包含關係;
4)繼承關係:ga1i ga1,ga1i =ga2j ga2(1
i,
jn),GT2R GT1為繼承關係;
5) GT1GT2,GT2GT1,
GT1GT2=,GT1RGT2為非交關係;
3.3.2 實例集與屬性定義集
定義 3 GT 為術語定義集,GAD為屬性定義
,GEX 為實例集,fins, fabs 為一元函數,則實例集與屬性
定義集的抽象關係為:
1)若某一地質類術語存在,則可抽象出其屬性定
義集,:GTiGT, fabs(GTi)=
{ga11,ga12,ga13,...,ga1n}, {ga11, ga12,
ga13,...,ga1n}GAD,其中 1i n
2) 本屬性可抽取於一個或多個實例,:
{ga11,ga12,ga13,...,ga1n}GAD,fabs(GTi)=
{ga11,ga12,ga13,...,ga1n},fins(GTi) GEX,其中
1 i n
 
3) 同一術語集的實例,其基本屬性相同,
:GTi,GTjGT, GTi=GTj,fabs(fins(GTi))=
fabs(fins(GTj)),其中 1i, jn
3.3.3 地質術語集與實例集
定義 4 GT 為術語定義集,GEX 為實例定義
,fins,fabs 為一元函數,則地質術語集與實例集的實例
關係為:
1) 實例集是實例的集合,凡類術語都可被實例化,
:GTiGT, fins(GTi)
,
fins(GTi)=GEXiGEX,其中 1
i n
2) 凡實例都有其歸屬的類術語存在,:
GEXiGEX, GEXifins(GTi)GTiGT,其中
1 i n
3) 兄弟類的實例不相交,:
fins(GT1)=GEX1,fins(GT1)=GEX2,GT1GT,GEX1,GEX2
GEX,GEX1GEX2,fins(GT1) fins(GT1)=
4)若實例相同,則其對應的類術語具有相等或包
含關係,: GT1,GT2GT,fins(GT1)= fins(GT2),
GT1GT2GT2GT1
5) 類術語相同,則其實例具有相同的基本屬性,
見定義 3.
3.3.4 地質術語集與屬性定義集
定義 5 GT為術語定義集,GAD為屬性定義集,則地
質術語集與屬性定義集的區分關係為:
1)屬性定義集相同則對應的地質術語相同,見定
2
2)不同屬性定義集用於區分不同的地質術語,
:{ga1,ga2,ga3,...,gam}GAD, {ga1,ga2,
ga3,...,gan}GAD,m
n,fequ(GT1) f
equ(GT2).
4. 五步法創建地質領域本體的元資料擴展模型
在遵循上述元資料擴展模型的設計原理與形式化
描述的基礎上,通過抽象總結出一套創建地質領域元
資料擴展模型知識工程的五步法.
第一步,列舉地質領域本體中的重要術語.
盡可能多的列舉一份地質領域術語清單,清單中
的術語是元資料擴展模型想要陳述的或要向用戶解釋
的所有概念.此時暫不考慮概念間會有屬性及表達上
的重複.
第二步,地質領域本體術語提取
上一步驟中已經產生了地質領域中大量術語,
卻是一張毫無組織結構的辭彙表,這時需要對其中的
每一個術語的重要性要進行評估,選出關鍵性術語,
棄那些不必要或者超出地質領域範圍的術語,盡可能
準確而精簡的表達出地質領域的知識,從而形成一個
領域知識的框架體系,為建立地質領域本體元資料模
型做必要準備.
第三步,建立元資料擴展模型框架,定義四元組關係
為了描述地質領域本體元資料擴展框架,本文提
出四元組模型.該模型不僅定義了地質領域概念集,
定義了地質領域概念間的關係.
1) 定義類及 類間關 係 .創建的術語中,很大一部分
屬於類術語,而對類術語的術語定義有以下 3種方法:
自頂向下法、自底向上法及綜合法(參見 2.2 ).3
種但不論採用哪種方法,都需要從類術語的定義開始.
類間關係表示該類術語與術語定義集間包含、繼承、
等價及非交關係,如子類與父類所描述的概念是包含
或繼承關係.
2) 定義類的屬性.僅有類間的關係根本不足以描述
地質領域元資料擴展模型.因此,一旦定義好了類就要描
述這個類的內部結構.已經從步驟 2術語列表中選擇
好類,絕大多數剩下的術語可能是這些類的屬性.通常,
Copyright © 2009 SciRes. JGIS
16 METADATA EXTENDED MODEL BASED ON GEOLOGICAL DOMAIN ONTOLOGY
Copyright © 2009 SciRes. JGIS
幾種物件屬性的類型 能夠成為一個 本體中的屬性 : “
屬性、外在屬性、組成部分、個體間關係(參見
2.3 ).除了最初確定的一些屬性之外還要描述地質類
術語與屬性、實例與屬性定義集間的關係.
3)定義屬性值.屬性術語根據其取值的類型可分
為兩種:一種是地質類屬性;另一種是屬性分面(參見
2.3 ).
4)創建實例集(參見 2.4 )
第四步,對元資料擴展模型編碼形式化.
選用合適的本體描述語言對本模型進行編碼、形
式化.目前大多數已經建立的本體模型都是基於一階
謂詞邏輯或描述邏輯[4,7]. 本模型採用一階謂詞邏輯.
元資料擴展模型的形式化描述可以提供比自然語言更
嚴格的格式,增強機器的可讀性,進行自動翻譯以及交
,便於本模型自動進行邏輯推理.(參見3.3 )
第五步,模型的檢驗評價.
元資料擴展模型形式化以後,是否滿足了我們剛
開始提出的需求,是否滿足模型的建立準則,模型中的
術語是否被清晰的定義了,概念及其關係是否完整等
問題都需要我們在模型建立過後進行核對總和評估.
由於是在建立客戶本體過程中進行檢驗評價,鑒於文
章篇幅的原因,在這裏不具體介紹.
5 結論
將本體理論引入到地質領域元資料建模中來,
以把元資料模型中實體、屬性和聯繫隱含的語義顯
式的表達出來,不僅為地質領域知識概念的表示和知
識組織體系提供了內容標 準 ,也為地質領域專用元資
料標準的建立、地質領域多源資料的集成以及在語
義一致性上解決歷史資料整合與應用等方面提供了
基礎.
今後還要在以下幾個方面深入研究:
1)擴展各元組間二元或多元的關係;
2)研究地質領域本體元資料分類粒度問題;
3)研究地質領域本體元資料分類標引規則.
參考文獻 (References)
[1] V. Kashyap and A. Sheth. Information brokering across
heterogeneous digital data—A metadata based approach.
Kluwer Academic Publishers, 2000.
[2] C. L. Li, F. D. Li, and X. G. Luo. The construction and
implementation of national geological spatial information
grid node computing pool. 2006, 5(5): 2.
[3] L. Su, Q. W. Zhu, and Y. J. Chen. Conceptual modeling
of spatial database based on geographic ontology. Com-
puter Engineering, 2007, 33(12): 87.
[4] H. W. Wang, J. C. Wu, and F. A. Jiang. Study on ontol-
ogy model based on description logics: System engineer-
ing. 2003, 21(3): 101-107.
[5] T. Bittner, M. Donnelly, and B. Smith. Individuals, uni-
versals, collections: On the foundational relations of on-
tology. Proceedings of the Third Conference on Formal
Ontology in Information Systems, FOIS, Turin, 2004,
37-48.
[6] C. Masolo and S. Borgo. Qualities in formal ontology P.
Hitzler, C. Lutz, G. Stumme. The proceedings of the
workshop on foundational aspects of ontologies. Koblenz
Germany, 2005, ISTC-CNR: 2-16.
[7] H. W. Wang, J. C. Wu, and F. Jiang, Extended ontology
model and ontology checking based on description logics.
Journal of Shanghai Jiaotong University (Science), 2004,
1, 195-198.
C
opyright © 2009 SciRes. Wireless Sensor Network, 2009, 1, 1-**