元數(shù)據(jù) - 元數(shù)據(jù)的相關(guān)資料以及實(shí)際應(yīng)用
元數(shù)據(jù)(Meta Data)是關(guān)于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù),指在數(shù)據(jù)倉(cāng)庫(kù)建設(shè)過(guò)程中所產(chǎn)生的有關(guān)數(shù)據(jù)源定義,目標(biāo)定義,轉(zhuǎn)換規(guī)則等相關(guān)的關(guān)鍵數(shù)據(jù)。同時(shí)元數(shù)據(jù)還包含關(guān)于數(shù)據(jù)含義的商業(yè)信息,所有這些信息都應(yīng)當(dāng)妥善保存,并很好地管理。為數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展和使用提供方便。

目錄
定義
原理
特點(diǎn)
應(yīng)用
概念
元數(shù)據(jù)被定義為:提供關(guān)于信息資源或數(shù)據(jù)的一種結(jié)構(gòu)化的數(shù)據(jù),是對(duì)信息資源的結(jié)構(gòu)化的描述。其作用為:描述信息資源或數(shù)據(jù)本身的特征和屬性,規(guī)定數(shù)字化信息的組織,具有定位、發(fā)現(xiàn)、證明、評(píng)估、選擇等功能。一般認(rèn)為,所謂元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),或關(guān)于數(shù)據(jù)的結(jié)構(gòu)化的數(shù)據(jù)。從已有的結(jié)論看,元數(shù)據(jù)的含義是逐漸發(fā)展的。元數(shù)據(jù)一詞,早期主要指網(wǎng)絡(luò)資源的描述數(shù)據(jù),用于網(wǎng)絡(luò)信息資源的組織;其后,逐步擴(kuò)大到各種以電子形式存在的信息資源的描述數(shù)據(jù)。目前,元數(shù)據(jù)這一術(shù)語(yǔ)實(shí)際用于各種類型信息資源的描述記錄。此外,元數(shù)據(jù)在地理界,生命科學(xué)界等領(lǐng)域也有其相應(yīng)的定義和應(yīng)用。元數(shù)據(jù)是一種二進(jìn)制信息,用以對(duì)存儲(chǔ)在公共語(yǔ)言運(yùn)行庫(kù)可移植可執(zhí)行文件? - PE?文件或存儲(chǔ)在內(nèi)存中的程序進(jìn)行描述。將您的代碼編譯為?PE?文件時(shí),便會(huì)將元數(shù)據(jù)插入到該文件的一部分中,而將代碼轉(zhuǎn)換為?Microsoft?中間語(yǔ)言? - MSIL?并將其插入到該文件的另一部分中。在模塊或程序集中定義和引用的每個(gè)類型和成員都將在元數(shù)據(jù)中進(jìn)行說(shuō)明。當(dāng)執(zhí)行代碼時(shí),運(yùn)行庫(kù)將元數(shù)據(jù)加載到內(nèi)存中,并引用它來(lái)發(fā)現(xiàn)有關(guān)代碼的類、成員、繼承等信息。
內(nèi)容
元數(shù)據(jù)以非特定語(yǔ)言的方式描述在代碼中定義的每一類型和成員。元數(shù)據(jù)存儲(chǔ)以下信息:
程序集的說(shuō)明
標(biāo)識(shí)(名稱、版本、區(qū)域性、公鑰)
導(dǎo)出的類型
該程序集所依賴的其他程序集
運(yùn)行所需的安全權(quán)限
類型的說(shuō)明
名稱、可見(jiàn)性、基類和實(shí)現(xiàn)的接口
成員(方法、字段、屬性、事件、嵌套的類型)
屬性
修飾類型和成員的其他說(shuō)明性元素
優(yōu)點(diǎn)
對(duì)于一種更簡(jiǎn)單的編程模型來(lái)說(shuō),元數(shù)據(jù)是關(guān)鍵,該模型不再需要接口定義語(yǔ)言 - IDL 文件、頭文件或任何外部組件引用方法。元數(shù)據(jù)允許 .NET 語(yǔ)言自動(dòng)以非特定語(yǔ)言的方式對(duì)其自身進(jìn)行描述,而這是開發(fā)人員和用戶都無(wú)法看見(jiàn)的。另外,通過(guò)使用屬性,可以對(duì)元數(shù)據(jù)進(jìn)行擴(kuò)展。元數(shù)據(jù)具有以下主要優(yōu)點(diǎn):
自描述文件
公共語(yǔ)言運(yùn)行庫(kù)模塊和程序集是自描述的。模塊的元數(shù)據(jù)包含與另一個(gè)模塊進(jìn)行交互所需的全部信息。元數(shù)據(jù)自動(dòng)提供 COM 中 IDL 的功能,允許將一個(gè)文件同時(shí)用于定義和實(shí)現(xiàn)。運(yùn)行庫(kù)模塊和程序集甚至不需要向操作系統(tǒng)注冊(cè)。結(jié)果,運(yùn)行庫(kù)使用的說(shuō)明始終反映編譯文件中的實(shí)際代碼,從而提高應(yīng)用程序的可靠性。
語(yǔ)言互用性和更簡(jiǎn)單的基于組件的設(shè)計(jì)
元數(shù)據(jù)提供所有必需的有關(guān)已編譯代碼的信息,以供您從用不同語(yǔ)言編寫的 PE 文件中繼承類。您可以創(chuàng)建用任何托管語(yǔ)言(任何面向公共語(yǔ)言運(yùn)行庫(kù)的語(yǔ)言)編寫的任何類的實(shí)例,而不用擔(dān)心顯式封送處理或使用自定義的互用代碼。
屬性
NET Framework 允許您在編譯文件中聲明特定種類的元數(shù)據(jù)(稱為屬性)。在整個(gè) .NET Framework 中到處都可以發(fā)現(xiàn)屬性的存在,屬性用于更精確地控制運(yùn)行時(shí)您的程序如何工作。另外,您可以通過(guò)用戶定義的自定義屬性向 .NET Framework 文件發(fā)出您自己的自定義元數(shù)據(jù)。有關(guān)更多信息,請(qǐng)參見(jiàn)利用屬性擴(kuò)展元數(shù)據(jù)。
意義
說(shuō)到元數(shù)據(jù)的意義,可以從其應(yīng)用目的來(lái)談的。雖然做數(shù)據(jù)倉(cāng)庫(kù)言必稱元數(shù)據(jù),必稱技術(shù)、業(yè)務(wù)元數(shù)據(jù),但其到底用于何處?離開了目標(biāo)去談元數(shù)據(jù),就發(fā)現(xiàn)元數(shù)據(jù)包含太多的東西,因?yàn)樗敲枋鰯?shù)據(jù)的數(shù)據(jù)嘛。
還是那客戶關(guān)系系統(tǒng)來(lái)比喻,這個(gè)系統(tǒng)維護(hù)客戶信息當(dāng)然是有目的的,是要用這些信息進(jìn)行一些自動(dòng)的流程處理、去挖掘一些客戶潛在的價(jià)值、做好客戶服務(wù)。當(dāng)然沒(méi)有必要去維護(hù)客戶的生命特征信息,諸如指紋、犯罪史等,這些信息跟客戶關(guān)系管理的目標(biāo)關(guān)系不大。元數(shù)據(jù)也是如此,你可以將所以數(shù)據(jù)的結(jié)構(gòu)、大小、什么時(shí)間創(chuàng)建、什么時(shí)間消亡、被那些人使用等等,這些信息可以延伸得太廣,如果不管目標(biāo),而試圖去建一個(gè)非常完美的元數(shù)據(jù)管理體系,這是一種絕對(duì)的"自上而下"做法,必?cái)o(wú)疑。
內(nèi)容
基于應(yīng)用,可以將元數(shù)據(jù)分成以下的若干種:
數(shù)據(jù)結(jié)構(gòu):數(shù)據(jù)集的名稱、關(guān)系、字段、約束等;
數(shù)據(jù)部署:數(shù)據(jù)集的物理位置;
數(shù)據(jù)流:數(shù)據(jù)集之間的流程依賴關(guān)系(非參照依賴),包括數(shù)據(jù)集到另一個(gè)數(shù)據(jù)集的規(guī)則;
質(zhì)量度量:數(shù)據(jù)集上可以計(jì)算的度量;
度量邏輯關(guān)系:數(shù)據(jù)集度量之間的邏輯運(yùn)算關(guān)系;
ETL過(guò)程:過(guò)程運(yùn)行的順序,并行、串行;
數(shù)據(jù)集快照:一個(gè)時(shí)間點(diǎn)上,數(shù)據(jù)在所有數(shù)據(jù)集上的分布情況;
星型模式元數(shù)據(jù):事實(shí)表、維度、屬性、層次等;
報(bào)表語(yǔ)義層:報(bào)表指標(biāo)的規(guī)則、過(guò)濾條件物理名稱和業(yè)務(wù)名稱的對(duì)應(yīng);
數(shù)據(jù)訪問(wèn)日志:哪些數(shù)據(jù)何時(shí)被何人訪問(wèn);
質(zhì)量稽核日志:何時(shí)、何度量被稽核,其結(jié)果;
數(shù)據(jù)裝載日志:哪些數(shù)據(jù)何時(shí)被何人裝載;
標(biāo)準(zhǔn)化框架
數(shù)字圖書館資源組織框架
元數(shù)據(jù)開發(fā)應(yīng)用框架
元數(shù)據(jù)的基本意義 Metadata(元數(shù)據(jù))是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”;
元數(shù)據(jù)為各種形態(tài)的數(shù)字化信息單元和資源集合提供規(guī)范、普遍的描述方法和檢索工具;
元數(shù)據(jù)為分布的、由多種數(shù)字化資源有機(jī)構(gòu)成的信息體系(如數(shù)字圖書館)提供整合的工具與紐帶。
離開元數(shù)據(jù)的數(shù)字圖書館將是一盤散沙,將無(wú)法提供有效的檢索和處理。
元數(shù)據(jù)應(yīng)用環(huán)境
Metadata的應(yīng)用目的
(1)確認(rèn)和檢索(Discovery andentification),主要致力于如何幫助人們檢索和確認(rèn)所需要的資源,數(shù)據(jù)元素往往限于作者、標(biāo)題、主題、位置等簡(jiǎn)單信息,Dublin Core是其典型代表。
(2)著錄描述(Cataloging),用于對(duì)數(shù)據(jù)單元進(jìn)行詳細(xì)、全面的著錄描述,數(shù)據(jù)元素囊括內(nèi)容、載體、位置與獲取方式、制作與利用方法、甚至相關(guān)數(shù)據(jù)單元方面等,數(shù)據(jù)元素?cái)?shù)量往往較多,MARC、GILS和FGDC/CSDGM是這類Metadata的典型代表。
(3)資源管理(Resource Administration),支持資源的存儲(chǔ)和使用管理,數(shù)據(jù)元素除比較全面的著錄描述信息外,還往往包括權(quán)利管理(Rights/Privacy Management)、電子簽名(Digital Signature)、資源評(píng)鑒(Seal of Approval/Rating)、使用管理(Access Management)、支付審計(jì)(Payment and Accounting)等方面的信息。
(4)資源保護(hù)與長(zhǎng)期保存(Preservation and Archiving),支持對(duì)資源進(jìn)行長(zhǎng)期保存,數(shù)據(jù)元素除對(duì)資源進(jìn)行描述和確認(rèn)外,往往包括詳細(xì)的格式信息、制作信息、保護(hù)條件、轉(zhuǎn)換方式(Migration Methods)、保存責(zé)任等內(nèi)容。
Metadata在不同領(lǐng)域的應(yīng)用 根據(jù)不同領(lǐng)域的數(shù)據(jù)特點(diǎn)和應(yīng)用需要,90年代以來(lái),許多Metadata格式在各個(gè)不同領(lǐng)域出現(xiàn)
例如:
網(wǎng)絡(luò)資源:Dublin Core、IAFA Template、CDF、Web Collections
文獻(xiàn)資料:MARC(with 856 Field),Dublic Core
人文科學(xué):TEI Header
社會(huì)科學(xué)數(shù)據(jù)集:ICPSR SGML Codebook
博物館與藝術(shù)作品:CIMI、CDWA、RLG REACH Element Set、VRA Core
政府信息:GILS
地理空間信息:FGDC/CSDGM
數(shù)字圖像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images
檔案庫(kù)與資源集合:EAD
技術(shù)報(bào)告:RFC 1807
連續(xù)圖像:MPEG-7
Metadata格式的應(yīng)用程度
不同領(lǐng)域的Metadata處于不同的標(biāo)準(zhǔn)化階段:
在網(wǎng)絡(luò)資源描述方面,Dublin Core經(jīng)過(guò)多年國(guó)際性努力,已經(jīng)成為一個(gè)廣為接受和應(yīng)用的事實(shí)標(biāo)準(zhǔn);
在政府信息方面,由于美國(guó)政府大力推動(dòng)和有關(guān)法律、標(biāo)準(zhǔn)的實(shí)行,GILS已經(jīng)成為政府信息描述標(biāo)準(zhǔn),并在世界若干國(guó)家得到相當(dāng)程度的應(yīng)用,與此類似的還有地理空間信息處理的FGDC/CSDGM;
但在某些領(lǐng)域,由于技術(shù)的迅速發(fā)展變化,仍然存在多個(gè)方案競(jìng)爭(zhēng),典型的是數(shù)字圖像的Metadata,現(xiàn)在提出的許多標(biāo)準(zhǔn)都處于實(shí)驗(yàn)和完善的階段。
3.4 Metadata格式“標(biāo)準(zhǔn)化”程度問(wèn)題
Metadata開發(fā)應(yīng)用經(jīng)驗(yàn)表明,很難有一個(gè)統(tǒng)一的Metadata格式來(lái)滿足所有領(lǐng)域的數(shù)據(jù)描述需要;即使在同一個(gè)領(lǐng)域,也可能為了不同目的而需要不同的但可相互轉(zhuǎn)換的Metadata格式。
同時(shí),統(tǒng)一的集中計(jì)劃式的Metadata格式標(biāo)準(zhǔn)也不適合Internet環(huán)境,不利于充分利用市場(chǎng)機(jī)制和各方面力量。
但在同一領(lǐng)域,應(yīng)爭(zhēng)取“標(biāo)準(zhǔn)化”,在不同領(lǐng)域,應(yīng)妥善解決不同格式的互操作問(wèn)題。
元數(shù)據(jù)結(jié)構(gòu)
總體結(jié)構(gòu)定義方式 一個(gè)Metadata格式由多層次的結(jié)構(gòu)予以定義:
(1)內(nèi)容結(jié)構(gòu)(Content Structure),對(duì)該Metadata的構(gòu)成元素及其定義標(biāo)準(zhǔn)進(jìn)行描述。
(2)句法結(jié)構(gòu)(Syntax Structure),定義Metadata結(jié)構(gòu)p;? (3)語(yǔ)義結(jié)構(gòu)(Semantic Structure),定義Metadata元素的具體描述方法。
內(nèi)容結(jié)構(gòu)
內(nèi)容結(jié)構(gòu)定義Metadata的構(gòu)成元素,可包括: 描述性元素、技術(shù)性元素、管理性元素、結(jié)構(gòu)性元素(例如與編碼語(yǔ)言、Namespace、數(shù)據(jù)單元等的鏈接)。
這些數(shù)據(jù)元素很可能依據(jù)一定標(biāo)準(zhǔn)來(lái)選取,因此元數(shù)據(jù)內(nèi)容結(jié)構(gòu)中需要對(duì)此進(jìn)行說(shuō)明,例如MARC記錄所依據(jù)的ISBD,EAD所參照的isad(G),ICPSR所依據(jù)的ICPSR Data Preparation Manual。
句法結(jié)構(gòu)
句法結(jié)構(gòu)定義格式結(jié)構(gòu)及其描述方式,例如元素的分區(qū)分段組織、元素選取使用規(guī)則、元素描述方法(例如Dublin Core采用ISO/IEC 11179標(biāo)準(zhǔn))、元素結(jié)構(gòu)描述方法(例如MARC記錄結(jié)構(gòu)、SGML結(jié)構(gòu)、XML結(jié)構(gòu))、結(jié)構(gòu)語(yǔ)句描述語(yǔ)言(例如EBNF Notation)等。
有時(shí),句法結(jié)構(gòu)需要指出元數(shù)據(jù)是否與所描述的數(shù)據(jù)對(duì)象捆綁在一起、或作為單獨(dú)數(shù)據(jù)存在但以一定形式與數(shù)據(jù)對(duì)象鏈接,還可能描述與定義標(biāo)準(zhǔn)、DTD結(jié)構(gòu)和Namespace等的鏈接方式。
語(yǔ)義結(jié)構(gòu) 語(yǔ)義結(jié)構(gòu)定義元素的具體描述方法,例如 描述元素時(shí)所采用的標(biāo)準(zhǔn)、最佳實(shí)踐(Best Practices)或自定義的描述要求(Instructions)。
有些元數(shù)據(jù)格式本身定義了語(yǔ)義結(jié)構(gòu),而另外一些則由具體采用單位規(guī)定語(yǔ)義結(jié)構(gòu),例如Dublin Core建議日期元素采用ISO 8601、資源類型采用Dublin Core Types、數(shù)據(jù)格式可采用MIME、識(shí)別號(hào)采用URL或DOI或ISBN;
又如OhioLINK在使用VRA Core時(shí)要求主題元素使用A&AT、TGM和TGN,人名元素用uLan。
元數(shù)據(jù)編碼語(yǔ)言與制作方式
元數(shù)據(jù)編碼語(yǔ)言
元數(shù)據(jù)編碼語(yǔ)言(Metadata Encoding Languages)指對(duì)元數(shù)據(jù)元素和結(jié)構(gòu)進(jìn)行定義和描述的具體語(yǔ)法和語(yǔ)義規(guī)則,常稱為定義描述語(yǔ)言(DDL)。
在元數(shù)據(jù)發(fā)展初期人們常使用自定義的記錄語(yǔ)言(例如MARC)或數(shù)據(jù)庫(kù)記錄結(jié)構(gòu)(如ROADS等),但隨著元數(shù)據(jù)格式的增多和互操作的要求,人們開始采用一些標(biāo)準(zhǔn)化的DDL來(lái)描述元數(shù)據(jù),例如SGML和XML,其中以XML最有潛力。
元數(shù)據(jù)制作方式
(1)專門編制模塊(例如對(duì)MARC、GILS、FGDC等)
(2)數(shù)據(jù)處理時(shí)自動(dòng)編制(例如對(duì)Dublin Core等)
(3)數(shù)據(jù)物理處理時(shí)自動(dòng)編制(例如數(shù)字圖像掃描時(shí)的某些元數(shù)據(jù)參數(shù))
(4)共享元數(shù)據(jù)(例如OCLC/corc、IMESH
元數(shù)據(jù)互操作性
元數(shù)據(jù)互操作性問(wèn)題
由于不同的領(lǐng)域(甚至同一領(lǐng)域)往往存在多個(gè)元數(shù)據(jù)格式,當(dāng)在用不同元數(shù)據(jù)格式描述的資源體系之間進(jìn)行檢索、資源描述和資源利用時(shí),就存在元數(shù)據(jù)的互操作性問(wèn)題(Interoperability):
多個(gè)不同元數(shù)據(jù)格式的釋讀、轉(zhuǎn)換和由多個(gè)元數(shù)據(jù)格式描述的數(shù)字化信息資源體系之間的透明檢索。
元數(shù)據(jù)格式映射
利用特定轉(zhuǎn)換程序?qū)Σ煌獢?shù)據(jù)元格式進(jìn)行轉(zhuǎn)換,稱為元數(shù)據(jù)映射(Metadata Mapping/Crosswalking)。
目前已有大量的轉(zhuǎn)換程序存在,供若干流行元數(shù)據(jù)格式之間的轉(zhuǎn)化,例如
Dublin Core與USMARC; Dublin Core與EAD
Dublin Core與GILS; GILS與MARC TEI
Header與MARC FGDC與MARC
也可利用一種中介格式對(duì)同一格式框架下的多種元數(shù)據(jù)格式進(jìn)行轉(zhuǎn)換,例如UNIverse項(xiàng)目利用GRS格式進(jìn)行各種MARC格式和其它記錄格式的轉(zhuǎn)換。格式映射轉(zhuǎn)換準(zhǔn)確、轉(zhuǎn)換效率較高。不過(guò),這種方法在面對(duì)多種元數(shù)據(jù)格式并存的開放式環(huán)境中的應(yīng)用效率明顯受到限制。
標(biāo)準(zhǔn)描述框架
解決元數(shù)據(jù)互操作性的另一種思路是建立一個(gè)標(biāo)準(zhǔn)的資源描述框架,用這個(gè)框架來(lái)描述所有元數(shù)據(jù)格式,那么只要一個(gè)系統(tǒng)能夠解析這個(gè)標(biāo)準(zhǔn)描述框架,就能解讀相應(yīng)的Metadata格式. 實(shí)際上,XML和RDF從不同角度起著類似的作用。
XML通過(guò)其標(biāo)準(zhǔn)的DTD定義方式,允許所有能夠解讀XML語(yǔ)句的系統(tǒng)辨識(shí)用XML_DTD定義的Metadata格式,從而解決對(duì)不同格式的釋讀問(wèn)題。
RDF定義了由Resources、Properties和Statements等三種對(duì)象組成的基本模型,其中Resources和Properties關(guān)系類似于E-R模型,而Statements則對(duì)該關(guān)系進(jìn)行具體描述。
RDF通過(guò)這個(gè)抽象的數(shù)據(jù)模型為定義和使用元數(shù)據(jù)建立一個(gè)框架,元數(shù)據(jù)元素可看成其描述的資源的屬性。
進(jìn)一步地,RDF定義了標(biāo)準(zhǔn)Schema,規(guī)定了聲明資源類型、聲明相關(guān)屬性及其語(yǔ)義的機(jī)制,以及定義屬性與其它資源間關(guān)系的方法。另外,RDF還規(guī)定了利用XML Namespace方法調(diào)用已有定義規(guī)范的機(jī)制,
數(shù)字對(duì)象方式
建立包含元數(shù)據(jù)及其轉(zhuǎn)換機(jī)制的數(shù)字對(duì)象可能從另一個(gè)角度解決元數(shù)據(jù)互操作性問(wèn)題。
Cornell/FEDORA項(xiàng)目提出由內(nèi)核(Structural Kernel)和功能傳播層(Disseminator Layer)組成的復(fù)合數(shù)字對(duì)象。
內(nèi)核里,可以容納以比特流形式存在的文獻(xiàn)內(nèi)容、描述該文獻(xiàn)的元數(shù)據(jù)、以及對(duì)這個(gè)文獻(xiàn)及元數(shù)據(jù)進(jìn)行存取控制的有關(guān)數(shù)據(jù)。
功能傳播層,主功能傳播器(PrimitiveDisseminator)支持有關(guān)解構(gòu)內(nèi)核數(shù)據(jù)類型和對(duì)內(nèi)核數(shù)據(jù)讀取的服務(wù)功能,還可有內(nèi)容類型傳播器(Content-Type Disseminators),它們可內(nèi)嵌元數(shù)據(jù)格式轉(zhuǎn)換機(jī)制。
例如,在一個(gè)數(shù)字對(duì)象的內(nèi)核中存有MARC格式的元數(shù)據(jù),在功能傳播層裝載有請(qǐng)求Dublin Core格式及其轉(zhuǎn)換服務(wù)的內(nèi)容類型傳播器。當(dāng)數(shù)字對(duì)象使用者要求讀取以Dublin Core表示的元數(shù)據(jù)時(shí),相應(yīng)的內(nèi)容類型傳?程序的數(shù)字對(duì)象,然后將被請(qǐng)求數(shù)字對(duì)象中的MARC形式元數(shù)據(jù)轉(zhuǎn)換為Dublin Core形式,在輸出給用戶。
建議
跟蹤元數(shù)據(jù)發(fā)展、積極參與制定元數(shù)據(jù)標(biāo)準(zhǔn)、加快元數(shù)據(jù)應(yīng)用、注意國(guó)際接軌。
加快研究有效利用元數(shù)據(jù)進(jìn)行檢索(包括異構(gòu)系統(tǒng)透明檢索)、相關(guān)性學(xué)習(xí)、個(gè)性化處理等的機(jī)制。
加快研究元數(shù)據(jù)與數(shù)字對(duì)象和數(shù)字化資源體系有機(jī)整合的途徑與方法。
推進(jìn)研究利用元數(shù)據(jù)進(jìn)行基于知識(shí)的數(shù)據(jù)組織和知識(shí)發(fā)現(xiàn)。
