什么是元數(shù)據(jù)?
什么是元數(shù)據(jù)?
元數(shù)據(jù)(Metadata),又稱中介數(shù)據(jù)、中繼數(shù)據(jù),為描述數(shù)據(jù)的數(shù)據(jù)(data about data)。
元數(shù)據(jù)作用是:
1、描述數(shù)據(jù)屬性(property)的信息,用來支持如指示存儲位置、歷史數(shù)據(jù)、資源查找、文件記錄等功能。
2、元數(shù)據(jù)算是一種電子式目錄,為了達到編制目錄的目的,必須在描述并收藏數(shù)據(jù)的內(nèi)容或特色,進而達成協(xié)助數(shù)據(jù)檢索的目的。
元數(shù)據(jù)的應(yīng)用舉例:
1、數(shù)據(jù)結(jié)構(gòu):數(shù)據(jù)集的名稱、關(guān)系百科、字段、約束等;
2、數(shù)據(jù)部署:數(shù)據(jù)集的物理位置;
3、數(shù)據(jù)流:數(shù)據(jù)集之間的流程依賴關(guān)系(非參照依賴),包括數(shù)據(jù)集到另一個數(shù)據(jù)集的規(guī)則;
4、質(zhì)量度量:數(shù)據(jù)集上可以計算的度量;
5、度量邏輯關(guān)系:數(shù)據(jù)集度量之間的邏輯運算關(guān)系;
6、ETL過程:過程運行的順序,并行、串行;
7、數(shù)據(jù)集快照:一個時間點上,數(shù)據(jù)在所有數(shù)據(jù)集上的分布情況。
擴展資料:
元數(shù)據(jù)的優(yōu)點:
1、自描述:元數(shù)據(jù)自動提供 COM 中 IDL 的功能,允許將一個文件同時用于定義和實現(xiàn)。運行庫模塊和程序集甚至不需要向操作系統(tǒng)注冊。結(jié)果,運行庫使用的說明始終反映編譯文件中的實際代碼,從而提高應(yīng)用程序的可靠性。
2、設(shè)計:元數(shù)據(jù)提供所有必需的有關(guān)已編譯代碼的信息,以供用戶從用不同語言編寫的 PE 文件中繼承類。用戶可以創(chuàng)建用任何托管語言(任何面向公共語言運行庫的語言)編寫的任何類的實例,而不用擔心顯式封送處理或使用自定義的互用代碼。
什么是元數(shù)據(jù)?為何需要元數(shù)據(jù)?
元數(shù)據(jù)是關(guān)于數(shù)據(jù)的組織、數(shù)據(jù)域及其關(guān)系的信息,簡言之,元數(shù)據(jù)就是關(guān)于數(shù)據(jù)的數(shù)據(jù)。需要元數(shù)據(jù)是用來支持如指示存儲位置、歷史數(shù)據(jù)、資源查找、文件記錄等功能。
描述信息資源或數(shù)據(jù)本身的特征和屬性,規(guī)定數(shù)字化信息的組織,具有定位、發(fā)現(xiàn)、證明、評估、選擇等功能。
一般認為,所謂元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),或關(guān)于數(shù)據(jù)的結(jié)構(gòu)化的數(shù)據(jù)。從已有的結(jié)論看,元數(shù)據(jù)的含義是逐漸發(fā)展的。元數(shù)據(jù)一詞,早期主要指**資源的描述數(shù)據(jù),用于**信息資源的組織;其后,逐步擴大到各種以電子形式存在的信息資源的描述數(shù)據(jù)。元數(shù)據(jù)這一術(shù)語實際用于各種類型信息資源的描述記錄。
此外,元數(shù)據(jù)在地理界,生命科學界等領(lǐng)域也有其相應(yīng)的定義和應(yīng)用。
擴展資料
元數(shù)據(jù)的基本特點主要有:
a)元數(shù)據(jù)一經(jīng)建立,便可共享。元數(shù)據(jù)的結(jié)構(gòu)和完整性依賴于信息資源的價值和使用環(huán)境;元數(shù)據(jù)的開發(fā)與利用環(huán)境往往是一個變化的分布式環(huán)境;任何一種格式都不可能完全滿足不同團體的不同需要;
b)元數(shù)據(jù)首先是一種編碼體系。
元數(shù)據(jù)是用來描述數(shù)字化信息資源,特別是**信息資源的編碼體系,這導致了元數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)編碼體系的根本區(qū)別;元數(shù)據(jù)的最為重要的特征和功能是為數(shù)字化信息資源建立一種機器可理解框架。
元數(shù)據(jù)體系構(gòu)建了電子政務(wù)的邏輯框架和基本模型,從而決定了電子政務(wù)的功能特征、運行模式和系統(tǒng)運行的總體性能。
電子政務(wù)的運作都基于元數(shù)據(jù)來實現(xiàn)。
其主要作用有:描述功能、整合功能、控制功能和**功能。
由于元數(shù)據(jù)也是數(shù)據(jù),因此可以用類似數(shù)據(jù)的方法在數(shù)據(jù)庫中進行存儲和獲取。如果提供數(shù)據(jù)元的組織同時提供描述數(shù)據(jù)元的元數(shù)據(jù),將會使數(shù)據(jù)元的使用變得準確而高效。
用戶在使用數(shù)據(jù)時可以首先查看其元數(shù)據(jù)以便能夠獲取自己所需的信息。
什么叫元數(shù)據(jù)?
元數(shù)據(jù)(Meta Date),主要記錄數(shù)據(jù)倉庫中模型的定義、各層級間的映射關(guān)系、監(jiān)控數(shù)據(jù)倉庫的數(shù)據(jù)狀態(tài)及ETL的任務(wù)運行狀態(tài)。一般會通過元數(shù)據(jù)資料庫(Metadata Repository)來統(tǒng)一地存儲和管理元數(shù)據(jù),其主要目的是使數(shù)據(jù)倉庫的設(shè)計、部署、操作和管理能達成協(xié)同和一致。
元數(shù)據(jù)是數(shù)據(jù)倉庫管理系統(tǒng)的重要組成部分,元數(shù)據(jù)管理是企業(yè)級數(shù)據(jù)倉庫中的關(guān)鍵組件,貫穿數(shù)據(jù)倉庫構(gòu)建的整個過程,直接影響著數(shù)據(jù)倉庫的構(gòu)建、使用和維護。
元數(shù)據(jù)不僅定義了數(shù)據(jù)倉庫中數(shù)據(jù)的模式、來源、抽取和轉(zhuǎn)換規(guī)則等,而且是整個數(shù)據(jù)倉庫系統(tǒng)運行的基礎(chǔ),元數(shù)據(jù)把數(shù)據(jù)倉庫系統(tǒng)中各個松散的組件聯(lián)系起來,組成了一個有機的整體。
什么是元數(shù)據(jù)?
元數(shù)據(jù)被定義為:描述數(shù)據(jù)的數(shù)據(jù),對數(shù)據(jù)及信息資源的描述性信息。數(shù)據(jù)倉庫在數(shù)據(jù)倉庫領(lǐng)域中,元數(shù)據(jù)按用途分成技術(shù)元數(shù)據(jù)和業(yè)務(wù)元數(shù)據(jù)。
首先,元數(shù)據(jù)能提供基于用戶的信息,如記錄數(shù)據(jù)項的業(yè)務(wù)描述信息的元數(shù)據(jù)能幫助用戶使用數(shù)據(jù)。
其次,元數(shù)據(jù)能支持系統(tǒng)對數(shù)據(jù)的管理和維護,如關(guān)于數(shù)據(jù)項存儲方法的元數(shù)據(jù)能支持系統(tǒng)以最有效的方式訪問數(shù)據(jù)。具體來說,在數(shù)據(jù)倉庫系統(tǒng)中,元數(shù)據(jù)機制主要支持以下五類系統(tǒng)管理功能:(1)描述哪些數(shù)據(jù)在數(shù)據(jù)倉庫中;(2)定義要進入數(shù)據(jù)倉庫中的數(shù)據(jù)和從數(shù)據(jù)倉庫中產(chǎn)生的數(shù)據(jù);(3)記錄根據(jù)業(yè)務(wù)事件發(fā)生而隨之進行的數(shù)據(jù)抽取工作時間安排;(4)記錄并檢測系統(tǒng)數(shù)據(jù)一致性的要求和執(zhí)行情況;(5)衡量數(shù)據(jù)質(zhì)量。
什么是元數(shù)據(jù)?(metadata)
元數(shù)據(jù),就是描述數(shù)據(jù)的數(shù)據(jù)。好,本章完,請期待下一篇文章。
有時候我們經(jīng)常能在CDISC文件中看到metadata,翻譯過來就是“元數(shù)據(jù),源數(shù)據(jù)”,我感覺好像都可以,而且還偏向于“源數(shù)據(jù)”,源頭嘛,最原始的數(shù)據(jù)。
但是了解過后,發(fā)現(xiàn)還是“元數(shù)據(jù)”可能更合適。 那么如何理解呢?請先看下面這一組數(shù)據(jù): 09/02/21 這一組數(shù)據(jù)我相信大部分人都認為是日期,但是這是2021年9月2號還是2021年2月9號或者是09年2月21號呢?都有可能,放在不同**,讀法不一樣,得出來的日期就不一樣。實際上我們根本不知道這些數(shù)據(jù)的具體含義,因為我們不知道這個日期遵循的格式標準是什么。 所以,為了使上面的日期含義變得明確,就需要對這三組數(shù)字進行描述,像下面這樣 這個描述就成為元數(shù)據(jù),可以看到,這個描述對你的數(shù)據(jù)至關(guān)重要,它能保證別人看到你的數(shù)據(jù)后,知道是怎么回事,作用是什么,所以,元數(shù)據(jù)一般被稱為“數(shù)據(jù)的數(shù)據(jù)。
” CDISC已經(jīng)為研究所需的數(shù)據(jù)(應(yīng)采集的數(shù)據(jù)和對數(shù)據(jù)的描述或元數(shù)據(jù))制定了標準,CDISC有兩類基礎(chǔ)標準: 一類是規(guī)定內(nèi)容、數(shù)據(jù)、元數(shù)據(jù)和術(shù)語的標準,這就是define文件的作用,以前是提交define.pdf文件就好了,但現(xiàn)在隨著技術(shù)的發(fā)展,于是又出現(xiàn)了另一種標準,也就是第二類標準。 二類是數(shù)據(jù)操作模型(ODM)的傳輸標準,傳輸標準利用XML技術(shù)來傳輸數(shù)據(jù),所以我們經(jīng)常能看到CDISC文件中提到的define.xml。 不過最重要的還是要了解什么是元數(shù)據(jù),也就是metadata,這樣就不會在看IG的時候被這些詞匯弄的糊里糊涂了。
—————————————– 想知道大家的作息時間,像我的話一般10:30就睡了,然后每天差不多8個小時左右的睡眠,但是白天還是困成狗,這是為什么呢?是因為8小時定律給我造成的心里影響嗎? 但是有時候我明明睡了比8小時還久,還是沒有精神,所以我只能歸于是工作給我造成的影響,所以,人生之一大幸事就是找到自己喜歡并且熱愛的工作,在元氣滿滿中順便把錢掙了,而我們現(xiàn)在只是為了工作而工作(這也是人類必須經(jīng)受的一個考驗吧)。 想想父母從以前那么艱苦的環(huán)境下一步步把我們拉扯大,真的很好奇她們是怎么挺過來的,是我們年青一代變得嬌氣了、弱不禁風了?我想其中一個原因就是以前他們信息閉塞,即使外面的人花天酒地她們也不知道,所以也沒有什么怨氣,所有的信息都是看著周圍人怎么樣,大家都過得不好,那就這樣**是**唄。