- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2022-10-20來源:裝瘋都要死瀏覽數:878次
元數據是解釋數據的數據,數據字典也能解釋數據。數據字典是存儲所有信息的存儲庫。元數據是關于數據的數據。元數據是定義其他數據的數據。因此,數據字典可以是描述有關數據庫的一些信息的元數據。

可以這樣理解:元數據描述了數據。它是“關于數據的數據”。它包含有關如何、何時、由誰收集特定數據以及數據格式的信息。了解存儲在數據倉庫和基于 xml 的 Web 應用程序中的信息至關重要。數據字典是由數據庫的基本定義組成的文件。它包含數據庫中可用的文件列表、每個文件中的記錄數以及有關字段的信息。數據字典是存儲所有信息的存儲庫。元數據是關于數據的數據。元數據是定義其他數據的數據。因此,數據字典可以是描述有關數據庫的一些信息的元數據。
下面我們詳細了解下元數據和數據字典的主要內容。
一、關于元數據
元數據是指“關于數據的數據”。雖然“meta”前綴的意思是“之后”或“遲于”,但在認識論中它被用來表示“關于”。元數據被定義為提供關于數據的一個或多個方面的信息的數據;它用來總結關于數據的基本信息,以便更容易地跟蹤和處理特定的數據一些例子包括:
?數據的創建方法
?數據的用途
?創建的時間和日期
?數據的創建者或作者
?在計算機網絡上創建數據的位置
?標準使用
?文件大小
?數據質量
?數據來源
?用于創建數據的過程
例如,一幅數字圖像可能包含描述圖像大小、顏色深度、分辨率、創建時間、快門速度和其他數據的元數據文本文檔的元數據可能包含以下信息:文檔有多長、作者是誰、文檔的編寫時間以及文檔的簡短摘要。網頁中的元數據也可以包含頁面內容的描述,以及鏈接到內容的關鍵詞這些鏈接通常被稱為“元標簽”,直到20世紀90年代末,它一直被用作決定網頁搜索順序的主要因素在20世紀90年代后期,由于“關鍵詞填充”,元標簽在網絡搜索中的依賴程度有所下降,因此元標簽在很大程度上被誤用,以欺騙搜索引擎,使其認為一些網站在搜索中具有比實際更大的相關性。
元數據可以存儲和管理在一個數據庫中,通常稱為元數據注冊中心或元數據存儲庫。然而,如果沒有上下文和參考點,僅通過觀察可能無法識別元數據。例如:就其本身而言,一個包含數個數字的數據庫,所有13位數字都可能是計算的結果或插入等式的數字列表——沒有任何其他上下文,數字本身可以被視為數據。但是,如果給定這個數據庫是一個藏書日志的上下文,那么這些13位數字現在可以被識別為ISBN——指的是書的信息,但本身不是書中的信息。術語“元數據”是由Philip Bagley于1968年在他的《編程語言概念的擴展》一書中創造出來的,很明顯,他在ISO 11179的“傳統”意義上使用了這個術語,即“結構元數據”。“關于數據容器的數據”;而不是另一種含義“關于數據內容的單個實例的內容”或元內容,通常在圖書館目錄中找到的數據類型。從那時起,信息管理、信息科學、信息技術、圖書管理和GIS等領域都廣泛采用了這個術語。在這些字段中,元數據一詞被定義為“關于數據的數據”雖然這是一個被普遍接受的定義,但不同的學科對這個術語采用了各自更具體的解釋和用法。
1? 元數據的類型
?? 雖然元數據應用程序是多種多樣的,涵蓋了各種各樣的字段,但是有專門的、被廣泛接受的模型來指定元數據的類型。Bretherton和Singley(1994)區分了兩個不同的類別:結構/控制元數據和引導元數據結構元數據描述數據庫對象的結構,如表、列、鍵和索引。指南元數據幫助人們找到特定的項目,通常用自然語言表示為一組關鍵字。根據Ralph Kimball的說法,元數據可以分為3類:技術元數據、業務元數據和操作元數據。
??? NISO區分了3種類型的元數據:描述性的、結構化的和管理性的。描述性元數據通常用于發現和識別,作為搜索和定位對象的信息,如標題、作者、主題、關鍵字和出版商。結構元數據描述對象的組件是如何組織的。結構化元數據的一個例子是如何對頁面進行排序以形成一本書的章節。最后,管理元數據提供幫助管理源的信息。管理元數據指的是技術信息,比如文件類型,或者文件創建的時間和方式。管理元數據的兩個子類型是權限管理元數據和保存元數據。權限管理元數據解釋知識產權,保存元數據包含保存和保存資源的信息。
??? 統計數據存儲庫對元數據有自己的要求,以便不僅描述數據的來源和質量,而且還描述用于創建數據的統計過程,這對統計界來說特別重要,以便驗證和改進統計數據生產過程。另一種開始得到開發的元數據類型是可訪問性元數據。可訪問性元數據對圖書館來說并不是一個新概念;然而,通用設計的進步提高了它的知名度。像Cloud4All和GPII這樣的項目發現,缺乏通用術語和模型來描述用戶的需求和偏好,以及滿足這些需求的信息,這是提供通用訪問解決方案的主要差距。這些類型的信息是可訪問性元數據。
2? 元數據的示例

圖像中的元數據

描述用的元數據

Web中的元數據


文檔中的元數據

數據庫中的元數據
以上都是元數據的例子。我希望您已經很好地理解了什么是元數據。
二、關于數據字典
數據字典是數據庫的組成部分,它保存有關數據庫的信息以及它存儲的稱為元數據的數據,以便我們可以管理數據。也可以說數據字典是元數據的來源之一。數據字典不包含數據庫實際數據的信息。如果沒有數據字典,數據庫管理系統就無法訪問數據庫中的數據。數據庫管理員處理數據字典,用戶不與它交互。
1 數據字典包含以下信息:
?它包含數據庫中存在的所有表和模式的名稱。
?它包含有關數據庫中存在的表的詳細信息,例如創建表的時間、有關表的所有者信息等。
?它包含有關表的約束信息,如主鍵屬性。
?它還包含有關數據庫視圖的信息。
?它還包含表格的物理信息,例如關于它們的存儲、關于它們的更改等。數據字典用于實際控制數據庫操作、數據完整性和準確性。開發人員使用元數據來開發程序、查詢、控制和程序來管理和操作數據。元數據作為在線系統文檔可供數據庫管理員(DBA)、設計人員和授權用戶使用。這提高了數據庫管理員(DBA)對信息系統的控制以及用戶對系統的理解和使用。
2? 數據字典的類型數據字典有兩種類型:主動和被動。數據字典可以是主動的也可以是被動的。主動數據字典(也稱為集成數據字典)由數據庫管理軟件自動管理。與數據庫的當前結構和定義一致。大多數關系數據庫管理系統都包含可以從其系統目錄派生的活動數據字典。當數據庫管理系統對數據庫進行任何更改時,數據字典也會更新。它被稱為主動數據字典。也可以說,如果數據庫的結構或任何其他內容發生更改,那么該數據庫的數據字典也會發生更改。這是數據庫管理系統的任務。被動數據字典(也稱為非集成數據字典)是僅用于文檔目的的一種。數據處理環境中有關字段、文件、人員等的數據。輸入字典并交叉引用。被動字典只是一個獨立的應用程序或表單。它由系統的用戶管理,并在數據庫結構發生變化時進行修改。由于此修改必須由用戶手動執行,因此數據字典可能不會與數據庫的當前結構保持同步。然而,被動數據字典可以作為單獨的數據庫來維護。因此,它允許開發人員保持獨立于使用特定的關系數據庫管理系統。它可以擴展為包含有關未計算機化的組織數據的信息。在被動數據字典中,字典的內容不會自動更新,每次更改都是由數據庫管理系統在數據庫中進行的。因此,我們必須不時手動更新它。它與數據庫分開維護。被動數據字典的處理不像主動數據字典那么容易。我們必須小心維護它,以便數據字典和數據庫之間的同步不會中斷。
3? 數據字典的重要性由于以下原因,數據字典在DBMS中必不可少:
?數據字典提供數據元素的名稱、它的描述和可以在其中找到它的數據結構。
?數據字典在生成有關數據元素在所有提及它的程序中的使用位置的報告方面提供了極大的幫助。
?給定描述名稱的關鍵字,也可以搜索數據名稱。例如,您可能想要確定代表凈工資的變量的名稱。輸入關鍵字將生成可能的標識符及其定義的列表。使用關鍵字可以搜索字典以找到在程序中使用的正確標識符。如今,商業數據字典包可用于方便輸入、編輯和使用數據元素。數據字典的功能其功能如下:
?它定義了數據庫中每個用戶的數據對象。眾所周知,我們無法記住所有的表、視圖、約束等,因此用戶可以在任何數據定義語言(DDL)觸發時輕松搜索它們,然后數據庫搜索數據字典。DBMS軟件更新對象。
?它為我們提供了有關對象正在使用的數據和資源的報告。
?它允許那些有權訪問數據庫的用戶查看表和視圖。因此,它控制數據庫的訪問。
4? 數據字典的優點
?使用數據字典,以便我們可以刪除數據定義中的重復項。
?因為它提供了文檔。因此,它對任何組織都是有價值的參考。
?幫助分析人員簡化結構,使其滿足系統數據的要求。
?它有助于改善用戶和系統分析師之間的溝通。
?最大的數據庫管理系統包含數據字典作為標準功能。
?通過這個,新的數據庫管理員可以很容易地了解系統的數據庫。?數據庫管理員可以輕松跟蹤數據庫中的任何問題。
5? 數據字典示例

數據庫中的數據表


三、元數據和數據字典的關系
元數據本質上是關于數據的信息。元數據包含有關何時收集數據、如何收集以及由誰收集的信息。這有助于增強商業智能,并使團隊更好地了解他們公司擁有的數據。通過自動化的元數據管理,BI和分析團隊可以立即定位相關數據,識別數據的起源點,并創建合理的見解。通過創建有關數據的數據,團隊還可以設置流程和策略,以確保可以輕松訪問、共享、鏈接、集成和分析信息。這可確保數據對公司的所有成員都是相關且準確的。
元數據有助于填充數據字典。在數據字典中,BI團隊可以上傳他們已經從不同數據庫或描述中保存的任何數據元素。它是一個包含數據庫基本定義的文件。數據字典是BI專業人員用來組織所有元數據的主要工具。與公司數據倉庫(DWH)中存在的數據有關的所有信息都存儲在數據字典中。數據字典供技術團隊使用,是引用不同數據屬性的主要場所,包括約束、數據類型、默認值、長度、轉換規則和業務定義。通過建立整個公司都能理解的連貫定義,所有團隊都可以在同一層面上。這有助于保持數據的有效性并實現組織內的一致性。