解讀《錄音錄像類電子檔案元數據方案》DA/T 63—2017
根據檔案館(室)錄音錄像類電子檔案管理要求,經國家檔案局批準,江西省檔案局于2011年著手開展錄音錄像類電子檔案元數據標準化研究工作,2014年開始文本編制工作,2017年8月最終成果《錄音錄像類電子檔案元數據方案》(DA/T 63—2017)正式發布,并于2018年1月1日起實施。
編制背景
在電子檔案生命周期全程,依托應用系統持續捕獲、著錄元數據是保證電子檔案真實性、可靠性、完整性和可用性(以下簡稱“四性”)的重要措施之一。為此,國家檔案局先后組織編制并發布了《文書類電子文件元數據方案》(DA/T 46—2009)、《照片類電子檔案元數據方案》(DA/T 54—2014)等多項元數據標準。由于錄音錄像類電子檔案物理結構復雜、著錄與管理要求不同等自身特性,上述檔案行業元數據標準均不能完全適應其管理要求。比如,數字音視頻編碼標準有MPEG-X、H.2XX等10余種,一種編碼標準下具體技術參數亦可能不同,如色彩空間、視頻比特率、色度采樣率等。任何格式的計算機文件的寫入、存儲、讀取和呈現都是依據編碼標準進行編碼和解碼的過程。在電子檔案體外采用結構元數據記錄編碼標準及關鍵技術參數,就是保持錄音錄像類電子檔案解碼播放、格式轉換等功能,以此為電子檔案的長期可讀和可用提供保障。錄音錄像類電子檔案獲取方式還包括網上下載、購買、收錄等多種途徑,如果涉及攝錄者個人,還需要進行知識產權管理。此外,錄音錄像類電子檔案的可讀性要依靠對主題內容、責任者、業務背景等進行較為全面的著錄方可實現,這些都需要通過元數據給予記錄。
根據上述情況,有必要編制專門的元數據標準用于規范、指導錄音錄像類電子檔案元數據的捕獲、著錄等管理活動。
編制依據與適用范圍
1
編制依據
編制過程中,該標準主要依據《標準化工作導則 第1部分:標準的結構和編寫原則》(GB/T 1.1—2009)設置框架及文本內容,依據《電子檔案管理基本術語》(DA/T 58—2014)等相關標準定義術語。同時,依據或參照《信息與文獻 文件元數據管理 第2部分 概念與實施》(ISO23081—2009)、《檔號編制規則》(DA/T 13—1994)、《檔案著錄規則》(DA/T 18—1999)等標準,并結合我國檔案管理實際設置錄音錄像類電子檔案元數據集框架及其具體元數據。
2
適用范圍
該標準主要適用于各級各類檔案館及其立檔單位,可用來描述、管理以卷、件為單元的錄音錄像類電子檔案。基于該標準對各個元數據應用層次屬性的描述可組合形成附錄B所列的案卷級、文件級元數據集,將其實現于相關應用系統后即可支持檔案館(室)開展案卷級、文件級錄音錄像類電子檔案著錄工作,實現元數據全自動和半自動化捕獲、著錄,并為錄音錄像類電子文件歸檔與電子檔案管理提供支撐。
為實現錄音錄像檔案數字副本的集成管理和長期保存,該標準所設元數據均適用于錄音錄像檔案數字副本,其中,數字化責任信息、數字化時間、原始載體、生成方式等元數據具有明確的指向性,視頻參數、音頻參數與《錄音錄像檔案數字化規范》(DA/T 62—2017)第9章所列技術參數完全兼容。因此,錄音錄像檔案數字副本及其元數據管理可參照該標準執行。
主要內容
1
標準結構
該標準共9部分,第1~4章分別為范圍、規范性引用文件、術語和定義、元數據實體及元數據描述方法,第5~8章則分別對元數據集的4大類元數據作出逐一描述,附錄部分給出了5個實用性工具,均為資料性附錄。元數據集共計96個元數據,其中,必選元數據18個,可選元數據45個,條件選元數據33個,覆蓋了錄音錄像類電子檔案全生命周期。元數據捕獲方式主要有全自動、半自動和手工著錄3種,有12個容器型元數據無需著錄,47個元數據應由相關應用系統在不同業務節點和時間點全自動捕獲,33個元數據可以半自動方式捕獲,只有題名、責任者、攝錄者、附注4個元數據需手工著錄,最大限度地實現了元數據標準化與著錄自動化。
2
元數據集的一體化設置
數字音視頻文件結構示意圖
錄音錄像類電子檔案是指錄音類電子檔案和錄像類電子檔案。經對比研究,二者的元數據存在較大范圍的重合,不同之處在于責任者的稱呼,錄像類電子檔案技術參數涉及視頻編碼部分。在最簡單的數字音視頻文件結構中,沿著時間軸的伸展,至少由一個音頻編碼數據流和與其并行的一個視頻編碼數據流組成,比數字音頻文件多了視頻編碼數據(如圖所示)。為此,該標準提供了錄音錄像類電子檔案一體化元數據集,通過適用門類屬性和攝錄者元數據的設置予以區分。
3
元數據集構成及其作用
錄音錄像類電子檔案元數據集由檔案實體、業務實體、機構人員實體和授權實體元數據4個部分組成。檔案實體元數據用于描述錄音錄像類電子檔案本身,為必選元數據實體,共75個元數據,涵蓋了電子檔案標識、內容、結構、背景和管理權限等多個方面。檔號、題名、責任者、攝錄者、時間、保管期限等18個必選元數據都位列其中;業務實體、機構人員實體和授權實體元數據為管理過程元數據,均為可選元數據實體,該標準推薦采用多元數據實體模式,此時,業務實體、機構人員實體為必選元數據實體。將業務實體的管理活動元數據與另一個或兩個元數據實體組配后即可描述一系列管理活動,使后人能夠追溯任一電子檔案管理過程,并與檔號、原始載體、捕獲設備等元數據共同解答“它從哪里來”等重要問題,為錄音錄像類電子檔案的真實性和可靠性提供證據鏈。
4
元數據描述
該標準第4章第4節規定了元數據描述方法,描述內容包括23個屬性。除對注冊版本、注冊機構、字符集、語言4個共同屬性進行集中描述外,還需從編號、中文名稱、英文名稱、定義等19個屬性對每個元數據進行逐一描述。
下面只對約束性等4個元數據屬性作出進一步說明:
約束性屬性有3個值域,包括必選、條件選和可選。該標準明確的18個必選元數據是最小元數據集,同時適用于檔案室和檔案館。條件選有2種情況:其一,當該元數據所屬實體或其上位元數據被選用時,該元數據必選,如業務實體的管理活動元數據和檔案實體的主題、來源、存儲、原始載體元數據的子元數據;其二,格式名稱、格式版本元數據的約束性為條件選,當其上位復合型元數據格式信息僅作為容器型元數據時,這兩個元數據必選。
可重復性屬性用于說明該元數據或元數據組是否可以循環著錄新的元數據值。不可重復元數據僅記錄最后一次著錄信息。可重復元數據有主題、捕獲設備、計算機文件大小等11個(組)元數據。主題元數據用于一件錄音錄像電子檔案的多個片斷內容的深度著錄,比如,描述某次重大活動的各項議程信息。其他可重復元數據則可以反映錄音錄像類電子檔案形成、變化或管理過程,如再次執行格式轉換操作,則電子檔案編碼標準、計算機文件格式等必然變化,應通過相互關聯的元數據捕獲、著錄新的元數據值。
信息來源屬性從捕獲節點和捕獲方式2個緊密關聯的方面對元數據進行描述。捕獲節點主要有登記、掛接、手工著錄、觸發或完成管理行為等業務節點。捕獲方式主要有5種:從操作系統和應用系統參數自動捕獲、從電子檔案內部編碼數據中自動提取、基于應用系統數據字典半自動捕獲、由外部數據導入以及手工著錄。
著錄說明屬性則明確了復合型和簡單型元數據值著錄的規范性要求,并提供了具體的著錄示例,附錄D、附錄E分別提供了整體著錄實例,為標準實施提供具體參考。
元數據集的實施應用
該標準推薦全面采用所設元數據集,或由省級檔案行政管理部門統一編制錄音錄像類電子檔案元數據集及其XMLSchema,統一實施于相關應用系統。編制本地區元數據集時,需考慮區域性電子檔案全程管理、集成管理和異構應用系統間的數據共享、交換等因素,有助于優化應用系統功能設計、開發和運維升級;本地區檔案館(室)需要管理錄音錄像檔案數字副本時,應將數字化責任信息等元數據一并納入元數據集,以便實現二者的集成管理;使用商業化媒資管理系統的檔案館(室),應要求中標供應商完成系統功能對標工作。
在技術層面,任何門類電子檔案元數據集的實施應用都是通過嵌入相關應用系統而實現的,錄音錄像類電子檔案元數據集也無例外。這個“嵌入”包含數據庫與一系列管理功能的設計與開發。因此,在實施元數據集之前,檔案局(館)和應用軟件開發商等相關責任人要全面讀懂每個元數據的23個屬性,在此基礎上方能編制本地區錄音錄像類電子檔案元數據集,開展相關應用系統功能需求分析、采購需求撰寫、軟件設計開發等工作。
轉自:蘭臺之家