- 相關推薦
分布式參考咨詢服務標準與規(guī)范研究與應用
【內容提要】根據(jù)網(wǎng)上數(shù)字參考咨詢服務發(fā)展,介紹了國內外主要的數(shù)字(或網(wǎng)上)參考咨詢服務系統(tǒng)的問答內容創(chuàng)建、對象描述、知識組織、數(shù)據(jù)存取傳遞。專家信息管理、協(xié)作館信息管理、服務流程管理、質量控制、知識產權管理、個人隱私控制等方面的標準規(guī)范的研究和發(fā)展。討論了國家科學數(shù)字圖書館分布式參考咨詢服務和管理標準規(guī)范研究和規(guī)定。【摘 要 題】信息服務
[分類號]G255.54
數(shù)字化信息環(huán)境下的數(shù)字化參考咨詢服務,不僅可以體現(xiàn)文獻信息服務的專業(yè)化,自動化、智能化和知識化程度,同時能夠更有效地幫助用戶充分、高效地利用文獻信息資源與服務。
隨著數(shù)字化參考咨詢服務和協(xié)作咨詢服務網(wǎng)絡的發(fā)展,需要研究和制訂咨詢系統(tǒng)和參考服務管理標準,以保證服務質量和系統(tǒng)的互操作。目前國內外很多網(wǎng)上參考咨詢服務系統(tǒng)日益重視咨詢服務及其管理的標準化問題,正在研究和制訂一系列相關標準規(guī)范。
1 數(shù)字參考咨詢標準研究概況
目前國內外數(shù)字參考咨詢系統(tǒng)及其服務標準研究及其規(guī)范工作,主要集中在三個方面:
。1)專家或成員信息描述標準。用于識別咨詢(學科)專家(館員)或協(xié)作成員。
(2)知識庫標準。主要用于收集、描述、加工、存儲和共享問題和答案的知識庫建設。
。3)問題傳輸協(xié)議。主要解決參考咨詢服務機構之間的信息交換。
目前通常采用Web表單或者電子信箱等工具來處理這個問題。這意味著大量的數(shù)據(jù)的流動,包括從數(shù)據(jù)庫或電子信箱中導出或導入。創(chuàng)建一種信息交互的無縫方式能夠使信息共享更加容易,更加經濟。
2 參考咨詢標準內容研究
2.1 咨詢數(shù)據(jù)庫格式與標準
知識庫的數(shù)據(jù)格式提供了廣泛的問答知識的組織框架,以獲取咨詢業(yè)務中的知識層面的信息,定義參考咨詢業(yè)務流程、管理和問答知識組織、描述、存取數(shù)據(jù)。知識庫格式把參考咨詢交互轉換經過編目,并且能夠妥善保存、便于編輯修改的可靠、嚴格的知識數(shù)據(jù)。制定知識庫格式的基本原則是:必須能處理咨詢業(yè)務中濃縮的信息比特內容;在形成對信息來源的選擇和評價過程中,必須能將圖書館員的知識具體化。
目前,知識庫標準主要包括知識內容、數(shù)據(jù)元素/元數(shù)據(jù)、過程維護和功能報告。內容包括一個問/答過程完成后的問題、答案、匹配和指示/鏈接。數(shù)據(jù)和元數(shù)據(jù)元素包括信息描述、問答記錄、個人信息、權力管理、費用信息和回答者及資源的確認/證明。過程維護包括記錄的更新、增加、刪除和記錄之間的相互參見。功能報告包括知識庫記錄的趨勢、統(tǒng)計和分析。知識庫標準可以與資源描述、質量、權限管理、隱私、版權、統(tǒng)計、鑒定和存檔等方面的標準進行整合和協(xié)調。此外,需進一步研究與語言和文化、隱私、版權、行政權限以及文化、法律和政治敏感性等相關的標準。
專家與成員館描述標準須考慮提問者的描述元素和答者的描述元素,以及二者的有機結合。可參考的模型有CPEX(Customer Profile Exchange)和CDRS.CPEX中劃分類別包括代理/參與者/執(zhí)行者(如統(tǒng)一標識符,國籍、角色)、聯(lián)系方式、參與人數(shù)統(tǒng)計、交易對象參考、管理、交互歷史、優(yōu)先信息/約束以及司法和隱私限定。
交換協(xié)議包括描述過程模型,消息和功能,內容描述包。目前有許多現(xiàn)存的標準或推薦標準可以參考借鑒,或者可以與之整合、協(xié)調。如ILL、SOAP、QuIF、ISO2146、N-CIP、Z39.50等。需要研究和試驗的內容包括:問/答交換模式的應用、元素和元數(shù)據(jù)交換性測試、參考咨詢軟件包之間的測試。協(xié)議標準的發(fā)展過程中對一些涉及國際性的問題比較敏感,如語言、時區(qū)和司法問題。
知識庫格式與標準需要進一步解決的主要問題包括:版權、問題和答案的所有者、語言、文化、主題分類法的選擇、采用受控詞表還是自然語言等,知識庫中提問信息之間的平衡、數(shù)據(jù)元素、權重、值是否正確及其表單設計等。另外,作為協(xié)作式參考咨詢,需要解決合作型知識庫系統(tǒng)、問題交換標準、資源共享、標準化的度量和計費系統(tǒng)。
數(shù)字參考咨詢標準研究主要針對數(shù)字參考咨詢過程中獲取的數(shù)據(jù)進行描述、共享和存儲說明。目前,美國ABC公司(AnswerBase Corporation)和OCLC分別聯(lián)合研究型圖書館和數(shù)字圖書館聯(lián)盟(Digital Library Federation)研究提出了2個標準:KnowBit(KBIT)和QuIP。
。1)KBIT 數(shù)據(jù)庫格式
KnowBit是一種管理咨詢信息交互的標準數(shù)據(jù)格式。該格式為集成、可升級、鏈接和可擴展的數(shù)據(jù)標準,能夠將各種信息成分組合到一個簡單的格式中。它既包括對敘詞表或分類詞表的選擇,還包括與MARC及其它標準有關字段的連接。KnowBit格式區(qū)分了問題的類型:原始問題,咨詢過程問題和正式問題,并通過提問目的和所問問題類型來識別問題。描述字段可以對問題的地理范圍,語種,版權狀態(tài)和可獲得狀態(tài)進行識別。除此以外,采用主題分類,關鍵詞術語,數(shù)據(jù)條目,著者和來源評價、數(shù)據(jù)頻率等途徑可以進行分類、評價和統(tǒng)計分析,為獲取、識別、分類問題答案庫中的信息提出了有效手段。KBIT數(shù)據(jù)格式具有多種特點。
。2)QuIP數(shù)據(jù)標準
QuIP是針對基于網(wǎng)絡的數(shù)字化參考咨詢服務的問題和答案內容描述的一個交換協(xié)議。以分布式協(xié)作型為基礎,為Internet不同域的用戶設計。QuIP是一種基于元數(shù)據(jù)的線程化的數(shù)據(jù)格式,能以統(tǒng)一的格式維護、跟蹤、存儲咨詢服務的問題和答案。其核心是一個問答流。數(shù)字咨詢交換是多個問題/答案的交互。這種交換可能是多個交互,包括問題主題和咨詢人員或用戶的變化或變更。QuIP是面向過程的。QuIP支持基于多個服務器的問題和答案序列的知識共享的發(fā)展,輔助平衡服務器之間的問題負載。QuIP有三個主要概念:元數(shù)據(jù)模式,語法綁定,協(xié)議集。QuIP可分為兩個部分:
①元數(shù)據(jù)。確定數(shù)據(jù)存儲、交換的結構和格式。
、趨f(xié)議。協(xié)議能夠實現(xiàn)計算機到計算機的事務處理(如處理問題)和其它服務(如提問狀態(tài))。
3 問答知識元數(shù)據(jù)研究
3.1 數(shù)據(jù)元素特征
知識庫格式和標準建有數(shù)據(jù)元素、字段或者數(shù)據(jù)詞典,力圖使問答過程的描述和數(shù)據(jù)庫的存儲格式化、標準化。
咨詢問答過程(交互)中通常有若干個屬性。每個屬性可能會有子元素,或子屬性。
以QuIP數(shù)據(jù)標準為例,可以得出知識庫數(shù)據(jù)元素一般具備以下特征:
(1)數(shù)據(jù)元素是可強制、有條件或可選擇的。
。2)數(shù)據(jù)元素可重復或不可重復。
(3)可預定元素值。
(4)元素和屬性可擴展。
(5)建立一些控制元素。
。6)建立唯一識別符,一般分為“
注冊識別符”和“本地識別符”兩種。
。7)建立注冊信息元素。
3.2 數(shù)據(jù)元素設置
知識庫格式一般由數(shù)據(jù)字段(即元素屬性)和數(shù)據(jù)元素(即屬性子元素)組成。根據(jù)目前已有的幾個數(shù)字參考咨詢數(shù)據(jù)庫格式內容,通常數(shù)據(jù)字段分四個部分:問題字段、答案字段、成員描述字段和代理描述字段。
問題字段和答案字段十分相似,都有提問/回答跟蹤、成員館、控制、內容等幾個部分。提問/回答跟蹤字段有提問/回答代碼、時間和日期標識等元素。成員館字段主要有代碼、電子信箱、網(wǎng)址,館藏實力、館員實力、回答范圍、回答數(shù)量、代理份額、技術環(huán)境等元素。控制字段包括對問題難度、教育層次、提問/拒絕原因、詞表、分類表,已查資源、時間限制的說明性元素。內容字段則包括具體問題/答案的內容、提問關鍵詞、答案引文等元素。另外,問題字段還包括一個最終用戶手段,對個體用戶的說明。咨詢服務代理(方)描述字段主要有名稱、地址、電子信箱、網(wǎng)址、實力等元素。
目前OCLC提出的QP(Question Point)元素和虛擬咨詢臺(VRD)研究的QuIP數(shù)據(jù)元素如下:
。1)QP 數(shù)據(jù)元素設置
OCLC的QP(Question Point)數(shù)據(jù)庫格式以及數(shù)據(jù)元素主要包括五個部分:
、儆脩、代理users/agents;
、诔蓡T檔案數(shù)據(jù)庫member profile database;
③提問管理器request manager;
、苤R庫knowledge base;
、莘⻊账絽f(xié)議service level agreement.其成員館描述分為幾個層次:沒有或最少信息型、基本信息型、指導支持型、研究型、全面型。
QP也設置了問題字段和答案字段,分別對問題和答案的具體描述。問題字段包括問題內容、機構、提問文件、提問來源、教育水平、關鍵詞、提問日期、主題、地理代號、機構代號、代理代號、提問原因、提問語言、已查資源等元素(或子元素)。答案字段包括答案內容、機構名稱、答案狀態(tài)、關鍵詞、機構代號、回答日期、格式、答案語言、當前問答狀態(tài)等元素(或子元素)。
。2)QuIP數(shù)據(jù)元素設置
虛擬咨詢臺(VRD)使用的QuIP數(shù)據(jù)元素按其間關系可以形成一個等級樹狀表。QuIP線程位于最上層,包括QUID標識號和問答交互(interchange)。QUID又分為注冊號和本地號,交互流則包括次序、發(fā)起者、日期、狀態(tài),交互控制,主題、內容等幾個部分。其中,發(fā)起者是對提問/回答的組織或個人情況的描述,有名稱、地址、電子信箱、電話號碼以及在問答過程中的角色(回答者的資格或資歷、專業(yè)水平)等幾方面。內容是對問答具體內容的描述,包括格式、語種、描述、信息正文四個方面。
2002年QuIP推出了2.0版的草案,對QuIP元素作了較大修改和精簡。Interchanges用event代替,date用temporal indicator代替,text用body代替。調整后的元素等級表更為簡明清晰,主要由兩個一類對象Profile和Event組成,把問答發(fā)起者、代理的描述和問答流的描述區(qū)分開來,這與CDRS的元素結構更接近了。Profile包括代碼(PID)和描述內容(P_ Content)兩部分;Event包括狀態(tài)(State)、次序(Sequence)、內容(Content)、主題(Subject)、發(fā)起者(Actor)、時間標識(temporal indicator)、控制(Restriction)等幾個部分。其中,內容依舊由格式、語種、正文幾方面組成。
3.3 數(shù)據(jù)元素與DC元數(shù)據(jù)的映射關系
DC(Dublin Core)正在成為元數(shù)據(jù)的通用語言,因此在問答知識庫元素與DC元數(shù)據(jù)間實現(xiàn)映射有一定的意義。VRD在制定知識庫標準時就注意其QuIP元素與DC元數(shù)據(jù)的對應和映射。DC是對文件對象進行最基本的描述,而知識庫是將一次問答交互等同于一個文件,對問答數(shù)據(jù)交互進行描述,所以二者之間不能進行簡單的映射。另外,問答交互文件是動態(tài)的,在用戶和服務器,服務器和服務器之間進行數(shù)據(jù)交換時,是不斷變化的。DC元數(shù)據(jù)的特征之一就是可以根據(jù)特定的團體和應用需求進行擴展。因此,知識庫的許多元素可以從DC中擴展而來,當然也有DC中不存在的元素。
3.4 問答數(shù)據(jù)的XML描述
問答數(shù)據(jù)可以用多種方式進行描述,并能基于不同協(xié)議進行傳輸。例如,具有自己的DTD文件,能與XML語言進行綁定。以QuIP為例:
QuIP的DTD片斷:
。!——The root of a QuIP threaded interchange.——>
。!ELEMENT QuIPThread(QUIP,Interchange+)>
。迹 狝 unique identifier of thread.——>
。迹LEMENT QUIP(QUIP_Registry_ID.Local_ID)>
。!——Basic repeating element of a thread.——>
。迹LEMENT Interchange
。⊿equence,Instigator,Dates+,State?,Restriction *, Subject,Content+>
。!ELEMENT QuIP_Registry_ID(#PCDATA)>
<!ELEMENT Local ID(#PCDATA)>
4 分布式參考咨詢服務標準研究與設計
“分布式參考咨詢服務系統(tǒng)”是中國科學數(shù)字圖書館研究項目。在考察了國內外分布式數(shù)字參考咨詢系統(tǒng)的基礎之上,針對我院文獻情報系統(tǒng)網(wǎng)絡文獻信息服務的需要與發(fā)展,研究和設計了一個基于網(wǎng)絡環(huán)境下的“分布式參考咨詢服務系統(tǒng)。
系統(tǒng)建于通用性網(wǎng)絡平臺之上,整個參考咨詢系統(tǒng)采用“咨詢控制中心+成員館”的模式。主要包括單館式和實時參考咨詢。系統(tǒng)集成二種參考咨詢方式:脫機模式(Offline interactio
n),實時聯(lián)機(Real time interaction)。系統(tǒng)由讀者服務系統(tǒng)和管理系統(tǒng)組成,讀者服務系統(tǒng)能夠提供:讀者注冊、我的問題、表單咨詢、E-mail咨詢、實時咨詢、網(wǎng)站內容發(fā)布、咨詢專家推介、問題征解,最新問題/答案列表、Q/A檢索、FAQ、服務聲明、系統(tǒng)幫助等功能。管理系統(tǒng)功能主要包括系統(tǒng)的服務與管理以及11個子系統(tǒng)的運行管理。
4.1 數(shù)據(jù)模型研究與設計
根據(jù)分布式數(shù)字參考咨詢服務實際環(huán)境設計和建立系統(tǒng)數(shù)據(jù)標準。以元數(shù)據(jù)設計為基礎,通過對分布式數(shù)字參考咨詢過程、管理對象、對象與過程間關系、管理過程以及知識組織與利用進行分析和分解,建立了系統(tǒng)服務標準設計邏輯功能,并在此基礎上構建了分布式數(shù)字參考咨詢服務系統(tǒng)標準數(shù)據(jù)模型,基于這個數(shù)據(jù)模型,設計并建立了分布式數(shù)字參考咨詢服務的整個業(yè)務流程管理、咨詢專家(成員館管理)調用、咨詢質量控制與評價和知識信息組織與利用描述元數(shù)據(jù)標準與規(guī)范。分布式數(shù)字參考咨詢服務及系統(tǒng)數(shù)據(jù)模型如圖1:
附圖
圖1
4.2 數(shù)據(jù)庫格式與標準研究與設計
為了保存和共享豐富、有價值的信息和學科專業(yè)知識以及專家資源,提高系統(tǒng)的自動化和智能化管理程度,提供更多、更便捷的信息和專業(yè)知識導航,系統(tǒng)按照上述數(shù)據(jù)模型,分析提出了實現(xiàn)業(yè)務流程、專家管理、質量控制、問答知識組織與利用等各個環(huán)節(jié)、過程的數(shù)據(jù)元素,形成了系統(tǒng)的數(shù)據(jù)文件模型,并在此基礎上提出并建立了系統(tǒng)數(shù)據(jù)庫格式與標準。
分布式參考咨詢系統(tǒng)數(shù)據(jù)庫格式和數(shù)據(jù)標準是基于元數(shù)據(jù)設計制定的數(shù)據(jù)格式與標準。數(shù)據(jù)標準結構主要包括答案表、問題分配表、分類表、專家表、問題征詢表、成員館表、讀者表、問題請求表、主題詞表等9個數(shù)據(jù)表。
。1)答案表的元素設計主要有:回答、請求、次序、專家、成員、回答類型、答案內容、語言、格式、版權、時間、參考資源、質量評價等。
。2)問題分配表數(shù)據(jù)員主要有:問題分配、請求、專家、分配時間、響應時間、完成時間、答復結果。
(3)分類表的數(shù)據(jù)元素主要包括:分類號,類別名稱、類別等級等。
。4)專家表數(shù)據(jù)元素有:專家識別號、專家注冊、密碼、角色、專家姓名、成員、教育程度等。
。5)問題征詢表元素主要包括:請求識別號、次序、出處,發(fā)起者、主題、全文等。
。6)成員館表的數(shù)據(jù)元素有:成員館識別號、成員館名稱、成員館服務時間、成員館數(shù)字參考URL、成員館地址、電話等。
。7)讀者表數(shù)據(jù)元素主要包括:讀者識別號E-mail、密碼、姓名、國別、地址、郵編、電話等。
(8)問題請求表數(shù)據(jù)元素有:請求識別號、讀者識別號,成員識別號、分類號、問題主題、詞匯、問題深度、問題難度,響應時間、處理狀態(tài)、發(fā)表確認、問題IP地址等。
。9)主題詞表數(shù)據(jù)元素主要包括:詞表識別號、分類號、主題詞。
在設計分布式參考咨詢服務與管理數(shù)據(jù)標準時充分注意采用元數(shù)據(jù)標準和開放描述語言(例如DC元數(shù)據(jù)、XML、DTD)并保持與之直接對應關系,以增進系統(tǒng)數(shù)據(jù)標準的開放性和規(guī)范性。
4.3 咨詢服務與管理數(shù)據(jù)元素著錄規(guī)范
咨詢服務與管理標準化工作將提高系統(tǒng)的流程管理與信息管理效率,增加網(wǎng)絡參考咨詢務工作中各個不同成員之間、不同平臺與環(huán)境之間信息的互操作能力,提高參考咨詢服務質量,保證問答知識庫的數(shù)據(jù)質量,提高知識庫的利用率和準確率,分布式參考咨詢服務系統(tǒng)準備進一步研究和制定有關數(shù)據(jù)著錄規(guī)范。
。1)知識庫數(shù)據(jù)著錄規(guī)范
問答知識庫是由若干組經過核實、標引、編輯的問答記錄所組成的可供檢索的數(shù)據(jù)庫。知識庫可為讀者和咨詢專家提供答案檢索服務,根據(jù)知識庫的數(shù)據(jù)格式與標準要求,知識庫的數(shù)據(jù)收入范圍規(guī)定設計為:
、俜灿斜A魞r值的問題/答案須編輯處理、標引加工,存入知識庫;
、诜矊俪R、常識性問題/答案應編輯處理、標引加工,存入知識庫;
、鄯矊僖话阈钥萍贾R類問題/答案應編輯處理、標引加工,存入知識庫;
、芊矊偈聦嵭裕〝(shù)據(jù)、名詞解釋)問題/答案應編輯處理、標引加工,存入知識庫。
⑤凡有具體出處(網(wǎng)址除外)等文獻信息指南性答案應編輯處理、標引加工,存入知識庫;
、薹灿忻鞔_的信息檢索查詢指導步驟的答案應編輯處理、標引加工,存入知識庫。知識庫的數(shù)據(jù)著錄規(guī)定設計為:
⑦對問題/答案中的個人信息:姓名、E-mail地址、機構名稱、密碼、國別、地址、郵編、電話等信息經刪除后編輯加工入數(shù)據(jù)庫;
、啻鸢钢幸玫奈墨I信息書目須采用《國家文獻著錄標準—檢索期刊條目著錄規(guī)則》(GB3793-92)格式進行規(guī)范處理;
、釋栴}/答案進行學科分類審核和維護;
、庥孟到y(tǒng)知識庫分類主題詞匯,對問題/答案進行主題詞或關鍵詞標引。
。2)系統(tǒng)數(shù)據(jù)元素著錄規(guī)則
根據(jù)分布式參考咨詢服務系統(tǒng)數(shù)據(jù)庫建設,設計和制定了9個數(shù)據(jù)元素著錄規(guī)則:
、俅鸢笖(shù)據(jù)著錄規(guī)則 、趩栴}分配數(shù)據(jù)著錄規(guī)則
、鄯诸悢(shù)據(jù)著錄規(guī)則 、軐<覕(shù)據(jù)著錄規(guī)則
⑤問題征詢數(shù)據(jù)著錄規(guī)則 、蕹蓡T館數(shù)據(jù)著錄規(guī)則
⑦讀者數(shù)據(jù)著錄規(guī)則 、鄦栴}請求數(shù)據(jù)著錄規(guī)則
⑨主題詞數(shù)據(jù)著錄規(guī)則
國家科學數(shù)字圖書館分布式參考咨詢服務系統(tǒng)是基于開放體系結構的數(shù)字化網(wǎng)上咨詢服務系統(tǒng),通過開放建設和集成各種分布、 異構服務和多樣化數(shù)字信息資源,形成個性化的虛擬參考咨詢服務和完善的服務機制。為了保證數(shù)字參考咨詢服務順利開展,并高效、可持續(xù)進展,分布式參考咨詢服務系統(tǒng)將不斷按照國際化、開放性、技術成熟性等原則,明確確定本系統(tǒng)的各項服務與管理標準,以提供準確、方便的網(wǎng)絡數(shù)字參考咨詢服務。
【參考文獻】
[1]R.David Lankes.The virtual reference desk:question intercha nge profile http://www.vrd.org
[2]Blithe Allison Bennett.Virtual reference desk Incubator:A De mo.http://www.vrd.org
[3] 張奇.虛擬參考服務的成功范例——CDRS.戰(zhàn)略思考——圖書館發(fā)展十大熱門話題.上海科學技術文獻出版社,2001
[4]莫少強等.數(shù)字圖書館參考咨詢服務的實踐與研究.知識導航與圖書館服務(第一界國際圖書
館論壇論文集),上?茖W技術文獻出版社,2002
[5]吳建中,DC元數(shù)據(jù),上海科學技術文獻出版社,2000
[6] Abby S. Kasowitz. Trends and issues in digital reference servi ces. http://www. ericit. org
[7] Butler Brett. KnowledgeBit: A database format for reference ve rsion 2.0. http://www. vrd. org
[8] Marsh Geoffrey. A help desk knowledge database: the first year. http://csb. dcrt. nih. gov/kbwhite/firstyear/index. html
[9] Streenivasulu V. The role of a digital librarian
【分布式參考咨詢服務標準與規(guī)范研究與應用】相關文章:
分布式對象技術及其在Web上的應用08-09
分布式對象技術及其在Web上的應用08-06
網(wǎng)絡技術在分布式測試系統(tǒng)上的應用08-06
參考文獻的規(guī)范要求01-26