一区二区91,久久伊人热99,亚洲AV成人一区二区三区观看在线飞飞影视,国产高清国际精品福利色噜噜

首頁論文查重動(dòng)態(tài)常用論文檢測期刊數(shù)據(jù)庫資源重復(fù)建議問題

常用論文檢測期刊數(shù)據(jù)庫資源重復(fù)建議問題

時(shí)間:2014-03-12 編輯整理:早檢測網(wǎng) 來源:早檢測網(wǎng)

論文以維普 (v iP)、中國知 網(wǎng) (c N K I)和萬方三大全丈期刊數(shù)據(jù)庫為例,分析了數(shù)據(jù)庫資源重復(fù)建設(shè)問翅,并初步提出基于學(xué)科專業(yè)分別建庫的特色化發(fā)展構(gòu)想。

電子期刊數(shù)據(jù)庫是隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)以及多媒體技術(shù)的發(fā)展而產(chǎn)生,目前已經(jīng)成為重要的學(xué)術(shù)信息資源寶庫。我國的電子期刊數(shù)據(jù)庫建設(shè)始于20世紀(jì)80年代,一經(jīng)出現(xiàn)便顯示出旺盛的生命力,特別是在90年代借助于因特網(wǎng)的應(yīng)用和普及,電子期刊數(shù)據(jù)庫更是進(jìn)人了蓬勃發(fā)展期。與國外相比,我國的電子期刊數(shù)據(jù)庫起步較晚,盡管這二十多年來的建設(shè)成果令人欣慰,但其發(fā)展中也確實(shí)存在不少問題,其中資源內(nèi)容重復(fù)建設(shè)就是主要問題之一。各個(gè)數(shù)據(jù)庫公司各自為政,獨(dú)立進(jìn)行數(shù)字化生產(chǎn),一味追求大而全、小而全,過分強(qiáng)調(diào)收錄文獻(xiàn)的數(shù),生成的數(shù)據(jù)庫資源重復(fù)、標(biāo)準(zhǔn)不一。本文就以我國三大電子期刊全文數(shù)據(jù)庫為例對此問題作簡要的分析說明,并提出數(shù)據(jù)庫資源特色化的初步構(gòu)想。

1.中文電子期刊數(shù)據(jù)庫資源建設(shè)的現(xiàn)狀及存在問題

1989年.中國科技信息研 究所重慶分所數(shù)據(jù)部成功研建《中文科技期刊數(shù)據(jù)庫》,收錄期刊以2000余種,以軟盤形式開始向全國用戶發(fā)行,開創(chuàng)了中國信息產(chǎn)業(yè)數(shù)據(jù)庫建設(shè)的先河。進(jìn)人叨年代以后,我國的電子期刊數(shù)據(jù)庫逐漸走上了商品化、產(chǎn)業(yè)化之路,許多數(shù)據(jù)公司、研究機(jī)構(gòu)及高等院校紛紛進(jìn)行數(shù)字化生產(chǎn),出現(xiàn)了規(guī)模不同風(fēng)格各異的電子期刊數(shù)據(jù)庫產(chǎn)品,經(jīng)過20多年的發(fā)展,已經(jīng)形成了vIP、CNKI、萬方三足角立,其他中小型數(shù)據(jù)庫百花齊放的國內(nèi)市場格局。

在發(fā)展過程中,各個(gè)數(shù)據(jù)庫都在不斷擴(kuò)大收錄范圍,尤其是以收錄量大而著稱的維普、中國知網(wǎng)、萬方三大電子期刊數(shù)據(jù)庫,但就其收錄的資源 內(nèi)容來看,很大一部分都是重復(fù)的。如表 1 所示,截至2(X)7年6月,維普的《中文科技期刊全文數(shù)據(jù)庫》收錄了近馴X刃種期刊刊載的150余萬篇文獻(xiàn),內(nèi)容分為社會(huì)科學(xué)、自然科學(xué)、工程技術(shù)、農(nóng)業(yè)科學(xué)、醫(yī)藥衛(wèi)生、經(jīng)濟(jì)管理、教育科學(xué)和圖書情報(bào)八個(gè)專輯。中國知網(wǎng)的《中國期刊全文數(shù)據(jù)庫(CJFD)》收錄國內(nèi)7以洲)多種期刊全文,縈積期刊全文文獻(xiàn)1750萬篇,內(nèi)容彼蓋自然科學(xué)、工程技術(shù)、農(nóng)業(yè)、哲學(xué)、醫(yī)學(xué)、人文社會(huì)科學(xué)等各個(gè)領(lǐng)域,其中核心期刊1735種?!度f方數(shù)據(jù)—中國數(shù)字化期刊群》內(nèi)容班蓋哲學(xué)政法、社會(huì)科學(xué)、經(jīng)濟(jì)財(cái)政、教科文藝、基礎(chǔ)科學(xué)、醫(yī)藥衛(wèi)生、農(nóng)業(yè)科學(xué)和工業(yè)技術(shù)八個(gè)大類10多個(gè)類目,收錄期刊近倪以)種,總記錄數(shù)7685291(更新日期2007年4月26日)。

為了對三大全文數(shù)據(jù)庫內(nèi)容重復(fù)程度有定化的認(rèn)識(shí),我們采用兩種簡單的統(tǒng)計(jì)方法。第一種是局部調(diào)查法,統(tǒng)計(jì)對象為收錄期刊種類。由于三大全文數(shù)據(jù)庫的收錄很大,難以全部進(jìn)行調(diào)查統(tǒng)計(jì),所以我們選擇圖書悄報(bào)檔案目錄下收錄的期刊作為統(tǒng)計(jì)對象,通過對圖書情報(bào)檔案目錄下期刊重復(fù)量的統(tǒng)計(jì)來預(yù)見整體。在該目錄下,按照收錄排名分別是維普、CNKI、萬方,CNKI全文數(shù)據(jù)庫共計(jì)收錄74種期刊,其中73種期刊同時(shí)被維普全文數(shù)據(jù)庫收錄,未被維普收錄的期刊是《圖書發(fā)行研究》。萬方全文數(shù)據(jù)庫共計(jì)收錄39種,其中有36種同時(shí)被維普收錄,36種同時(shí)被CNKI收錄,未被維普收錄的下種是《黑龍江檔案》,《中國典籍與文化》、《中國科技期刊研究》,未被CNKI收錄的三種期刊是《數(shù)字圖書館論壇》、《中國典籍與文化》、《中國科技期刊研究》。這些期刊種類和數(shù)量是分別以二大數(shù)據(jù)庫的期刊導(dǎo)航為依據(jù)統(tǒng)計(jì)的,在維普全文數(shù)據(jù)庫的期刊導(dǎo)航中,圖書情報(bào)檔案隸屬于文化、科學(xué)、教育、體育一級(jí)類目之下,未被作為單獨(dú)的類目列出,而是分散于信息與知識(shí)傳播、科學(xué)、科學(xué)研究等二級(jí)類目之下,所以沒有明確統(tǒng)計(jì)出圖書情報(bào)檔案類期刊的數(shù)。(統(tǒng)計(jì)時(shí)間:2007年6月16日)

第二種統(tǒng)計(jì)方法是抽樣法,統(tǒng)計(jì)對象為收錄文章數(shù)量。首先選取物理學(xué)、醫(yī)學(xué)、管理學(xué)、農(nóng)業(yè)、化學(xué)五個(gè)學(xué)科領(lǐng)域,在各個(gè)學(xué)科中用同一個(gè)檢索詞分別對三個(gè)全文數(shù)據(jù)庫進(jìn)行檢索,再統(tǒng)計(jì)檢索結(jié)果中重復(fù)的條目數(shù)。這里以作者姓名為檢索詞進(jìn)行精確查找,為使樣本具有一定的代表性,選取的五位作者都是中國科學(xué)院的院士。統(tǒng)計(jì)結(jié)果如表 2 所示,從表中的數(shù)據(jù)來看,三大全文數(shù)據(jù)庫檢索結(jié)果重復(fù)現(xiàn)象比較嚴(yán)重,尤其是CNKI和VIP的重復(fù)比例都在50%以上,甚至可以達(dá)到80%左右。萬方與VIP、CNKI的重復(fù)數(shù)也占到萬方總數(shù)的50%~90%。(統(tǒng)計(jì)時(shí)間:2007年6月18日)

2.期刊數(shù)據(jù)庫資派工復(fù)化的弊端

2.1 生產(chǎn)者的重復(fù)勞動(dòng)

由于缺乏統(tǒng)一的規(guī)劃和指導(dǎo),目前我國的各個(gè)數(shù)據(jù)公司都是各自為政、獨(dú)立生產(chǎn),各個(gè)數(shù)據(jù)庫一味追求收錄數(shù),同一種期刊或者同一篇文章通常都是被幾個(gè)數(shù)據(jù)庫同時(shí)收錄,再分別進(jìn)行數(shù)字化加工生產(chǎn),這實(shí)際上就是低水平的重復(fù)勞動(dòng)。一篇論文或者一本期刊從原來的印刷狀態(tài)轉(zhuǎn)化為最后的數(shù)字化產(chǎn)品要經(jīng)歷編目、拆裝、掃描、核對、標(biāo)引等一系列加工過程,在這個(gè)數(shù)字化的過程中需要耗費(fèi)大量的人力、物力、財(cái)力和存儲(chǔ)空間,其成本主要包括人員的工資、設(shè)備的損耗、支付的版權(quán)費(fèi)、廣告宣傳費(fèi)及其他各種管理費(fèi)用等等,而這些費(fèi)用很多卻是耗費(fèi)在資源重復(fù)建設(shè)之中。上文中統(tǒng)計(jì)的三大期刊數(shù)據(jù)庫內(nèi)容嚴(yán)重重復(fù),如CNKI和VIP全文數(shù)據(jù)庫的重復(fù)率都在50%以上,甚至達(dá)到80%,這個(gè)重復(fù)勞動(dòng)量是巨大的,浪費(fèi)的人力、物力和財(cái)力也是驚人的。

2.2 購買者的經(jīng)費(fèi)浪費(fèi)

學(xué)術(shù)性期刊數(shù)據(jù)庫的購買者多為大學(xué)、研究所和圖書情報(bào)所等非盈利性機(jī)構(gòu),這些單位的采購經(jīng)費(fèi)是非常有限的。三大全文數(shù)據(jù)庫的收錄內(nèi)容大量重復(fù)、學(xué)科范圍涵蓋各個(gè)專業(yè),但三者之間又有少量差別,購買者很難進(jìn)行選擇。尤其是大學(xué)圖書館面對的讀者往往是各個(gè)學(xué)科專業(yè)的師生,為了使查全率達(dá)到最大化,許多大學(xué)都是同時(shí)購買三個(gè)數(shù)據(jù)庫。當(dāng)用戶要求較高的查全率時(shí)往往是分別對三個(gè)數(shù)據(jù)庫進(jìn)行檢索,盡管檢索結(jié)果大部分都是重復(fù)的,但在一定程度上可以保證檢索結(jié)果的全面性。三大數(shù)據(jù)庫的價(jià)格不菲,如果同時(shí)購買無疑加重了購買者的經(jīng)濟(jì)負(fù)擔(dān),原本就很拮據(jù)的經(jīng)費(fèi)為了保證三大數(shù)據(jù)庫的購買,通常會(huì)影響其他資源的購.例如圖書館在經(jīng)費(fèi)不足時(shí)常常會(huì)裁減外文期刊的購買量。按照現(xiàn)在的價(jià)格.如果剔除三大數(shù)據(jù)庫中重復(fù)的內(nèi)容,實(shí)際每單位文獻(xiàn)的平均價(jià)格是原來的2~3倍。

2.3 使用者的利用負(fù)擔(dān)

用戶想要查找某一主題的文章時(shí),很難確定哪個(gè)數(shù)據(jù)庫更適合,為達(dá)到最大的查全率總是要分別使用三個(gè)數(shù)據(jù)庫進(jìn)行檢索。在瀏覽或者下載文章時(shí),還要進(jìn)行過濾以別除重復(fù)的文章,這就造成用戶時(shí)間和精力的極大浪費(fèi)。另外,到目前為止,國內(nèi)期刊數(shù)據(jù)庫還沒有一個(gè)統(tǒng)一的格式標(biāo)準(zhǔn)和檢索規(guī)范,不同的數(shù)據(jù)庫公司都是執(zhí)行 自己 的文件標(biāo) 準(zhǔn)和檢索方式。例如,共大期刊數(shù)據(jù)庫需要下載安裝三種閱讀器,用戶還需要掌握每個(gè)數(shù)據(jù)庫的使用方法,這些都加重了使用者的負(fù)擔(dān)。

2.4社會(huì)資源的巨大浪費(fèi)

生產(chǎn)者的重復(fù)勞動(dòng)可以將成本轉(zhuǎn)嫁給購買者,購買者(大學(xué),研究所等)的經(jīng)費(fèi)又多來自于政府撥款,國家給每個(gè)大學(xué)、研究所和圖情機(jī)構(gòu)的科研經(jīng)費(fèi)都是非常有限的。無論是生產(chǎn)者的重復(fù)勞動(dòng)還是購買者的經(jīng)濟(jì)負(fù)擔(dān),歸根結(jié)底都是對社會(huì)資源的浪費(fèi)。另外,我國數(shù)字化生產(chǎn)的能力還是十分有限的,如果都把有限的人力、物力和財(cái)力耗費(fèi)在重復(fù)的數(shù)字化生產(chǎn)上,勢必會(huì)影響對其他的學(xué)術(shù)資源和研究成果的開發(fā)能力,例如對各種灰色文獻(xiàn)的開發(fā)利用。科研領(lǐng)域的成果都是成指數(shù)增長的,數(shù)量非常巨大,每個(gè)數(shù)據(jù)庫都追求全面,結(jié)果卻是對整個(gè)社會(huì)資源收錄的不全面。據(jù)國家新聞出版署副署長李東東稱:截至 2007年4月,我國國內(nèi)期刊種類已經(jīng)達(dá)到9468種。而就三大數(shù)據(jù)庫的收錄量來看都沒有達(dá)到十分全面。如此必然會(huì)使一部分科研成果未能進(jìn)人數(shù)字化流通范圍而淹沒于信息洪流中,不能為大眾所利用,實(shí)在是對社會(huì)資源的極大浪費(fèi)。

2.期刊數(shù)據(jù)庫資諫特色化的初步構(gòu)想

針對目前中文期刊數(shù)據(jù)庫資源的重復(fù)建設(shè)問題,我們建議各個(gè)數(shù)據(jù)庫改變一味追求收錄數(shù)的經(jīng)營方式,而是更加突出針對性,實(shí)行差異化競爭。對于這一建議主要有以下幾方面的構(gòu)想。

3.1 國家統(tǒng)一規(guī)劃和協(xié)調(diào)

我國的電子期刊生產(chǎn)活動(dòng)源于20世紀(jì)80年代末,進(jìn)人90年代以后,數(shù)字信息產(chǎn)品的生產(chǎn)實(shí)現(xiàn)了產(chǎn)業(yè)化和商業(yè)化。目前,我國的數(shù)字化信息市場已經(jīng)初具規(guī)模,出現(xiàn)了一批自主經(jīng)營的數(shù)據(jù)公司。但目前的數(shù)字化信息的生產(chǎn)活動(dòng)和交易市場尚缺乏政府統(tǒng)一的領(lǐng)導(dǎo)和規(guī)范,也沒有相關(guān)的行業(yè)協(xié)會(huì)監(jiān)督,完全是自發(fā)的市場行為,各種不規(guī)范的問題普遏存在。除了本文所討論的重復(fù)化生產(chǎn)外,還有數(shù)字化生產(chǎn)的知識(shí)產(chǎn)權(quán)問題等,都是制約數(shù)字化生產(chǎn)繼續(xù)發(fā)展的重要問題。再加上我國人力、物力、財(cái)力有限的國情,我們應(yīng)該集中力量重點(diǎn)扶持一 些項(xiàng)目,在已擁有一定信息資源積累的基礎(chǔ)上,采取“國家立項(xiàng)、企業(yè)運(yùn)作、中央為主、地方配合”的模式,走宏觀調(diào)控聯(lián)合開發(fā)之路’。國家應(yīng)該設(shè)立專門的電子資源管理部門,本著資源共享的原則,對我國的電子資源尤其是學(xué)術(shù)性電子資源的生產(chǎn)和銷售活動(dòng)進(jìn)行統(tǒng)一規(guī)劃、整體協(xié)調(diào),打破各個(gè)部門各個(gè)數(shù)據(jù)公司各自為政條塊分割的局面。各部門各公司都要服從于國家的統(tǒng)一指導(dǎo)和監(jiān)督,避免重復(fù)化建設(shè)。

3.2 突出收錄資源 的學(xué)科專業(yè)特色

學(xué)科專業(yè)化是學(xué)術(shù)性電子期刊特色化研究的重點(diǎn),特別是對于全文數(shù)據(jù)庫的建設(shè),強(qiáng)調(diào)對某一學(xué)科文獻(xiàn)的收錄數(shù)和質(zhì)量,更加符合科學(xué)發(fā)展以及數(shù)據(jù)庫建設(shè)的規(guī)律。在國家統(tǒng)一規(guī)劃之下,各個(gè)數(shù)據(jù)公司按照學(xué)科專業(yè)進(jìn)行分工,每個(gè)全文數(shù)據(jù)庫只收錄某一個(gè)或者幾個(gè)學(xué)科的期刊,不追求綜合性,但求在某一學(xué)科范圍內(nèi)做到梢、深、全,追本學(xué)科內(nèi)收錄范圍最大、加工質(zhì)量最高、使用效果最好。按照學(xué)科分工的優(yōu)勢主要體現(xiàn)在兩個(gè)方面:對于生產(chǎn)者來說,標(biāo)引人員豁要某一學(xué)科專業(yè)的背景知識(shí)才能保障標(biāo)引的質(zhì),如果某個(gè)數(shù)據(jù)庫只收錄一個(gè)學(xué)科范圍,該數(shù)據(jù)公司就很容易培養(yǎng)出該學(xué)科專業(yè)的標(biāo)引專家,生成的數(shù)據(jù)庫產(chǎn)品的標(biāo)引質(zhì)更高;另外,對于購買者和使用者來說,容易根據(jù)自身的悄況進(jìn)行選擇,例如醫(yī)學(xué)院就可以只選擇購買醫(yī)學(xué)類數(shù)據(jù)庫,農(nóng)科院只需購買農(nóng)業(yè)類數(shù)據(jù)庫,使用者也可以根據(jù)自己的科研主題直接選擇某一專業(yè)類別的數(shù)據(jù)庫進(jìn)行檢索。

3.3 加強(qiáng)各個(gè)數(shù)據(jù)公司之間的交流合作

市場上的競爭和合作從來都是共存的,各個(gè)數(shù)據(jù)公司要本著共建、共享的原則進(jìn)行合作。按照上文提到的根據(jù)學(xué)科進(jìn)行分工,各個(gè)公司分別以自己專業(yè)特色的產(chǎn)品進(jìn)行竟?fàn)?但在生產(chǎn)設(shè)備、管理方法、生產(chǎn)技術(shù)、營梢措施等方面都可以進(jìn)行交流和共享,特別是要進(jìn)行信息的廣泛交流,遞免資裸的重復(fù)建設(shè)。各個(gè)數(shù)據(jù)公司在生產(chǎn)前要進(jìn)行深人的市場調(diào)查、準(zhǔn)確地進(jìn)行市場細(xì)分和定位,確定重點(diǎn)、突出特色。為了保證特色數(shù)據(jù)庫在內(nèi)容姓“特” ,在質(zhì)上月“優(yōu)” ,數(shù)據(jù)庫開發(fā)研制單位應(yīng)加強(qiáng)對信息市場的調(diào)查.努力做到“你無我有,你有我新,你新我奇,你奇我特”,以避免因不必要的重復(fù)建設(shè)所導(dǎo)致的大量人力物力和財(cái)力的浪費(fèi)。


作者:溫芳芳 (鄭州大學(xué)信息管理系)

在線咨詢
在線留言
系統(tǒng)列表
返回頂部