時(shí)間:2014-03-16 編輯整理:早檢測網(wǎng) 來源:早檢測網(wǎng)
在網(wǎng)絡(luò)資源飛速發(fā)展的大環(huán)境下,科技網(wǎng)絡(luò)資源的建設(shè)逐步完善,在我國開展科技查新工作的二十多年歷程中,以往以手工檢索書本型檢索工具為主的工作模式,也逐漸轉(zhuǎn)變?yōu)橐杂?jì)算機(jī)檢索科技數(shù)字資源為主的檢索方式??萍疾樾?,簡單地說就是基于文獻(xiàn)檢索判定前人有無相似的研究或成果,為判斷目標(biāo)項(xiàng)目是否具有新穎性提供客觀依據(jù),以防止低水平重復(fù)研究開發(fā)而造成的人力,財(cái)力,物力的浪費(fèi)和損失。要完成一個(gè)項(xiàng)目查新,證實(shí)該項(xiàng)目涉及的研究內(nèi)容在檢索范圍內(nèi)未見有文獻(xiàn)報(bào)告,就要求立足于對相關(guān)文獻(xiàn)檢索的全面性,而檢索人員則通過多個(gè)電子數(shù)據(jù)庫聯(lián)用的方式來應(yīng)對“查全”的要求。
萬方,維普,CNKI作為中文文獻(xiàn)檢索的三大常用數(shù)據(jù)庫資源,它們在各個(gè)學(xué)科領(lǐng)域的查新過程中基本成為必檢的數(shù)據(jù)庫。而由于上述三大數(shù)據(jù)庫各自的特點(diǎn),它們相互具有資源同質(zhì)化和差異化。因此在查新過程中應(yīng)當(dāng)充分發(fā)揮三大數(shù)據(jù)庫檢索功能的優(yōu)勢,互補(bǔ)式地調(diào)用三大數(shù)據(jù)庫中的文獻(xiàn)資源,以減少漏檢的風(fēng)險(xiǎn)。此外,由于搜索引擎能有效地搜索因特網(wǎng)上的相關(guān)信息,充分調(diào)用網(wǎng)絡(luò)資源所以它對提高查全率的作用受到越來越多的重視。已有文獻(xiàn)論述了三大常用數(shù)據(jù)庫資源以及搜索引擎在查新檢索中的重要性及其數(shù)字資源的特點(diǎn),但未見有文獻(xiàn)對它們的檢索能力進(jìn)行定量研究。本文旨在對查新過程中的檢出文獻(xiàn)進(jìn)行定量分析,對比研究科技電子資源數(shù)據(jù)庫與網(wǎng)絡(luò)資源在查新過程中的文獻(xiàn)檢索能力。
選取萬方,維普以及CNKI三大中文常用數(shù)據(jù)庫,為電子資源數(shù)據(jù)庫選取Google,Baidu兩大搜索引擎為網(wǎng)絡(luò)資源檢索工具。通過對檢出文獻(xiàn)的定量分析,研究電子資源數(shù)據(jù)庫與網(wǎng)絡(luò)資源在查新過程中的文獻(xiàn)檢索能力,同時(shí)調(diào)用國家知識產(chǎn)權(quán)局http://www.sipo.gov.cn/ 的專利數(shù)據(jù)信息用作專利檢索能力對比研究。上述數(shù)據(jù)庫及網(wǎng)絡(luò)信息均為2012年6月份數(shù)據(jù)。
文中選取兩個(gè)理工類(材料領(lǐng)域熱)門查新課題作為研究案例,包括“硅基量子點(diǎn)太陽電池的關(guān)鍵技術(shù)”和“氧化錳分子篩的合成表征及應(yīng)用”。在檢索過程中編定一精確檢索式以便保證研究數(shù)據(jù)具有橫向?qū)Ρ葍r(jià)值。在萬方,維普以及CNKI三大中文常用數(shù)據(jù)庫中,檢索范圍限定在題目,關(guān)鍵詞和文摘范圍內(nèi),以確保上述三個(gè)中文數(shù)據(jù)庫檢索范圍的一致性。
首先從各個(gè)數(shù)據(jù)庫以及搜索引擎當(dāng)中檢索獲取相關(guān)文獻(xiàn),再由人工逐一篩除從檢索中獲,得的但實(shí)際基本不相關(guān)或相關(guān)度較低的文獻(xiàn),得到用于數(shù)據(jù)統(tǒng)計(jì)和分析的有效文獻(xiàn),并將有效文獻(xiàn)按期刊論文,學(xué)位論文,會議論文和專利四個(gè)類別進(jìn)行統(tǒng)計(jì)。在數(shù)據(jù)統(tǒng)計(jì),中為了反映文獻(xiàn)發(fā)表年限的分布情況,將檢索年限分成六個(gè)區(qū)域,分別為2000年以前(主要是1990~1999年間的文獻(xiàn)),2000~2004年,2005~2009年,2010年,2011年和2012年,近三年的數(shù)據(jù)單獨(dú)統(tǒng)計(jì)是為了能更直觀反映研究對象對最新文獻(xiàn)的檢索能力。利用Excel將系列有效數(shù)據(jù)以柱狀圖形式直觀反映在同一圖表中,以便作橫向定量分析,通過對人工篩選后得出的檢出文獻(xiàn)數(shù)量值,完整度以及相關(guān)度進(jìn)行綜合考慮,對三大數(shù)據(jù)庫及搜索引擎的檢索能力做出初步評價(jià)。
期刊論文:在統(tǒng)計(jì)于2010年的數(shù)據(jù)中,在萬方,維普和CNKI中檢出密切相關(guān)期刊論文數(shù)量值分別為2,3和5,其中萬方,維普檢出的文獻(xiàn)全部不相同,而兩者調(diào)出的文獻(xiàn)則分別對應(yīng)CNKI檢出的5篇文獻(xiàn)。2011年數(shù)據(jù)中,萬方,維普檢出密切相關(guān)期刊論文數(shù)量值分別為1和0,CNKI的檢出數(shù)量值為2,其中1篇同于萬方檢出的相關(guān)文獻(xiàn)。2012年數(shù)據(jù)中,萬方,維普均未檢出密切相關(guān)期刊論文,而CNKI的檢出數(shù)量值為3。在這個(gè)案例中,CNKI檢出的密切相關(guān)期刊論文基本覆蓋了萬方和維普兩個(gè)庫。另一方面,利用Google和Baidu搜索引擎檢出的相關(guān)期刊論文數(shù)量較多,對其逐一比照后發(fā)現(xiàn),所述文獻(xiàn)有一部分與三大數(shù)據(jù)庫中調(diào)出文獻(xiàn)相同,也有一部分文獻(xiàn)未能以同一個(gè)檢索式從三大數(shù)據(jù)庫中調(diào)出這里分析主要原因:有1)搜索引擎對檢索詞的檢索范圍有可能超出題目關(guān)鍵詞和文摘一定程度削弱了有效數(shù)據(jù)的可對比性2)搜索引擎調(diào)用了網(wǎng)上各類資源部分文獻(xiàn)所屬的雜志三大數(shù)據(jù)庫未有收錄,盡管檢出文獻(xiàn)數(shù)量上占據(jù)絕對優(yōu)勢但通過對文獻(xiàn)進(jìn)行人工注意比照分析后發(fā)現(xiàn)搜索引擎檢出的相關(guān)期刊論文在相關(guān)度方面明顯低于三大數(shù)據(jù)庫中調(diào)出的文獻(xiàn)而且搜索引擎調(diào)出的大部分文獻(xiàn)連接此查新課題中約為83%實(shí)際上是調(diào)用了三大數(shù)據(jù)庫的資源即通過調(diào)整檢索式和檢索范圍,以在三大數(shù)據(jù)庫中調(diào)出這部分文獻(xiàn),此外搜索引擎檢出的相關(guān)期刊論文中還有較多綜述文獻(xiàn)而查新報(bào)告中引用相關(guān)文獻(xiàn)一般為研究型論文而較少采用綜述文獻(xiàn)。
學(xué)位論文:本查新案例中萬方,CNKI在學(xué)位論文的檢出數(shù)量值方面優(yōu)于Google和Baidu搜索打開搜索引擎鏈接發(fā)現(xiàn)調(diào)出的大部分有效信息(此查新課題中約為89%)同樣最。終是連接到三大數(shù)據(jù)庫之一,而且從Google和Baidu搜索引擎得到的相關(guān)學(xué)位論文已被萬方及CNKI共同覆蓋,可以認(rèn)為在本查新案例中無需進(jìn)一步利用Google和Baidu搜索引擎進(jìn)行學(xué)位論文的補(bǔ)檢,而萬方和CNKI分別有部分學(xué)位論文在對方中未能檢出因此兩者需互補(bǔ)使用。
會議論文:在本查新案例中,萬方,CNKI,Google,Baidu都在會議論文檢索方面體現(xiàn)了一定作用,從Google或Baidu檢出的個(gè)別會議論文無法從萬方或CNKI中調(diào)出,因此需要聯(lián)用上述檢索手段才能保證會議論文的檢全率。
專利:從萬方調(diào)出的相關(guān)專利從數(shù)量上和相似度上都十分接近于國家專利局發(fā)布的相關(guān)專利,僅是在2011年的數(shù)據(jù)中萬方多檢索出1篇相關(guān)專利,其余與國家專利局的數(shù)據(jù)完全一致(總計(jì)獲得17項(xiàng)相關(guān)專利),CNKI檢出的相關(guān)專利總計(jì)僅5項(xiàng),且全部被包含于萬方調(diào)出專利.而Baidu則調(diào)出28項(xiàng)專利,其中11項(xiàng)專利同于萬方調(diào)出的數(shù)據(jù),剩余17項(xiàng)專利在相關(guān)度方面明顯較低。因此,在本查新案例中,可以認(rèn)為利用萬方及國家專利局網(wǎng)上專利搜索已能滿足專利檢索的要求。
檢索式:(氧化錳or MnO2) and 分子篩。
期刊論文:此查新項(xiàng)目中從萬方維普CNKI調(diào)出的期刊論文數(shù)量接近相互重復(fù)性也較大GoogleBaidu也都能調(diào)出較多論文但相關(guān)度同樣較低。
學(xué)位論文:CNKI中調(diào)出的學(xué)位論文包含了其他數(shù)據(jù)及搜索引擎調(diào)出的全部學(xué)位論文表現(xiàn)出最佳檢索效果。
會議論文:萬方及CNKI的檢索結(jié)果都比較理想但兩者調(diào)出文獻(xiàn)中都有不重復(fù)部分Baidu中則無法調(diào)出密切相關(guān)的會議論文。
專利:從萬方調(diào)出專利數(shù)量與從國家專利局調(diào)出的專利數(shù)量接近分別是33項(xiàng)和29項(xiàng)而后者29項(xiàng)專利都被包含于前者之中CNKIGoogle及Baidu的檢索效果均不理想。
通過對上述查新案例作綜合分析用以評價(jià)三大數(shù)據(jù)庫及收索引擎的檢索能力如表3所示:
通過查新案例的研究對三大數(shù)據(jù)庫及搜索引擎的檢索能力綜合評價(jià)為:
萬方:綜合檢索能力較好尤其是專利的檢索能力較強(qiáng)一般能滿足初步檢索的要求檢索速度快便于提煉檢索詞和初步制定檢索式無時(shí)間限制便于長時(shí)間檢索。
維普:對期刊論文的檢索能力較好可實(shí)現(xiàn)文摘顯示便于把握查新點(diǎn)的技術(shù)范疇且檢索速度較快。
CNKI:對期刊論文及學(xué)位論文的檢索能力突出檢索速度較快但對專利檢索不理想。
Google:檢索內(nèi)容豐富尤其適用于對會議論文的補(bǔ)充檢索但文獻(xiàn)可靠性需考究。
Baidu:可檢索出大量信息特別適用于查新過程中對產(chǎn)品信息的檢索但相關(guān)度相對較小文獻(xiàn)可靠性需考究。
本文以理工類熱門查新課題材料領(lǐng)域作為研究案例,對三大數(shù)據(jù)庫及收索引擎的檢索能力做了定量對比研究,并從檢出文獻(xiàn)數(shù)量值,完整度以及相關(guān)度角度綜合考慮,對其檢索能力做出了初步評價(jià)。研究結(jié)論為:1)萬方維普和CNKI三大數(shù)據(jù)庫單獨(dú)使用無法滿足科技查新的查全要求而三大庫聯(lián)用則在檢索期刊論文學(xué)位論文及專利方面能獲得較高的檢全率,2)萬方可用于查新檢索的初步檢索提煉檢索詞和初步制定檢索式 維普可實(shí)現(xiàn)文摘顯示以便于把握查新點(diǎn)的技術(shù)范疇CNKI則對期刊論文及學(xué)位論文的檢索能力特別突出,3)搜索引擎能在檢索會議論文及產(chǎn)品信息方面有較好的補(bǔ)充作用。