文獻檢索是科研的基本功, 閱讀文獻是科研人員獲取科研信息的重要途徑。評價(jià)文獻檢索質(zhì)量的兩個(gè)最重要的指標是查全率和查準率。
查全率指的是檢出的相關(guān)文獻量與系統文獻庫中相關(guān)文獻 總量的比率,它反映該系統文獻庫中實(shí)有的相關(guān)文獻量在多大程度上被檢索出來(lái)。查全率 = 檢出相關(guān)文獻量 / 文獻庫內相關(guān)文獻總量× 100% 。查準率指的是是指檢出的相關(guān)文獻量與檢出文獻總量的比率,是衡量信息檢索系統檢出文獻準確度的尺度。查準率 = 檢出的相關(guān)文獻篇數/檢出的全部文獻篇數× 100%。
查全率與查準率在一定程度上是成反比關(guān)系的,為了提高查全率就要以犧牲部分查準率為代價(jià),反之亦然。在不同的情況下,對二者的要求也不同,有時(shí) 文獻的全面更為重要,這時(shí)就要以提高查全率為重點(diǎn),有時(shí)希望找到的文獻準確率更高,就以提高查準率為重點(diǎn)。本文討論的是怎樣提高文獻的查全率。
1 檢索詞的轉換。常見(jiàn)的轉換是同義詞、近義詞、相關(guān)詞、單復數及縮寫(xiě)形式,如果是動(dòng)詞還有可能有不同的時(shí)態(tài)。每 一個(gè)檢索詞都有可能有多種表達形式,如果是由英文翻譯過(guò)來(lái)的還有可能有多種翻譯方法,所以應該盡可能找全檢索詞的所有同義詞、近義詞。相關(guān)詞指的是與檢索 詞不是同一個(gè)意思但是有關(guān)聯(lián)的詞。
如,META分析的同義詞包括元分析、薈萃分析、meta-analysis,近義詞包括系統綜述,相關(guān)詞為循證醫學(xué)。 前列腺癌的縮寫(xiě)可能是Pca等等。值得注意的是,在檢索中文文獻的時(shí)候,有必要把英文的全稱(chēng)和縮寫(xiě)也作為檢索詞,因為有些中文文章中是直接用英文詞匯表示 的。
2 使用截詞符。雖然從理論上來(lái)說(shuō)我們找到所有的同義詞和近義詞可以擴大檢索結果,但是要想做到這一點(diǎn)是相當困難的。這時(shí)可以利用截詞符來(lái)幫忙。一般用的截詞符是“?”和“*”,在不同的數據庫中表示的意思有所不同,常見(jiàn)的意思是“?”表示0-1個(gè)字符,而“*”表示多個(gè)字符。
3 使用上位詞,即指代范圍更廣的詞。有些檢索系統有主題詞途徑,則可以選用上位主題詞。例如水果是蘋(píng)果的上位詞,prostatic neoplasm的上位主題詞是prostatic disease。
4 改變布爾運算符,即將連接兩個(gè)或多個(gè)檢索詞的AND改為OR,即可提高檢出數量。
5 改變檢索項。如要求檢索詞位于標題中或為關(guān)鍵詞或主題,檢出記錄數太少,則可改為要求位于摘要或全文中,檢出記錄數即可增加。
6 減少限制條件,增加副主題詞。如果前面的檢索中有限制條件,放寬或去掉限制條件;如果采用的是主題詞和副主題詞搭配的形式,看是否漏掉可能的副主題詞。
以上說(shuō)的是在同一個(gè)數據庫 中進(jìn)行檢索。但是,每一個(gè)數據庫所收錄的文獻都是有限的,而不同的數據庫可能存在一定的互補關(guān)系。所以為了提高查全率,應該多檢索幾個(gè)數據庫,將結果綜合 起來(lái)。
當然前提條件是要了解每一個(gè)數據庫收錄期刊的范圍、起止年代等,因為不排除有些小的數據庫完全是另外一個(gè)大數據庫的子集的情況,這時(shí)當然完全沒(méi)有必 要再檢索那個(gè)小的數據庫了。
即使是將目前所有的數據庫 加起來(lái),也不能囊括所有的文獻。例如,有一些年代比較久遠的,或者是期刊知名度不高的。
所以,除了在數據庫中進(jìn)行檢索,還要輔以手工檢索。包括對一些重要 的而數據庫中沒(méi)有收錄的期刊進(jìn)行手工檢索,在已經(jīng)查到的文獻的“參考文獻”中或有些數據庫提供的“相關(guān)文獻”中進(jìn)行查找,看有無(wú)“漏網(wǎng)之魚(yú)”,還有,可以 請教相關(guān) 領(lǐng)域的專(zhuān)家,看看是否有重要的文獻沒(méi)有檢索到。
一般我們檢索文獻不是英文的就是中文的,對于其它語(yǔ)種的則不做要求。如果是要求查全率很高,則可以檢索一些不常用的語(yǔ)種的文獻,如日文、法文、德文等等。當然如果自己不會(huì )那門(mén)語(yǔ)言,即使查到了,閱讀也是一個(gè)問(wèn)題。如果真是非常重要,不妨請人翻譯過(guò)來(lái)。
PUBMED的查全率問(wèn)題
PUBMED是最常用的醫 學(xué)網(wǎng)絡(luò )數據庫,它收錄的期刊范圍最廣,更新速度快,有部分(大約5%)能夠獲得免費的全文,95%以上有英文摘要,而且可以知道查到的某一篇文獻是收錄在 哪個(gè)全文數據庫中,因而深受醫學(xué)科研工作者歡迎。
PUBMED有自動(dòng)轉換功能,在檢索框輸入一個(gè)檢索詞,它會(huì )自動(dòng)將其轉化為對應的主題詞,同時(shí)進(jìn)行主題詞 檢索和自由詞檢索,并把二者的檢索結果用“OR”連接起來(lái)。
所以,在PUBMED中,要提高查準率首選主題詞加副主題詞的形式,而要提高查全率則首選默認 的檢索形式,即打開(kāi)PUBMED主頁(yè)后直接在檢索框輸入檢索詞。如果采用主題詞加副主題詞的形式,由于最新的部分文獻還沒(méi)有進(jìn)行主題標引,因此不能檢索到 最新的文獻。
PUBMED的查全率問(wèn)題 與上面所說(shuō)的大同小異。值得注意的是,如果使用截詞符,其自動(dòng)轉換功能即停止??梢圆扇〉霓k法是第一次用默認檢索,第二次用截詞符,再把兩次檢索的結果合 并起來(lái)。
例如,檢索詞的所有同義詞近義詞縮寫(xiě)相關(guān)詞等分別為A、B、C、D、E,則第一次以默認的檢索方式檢索,檢索式為 A OR B OR C OR D OR E,第二次用截詞符檢索,如A? OR B* OR C? OR D OR E*, 再把兩次檢索的結果合并,檢索式為#1 OR #2。
此外,PUBMED還可以提供related articles, 點(diǎn)擊這里即可以看到與你檢索到的文獻相關(guān)的文獻,也許這其中就有需要而自己沒(méi)有查到的。
META分析的檢索問(wèn)題
META分析是對文獻的查 全率要求最高的一種研究。嚴格的說(shuō),要求獲得“所有發(fā)表的和未發(fā)表的所有形式的信息”,也就是說(shuō),包括各國語(yǔ)言的期刊論文、會(huì )議論文、學(xué)位論文、書(shū)籍、 Cochrone圖書(shū)館的文獻及正在研究尚未發(fā)表的資料。
其實(shí)目前發(fā)表的META分析能夠達到這一要求的幾乎沒(méi)有,即使是發(fā)表在柳葉刀、BMJ這樣頂級醫 學(xué)期刊上的META分析也不例外。關(guān)于META分析的文獻檢索,以后如有時(shí)間我再詳細討論
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請
點(diǎn)擊舉報。