• 當前位置:論文網 > 論文寶庫 > 信息科技類 > 信息技術 > 國內外文摘數據庫信息檢索綜述正文

    國內外文摘數據庫信息檢索綜述

    來源:UC論文網2018-03-11 09:39

    摘要:

      1MEDLINE數據庫  MEDLINE是美國國立醫學圖書館(TheU.S.NationalLibraryofMedicine,簡稱NLM)最早的書目數據庫,其包含生命科學領域,特別是生物醫學方面的超過2200萬期刊文獻的題錄及文摘信息。MEDLINE的一...

      1MEDLINE數據庫


      MEDLINE是美國國立醫學圖書館(TheU.S.NationalLibraryofMedicine,簡稱NLM)最早的書目數據庫,其包含生命科學領域,特別是生物醫學方面的超過2200萬期刊文獻的題錄及文摘信息。MEDLINE的一個顯著特點是記錄了NLM編制的醫學主題詞表(MeSH)的索引。MEDLINE是聯機的醫學文獻分析與檢索系統(MEDicalLiteratureAnalysisandRetrievalSystem),起源于1964年。是PubMed的主要部分,部分Entrez在線檢索數據庫是由美國國家生物技術信息中心(NCBI)來提供的。


      1.1數據庫介紹


      起始年限:1946年-至今,還包含一些舊的資源。


      來源:大約40種語言5600多種學術期刊的引文及60種語言的舊版期刊,MEDLINE引文由NLM,國際合作伙伴和一些合作組織共同創建。


      更新:自2005年起,每天增加2000-4000條完整的題錄信息。更新在11月至12月的幾周內暫停主要是因為NLM要將醫學主題詞表添加進索引中。


      學科范圍:MEDLINE的主體范圍是生物醫藥與健康,此外還包括生命科學,行為科學,化學、生物工程,公共衛生,臨床護理以及植物和動物科學領域。其中,生命科學覆蓋率增加始于2000年。


      MEDLINE數據庫掛靠在WebofScience平臺上,包含各生命科學領域的期刊文章,記錄超過1200萬條,尤其偏重于生物醫學領域。MEDLINE記錄由NLM和協作伙伴創建。MEDLINE的來源出版物涵蓋基本生物學研究和臨床科學。學科類別包括護理學、牙科學、獸醫學、藥理學、健康相關學科和臨床前科學。MEDLINE還包括對生物醫學從業者、研究人員和教育工作者至關重要的生命科學方面的內容,包括生物學、環境科學、海洋生物學、植物和動物科學以及生物物理學和化學的某些方面內容。從2000年開始,生命科學的涵蓋范圍得到增加。到2001年年底,以前包括在單獨的NLM專業數據庫中的多數引文均已添加到了MEDLINE中。數據庫收錄范圍從1950年至今。


      1.2檢索技術


      1.2.1字段檢索


      檢索字段共包含25個字段,其中,主題-添加Mesh字段允許在主題檢索中包括Mesh詞表,此選項自動將每個檢索詞比對到Mesh主題詞并擴展每個標題,使從屬于主題詞的詞語也包含在檢索中。作者標識符是指ResearchID或者ORCID標識符。Chemical字段可以從Chemical敘詞中選擇一個或多個物質名稱,并將其傳輸至檢索頁面,可以使用布爾運算符AND或OR組配多個詞語。識別代碼字段可在記錄中檢索以下字段:PubMedID、訂日期、LM唯一ID、SSN(包括印刷版和電子版)、子序列數據庫名稱、子序列數據庫入藏號。分主題庫是由專業主題定義的生物醫學文獻的子集,包括“AIDS/HIV、生物倫理學、生物技術學”18個分主題子庫。


      1.2.2布爾邏輯


      AND:使用AND可查找包含該運算符分開的所有檢索詞的記錄。


      OR:使用OR可查找包含被該運算符分開的任何檢索詞的記錄。


      NOT:使用NOT可將包含特定檢索詞的記錄從檢索結果中排除。


      注意在“主題”字段中可以使用AND,但在“出版物名稱”或“來源出版物”字段中確不能使用。


      1.2.3通配符


      *:表示任何字符組,包括空字符。?:表示任意一個字符。$:表示零或一個字符。


      有關通配符的規則:


      (1)在主題、標題、入藏號和識別標碼這幾個檢索字段中可以使用左截詞符。


      (2)在主題、標題檢索中,如果使用左截詞符或右截詞符,那么至少在通配符后至少輸入3個字符


      (3)在入藏號和識別代碼檢索中,如果使用左截詞符,那么必須在通配符后至少輸入1個字符


      (4)在作者檢索中,檢索姓氏時必須在通配符前輸入至少兩個字符


      (5)通配符可位于檢索詞的中間


      (6)不能在以下字符后面使用通配符:特殊符號(/@#)和標點符號(.,:;!)


      (7)不能在出版年檢索中使用通配符


      (8)通配符出現在單詞或名稱中,不能對其檢索


      (9)不能在引起的檢索內使用$


      (10)在截詞后匹配范圍很廣的情況下,盡量避免使用通配符。


      $對于查找同一單詞的英國拼寫和美國拼寫非常有用,?對于檢索最后一個字符不確定的作者姓氏非常有用。


      1.2.4短語檢索


      若要精確查找短語,可用引號括住短語,例:“energyconversation”。若輸入以連字號、句號或逗號分隔的兩個單詞,則檢索詞視為精確短語。特別說明:檢索精確匹配的短語時,不可在引號內部使用$符號。


      1.2.5位置算符


      NEAR/x:使用NEAR/x可查找由該運算符連接的檢索詞之間相隔指定數量的單詞的記錄。該規則也適用于單詞處于不同字段的情況。用數字取代x可指定將檢索詞分開的最大單詞數。如果只使用NEAR而不使用/x,則系統將查找其中的檢索詞由NEAR連接且彼此相隔不到15個單詞的記錄。即表示下面兩個檢索式效果相同:(1)salmonNEARvirus(2)salmonNEAR/15virus


      在使用NEAR這一位置限定運算符時要注意以下兩點:


      (1)不能在“主題”和“標題”檢索式中將AND運算符作為NEAR運算符的一部分使用,即若兩個詞間邏輯關系是AND,則需加雙引號將其引起來。


      (2)單詞NEAR出現在標題中時,檢索時需要拿雙引號將其引起。


      SAME:在地址檢索中,使用SAME將檢索限制為出現在“全紀錄”同一地址中的檢索詞。需要用括號來分組地址檢索詞。例:AD=(PortlandSAMEOregon)查找在記錄“地址”字段中存在Portland、Oregon或Or(州縮寫)的記錄。


      特別說明,在其他字段使用SAME時,其作用與AND完全相同。


      1.2.6檢索運算符優先順序


      如果在檢索式中使用不同的運算符,則會根據下面的優先順序處理檢索式:1)NEAR/x2)SAME3)NOT4)AND5)OR,使用括號可以改寫運算符的優先級。上述所有的檢索運算符均不區分大小寫,可以使用大寫、小寫或混合大小寫。


      1.3檢索實例


      1.3.1檢索題目及需求介紹


      檢索題目:基于專利分析的二噁英檢測技術發展趨勢研究


      檢索需求:查找有關基于專利分析方法對二噁英檢測技術發展趨勢進行研究的相關論文語種:英文,中文;文獻類型:期刊論文,綜述。


      提取關鍵概念,二噁英(Dioxin),是結構和性質相似的210種同類物或異構體的統稱,包括75種多氯二苯并二噁英(Polychlorinateddibenzo-p-dioxins,簡稱PCDDs)、135種多氯二聯苯呋喃(Polychlorinateddibenzofurans,簡稱PCDFs)。該化合物熔點較高,極難溶于水,極易在生物體內蓄積,且難以自然降解,對人體危害嚴重,可引起免疫系統損害和生殖障礙,具有很強的致癌性。其中,2,3,7,8-四氯代二苯并-對-二噁英(2,3,7,8-TCDD)是迄今為止人類已知的毒性最強的污染物。


      關鍵詞選取:DioxinPCDDsPCDFsTCDDdetect


      1.3.2檢索過程及結果


      檢索關鍵詞(DioxinorPCDDsorPCDFsorTCDD)anddetect,選擇主題添加Mesh,檢索結果共1644條數據,擴展Mesh主題詞Dioxins,Tetrachlorodibenzodioxin,結果如下圖所示。


      進一步修改檢索式為(DioxinorPCDDsorPCDFsorTCDD)anddetectand(patentanaly*),檢索結果只有1條,如下圖所示。


      結果不相關,因此選擇去掉“patentanaly*”這一關鍵詞,最終確定選擇第一次的檢索式(DioxinorPCDDsorPCDFsorTCDD)anddetect,選擇英文及中文,文獻類型選擇期刊論文及綜述對結果進行精簡,檢索結果共有1593條數據。


      2LISA(LibraryandInformationScienceAbstracts)


      2.1數據庫介紹


      圖書館學情報學文摘數據庫(LibraryandInformationScienceAbstracts)是一款為圖書館專業人士和其他信息專員設計的國際摘要和索引工具。目前摘錄了440多種期刊,來自68個以上的國家/地區及20多種不同的語言。每兩周更新一次,每次新增500多條記錄。


      起始年限:1969年-至今


      學科范圍:信息管理、信息技術、互聯網技能、知識管理、圖書館業、圖書館和檔案、圖書館管理、圖書館技術、圖書館使用和用戶、在線信息檢索。


      文獻類型:附錄(BackMatter)、參考書目(Bibliography)、書評(BookReview)、病例報告(CaseReport)、案例研究(CaseStudy)、注釋評論(Commentary)、會議文章(Conference)、報紙(Paper)、期刊文章(JournalArticle)、信件(Letter)、文學評論(LiteratureReview)、新聞(News)等一些常見文獻類型。


      2.2檢索技術


      2.2.1檢索詞


      可包含任何字母或數字。輸入的檢索詞可為英語或任何其他語言,例如法語、西班牙語、希臘語和斯拉夫語等。檢索詞是否能檢索出任何文檔取決于數據庫中是否有匹配內容或索引。它會自動忽略檢索詞中的標點符號字符,例如句號、逗號和冒號。如要檢索包含下標或上標字符的化學式,可按正確順序輸入所有字符。例如,輸入CH3CH2OH能正確檢索出乙醇(CH3CH2OH)化學式的匹配項。


      2.2.2無用詞


      任何“無用詞”列表會被忽略,如“a”、“the”之類的。例如,如果輸入“catinthehat”,則會針對“catANDinANDtheANDhat”進行檢索。檢索結果的默認相關性排序會將包含檢索詞的所有文檔(通常包含“catinthehat”)列于結果列表頂部。


      2.2.3運算符、字段和特殊字符


      2.2.4運算符優先級(不區分大小寫)


      PRE>NEAR>AND>OR>NOT


      2.2.5通配符和截詞字符


      2.3檢索形式及呈現方式


      檢索結果的呈現方式有三種,按照相關性,先遠后近、先近后遠進行排序;


      每頁顯示條數10,20,50,100,默認50條;是否包括重復文檔;有粗略查看和詳細查看兩種方式;輸出方式;可以通過選擇引用格式進行引用,是否有原文獲取的鏈接:提供兩個外部鏈接提供全文獲取方式。


      2.4檢索實例


      2.4.1檢索題目及需求介紹


      題目選取:圖書館的營銷策略研究


      需求分析:研究現在高校、科研院所的圖書館的圖書利用情況,尋找國外圖書館的營銷策略等文獻資料,可以進行比對研究,對現有中國圖書館情況進行參考和借鑒。


      2.4.2檢索過程及結果


      根據題目名稱選取兩個關鍵字“圖書館營銷”(librarymarketing)和“策略”(strategy)進行高級檢索。檢索式為:su(librarymarketing)ANDsu(strategy),共得到21條結果。


      由于該研究題目比較通俗易懂,先查取相關中文文獻,再插曲中的文獻中提取了比較接近的關鍵詞進行的檢索。21條記錄中,讀取前兩篇文章摘要后發現檢索出來后的文章主題與研究題目及其相關,由此可以判斷關鍵字選取比較準確,檢索結果的查準率較高,通讀該21篇文獻可大致了解研究題目的情況。


      但文章較多偏向某一角度和特色方面的對圖書館的營銷策略的研究,較少一個宏觀的把握和情況介紹。


      根據LISA數據庫頁面的提示,可進行其他關鍵詞組合的檢索,由于做學術研究的圖書館一般為高校圖書館,便將圖書館這一關鍵詞采取細化,選擇“academiclibrary”替代,使檢索結果更符合研究需要,同時進行比對檢索。


      檢索式如下:su(academiclibrary)ANDsu(marketing),共得到156條結果。


      從檢索結果看文獻題名更加符合整體角度的把握,如果要縮小文獻規模便可采取出版日期的篩選,使結果更加接近現在研究的內容,富有時效性。選取2011年-2015年的出版時間進行篩選,得到81條結果,比較符合閱讀規模。由此看出檢索式的構建在文獻檢索時非常重要,直接關系到之后的研究。


      于夏薇(作者單位:中國科學技術信息研究所)

    核心期刊推薦


    發表類型: 論文發表 論文投稿
    標題: *
    姓名: *
    手機: * (填寫數值)
    Email:
    QQ: * (填寫數值)
    文章:
    要求:
    11选5任3必中计算方法