日本免费精品视频,男人的天堂在线免费视频,成人久久久精品乱码一区二区三区,高清成人爽a毛片免费网站

在線客服

學(xué)術(shù)期刊語義出版整合

隨著科學(xué)技術(shù)的發(fā)展,數(shù)字出版成為目前的主流出版模式,在科學(xué)、技術(shù)和醫(yī)學(xué)領(lǐng)域(Science,TechnologyandMedicine,STM)發(fā)展迅猛,給科研人員帶來了豐富的學(xué)術(shù)資源。與此同時(shí),如何幫助科研人員在海量學(xué)術(shù)資源中快速準(zhǔn)確地找到自己所需的信息成為必須考慮的問題。大量半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)字資源使得傳統(tǒng)的科學(xué)交流系統(tǒng)無法滿足科研人員對(duì)數(shù)據(jù)語義的高度要求。而語義網(wǎng)的發(fā)展則為新時(shí)代的學(xué)術(shù)交流創(chuàng)造了條件,并促進(jìn)了語義出版的形成和發(fā)展。目前,基于對(duì)文獻(xiàn)知識(shí)內(nèi)容做結(jié)構(gòu)化處理和的語義出版成為新興出版形式被廣泛關(guān)注。2009年語義出版的概念被Shotton[1]提出后,語義出版就成為出版和學(xué)術(shù)界的熱點(diǎn)。語義出版是一種語義增強(qiáng)的出版形式,通過對(duì)文章內(nèi)容和形式進(jìn)行語義標(biāo)記,增強(qiáng)內(nèi)容之間的關(guān)聯(lián),提高科研人員的檢索和獲取效率,實(shí)現(xiàn)智能化出版。在數(shù)據(jù)、信息、知識(shí)、智慧鏈(DataInformationKnowledgeWisdom,DIKW)中,數(shù)據(jù)出版是基于數(shù)據(jù)、信息的時(shí)間基層的出版模式;而語義出版則是從知識(shí)層面不斷向智慧面延伸的空間深層次語義信息交流的出版模式,它無疑是數(shù)據(jù)出版的進(jìn)一步發(fā)展。本文的研究以數(shù)字資源聚合為基礎(chǔ),通過探究學(xué)術(shù)期刊語義出版的發(fā)展過程,總結(jié)歸納國(guó)外學(xué)術(shù)期刊語義出版的相關(guān)實(shí)踐,探索性研究了基于數(shù)字資源聚合的學(xué)術(shù)期刊語義出版模式,旨在為國(guó)內(nèi)學(xué)術(shù)期刊基于資源聚合和內(nèi)容組織實(shí)現(xiàn)語義出版提供經(jīng)驗(yàn)與借鑒。

1、相關(guān)研究

語義出版通過結(jié)構(gòu)化描述關(guān)聯(lián)外部資源,使得文章的可讀性和交互性增強(qiáng)[2],提升了學(xué)術(shù)出版功能,對(duì)科研人員從事科研閱讀和研究的幫助顯著[3]。語義出版有助于推動(dòng)出版機(jī)構(gòu)實(shí)現(xiàn)資源間的關(guān)聯(lián)分析和知識(shí)挖掘,為用戶提供體系化的知識(shí)[4]。2013年Outsell公司的STM報(bào)告[5]指出,STM期刊的技術(shù)發(fā)展依托語義技術(shù)得以實(shí)現(xiàn),通過借助符合語義標(biāo)準(zhǔn)的關(guān)聯(lián)數(shù)據(jù)進(jìn)行更加高效的內(nèi)容檢索和服務(wù)[6]。探索與交流在英國(guó)皇家化學(xué)學(xué)會(huì)(RSC)、愛思唯爾(Elsevier)、自然出版集團(tuán)(Nature)、美國(guó)科學(xué)公共圖書館(PLoS)等的推動(dòng)下,出現(xiàn)了一系列語義出版的舉措和學(xué)術(shù)研究。Elsevier的“ArticleoftheFuture”(未來文章)計(jì)劃對(duì)學(xué)術(shù)期刊的上下文結(jié)構(gòu)、內(nèi)容關(guān)聯(lián)、期刊呈現(xiàn)方式均做了創(chuàng)新,并借助ScienceDirect(全文文獻(xiàn)數(shù)據(jù)庫)平臺(tái)開展多個(gè)學(xué)科領(lǐng)域的語義出版實(shí)踐,搭建了語義出版實(shí)現(xiàn)的基礎(chǔ)[7]。PLoS為了實(shí)現(xiàn)期刊內(nèi)容的有機(jī)豐富,將期刊鏈接到多種外部資源上,以此來提升學(xué)術(shù)出版的功能。RSC為了實(shí)現(xiàn)期刊內(nèi)部以及期刊同外部資源的語義關(guān)聯(lián),對(duì)相關(guān)領(lǐng)域本體進(jìn)行了關(guān)聯(lián),并通過語義標(biāo)注部分期刊內(nèi)容實(shí)現(xiàn)期刊的RichHTML形式[8]。Hudson-Vitale等[9]提出研究是全球性的,學(xué)術(shù)界需要可互操作的中心,相互關(guān)聯(lián)的數(shù)據(jù)和基礎(chǔ)設(shè)施,支持跨庫信息交換,包括標(biāo)準(zhǔn)、元數(shù)據(jù)模式和語義互操作性。DeRibaupierre等[10]在實(shí)證研究的基礎(chǔ)上,分析了科學(xué)家的實(shí)際需求并考慮了文檔的語義和特殊性,提出了一種使用SciAnnotDoc模型自動(dòng)注釋PDF文檔的方法。Balaji等[11]提出使用共引用鄰近分析進(jìn)行擴(kuò)展,以發(fā)現(xiàn)語義相似性,進(jìn)而找到與給定研究出版物相匹配的研究論文的最佳語義路徑。Lafia等[12]提出通過生成可以在主題和空間上查詢的鏈接元數(shù)據(jù),使得數(shù)據(jù)集或文檔具有唯一資源標(biāo)識(shí)符(URI)和現(xiàn)有工具充分支持的基本元數(shù)據(jù),進(jìn)而使得跨域數(shù)據(jù)集被發(fā)現(xiàn),并且可理解、可重復(fù)使用。在國(guó)內(nèi),2009年張曉林教授[13]從關(guān)聯(lián)發(fā)現(xiàn)、內(nèi)容增強(qiáng)、開放與合作交流三方面對(duì)學(xué)術(shù)期刊的數(shù)字化發(fā)展進(jìn)行了闡釋,率先提出了Journal3.0模型。2012年王曉光等[14]提出語義出版可以借助多層次的領(lǐng)域本體對(duì)文章中的概念與資源實(shí)體進(jìn)行關(guān)聯(lián),集成不同事件、資料、記錄來減輕科研人員進(jìn)行反復(fù)資源搜集和整理工作的負(fù)擔(dān),將更多精力用于論點(diǎn)的理解和數(shù)據(jù)的分析。2013年周杰等[15]指出語義出版通過對(duì)知識(shí)的統(tǒng)一編碼實(shí)現(xiàn)對(duì)象的關(guān)聯(lián)和內(nèi)容的結(jié)構(gòu)化呈現(xiàn),實(shí)現(xiàn)用戶的精準(zhǔn)語義查詢,將成為未來主流的出版形態(tài)。2017年張偉偉等[16]基于供給側(cè)視角得出未來語義出版是學(xué)術(shù)期刊數(shù)字化出版的一個(gè)重要發(fā)展方向。李嬌等[17]通過對(duì)國(guó)內(nèi)外學(xué)術(shù)期刊數(shù)字資源描述、語義知識(shí)增強(qiáng)、語義出版等方面的分析,發(fā)現(xiàn)國(guó)內(nèi)語義出版實(shí)踐與國(guó)外相比仍有差距。陳鋼等[18]通過對(duì)廣東省16家科技期刊的出版方式進(jìn)行調(diào)研發(fā)現(xiàn),語義出版將代表今后的出版趨勢(shì),但目前語義出版仍在小規(guī)模實(shí)踐并未進(jìn)行大規(guī)模推廣。綜上,語義出版的到來為大型服務(wù)提供商和出版機(jī)構(gòu)的發(fā)展創(chuàng)造了契機(jī),它們可以將現(xiàn)有的期刊信息和外部資源進(jìn)行關(guān)聯(lián),實(shí)現(xiàn)對(duì)知識(shí)的挖掘和分析,促使用戶有效利用期刊、全面獲取知識(shí)。語義出版是學(xué)術(shù)期刊資源聚合的更高需求,基于數(shù)字資源聚合的語義出版實(shí)現(xiàn)需要同時(shí)具備語義網(wǎng)、本體、關(guān)聯(lián)數(shù)據(jù)等技術(shù)和挖掘深層次文獻(xiàn)語義特征的功能,從而幫助用戶檢索到更加體系化、知識(shí)化的信息。

2、學(xué)術(shù)期刊語義出版的發(fā)展

互聯(lián)網(wǎng)技術(shù)的發(fā)展使得目前學(xué)術(shù)期刊主要以數(shù)字化方式出版[19],相較國(guó)外學(xué)術(shù)期刊數(shù)字化的發(fā)展,國(guó)內(nèi)學(xué)術(shù)期刊數(shù)字化起步較晚,并且呈現(xiàn)散、小、弱的特點(diǎn),其數(shù)字化發(fā)展存在諸多障礙。面對(duì)海量學(xué)術(shù)資源,科研人員需要快速查詢到所需的有用信息,這需要學(xué)術(shù)資源的合理有效聚合。但是,目前學(xué)術(shù)期刊的數(shù)字出版面臨瓶頸化現(xiàn)象,而學(xué)術(shù)期刊的語義出版能夠揭示資源間的相互關(guān)系,實(shí)現(xiàn)數(shù)據(jù)挖掘和語義檢索,所以要基于數(shù)字資源聚合實(shí)現(xiàn)語義出版在學(xué)術(shù)期刊上更好地應(yīng)用。

2.1學(xué)術(shù)期刊語義出版的背景

從學(xué)術(shù)期刊開始數(shù)字化至今,大部分期刊只是將錄用的文章收錄到數(shù)據(jù)庫或者自建的學(xué)術(shù)期刊網(wǎng)站上[20]以PDF或者CAJ格式供用戶下載使用,在此過程中用戶不僅需要下載支持PDF/CAJ格式的閱讀軟件,并且無法很好地進(jìn)行語義標(biāo)注和互動(dòng),難以實(shí)現(xiàn)資源之間的互操作,這為用戶的使用帶來了不便,制約了學(xué)術(shù)期刊的數(shù)字化出版,突出表現(xiàn)為兩個(gè)方面。

(1)學(xué)術(shù)期刊數(shù)字資源內(nèi)部由于未形成統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),因而無法實(shí)現(xiàn)更深層次的關(guān)聯(lián),知識(shí)資源聚合目標(biāo)更是無法達(dá)到。此外,用戶若想實(shí)現(xiàn)對(duì)知識(shí)的集中獲取,需要滿足數(shù)字資源內(nèi)部知識(shí)單元與外部相關(guān)數(shù)據(jù)庫或知識(shí)組織關(guān)聯(lián)的條件,傳統(tǒng)的數(shù)字出版無法滿足。

(2)提高信息檢索的效率需要實(shí)現(xiàn)語義上的精確匹配,而目前我國(guó)的學(xué)術(shù)期刊官網(wǎng)只能實(shí)現(xiàn)基于關(guān)鍵詞的檢索,無法解決知識(shí)體系中存在的一詞多義、一義多詞現(xiàn)象,使得用戶無法實(shí)現(xiàn)對(duì)知識(shí)的深層次發(fā)現(xiàn)和挖掘[21]。語義出版則可以解決基于關(guān)鍵詞檢索中存在的低查全率、低檢索效率、用戶需重復(fù)檢索操作的問題。通過以上分析可以看出,現(xiàn)有的學(xué)術(shù)期刊數(shù)字出版只是將紙質(zhì)期刊進(jìn)行了數(shù)字化轉(zhuǎn)化,并未抓住期刊內(nèi)容和語義層面的重點(diǎn),無法實(shí)現(xiàn)學(xué)術(shù)期刊數(shù)字資源間的語義互操作,降低了學(xué)術(shù)期刊的服務(wù)質(zhì)量和效率。所以,變革當(dāng)前學(xué)術(shù)期刊的數(shù)字出版方式是當(dāng)務(wù)之急。

2.2學(xué)術(shù)期刊語義出版的價(jià)值

作為數(shù)字出版高級(jí)形態(tài)的語義出版,具有傳統(tǒng)出版無法比擬的特點(diǎn),能夠促進(jìn)數(shù)字時(shí)代的信息交流和聚合。對(duì)于學(xué)術(shù)期刊數(shù)字聚合的發(fā)展來說,語義出版可以整合大量分散的、紊亂的信息,并對(duì)信息資源進(jìn)行有機(jī)管理,打破“信息孤島”的局面,為用戶查找和利用信息提供便利[22]。

(1)語義出版可以實(shí)現(xiàn)知識(shí)關(guān)聯(lián)和語義查詢。語義出版機(jī)構(gòu)不同于以往基于形式劃分的學(xué)術(shù)期刊,它通過界定不同元素的屬性和類型,以知識(shí)點(diǎn)為單位來分解、標(biāo)注整篇文章。對(duì)期刊知識(shí)單元的關(guān)聯(lián)和揭示有利于形成語義聯(lián)系的知識(shí)網(wǎng)絡(luò),實(shí)現(xiàn)將用戶與所需知識(shí)進(jìn)行匹配。此外,語義出版基于知識(shí)推理構(gòu)建語義查詢可以減少以往基于關(guān)鍵詞查詢的工作量,提高查準(zhǔn)率和知識(shí)獲取速度。

(2)語義出版可以實(shí)現(xiàn)用戶行為分析和興趣推薦。語義出版可以通過收集用戶經(jīng)常查詢的關(guān)鍵詞和瀏覽的頁面借助數(shù)據(jù)挖掘和推薦算法對(duì)用戶行為進(jìn)行分析,找到用戶所需并分析用戶興趣從而構(gòu)建出用戶畫像。同時(shí),可以根據(jù)用戶行為構(gòu)建用戶數(shù)據(jù)庫,基于興趣進(jìn)行個(gè)性化推薦服務(wù),并通過使用行為找出與目標(biāo)用戶相似性高的用戶,為目標(biāo)用戶推薦資源。

(3)語義出版可以實(shí)現(xiàn)信息抽取和主題揭示。語義出版可以通過高亮詞條和語義標(biāo)簽以可視化方式展示文章知識(shí)結(jié)構(gòu),實(shí)現(xiàn)主題揭示。同時(shí),語義出版構(gòu)建了期刊數(shù)字資源與外部資源的鏈接,因而可以實(shí)現(xiàn)關(guān)聯(lián)信息的抽取,幫助用戶更好地理解文章內(nèi)容。

2.3學(xué)術(shù)期刊語義出版的應(yīng)用

語義出版對(duì)數(shù)字資源聚合提出了更高程度的要求。語義出版強(qiáng)調(diào)通過利用本體、關(guān)聯(lián)技術(shù)等實(shí)現(xiàn)自然語言處理,構(gòu)建信息與信息資源結(jié)構(gòu)化描述的關(guān)聯(lián),通過機(jī)器可理解和資源間的語義互操作,實(shí)現(xiàn)信息的可視化呈現(xiàn),提高科研人員的檢索效率。基于數(shù)字資源聚合方法在學(xué)術(shù)期刊語義出版中的應(yīng)用主要體現(xiàn)在以下方面。首先,通過元數(shù)據(jù)、本體、關(guān)聯(lián)數(shù)據(jù)等技術(shù)可以解決學(xué)術(shù)期刊的異構(gòu)資源、跨庫檢索等問題。學(xué)術(shù)期刊的語義出版可以通過元數(shù)據(jù)的提取,本體庫的構(gòu)建以及數(shù)據(jù)的關(guān)聯(lián)使得不同來源、不同類型的數(shù)字資源完成跨庫檢索,實(shí)現(xiàn)學(xué)術(shù)期刊數(shù)字資源的有效聚合。其次,專業(yè)本體庫和領(lǐng)域本體庫的構(gòu)建可以使用戶查詢期刊資源不再拘于關(guān)鍵詞查詢的限制,實(shí)現(xiàn)不同文獻(xiàn)、不同知識(shí)單元的語義關(guān)聯(lián),一詞多義、一義多詞將不是難題,用戶能夠獲取更精確的答案。最后,在文章中添加語義標(biāo)簽,可以使文章各部分內(nèi)容層次分明、相互關(guān)聯(lián),并且以機(jī)器可自動(dòng)讀取的結(jié)構(gòu)化形式呈現(xiàn),實(shí)現(xiàn)文本內(nèi)容的自動(dòng)化獲取和智能化處理。實(shí)現(xiàn)數(shù)字資源的深度聚合是語義出版中不可或缺的重要環(huán)節(jié),采用本體、關(guān)聯(lián)數(shù)據(jù)等語義網(wǎng)相關(guān)技術(shù)實(shí)現(xiàn)的資源聚合能促進(jìn)學(xué)術(shù)期刊的知識(shí)一體化、體系化、結(jié)構(gòu)化,通過構(gòu)建不同知識(shí)本體間的語義映射關(guān)系可以實(shí)現(xiàn)知識(shí)單元間的語義關(guān)聯(lián),并為用戶提供更好的服務(wù)和更佳的體驗(yàn)。

3、國(guó)外學(xué)術(shù)期刊語義出版的實(shí)踐

Elsevier、施普林格(Springer)、科睿唯安(ClarivateAnalytics)作為全球領(lǐng)先的3家STM出版社,每年出版論文種類十分豐富,并且均在語義出版方面開展了很多實(shí)踐,為學(xué)術(shù)期刊的語義出版提供了諸多發(fā)展經(jīng)驗(yàn)。本文主要以這3家國(guó)外學(xué)術(shù)期刊語義出版的實(shí)踐為例進(jìn)行介紹。

3.1Elsevier語義出版下的資源查詢管理

Elsevier的語義出版模式不同于以往學(xué)術(shù)期刊線性的出版方式,它結(jié)合超鏈接和語義標(biāo)記致力于改善用戶的閱讀體驗(yàn)、提供最佳瀏覽方式給用戶,其出版特點(diǎn)如下。

(1)一站式集成檢索。ClinicalKey集成了醫(yī)學(xué)圖書、期刊、專家評(píng)論等各種資源,用戶無須前往不同醫(yī)學(xué)信息庫查找信息,在同一平臺(tái)便可獲取所有臨床專科的豐富資源,提高了用戶獲取資源的效率。2019年5月Elsevier與ScilligenceELN合作,化學(xué)研究人員可以通過Scilligence的ELN進(jìn)入Reaxys進(jìn)行搜索,尋找感興趣的結(jié)構(gòu)、性質(zhì)、反應(yīng)、路線設(shè)計(jì)等信息,將結(jié)果讀取并存入ELN,而無須復(fù)制、粘貼或手動(dòng)繪制等操作。這一整合能夠有效幫助化學(xué)研究人員簡(jiǎn)化工作流程,提高效率,改善交叉引用并減少人為因素引發(fā)的錯(cuò)誤。同時(shí),嚴(yán)謹(jǐn)遵循科學(xué)數(shù)據(jù)管理的FAIR原則(可查找、可訪問、互操作、可重用),Elsevier為科研數(shù)據(jù)共享的效率和質(zhì)量提供了保證。

(2)支持語義檢索,實(shí)現(xiàn)精確檢索匹配結(jié)果。EMMeT構(gòu)建了能夠深度描述和標(biāo)引醫(yī)學(xué)數(shù)據(jù)的概念詞匯,從而幫助用戶進(jìn)行語義檢索醫(yī)學(xué)資源,實(shí)現(xiàn)對(duì)檢索結(jié)果的精確匹配,為用戶在最短時(shí)間內(nèi)準(zhǔn)確獲取所需答案提供保證,減少了用戶反復(fù)查找信息的時(shí)間。

(3)提供智能化知識(shí)。Elsevier通過打通文章內(nèi)部知識(shí)單元的關(guān)聯(lián)、構(gòu)建文章與外部資源的鏈接,為用戶提供智能化的知識(shí)。2019年4月,Elsevier與靈北公司(Lundbeck)合作,有效解決了生命科學(xué)企業(yè)管理海量數(shù)據(jù)的難題。Elsevier通過化學(xué)及生物活性綜合數(shù)據(jù)庫Reaxys和ReaxysMedicinalChemistry(RMC)藥物化學(xué)模塊,幫助科研人員提高信息的可見性、復(fù)用性和實(shí)踐性,加快數(shù)據(jù)分享和挖掘,推進(jìn)企業(yè)用戶內(nèi)部信息的自由訪問和與Reaxys及RMC模塊無縫對(duì)接,破除了內(nèi)部信息孤島,提高了數(shù)據(jù)互通性。

3.2Springer

語義出版下的關(guān)聯(lián)開放數(shù)據(jù)2017年3月,施普林格?自然集團(tuán)(SpringerNature)推出了SciGraph關(guān)聯(lián)開放數(shù)據(jù)平臺(tái),將所有的科研資助機(jī)構(gòu)、會(huì)議、出版物等信息集成到這一平臺(tái)上,截至2017年底,這一平臺(tái)將學(xué)術(shù)界關(guān)注對(duì)象的信息(三元組)擴(kuò)充到10億多條,并可以與CrossRef和DBPedia等數(shù)據(jù)集相鏈接。SpringerNatureSciGraph平臺(tái)在進(jìn)行關(guān)聯(lián)數(shù)據(jù)之前,將需要數(shù)據(jù)中的實(shí)體類型和實(shí)體間的關(guān)系一一對(duì)應(yīng),并以URI為資源命名,保證資源的可獲取。目前SpringerNature已經(jīng)可以做到期刊、文章、資助者、主題等實(shí)體型在關(guān)聯(lián)開放數(shù)據(jù)中。SpringerNature在建立唯一、有效的URI之后,還建立了SciGraphcoreontology本體,這一本體的構(gòu)建使得數(shù)據(jù)不僅可以被SpringerNature更好地描述,還可以更好地被外界所引用。SpringerNatureSciGraph關(guān)聯(lián)開放數(shù)據(jù)平臺(tái)通過對(duì)數(shù)據(jù)進(jìn)行關(guān)聯(lián)和互操作,打破了數(shù)據(jù)組織結(jié)構(gòu)的原有體系,是關(guān)聯(lián)開放科研在出版領(lǐng)域得以實(shí)現(xiàn)的開始,使科研人員可以共享學(xué)術(shù)合作、機(jī)構(gòu)知識(shí)庫等平臺(tái),促進(jìn)了學(xué)術(shù)期刊語義出版的發(fā)展。3.3ClarivateAnalytics語義出版下的資源獲取2017年6月ClarivateAnalytics宣布與Impactstory開展合作,這一行為使得科研人員可以獲取高質(zhì)量、經(jīng)過同行評(píng)議的開放內(nèi)容。ClarivateAnalytics資助Impactstory建立oaDOI服務(wù),以更容易發(fā)現(xiàn)開放獲取的內(nèi)容,提高科研工作從發(fā)現(xiàn)相關(guān)信息到最后成果的效率。ClarivateAnalytics可借助Impactstory創(chuàng)建的在線工具,使科學(xué)文獻(xiàn)可以更好地開放和重用。目前,oaDOI可通過免費(fèi)開放的API實(shí)現(xiàn)9000萬篇文章的開放獲取。ClarivateAnalytics目前致力于提高從科研想法的出現(xiàn)到實(shí)驗(yàn)驗(yàn)證,再到同行評(píng)審以及最后出版的整個(gè)研究生命周期的效率。ClarivateAnalytics與Impactstory的合作可以使研究人員實(shí)現(xiàn)開放獲取WebofScience上的1800萬篇新文章,有利于科研用戶的研究和創(chuàng)新。此外,ClarivateAnalytics的Kopernio作為一個(gè)免費(fèi)的瀏覽器插件及在線工具,通過集成超過2萬個(gè)期刊網(wǎng)站、平臺(tái)、數(shù)據(jù)庫、開放獲取知識(shí)庫和搜索引擎,幫助科研人員實(shí)現(xiàn)一鍵式合法獲取學(xué)術(shù)期刊全文文獻(xiàn),可以有效節(jié)省科研人員獲取文獻(xiàn)的時(shí)間和步驟。此外,它可以自動(dòng)將用戶檢索過的PDF全文保存在個(gè)人的PDF全文臨時(shí)儲(chǔ)存盤內(nèi),方便用戶后續(xù)回訪閱讀。

4、基于數(shù)字資源聚合的學(xué)術(shù)期刊語義出版模型

語義出版的發(fā)展為學(xué)術(shù)期刊的創(chuàng)新提供了新的方式,同時(shí)揭示了資源對(duì)象間的關(guān)聯(lián),幫助資源內(nèi)容實(shí)現(xiàn)更好地重組和,因而語義出版的實(shí)現(xiàn)需要以數(shù)字資源聚合作為基礎(chǔ),數(shù)字資源聚合的目標(biāo)則為語義出版。本文通過對(duì)當(dāng)前學(xué)術(shù)期刊數(shù)字化進(jìn)程中存在的問題進(jìn)行分析,并結(jié)合基于數(shù)字資源聚合的語義出版存在的價(jià)值和應(yīng)用,借鑒Elsevier、Springer、ClarivateAnalytics的出版實(shí)踐經(jīng)驗(yàn),探索了基于數(shù)字資源聚合的學(xué)術(shù)期刊語義出版模型。該模型以實(shí)現(xiàn)學(xué)術(shù)期刊的語義出版為目標(biāo),以數(shù)字資源聚合為抓手,從三個(gè)層面進(jìn)行構(gòu)建。第一層是基于本體的數(shù)字資源聚合,第二層是基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源聚合,第三層是基于關(guān)聯(lián)數(shù)據(jù)的訪問和應(yīng)用。

(1)基于本體的數(shù)字資源聚合。由于學(xué)術(shù)期刊通常采用不同的元數(shù)據(jù)規(guī)范對(duì)來源不同、類型不同的資訊進(jìn)行描述,使得大量結(jié)構(gòu)異構(gòu)的數(shù)字資源存在于學(xué)術(shù)期刊之中,造成聚合和檢索的困難。僅依靠元數(shù)據(jù)只能形成數(shù)字資源的語義化基礎(chǔ),資源描述的異構(gòu)性和語義性問題仍然存在。想要實(shí)現(xiàn)不同類型、不同格式的元數(shù)據(jù)進(jìn)行互操作需要依靠本體來完成。本體可以通過對(duì)元數(shù)據(jù)進(jìn)行描述,轉(zhuǎn)換為統(tǒng)一RDF格式,進(jìn)而使不同元數(shù)據(jù)之間可以進(jìn)行語義互操作。同時(shí),同義詞的描述、領(lǐng)域本體庫的建立可以解決以往資源聚合中存在的一詞多義、一義多詞難題,幫助用戶更好地獲取信息。

(2)基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源聚合。在這一層面將采用HTTP協(xié)議中的URI地址命名所有資源,對(duì)數(shù)字資源進(jìn)行語義化描述,在元數(shù)據(jù)本體化模型的基礎(chǔ)上,同時(shí)采用SKOS語義化描述,統(tǒng)一RDF格式描述其他資源、鏈接相關(guān)資源,實(shí)現(xiàn)學(xué)術(shù)期刊內(nèi)部不同知識(shí)單元間的聚合和外部知識(shí)組織的鏈接。基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源聚合可以實(shí)現(xiàn)不同格式、不同來源的數(shù)據(jù)相關(guān)聯(lián)。不同數(shù)據(jù)庫中的資源以及同一數(shù)據(jù)庫中不同格式、不同類型、無法實(shí)現(xiàn)互操作的數(shù)據(jù)均可以通過關(guān)聯(lián)數(shù)據(jù)構(gòu)建數(shù)據(jù)網(wǎng)絡(luò),將資源整合成無縫鏈接的整體。關(guān)聯(lián)數(shù)據(jù)還可以通過HTTP協(xié)議和RDF鏈接實(shí)現(xiàn)與其他相關(guān)資源在語義層面的關(guān)聯(lián),通過揭示資源間的關(guān)系,豐富期刊的知識(shí)內(nèi)容。

(3)基于關(guān)聯(lián)數(shù)據(jù)的訪問和應(yīng)用。這一層面通過關(guān)聯(lián)數(shù)據(jù)來瀏覽查詢學(xué)術(shù)期刊中的數(shù)字資源,不僅可以得到簡(jiǎn)潔清晰的答案,還可以鏈接到其他相關(guān)數(shù)據(jù)資源,實(shí)現(xiàn)資源間的無縫對(duì)接。在數(shù)據(jù)資源聚合和關(guān)聯(lián)數(shù)據(jù)的基礎(chǔ)上,用戶可以通過關(guān)聯(lián)數(shù)據(jù)瀏覽器在不同數(shù)據(jù)源之間進(jìn)行瀏覽,這得益于數(shù)據(jù)之間已通過RDF進(jìn)行鏈接,并且已實(shí)現(xiàn)語義搜索。同時(shí),用戶還可以通過資源導(dǎo)航瀏覽整個(gè)數(shù)據(jù)網(wǎng)絡(luò),借助關(guān)聯(lián)數(shù)據(jù)搜索引擎實(shí)現(xiàn)對(duì)關(guān)聯(lián)數(shù)據(jù)的查詢,高效抓取關(guān)聯(lián)數(shù)據(jù)檢索所需信息。基于關(guān)聯(lián)數(shù)據(jù)的訪問和應(yīng)用可以使用戶體驗(yàn)到更加智能化的數(shù)據(jù)服務(wù)。

5、結(jié)束語

從印刷期刊到數(shù)字化期刊再到語義出版,學(xué)術(shù)期刊出版模式在不斷發(fā)生變化。數(shù)字環(huán)境下,傳統(tǒng)的圖片、文字、段落表達(dá)已經(jīng)無法達(dá)到科研人員所需。而語義出版則是對(duì)出版物內(nèi)容層面的深度挖掘,借助本體、關(guān)聯(lián)數(shù)據(jù)等語義技術(shù)生成有價(jià)值的知識(shí)單元,實(shí)現(xiàn)語義層面更細(xì)粒度的知識(shí)關(guān)聯(lián)。通過本文的研究,可以發(fā)現(xiàn):①語義出版的應(yīng)用實(shí)踐還處于發(fā)展階段,隨著語義技術(shù)的發(fā)展,基于淺層語義的資源組織方式會(huì)逐漸向深度語義化的知識(shí)關(guān)聯(lián)與集成轉(zhuǎn)變;②語義出版是學(xué)術(shù)期刊數(shù)字資源聚合的目標(biāo),而學(xué)術(shù)期刊數(shù)字資源聚合是實(shí)現(xiàn)語義出版的基礎(chǔ)性工作;③借鑒現(xiàn)有的國(guó)外學(xué)術(shù)期刊語義出版實(shí)踐,探索符合我國(guó)學(xué)術(shù)期刊發(fā)展的語義出版模式,是這一領(lǐng)域的重點(diǎn)研究?jī)?nèi)容之一;④借助本體、關(guān)聯(lián)數(shù)據(jù)等語義技術(shù),實(shí)現(xiàn)對(duì)學(xué)術(shù)期刊及其知識(shí)內(nèi)容的語義化描述是語義出版的主要技術(shù)路線,并以此為基礎(chǔ),探索基于數(shù)字資源聚合的學(xué)術(shù)期刊語義出版模式,為國(guó)內(nèi)學(xué)術(shù)期刊基于資源聚合和內(nèi)容組織實(shí)現(xiàn)語義出版提供經(jīng)驗(yàn)與借鑒。綜上所述,學(xué)術(shù)期刊數(shù)字資源的深度聚合為其語義出版實(shí)現(xiàn)提供了良好的資源基礎(chǔ),在本體、關(guān)聯(lián)數(shù)據(jù)等相關(guān)語義技術(shù)的不斷變革和大量數(shù)據(jù)、知識(shí)的不斷涌現(xiàn)以及科研人員對(duì)語義出版更高要求更迫切需求的背景下,只有不斷發(fā)現(xiàn)和挖掘出更多的隱性知識(shí)特征,不斷促進(jìn)學(xué)術(shù)期刊在資源上的深度聚合和在語義層面上的發(fā)展才能跟上數(shù)字化、語義化的時(shí)代潮流。為此,推動(dòng)數(shù)字資源聚合下的學(xué)術(shù)期刊語義出版發(fā)展刻不容緩。

參考文獻(xiàn)[1]SHOTTOND.Semanticpublishing:thecomingrevolutioninscienti?cjournalpublishing[J].LearnedPublishing,2009,22(2):85-94.[2]SHOTTOND,PORTWINK,KLYNEG,etal.Adventuresinsemanticpublishing:Exemplarsemanticenhancementsofaresearcharticle[J].PlosComputationalBiology,2009,5(4):e1000361.[3]李楠,孫濟(jì)慶,馬卓.面向?qū)W術(shù)文獻(xiàn)的語義出版技術(shù)研究[J].出版科學(xué),2015(6):85-92.[4]MAYERD.MainstreamSemanticEnrichment[EB/OL].[2019-04-25].www.stmassoc.org/2011_12_02_Innovations_Mayer_Mainstream_Semantic_Enrichment.pdf.[5]WAREM,MABEM.TheSTMReport:Anoverviewofscientificandscholarlyjournalpublishing[J].InformationStandardsQuarterly,2013,25(1):23.[6]姚偉欣,馬建華.新學(xué)術(shù)環(huán)境下科技期刊數(shù)字出版平臺(tái)的技術(shù)發(fā)展趨勢(shì)[J].中國(guó)科技期刊研究,2013,24(6):1039-1043.[7]TheArticleoftheFutureisnowlive[EB/OL].[2019-07-10].www.Articleofthefuture.com/.[8]翁彥琴,李苑,彭希珺,等.英國(guó)皇家化學(xué)會(huì)(RSC)-科技期刊語義出版模式的研究[J].中國(guó)科技期刊研究,2013,24(5):825-829.[9]HUDSON-VITALECR,JOHNSONRP,RUTTENBERGJ,etal.SHARE:Community-focusedinfrastructureandapublicgoods,scholarlydatabasetoadvanceaccesstoresearch[J].D-LibMagazine,2017,23:5-6.[10]DERIBAUPIERREH,F(xiàn)ALQUETG.ExtractingdiscourseelementsandannotatingscientificdocumentsusingtheSciAnnotDocmodel:ausecaseingenderdocuments[J].InternationalJournalonDigitalLibraries,2018,19(2/3):271-286.[11]BALAJIA,SENDHILKUMARS,MAHALAKSHMIGS.Tracingbestsemanticpathusingco-citationproximityanalysis[J].Biblios:RevistaElectrónicaDeBibliotecología,Archivologíaymuseología,2019(74):15-28.[12]LAFIAS,KUHNW.Spatialdiscoveryoflinkedresearchdatasetsanddocumentsataspatiallyenabledresearchlibrary[J].JournalofMap&GeographyLibraries,2018,14(1):21-39.[13]彭希珺,張曉林.國(guó)際學(xué)術(shù)期刊的數(shù)字化發(fā)展趨勢(shì)[J].中國(guó)科技期刊研究,2013,24(6):1033-1038.[14]王曉光,陳孝禹.語義出版:數(shù)字時(shí)代科學(xué)交流系統(tǒng)新模型[J].出版科學(xué),2012,20(4):81-86.[15]周杰,曾建勛.數(shù)字環(huán)境下的語義出版研究[J].情報(bào)理論與實(shí)踐,2013(8):32-35.[16]張偉偉,李燕,趙文義,等.供給側(cè)視域下的學(xué)術(shù)期刊數(shù)字出版發(fā)展路徑[J].中國(guó)科技期刊研究,2017,28(2):151-155.[17]李嬌,寇遠(yuǎn)濤,黃永文,等.國(guó)內(nèi)外語義出版實(shí)踐研究[J].數(shù)字圖書館論壇,2017(12):25-31.[18]陳鋼,謝文亮,顏志森,等.廣東科技期刊出版方式現(xiàn)狀與發(fā)展態(tài)勢(shì)研究[J].科技管理研究,2017,37(13):75-80.[19]彭希珺,張曉林.國(guó)際學(xué)術(shù)期刊的數(shù)字化發(fā)展趨勢(shì)[J].中國(guó)科技期刊研究,2013,24(6):1033-1038.[20]吉海濤,郭雨梅,郭曉亮,等.數(shù)字化背景下學(xué)術(shù)期刊融合發(fā)展研究[J].編輯學(xué)報(bào),2015,27(1):75-77.[21]謝文亮,王石榴.基于語義Web的科技期刊網(wǎng)絡(luò)信息檢索及其應(yīng)用[J].科技管理研究,2015,35(2):1.[22]余溢文,陳愛萍,趙惠祥.基于語義網(wǎng)的學(xué)術(shù)期刊發(fā)展初探[J].中國(guó)科技期刊研究,2013,24(5):954-956.許鑫毛璐江燕青基于數(shù)字資源聚合的學(xué)術(shù)期刊語義出版研究

作者:許鑫;毛璐;江燕青。作者單位:華東師范大學(xué)經(jīng)濟(jì)與管理學(xué)部

免責(zé)聲明以上文章內(nèi)容均來源于本站老師原創(chuàng)或網(wǎng)友上傳,不代表本站觀點(diǎn),與本站立場(chǎng)無關(guān),僅供學(xué)習(xí)和參考。本站不是任何雜志的官方網(wǎng)站,直投稿件和出版請(qǐng)聯(lián)系出版社。