舊版網站入口

站內搜索

基於特定領域的網絡資源知識組織與導航機制研究中期檢測報告

2016年11月29日15:28來源:全國哲學社會科學工作辦公室

一、研究進展情況

①本項目於2012年12月立項,研究已開展將近三年半,項目總體執行情況以及各子課題進展情況順利。自2014年6月中期檢查后,項目舉行課題中期報告說明會,根據會上各課題組成員的討論和建議,繼續深化各子課題的研究方法和進展,項目首席專家對后期工作的總體推進和協調進行了進一步的統籌和調整。期間,課題組成員定期(每周或每兩周)召開例會集中匯報討論各課題組成員的研究進展,並布置下一步任務與計劃,每次例會均有首席專家主持並點評,與會成員們積極發言討論。

子課題一:面向學科領域的網絡信息資源及其深度聚合與導航基本理論研究

1.圖情領域網絡資源分布及利用需求

在對網絡學術資源進行類型劃分的基礎上,進一步對網絡學術資源的分布、網絡學術資源的類型、網絡學術資源的微觀結構和特征等方面進行了深入研究。首先,從網絡引文的角度,對特定領域研究網絡學術資源的利用情況和需求進行了深入的探討,包括主題分布、域名分布、類型分布、URL深度分布、研究者利用數量、利用類型、利用目的等特征。其次,以圖情領域網站間的社會網絡關系為切入點,採用社會網絡分析法,借助社會網絡分析工具Ucient,從國內圖情網站中選擇了15種資源類型,共306個有效網站進行分析,按照網站間的友情鏈接關系構建了網絡關系圖,並進行了圖情領域整體網群可視化分析、網絡密度分析、中心性分析和核心-邊緣結構分析。按照資源類型,對其中10種資源類型的圖情領域子網群的網絡結構和中心性進行了分析。網絡結構分析發現圖情領域整體網群結構鬆散,處於核心位置的網站較少﹔高校圖書館網群、科技情報研究所網群和公共圖書館網群聯系的最為緊密。中心性分析發現了三類核心網站,這三類網站都處於網絡中的重要位置。

2.網絡資源的引用行為與動機

選擇在線百科這一類型網絡資源為研究對象,將引用類型劃分為八大類,分別為(1)網站或詞條本身的引用以証明網站或詞條的存在,此類主要包括直接在網站名或詞條名后進行標注,沒有具體引用其內容。(2)圖書情報學專業術語的引用,此類是指引用的詞條為圖書情報學專業術語。(3)非圖書情報學專業術語的引用,如計算機科學、醫學、法律、社會學等的相關概念。(4)專有名詞、流行文化等的引用,此類包括不具體歸屬於某一學科的專有名詞,如人名、地名、機構名、作品、公司名、產品名、網絡用語、某些新出現的網絡現象、新聞、歷史性事件的描述等。(5)數值類引用,主要是指引用某一具體數值,如社會經濟指標等。(6)公文標准類引用,包括政府政策、法規等以及明確指出某一協會或報告的間接性引用。(7)冗余引用,此類是指在引用在線百科資源之前還標注其他類型資源的引文,而如果其他類型的引用是出現在之后則根據其特征歸入其他某一類中。(8)其他,如圖片、表格等的引用。並對這八種類型的引用分布進行了統計分析。

子課題二:面向學科領域的網絡信息採集、抽取和預處理

1.基於主題的採集

互聯網上(如電子資源、網絡數據庫、專題論壇、研究博客、維基百科等等)積累了豐富的學科信息資源,這些資源由於缺少統一的形式化表達與操作標准,呈現異質、異構、分散、重復、動態和隱藏等特征,嚴重限制了資源的集成應用,如何快速有效地獲取所需專業信息或決策信息成為亟待解決的重要問題。以1998年康奈爾大學的Watts和Strogatz建立的小世界模型、1999年聖母大學的Barabási和Albert建立的無標度模型為標志,研究人員廣泛使用復雜網絡理論對社會網絡進行分析,分析網站之間構成的網群的拓扑結構,從而分析信息的發布、互動和傳播特性,以便採集。利用復雜網絡理論對興趣社交網站進行了拓扑結構分析。興趣社交網站就是興趣愛好的社交平台,人們通過共同愛好形成各種興趣社區,針對某個或某幾個主題展開交流,作為“領域專家的意見領袖”在引導興趣主題的發展上起著主導作用。3個社區的出入度分布的冪率指數a均滿足大多數社交網絡的度分布函數的冪率指數范圍1<a<2[22],這種無標度特征揭示出網絡存在中心節點、網絡資源佔有不平衡的現象。對興趣社交網站的採集,我們採用滾雪球採樣法,在開源軟件Heritrix的基礎上,自行開發數據採集器。採集器共抓取了近600萬頁面,總容量接近60G。對百科資源的採集,採用維基百科中文版(zh.wikipedia.org)的鏡像文件,共約1.2G。在主題相關性計算方法方面,選擇中文維基百科這一理想的語義知識資源進行領域概念的相關性研究,包括基於語義距離、信息量和文本重疊的計算方法三種。

2.基於語義的抽取。

採用基於依存句法分析的方法,基於哈工大的語言雲平台,隻需要根據API參數構造HTTP請求即可在線獲得XML分析結果。繼而選用了中科院計算所譚鬆波博士提供的酒店、電腦2個領域的4000篇評論語料進行了依存句法方面的分析。

子課題三:面向學科領域的網絡信息資源深度聚合研究

1.聚合單元內容元數據

目前已有的元數據標准基本都以粗粒度的信息資源為單位,如一本書、一篇論文、一個網頁等,而缺少對細粒度信息資源的描述標准,如章節、段落、句群等聚合單元。因此,為了使更細粒度的網絡信息資源得以被便捷、高效地檢索和利用,有必要建立細粒度信息資源的元數據描述框架。本文以圖書情報領域為例,圖書情報領域網上免費信息資源包括OA論文、百科、博客、微博、論壇、新聞、教案、程序等。本文對不同網絡信息資源類型進行研究,探討網絡資源細粒度單元的劃分以及組織機制,旨在建立針對不同資源類型的統一的細粒度單元元數據描述框架,為網絡信息資源聚合提供可操作的信息組織理論基礎。本文在已有的研究基礎上,綜合對文獻單元研究的已有成果並借鑒應用語言學對於體裁分析的研究確定聚合單元的定義框架。然后,針對不同層級單元的屬性特征,構建描述聚合單元訪問信息、物理信息和語義信息的元數據框架,並探討了元數據實現自動抽取的可能性。最后,本文依據元數據框架設計並實現了網絡資源細粒度單元檢索數據庫,通過實驗法展示元數據框架支持聚合與檢索的效果。

2.學術會議PPT資源深度聚合

按照“相關理論研究-模型構建-實証分析”的思路進行研究。首先,總結和歸納國內外學者在學科領域網絡信息資源理論、信息聚合、會議文獻資源等相關領域的研究成果,深入了解國內外有關信息資源深度聚合的理論基礎及其最新研究成果。其次,借鑒已有的聚合理論與方法,結合會議 PPT 的特征,從文獻特征關聯維度,針對會議、關鍵詞、主講者、主講者機構等的關聯關系,結合社會網絡分析方法與計量學方法,利用會議 PPT的主講者、主講者機構、關鍵詞等關系及其之間交叉關系建立會議 PPT聚合模型,通過社會網絡關系可視化地展示關鍵詞網絡、關鍵詞-會議網絡、主講者-會議網絡、主講者-關鍵詞網絡、機構-會議網絡、機構-關鍵詞網絡、關鍵詞-會議-主講者網絡、關鍵詞-機構-主講者網絡等,並且根據不同網絡的特點,採用不同的社會網絡指標(密度、中心性、小世界等)分析不同的網絡,研究揭示了會議研究主國內外圖情領域學術會議網絡 PPT主題、會議主題相關性、主講者間潛在的交流關系、研究主題分布及各主講者的研究興趣、機構間的潛在交流、機構研究主題的相關性等。

3.情景相關的網絡學術資源聚合單元研究

在回顧多類型網絡資源聚合、細粒度檢索與聚合和用戶聚合需求與行為研究的基礎上,提出按照學科領域用戶認知規律劃分聚合單元、通過揭示和利用用戶與多類型網絡學術文檔內聚合單元的關聯關系從而實現細粒度聚合的聚合模式,以優化用戶網絡學術資源獲取的效率與效用。在借鑒語言學的語篇體裁理論、相關性理論和圖書情報學的情景檢索理論的基礎上,以圖書情報學領域網絡文檔為研究對象和范圍,展開三階段實証研究:第一階段,在文獻回顧和網絡調查的基礎上構建跨類型網絡文檔聚合單元類型體系,並進行基於語料的有效性檢驗。該體系涵蓋論文題錄、OA期刊論文、網絡百科和博客文章等四種體裁類型的網絡文檔,並統一劃分為篇章—構成—功能單元三個層級﹔第二階段,通過兩輪用戶調查檢驗第一階段類型體系的有效性以及一組信息搜尋任務下各層級和各類聚合單元感知有用性的差異,並初步探討了與任務存在高相關性的聚合單元之間可能存在的關系﹔第三階段,在實証研究結果的基礎上,設計任務關聯的細粒度聚合系統,並對網絡學術文檔聚合單元自動識別進行探討,從而為聚合單元類型體系的應用提供借鑒。

4.特定學科領域的網絡資源語義聚合研究

在對語義聚合理論進行總結和綜述的基礎上,提出了前控+后控的語義聚合模式。在前控階段,採集到學科領域網絡資源后,聚合系統先利用領域本體對資源進行語義描述,建立資源之間的語義關系,構成多維度的資源語義描述庫,並提取資源語義描述索引。在后控階段,聚合系統利用領域本體將用戶提出的自然語詞自動轉換成學科領域概念,並根據領域本體中的概念關系對用戶提問作進一步的語義引導和挖掘。最后,在聚合處理階段,聚合系統將語義明確的用戶需求與資源語義描述庫進行語義匹配,計算提問和資源的語義距離,形成資源聚合體,並通過多種語義聚合網絡展示出來。

子課題四:用戶認知導向的學科領域網絡信息資源導航機制研究

1.Flow測量

網絡環境下Flow量表的研究仍處於發展階段,研究重點在於Flow維度識別及其結構厘清。已有研究中,Flow的操作化定義形形色色,Romero(2015)宣稱其中不乏誤操作的產物,他們堅持,隻有深入認識和理解Flow本質,才能准確操作化Flow。Flow測量包括單一維度測量法和多維度測量法。單一維度測量法視心流體驗為單一維度直接衡量。單一維度測量法又分為三種形式,第一種是“心流短摘錄”。“心流短摘錄”是以簡短摘錄的方式描述心流體驗,以Bilgihan(2015)為例,它的“心流短摘錄”文本為:“’心流’是用來描述人們全身心投入某項活動的精神狀態。例如,當用戶網上購物進入心流狀態時,心無雜念,身心合一,全神貫注地投入並享受其中。許多人在網頁瀏覽、在線聊天和文字編輯等活動都會經歷這種感覺。”第二種測量方法是“技巧與挑戰的平衡計分”,它的原理基於心流體驗的四通道模型,該模型認為,“流動狀態”產生於挑戰與技巧適配且都處於高水平時。據此,可以通過量表的方式獲取被試在技巧和挑戰方面的得分,比較它們之間的得分就可以判斷受測者是處於技巧高於挑戰的“無趣狀態”、挑戰大於技巧的“焦慮狀態”,還是技巧與挑戰匹配的“流動狀態”第三種是“混合維度測量法”,混合不同維度的指標測量心流體驗。陳潔(2009)和Skadberg and Kimmel(2004)定義心流體驗為“時間感扭曲”和“愉悅感”,Senecal, Gharbi, and Nantel (2002)混合專注、控制、挑戰與愉悅感的指標測量心流體驗,Jiang and Benbasat (2005),類似的,Jiang and Benbasat (2005)視控制、專注和愉悅感為心流體驗, Choi, Kim,and Kim (2000) 的心流體驗測量由2個內在興趣指標、2個好奇感指標、1個控制指標和1個專注指標組成。類似的研究有WU(2014)、Barker(2015)。為了彌補單一維度測量法無法全面揭示心流概念的不足,多維度測量法應運而生。與“混合維度測量法”把心流定義的部分維度指標(如愉悅、控制或專注等)混合成單一構念(construct)不同,多維度測量法視心流為多維度構念,每個維度採用若干指標單獨測量,運用結構方程模型檢驗這些維度是否指向同一高階因子,從多維的角度呈現心流概念的結構。在網絡環境下,早期多維度測量法的對象並不是Flow本身,而是Flow相似概念,例如Koufaris(2002)把體驗操作化為五個維度,分別是控制、愉悅、專注、感知有用和感知易用,與之相似的還有Bridges and Florsheim(2008)把Flow操作化為臨境感、時間感扭曲、技巧、交互速度和重要性。作為中介變量,這些維度在研究架構中的作用得到了檢驗,但研究對維度之間的關系避而不談。

2.學科領域網絡資源聚合系統導航的用戶行為研究

結合國內外學者對導航行為的已有研究,構建了學科領域網絡資源聚合系統導航的用戶行為研究模型,主要使用實驗的方法,以圖情領域網絡資源聚合系統“e線圖情”作為實驗網站,選取圖書情報學科的本科生、研究生共23名作為實驗對象,設計了 10 個事實信息任務,利用屏幕錄制軟件採集實驗對象的行為,使用 SPSS19.0 對實驗數據進行統計分析。研究表明,個體特征中,性別、受教育程度、網絡使用年限對用戶的主觀復雜性判斷具有顯著影響﹔性別對用戶導航使用過程中的導航時間、每個頁面所花時間有顯著影響,受教育程度和網絡使用年限對導航使用行為沒有顯著影響。不同認知風格的用戶對任務的主觀復雜性判斷、導航使用過程中訪問的不重復頁面數量、主頁次數、導航欄次數都具有顯著差異。任務目標頁面的邏輯層級對客觀任務復雜性有顯著影響,邏輯層級對導航欄

訪問次數有正向影響,與主頁訪問次數負顯著相關。客觀任務復雜性會影響用戶的主觀復雜性判斷,並對導航使用過程中訪問的頁面總數、不重復頁面數、導航欄訪問次數、重訪率、導航時間具有顯著影響,且與任務執行結果顯著相關。用戶對任務復雜程度的主觀判斷會影響其執行任務過程中的所有行為特征。

3.網絡信息資源聚合情境下大學生用戶心智模型研究

以信息用戶心智模型的構成維度為研究切入點,將定性與定量方法相結合,綜合利用概念列表法、半結構化訪談法和問卷調查法,以中山大學學生為調查對象,探索當前環境下大學生用戶對於網絡學術信息資源聚合及聚合系統的心理認知情況。網絡信息資源聚合情境下大學生用戶心智模型主要包含認知和評價兩個層面,其中認知體系主要包括有用性認知、資源聚合功能認知、資源聚合的環境認知,評價體系主要包括對比評價、檢索效果評價、負面評價。

子課題五:面向學科領域的網絡信息資源深度聚合與導航機制應用研究

1.構建面向學科領域的網絡信息資源深度聚合與導航原型系統

基於任務相關性的跨類型網絡資源聚合單元類型體系的細粒度聚合系統的設計將圍繞細粒度聚合系統設計原理、語料庫數據來源、數據結構與組織、聚合機制、界面設計等幾個方面進行。在聚合單元類型體系構建和任務相關性研究的基礎上,我們得到由4類體裁、15類構成單元和54類功能單元組成的聚合單元類型體系,為當前聚合檢索系統原型的設計提供參考,從而通過提示和呈現與任務高度相關的聚合單元來促進檢索的效率和效用。通過三個功能可達到這一目標:一個是聚合單元任務相關性的排序器,在主題相關性的基礎上,對聚合單元的排序進行加權﹔第二個是聚合單元選擇器,可根據用戶所選擇的任務類型選擇相關的聚合單元﹔第三個是相關聚合單元提示器,可在對各類資源進行主題匹配的基礎上,根據檢索任務的相關性對相關的聚合單元進行提示。系統採用JAVA語言編寫,採用JFINAL框架進行開發,並以Sqlserver數據庫管理系統對基於“引文分析”聚合單元語料庫的元數據和文本數據進行管理和檢索,包含檢索匹配和結果呈現兩大功能模塊。語料庫中 81 篇資源分由三個層級的元數據表進行組織。其中篇章元數據表主要包括:資源 ID、資源類型、資源體裁、標題、篇關鍵詞、分類、來源、更新時間、作者等字段﹔構成單元元數據表主要包括:構成 ID、來源文獻 ID、題名、章節層級、構成名稱、標題關鍵詞等﹔功能單元元數據表主要包括:功能單元 ID、來源文獻、構成 ID、功能單元名、內容關鍵詞等字段。三層級元數據除了包含上述字段及相應內容外,還包含對應的全文內容。篇章、構成與功能單元三個層級的元數據為各層級單元內容的檢索提供了支持,並支持三個層級內容間的鏈接和跳轉。

②調查研究及學術交流情況(調研數據整理運用、文獻資料收集整理、學術會議、學術交流、國際合作等)﹔

1.數據收集與文獻資料整理

(1)數據收集。數據採集包括三個方面,一是學科領域網絡學術資源數據的採集,包括OA期刊論文、百度百科和維基百科、精品課程、學術會議等的採集,OA期刊論文如《現代圖書情報技術》、《知識管理論壇》、《圖書情報工作網刊》刊載的所有論文的文獻著錄數據和全文數據,國內外圖情領域會議的PPT資源等﹔二是輿情數據的採集﹔三是用戶利用與需求數據的採集,包括採用實驗法和用戶調查法,如在圖情領域大學生用戶的網絡資源聚合需求以及其在網絡資源聚合系統中的查尋行為方面,通過問卷調查圖情領域學生對網絡資源聚合系統的使用情況和評價以及對網絡資源聚合粒度的需求,以了解用戶對網絡資源聚合的需求狀況,同時通過實驗,以檢索式策略、導航菜單使用頻率、檢索結果瀏覽方式、檢索時長作為指標,對比分析用戶在一般環境下和網絡資源聚合系統情境中查尋行為的差異以及個體特征、檢索技能與經驗、檢索任務復雜度和任務聚合粒度需求對用戶查尋行為的影響,同時對其檢索結果和過程的滿意度進行評價﹔

(2)文獻收集。

A.聚合單元相關研究。

國內外對聚合單元的研究主要分為三個方面:知識元研究,學習對象研究和關聯數據研究。弗拉基米爾·斯拉麥卡來華講學時曾指出,知識的控制單位將從文獻深化到文獻中的數據、公式、事實、結論等最小的獨立的“數據元”(事實上指的就是“知識元”),而大量文獻中所包含的“知識元”及相關信息間的鏈接能產生極大的知識增值。馬費成教授也指出情報學取得突破的關鍵之一是知識信息的表達和組織必須從物理層次的文獻單元向認識層次的知識單元或情報單元轉換[1]。學者徐如鏡指出知識的控制單位長期停留在文獻一級,而人們對知識的需求一般不是以文獻為單位[2]。周寧等指出互聯網信息檢索查准率、查全率不高的原因主要是信息組織的深度還停留在文獻層次,根本的解決方法是對信息資源進行深入到知識元層次的信息組織[2]。

在“知識元”的研究中,以西安電子科技大學溫有奎教授為代表的對中文文本知識元進行的基礎性研究尤為引人注目,知識元及其構建問題一經提出即刻引起了情報學、信息管理等領域學者的高度關注和重視[3]。溫有奎教授指出我們假定文本內容的組織排列,是由一個個獨立知識元素的邏輯排序結構,這種獨立的知識元素我們稱它為知識元,邏輯依存關系稱它為知識鏈,知識元是構造知識結構的基元,標引知識元便於用戶直接查詢知識元,組合知識元,改善自己的知識結構,從而加快知識創新速度[4]。劉平峰等提出一種基於模糊等價關系的文本多粒度劃分方法,以模糊等價關系構建文本信息顆粒,為多粒度知識服務基於主題的導航提供基礎[5]。王玉林等提出一種細粒度語義共詞分析方法,該方法一方面對詞對共現統計單元進行碎片化處理,由“文獻單元”變為“知識單元”(RDF三元組),達到細粒度的目的﹔另一方面對共詞分析方法進行語義化處理,將共現詞對的語義信息融入到共詞分析過程之中[6]。在知識元的處理單位上也有不少的研究,文獻[7,8,9]探討了把詞作為處理單元的知識抽取技術,文獻[11,12 ,13]則研究句子級信息抽取和知識抽取的方法。

在E-Learning中,強調的就是將學習資源進行分解、描述和揭示,剔除冗余、重復和劣質信息,對學習資源來源、內容和結構進行新的類聚和重組,形成一個具有特定邏輯組織、向導性和關聯性的學習對象知識資源體系,其中,學習對象知識資源的整合依托於對不同類型和來源的學習資源的內容進行深度揭示和規范描述,形成標准規范的學習對象,之后再利用知識本體對學習對象中知識單元所標引的邏輯關系形成具有新的組織結構和功能的知識系統[10]。在這個過程中,對學習資源的標引至關重要,首先就是要建立學習對象的元數據描述框架。目前,使用率最高的針對學習對象的元數據體系是本文2.2提到的LOM元數據框架[14]。在應用方面,美國國家科學基金會進行的可重用學習項目(The Reusable Learning Project,2003-2005)正是把學習資源切分為學習對象,因為這樣能夠通過分析用戶的目的和現有技能,聚合從資源中分解出的學習對象,使用戶不用在大量已經熟知或不感興趣的信息中對確定需要的知識進行篩選,更好地對用戶進行個性化的服務。項目中學習對象的元數據框架包括:①基本描述信息(也稱數目元數據),包括資源的標題、作者、描述、標識和關鍵字,目的是使資源被發現和使用﹔②情境信息,包括適用年級、適用對象等教育資源的信息,使搜索能夠為某一個特定情境服務﹔③產權信息,描述資源使用的條件和權限﹔④技術信息,包括資源的格式信息以及使用和修改資源的軟硬件要求﹔⑤用戶信息,包括軟件文檔(在線、印刷或者幫助界面格式)、教學指導和其它能夠幫助更正確和有效地使用資源的信息[15]。項目也提出利用XML表示是一種可行的方法[16]。等學者提出將本體運用到學習對象的元數據中只是有助於從數據庫中檢索出相關的學習對象,卻並不能讓學習對象中的組成成分獲得重用,也無法有效定義學習對象內容的語義,因此,他們提出使用領域本體和結構本體對學習對象的內容進行標引的方法,使直接訪問學習對象的組成成分成為可能[17]。

常娥指出關聯數據採用RDF 數據模型,借助其核心技術URIs,可創建包含各種數據、信息和知識在內的任何資源的細粒度化的數據網絡,是語義網的簡化方案,且元數據和本體模型均可融入關聯數據的技術框架,因此,關聯數據為圖書館將各種資源轉化為細粒度提供連通著的網絡數據,徹底轉變圖書館資源組織的模式,彌補館藏書目數據組織的粗粒度、無語義和封閉性的不足,從而打破館藏資源組織與利用的困境,提供很好的思路[18]。沈志宏等指出不同於Document Web,關聯數據將互聯網上任一信息內容或其子內容看成是一個可採用標准方法規范描述和調用的知識對象,通過創建和發布關於各類知識對象及其與各類其他知識對象之間關系的規范化描述信息,通過建立基於知識內容的檢索以及基於知識關系的分析關聯機制,關聯數據便可支持在特定信息環境下對不同知識對象的關聯發現[19]。李成龍以科技報告為研究對象,通過對科技報告的結構進行分解,以章節為單元進行中粒度關聯數據的創建與發布,為構建多粒度的組織體系打下基礎,以期達到滿足用戶多粒度的信息需求[20]。王忠義等為實現數字圖書館館藏資源目錄數據(中粒度)的中層關聯數據的創建與發布,在對現有關聯數據創建與發布方法進行研究的基礎上,針對目錄數據自身的特點,採用自動標引、主題詞映射等技術實現目錄數據的結構化,借助目錄體系與文本匹配實現關聯數據的關聯發現,借助 D2R最終實現中層關聯數據的創建與發布[21]。SWSE、Sindice等語義網搜索引擎分別將眾多書目的RDF文檔編入索引[22]。Olaf Hartig等從數據庫的角度來研究網絡上出現的關聯數據,分析了近年來越來越多的供應商採用了關聯數據原則來出版和連結結構化數據,從而創造了一個全球的分布式數據空間——網絡數據[23]。

B.體裁分析相關研究

John Swales等學者對學術論文這種特定的體裁進行研究,學術文獻在語言的功能性和目的上比其它體裁更加明顯,由於期刊篇幅等的限制,學術文獻中的每一句話甚至話語出現的順序通常都具有很強的意識和目的性。John Swales認為期刊論文具有一定的宏觀結構,可以劃分為四個組件(Component)——介紹(Introduction)、方法(Methods)、結果(Results)和討論(Discussion),即IMRD模型[1,2]。不過,IMRD模型主要是針對實証性論文,對於非實証性論文,學者楊瑞英提出由介紹(Introduction),理論基礎(Theoretical Basis),論証(Argumentation),結論(Conclusion)構成[3]。

在組件的基礎上,Swales和Sperber等學者提出功能性單元的概念(functional units),功能單元是內含在IMRD各個組件中有獨立交際功能的句群[4]。例如,在介紹組件中,回顧以往研究的文本片段可以被認為是一個功能單元,其它沒有指示出以往研究的文本片段是不同的功能單元。功能單元的概念是基於Swales的構建學術工作空間模型(Create a Research Space,CARS),該模型一開始是用來指導撰寫研究文獻介紹的。

對於功能性單元的劃分方法分為兩種派別,一個派別是“Swalesian School”,他們的劃分方法是語步(move)/步驟(step),他們的分析對象多以學術和職業語篇。另一個派別稱“Australian School”,他們的分析對象主要是與牙醫交際、講故事、求職、請人吃飯等事件。

2004年Swales又繼續修改他的模型,把三個語輪變為:語輪1-提出某領域論題﹔語輪2-收窄論題﹔語輪3-介紹當前研究。Swales的研究促進了介紹部分語輪/語步的進一步研究,如Kanoksilapatham (2005)[5],Lewin et al. (2001)[6], and Nwogu (1997)[7]等。同時,其它組件的研究也都開始進行,如在方法部分,Lim通過分析管理學領域的20篇英語學術論文的方法部分,分析總結出方法部分的三個語輪分別為描述數據收集過程、描述變量測量過程和描述數據分析過程,以及每個語輪對應下的多個語步[8]﹔Zhang[9]對心理學領域的英語學術論文體裁分析,認為方法部分的語篇語步包括:關聯以往或下一個實驗、証明方法的合理性、預覽方法、預覽結果、描述被試者、描述支撐材料、描述任務、實驗程序提要、呈現變量和概述數據分析程序。國內楊瑞英對10篇英語應用語言學實証性學術論文分析,認為方法部分語輪包括背景信息、描述數據和介紹分析方法三個方面[3]。在結果部分,Nwogu (1997) 指出兩個語輪,而Kanoksilapatham (2005) 通過生物化學領域學術文獻的研究得到四個語輪。討論部分,Swales and Freak (1994: 195) 提出三個語輪:語輪1-鞏固研究空間﹔語輪2-結果啟示﹔語輪3-日后研究。而Dudley-Evans(1986)也提出三個語輪,介紹,結果解釋,總結與日后研究,在總結日后研究下他還提出三個語步,總結主要結果,總結主要觀點和推薦日后研究,他同時指出在這個部分語步往往是循環出現的。上述研究中的語步即揭示一個修辭單元的交際目的或稱功能。

C.網絡資源導航相關研究

無論是瀏覽還是搜索網絡信息,都離不開導航工具和導航系統的輔助。金燕總結的導航機制共有五種:基於超鏈接的導航機制、基於內容的導航機制、時序機制、空間機制、社會導航機制,並對這五種機制進行了比較,還介紹了可視化輔助機制及魚眼圖技術、Focus+Context技術、視點控制技術、突顯技術[5]。之后金燕還專門研究了社會機制的導航,介紹了其內涵、特點,並在此基礎上給出了一個基於多Agent 的社會導航模型,分析了該模型的導航策略[6]。王秀峰的博士論文中介紹了四種主要的web 導航機制,分別為基於瀏覽器的 web 導航、基於鏈接的 web 導航、基於站點地圖的 web 導航和社會導航機制[7]。國外學者通常將信息導航總結為三種機制:基於信息對象間空間關聯的空間導航、基於信息對象間語義關聯的語義導航和受社會因素影響的社會導航。Wexelblat 等人認為,使用隱含在信息或結構背后的語義屬性信息的是語義導航,而使用來自他人信息的是社會導航[8]。Dieberger 認為,社會導航與其他導航方式的不同主要表現在導航建議是如何被提供給用戶的,社會導航的導航信息是由他人發出的,不是靜態設計好的而是動態的,可針對用戶個人的具體情況給出動態的建議,它不是根據頁面上端的指示性信息進行的,而是搜集他人的社會性活動,並以此為指導進行的[9]。導航策略是幫助用戶實現信息獲取目標的一些途徑和方法。高尚在其博士論文中介紹了常用的導航設施,包括分層導航、跳轉、可視化組織器、地圖、回溯、歷史清單、查找、索引及在線幫助,並分析了各自的優缺點,隨后又總結了超文本學習系統中常用的導航策略,包括檢索導航、線索導航、幫助導航、瀏覽導航、演示導航和書簽導航[10]。金燕的博士論文“WWW信息導航機制研究”中總結了瀏覽器和網站提供的各種導航方法,包括支持直接搜索和頁面重訪的瀏覽器導航策略,從結構、內容和圖形化來實現導航的網站導航策略、面向用戶的個性化需求的“拉”、“推”式導航策略,並分析了用戶不同信息查詢行為的認知過程、認知負擔以及對導航支持的依賴程度,建議導航工具的設計者根據用戶查詢行為的特征提供不同的導航策略[11]。Cockburn 和Head 等外國學者研究認為,網站瀏覽器、等級式內容目錄和列表、搜索引擎、站點地圖、情景提示等是最重要的導航工具,它們也是導航策略[12][13]。Catledge 等人認為瀏覽器是最基本的導航策略,它具備前進、后退、歷史記錄、直接查詢和搜索、收藏夾等功能,可提供簡單的導航,特別是“后退”按鈕,佔了導航使用中43%的導航份額﹔等級式內容目錄和列表是基於分類思想的,受網站設計者的分類標准限制,用戶難以確定內容的類目﹔搜索引擎受到檢索性能和排名算法影響,且存在詞匯控制問題。而站點地圖和情景提示會受用戶的使用習慣影響[14]。基於導航理論的研究,國內外一些研究者提出或實現了一些導航系統。國外的主要有:Cockburn 在其文章中介紹了一個擴展導航功能的瀏覽器原型“WebNet”[26],Singer 和Pecatte 等人提出了一個多代理合作導航系統 MAWA[27],Garg 等人提出了一個基於潛在語義技術的面向需求的環境內容導航系統MediaCaddy,根據語義技術和本體技術不僅實現對元內容資源的導航,而且可提供個性化服務[28]。1996 年盧增祥的碩士論文在分析搜索引擎技術內容的基礎上,設計了一個使用網絡信息代理進行網絡信息搜集、利用情報檢索技術進行網絡信息查詢的網絡信息導航系統[29]。1997 年中經網信息導航事業部利用超文本技術、依托CEInet 計算機網絡平台,研制出了 CEI 信息導航,為各級政府乃至全世界的網絡用戶提供免費、快捷、方便的中國經濟信息檢索手段[30]。於晏在其碩士論文中詳細闡述了Internet 信息導航系統的設計方案、算法、概念、主要技術、及實現方法[31]。朱江嶺等人則詳細說明了因特網信息導航系統的組成部分及需要解決的技術問題,並提出建立全國網絡導航體系和信息資源共享的構想[32]。之后一些學者提出了基於某種技術建設網站導航系統的方法,包括基於信息地圖的可視化信息導航系統[33]、QUIC 智能超文本導航系統[34]、基於信息定制的信息導航系統[35]、基於用戶訪問序列聚類的網站導航系統[36]、基於信息構建的電子商務網站導航系統[37]、基於序列模式的網站導航系統[38]。

導航模型方面,目前共有五種主要的導航模型,分別為:CoLiDeS 系列模型,2000 年Kitajima[42]等人推出 CoLiDeS——一個以理解為基礎的檢索關聯模型,CoLiDeS基於語義相似度、詞頻和文本匹配這三個因素來衡量特定的頁面與用戶目標(信息氣味)之間的關聯性,語義相似度根據文字和文件之間的共現來計算,輔以潛在語義分析(LSA)這一算法,之后,Oostendorp 與Juvina[43]對該模型進行了一些修正,引入“路徑充足”(導航路徑與用戶目標間的語義相似度)這一概念來補充信息氣味,提出了網站導航的計算認知模型CoLiDeS+,2012年Oostendorp[44]等人開發了考慮圖像內容義信息的導航認知模型CoLiDeS+Pic,新的模型建立在CoLiDeS模型基礎上,作者表明將用戶圖像信息的使用明確到模型中讓認知導航模型更加完善﹔Pirolli 和 Fu 建立了模擬用戶執行網頁任務的計算認知模型SNIF-ACT(Scent-based Navigation and Information Foraging in theACT cognitivearchitec-ture),該模型預測導航選擇,即基於信息氣味預測下一步去哪裡、何時停止(離開網站),信息氣味計算為基於詞的出現和共現的用戶目標與鏈接文本之間的相互關聯性[45]﹔Miller 與 Remington 提出的MESA(Method for EvaluatingSiteArchitectures)模型,該模型通過利用模擬用戶行為的信息導航計算模型來研究每個網頁的最佳選擇數量,通過改變鏈接標簽的質量發現最優的信息結構取決於標簽的質量[46]﹔Marques 等人提出的 RED(Navigation Strategies Recognizer)模型,該模型介紹了一種識別用戶使用網站導航時的決策策略的方法,代理技術和解析算法是 RED的關鍵組件,基於用戶導航歷史來識別用戶策略,以此來評價網站的使用並為簡化交互提供建議[47]﹔Vera Hollink 等人提出了探討鏈接結構與導航可用性之間關系的導航行為模型,該模型包括一組關於用戶目標和導航策略的明確假設,用發現信息的數量(有效性)與找到信息所需時間(效率)這兩個指標來明確導航過程的效用[48]。

[5] 金燕.WWW 信息導航機制研究[D]. 武漢大學,2005.

[6] 金燕. 試論 WWW 信息導航的社會機制[J]. 現代情報, 2007(9): 72-75.

[7] 王秀峰.Web導航中用戶認知特征及行為研究[D]. 南京大學, 2013.

[8] Wexelblat, A,. et al. Social navigation: what is it good for? (panel discussion)[C]. CHI’99

ExtendedAbstracts,ACM Conference on Human Factors in Computing Systems. 1999 May 15-20;

Pittsburgh, PA.NY:ACM; 1999: 89-90.

[9] Dieberger A. Social navigation--technique for building more usable systems[J]. Interaction,

2000(6): 36-45.

[10] 高尚. 基於超文本的學習模型及學習控制的研究[D]. 東北大學, 2000.

[11] 金燕.WWW 信息導航機制研究[D]. 武漢大學, 2005.

[12] Cockburn A. Which way now? Analyzing and easing inadequacies in WWW navigation[J].

Human Computer Studies, 1996(45): 105-129.

[13] Head M.,Archer N., YuanYF. World Wide Web navigation aid[J]. Human Computer Studies,

2000(53): 301-330.

[14] Catledge I., Pitkow J. Characterizing browsing strategies in the World Wide Web[J].

Computer Networks andISDN Systems, 1995(27): 1065-1073.

[15] David K. Farkas, Jean B. Farkas. Guidelines for designing web navigation[J]. Technical

Communication.2000,(3): 341-358.

[16] Susanne Jul, George W. Furnas. Navigation in Electronic Worlds: A CHI 97

workshop[EB/OL]. http://homepages.cwi.nl/~steven/sigchi/bulletin/1997.4/jul.html, 2014-12-25.

[17] 劉甲學. 超媒體信息空間智能導航理論與實証研究[D]. 吉林大學,2006.

[18] 詹姆斯·卡爾巴赫(James Kalbach).Web導航設計[M]. 北京: 電子工業出版社, 2009.

[19] 郭熙. 網站導航系統創意設計探究[D]. 南京藝術學院, 2010.

[20] 龔俊輝. 淺析網站建設中網絡導航形象識別系統的設計[J]. 美術大觀, 2004(1): 24-25.

[21] 李辛旺. 基於信息構建理論的WEB導航系統視覺信息優化設計[D]. 北京航空航天大學,

2012.

[22] 詹晶晶, 黃慧琴, 劉沛芬. 網站導航欄設計的應用心理[J]. 藝術與設計(理論),2010(12):

62-63.

[23] 滕廣青, 畢強. 電子商務網站導航設計新理念:經營目標導向的以用戶為核心的電子商

務網站導航設計研究[J]. 圖書情報工作, 2009(20): 122-126.

[24] 陳子健, 孫禎祥. 從信息無障礙角度探討教學網站導航設計[J]. 中國醫學教育技術,

2008(4): 311-314.

[25] 陳子健, 孫禎祥. 信息無障礙視角下網站的導航設計[J]. 圖書情報工作, 2008(9):6-8.

[26] Cockburn A. Which way now? Analyzing and easing inadequacies in WWW navigation[J].

Human Computer Studies, 1996(45): 105-129.

[27] Stinger N., Pecatte JM., Trouilhet S.. The multi-agent cooperative navigation system Mawa; a

model of dynamic knowledge specialization for a user-centric analyze of the Web[C].

International Conference on Computational Intelligence for Modeling, Control & Automation

Jointly with International Conference on Intelligence Agents, Web Technologies & Internet

Commerce.Vienna,AUSTRIA. NOV28-30, 2005: 289-294.

[28] Garg S, GoswamiA, Huylebroeck M. MediaCaddy - Semantic web based on-demand content

navigation system for entertainment[C]. 4th International Semantic Web Conference(ISWC2005).

Galway,IRELAND. NOV06-10, 2005: 858-871.

[29] 盧增祥. 網絡信息導航系統[D]. 清華大學,1996.

[30] 佚名. CEI 信息導航的回顧與展望[J]. 信息經濟與技術. 1997(12): 46-48.

[31] 於晏. Internet 信息導航系統設計與實現[D]. 哈爾濱理工大學, 1997.

[32] 朱江嶺, 趙淑君等. 因特網信息導航系統的建立與資源共享[J]. 電子出版, 2001(4):

32-34.

[33] 張錦, 傅辛等. 可視化 Internet 信息導航系統[J]. 計算機工程,2001(1): 99-101.

[34] 畢強, 劉甲學. QUIC——一個智能超文本導航系統[J]. 情報科學, 2002(12):

1277-1281.

[35] 蔡建峰, 劉祎玎, 武立新. 基於信息定制的信息導航系統研究:以管理案例教學為例[J].

情報雜志, 2008(11):54-58.

[36] 王有為, 許博等. 基於用戶訪問序列聚類的網站導航系統[J]. 系統工程理論與實踐,

2010(7): 1305-1311.

[37] 余小鵬, 彭鴻儒. 基於信息構建的電子商務網站導航系統研究[J]. 時代經貿, 2011(5):

50-51.

[38] 王有為, 張雯晶, 凌鴻. 基於序列模式的網站導航系統[J]. 系統管理學報, 2012(5):

690-695.

[39] 康忠民. 網絡學術信息導航系統綜合評價指標體系的研究及應用[D]. 華中科技大學,

2005.

[40] 劉甲學. 超媒體信息空間智能導航理論與實証研究[D]. 吉林大學,2006.

[41] Mohagag M.F., Graphics S.. The influence of hypertext linking structures on three efficiency

of information retrieval[J]. Human Factors, 1992(3): 351-367.

[42] Kitajima, M., Blackmon, M.H., Polson, P.G. A comprehension based model of web

navigation and its application to web usability analysis[A]. People and Computers XIV[C].

London:Springer,2000: 357-373.

[43] Oostendorp H. Van, Ion Juvina. Using a cognitive model to generate web navigation

support[J].International Journal of Human-Computer Studies, 2007:887-897.

[44] Oostendorp H. Van., Karanam S., Indurkhya B.. CoLiDeS+Pic: a cognitive model of web

navigation based on semantic information from pictures[J]. Behavior and Information Technology,

2012(31): 17-30.

[45] Peter Pirolli, Wai-Tat Fu. SNIF-ACT: a model of information foraging on the World Wide

Web[A].User Modeling 2003[C]. Heidelberg: Springer Berlin, 2003: 45-54.

[46] Craig S. Miller, Roger W. Remington. Modeling Information Navigation: Implications for

InformationArchitecture[J]. Human-Computer Interaction,2004(3): 225-271.

[47] Eduardo Marques, Ana Cristina Garcia, Inhaúma Ferraz. RED: A Model To Analyze Web

NavigationPatterns[EB/OL].http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.88.5075&rep=rep1&type=pdf.2014-12-25.

[48] Vera Hollink, Maarten van Someren, Bob J. Wielinga. Navigation behavior models for link

structure optimization[J]. User Modeling and User-Adapted Interaction,2007(4): 339-377.

D.用戶心智模型相關研究

心智模型的形成建立在人的有限理性[42]的理論基礎上,有限理性影響著個人認知,這種有限理性主要表現在個人知識的局限性、不能完全做出准確的預期以及行為受到限制,有限理性的存在使得個人在決策時需要依賴心理過程,這個過程就是心智模型,是解釋環境的內部表征,是由人的認知系統為應對環境的不確定而創立[43]。心智模型與用戶認知密切相關,心智模型關注的是用戶心理認知層面的內容。 心智模型,又稱為心智模式、思維模型或心理模型等,由認知心理學學者K.Craik(1943)首次提出,並認為它真實存在於人們心中,能夠對人們描述、解釋世界產生影響,對人們如何採取行動的陳見、假設和印象產生影響[44]。心智模型是用戶對現有存在的思維方式與看法,受既有經驗的影響,具有相對持續的穩定性[45]。后來,心智模型的研究逐漸從認知心理學領域擴展到情報學、計算機科學、經濟學、管理學。

目前尚沒有關於心智模型的統一的定義。Johnson Laird將心智模型定義為:對世界的一種表征,人類系推理則是基於這種表征[46]。L.Wozny(1992)認為心智模型包含陳述性知識和過程性知識,這些知識都是依據歸類與關聯組織而形成的[47]。Rouse 和 Morris 認為心智模型是一種心理機制,通過這種心理機制,人們可以對系統的目標和形式進行描述、對系統的功能進行解釋、對系統的狀態和未來進行觀察和預測[48],該定義揭示了心智模型的功用。白晨、甘立人等[49]認為心智模型是個體理解和看待周圍事物的思維模型,將信息用戶的心智模型定義為用戶在個人知識基礎上,經由檢索經驗和檢索過程學習而在腦海中形成的關於檢索策略的信念,用以指導未來的行為決策。

在信息檢索領域,Borgman是最早研究用戶心智模型的學者,採用實驗的方法,以圖書館在線電子分類目錄用戶為實驗對象,將用戶分成兩組,並分別給予不同的培訓,從而探索用戶的心智模型[50]。此后,國內外學者們針對個研究對象從多個角度對用戶的心智模型進行研究,其中研究對象主要有搜索引擎、數字圖書館、信息門戶網站、文獻數據庫、電子商務與電子政務網站等,而在具體的研究內容上,主要集中在用戶心智模型的影響因素、構成維度及測量、心智模型分類和動態變化等方面。(1)信息用戶心智模型的影響因素。黃慕萱通過實驗的方法發現學院、檢索經驗、年級、對主題的熟悉程度、檢索目的等均不會對心智模型產生影響[51]。Zhang Xiangmin 採用多因素方差分析法,得出教育和職業狀況、學術背景、計算機水平對文獻數據庫用心智模型有顯著影響[52]。Li Ping 以博士生為研究對象,得出在用戶使用網絡搜索引擎時,僅僅認知風格因素與用戶心智模型的完備性有關,即場獨立型風格用戶的心智模型的完備性比場依存型風格的用戶更高[53]。Zhang Yan 研究了外在情境因素對信息豐富網絡空間(information rich web space)用戶心智模型的影響,發現任務的復雜性間接影響用戶的心智模型[54]。(2)心智模型構成維度及其測量研究。Borgman.C 和 Dimitroff A.通過開發用戶心智模型完備性量表,得出用戶心智模型由數據庫構成和特征兩個維度構成[50][55]。1997年,Saxon改編了Bimitroff的心智模型完善度量表,同時對用戶心智模型完備性量表的構成維度進行了修正,將用戶心智模型的構成維度由兩個擴展為數據庫結構、搜索特征和交互層次三個維度[56]。Li Ping 以博士生為調查對象,測量出博士對於 Google 的心智模型有三個維度,分別是Google 的本質特性、搜索特征和交互層次[53]。Zhang Xiangmin 利用凱利方格技術研究出用戶關於文獻數據庫的構成維度由九個方面,分別是查詢的目的、功能和適用性,數據組織的適用性,瀏覽的目的和適用性,數據結構的功能和適用性,文獻的功能[52],並基於這些維度研究了教育、母語、專業地位、學科、計算機經驗等用戶特征對心智模型的影響。Zhang Yan利用概念列表法和半結構化訪談法抽取了醫學健康網站的用戶心智模型,並認為該網站的用戶心智模型是由系統、系統內容、信息組織和界面構成[57]。 在用戶使用網站心智模型的測量方法上,李海濤、宋琳琳等[58]對用戶使用網站的心智模型測量的方法進行了介紹,並提出卡片分類法是最適於記錄用戶關於網站的認知信息,而路徑搜索法最適於測量網站用戶心智模型。 甘立人、白晨等將心智模型引入到信息用戶決策行為的研究過程中,認為信息檢索中,用戶認知偏差主要有信息偏差、感知偏差、“錨”定、習慣和保守,這都與心智模型相關,分析了用戶心智模型構成以及對決策行為的作用機制,採用實驗的方法考察了心智模型對決策行為的影響效果[59],同時提出信息用戶的心智模型是由個人知識和信念構成的[49]。 胡昌平、馬丹對信息用戶的心理過程、心智模型、心智模型表征、心智模型功能等進行了分析,並闡述了基於 ZMET(隱喻抽取技術)的心智模型構建流程,以視覺隱喻和圖片想象為基礎,結合方法-目的鏈理論,對信息用戶的心智模型的構建進行了研究[43]。 韓正彪[60][61]以綜合性文獻數據庫為研究實體,以大學生為調查對象,探索用戶心智模型,他首先通過概念列表法得出用戶心智模型由系統、系統內容、系統內容組織、系統界面和系統后台五個維度組成,后有通過實証研究得出用戶心智模型由認知、情感、策略三個層面和數據庫內容認知、常識認知、檢索策略、用戶負面情感、用戶范圍評價、界面功能認知、用戶動機認知等八個維度構成,並分析了這些維度對用戶心智模型影響效應的大小,發現對用戶心智模型直接效應最大的是界面功能認知和用戶負面情感。尤少偉,吳鵬等[62]以南京市政府網站旅游概念主題分類目錄為例進行了實驗研究,研究採用基於路徑搜索法定量測量用戶的心智模型,並對提出的假設進行了驗証。夏子然等[63]以中國制造網為例,使用心智模型完善度量表實驗設計,收集用戶在網絡信息檢索過程中的心智完善水平數據並進行聚類分析,對用戶進行探索性分類,並提出心智模型是一個相對持久的動力系統,這主要體現在兩個部分,第一是與檢索相關的個體知識背景,第二是對檢索方法的信念體系。因此,造成心智模型個體差異的兩個原因就是個人因素和個性因素,其中個體的教育背景、個人經歷、工作環境等都是個人因素,而個體的性格特征屬於個性因素。(3)用戶心智模型對檢索績效的影響。心智模型是用戶信息行為產生的內在機制,通過研究用戶心智模型對檢索績效的影響,可以更好地實現對心智模型的應用。學者們普遍認為,用戶心智模型對用戶檢索績效會產生影響,也即心智模型越完善,則用戶的檢索績效越高[55][64]。其中,韓正彪對 61 名大學生進行試驗,得出網齡和認知風格是造成用戶心智模型不同的重要因素,但是性別、學科、年級、使用頻率、學習風格等在用戶心智模型整體上沒有差異,只是在一些維度上會產生差異,同時他還發現用戶心智模型在用戶特征與用戶檢索績效之間存在中介效應,其中網齡起著完全中介效應,用戶認知風格起著部分中介效應[65]。

[42] 赫伯特·西蒙.管理行為[M].北京:機械工業出版社,2007.

[43] 胡昌平,馬丹.基於 ZMET 的用戶心智模型構建[J].情報科學,2011(1):1-5.

[44] Craik K. The Nature of explanation[M]. Cambridge: Cambridge University

Press,1943.

[45] 宋琳琳,李海濤.近二十年來網絡用戶心智模型研究綜述[J].大學圖書情報學刊,

2016(2):100-112.

[46] Johnson-Laird P N. How we reason[J]. How We Reason, 2009.

[47] Wozny L A. Navigation in a metaphorical computer interface: A study of

analogical reasoning and mental models﹝D﹞. Philadelphia: Drexel University,1992.

[48] Rouse W B, Morris N M. On Looking into the Black Box: Prospects and Limits

in the Search for Mental Models[J]. Psychological Bulletin, 1985, 100(3):82.

[49] 白晨,甘利人,朱憲辰.基於信息用戶決策心智模型的實驗研究[J].情報理論與實踐,

2009, 32(10):94-98.

[50] Borgman C L. The user's mental model of an information retrieval system:

effects on performance[D].USA: Stanford University,1984.

[51] 黃慕萱.影響個人心智模型之因素初探[J].(台灣)圖書館資訊學,2000,12(15):19-36.

[52] Zhang Xiangmin. A Study of the Effects of User Characters on Mental Models of Information Retrieval System [D]. Toronto : University of Toronto .1998.

[53] Li Ping. Doctor Students’ Mental Models of a Web Search Engine: An

Exploratory Study [D]. Montreal: McGill University,2007.

[54] Zhang Y. The impact of task complexity on people’s mental models of

MedlinePlus[J]. Information Processing & Management, 2012, 48(1):107-119.

[55] Dimitroff A. Mental models and error behavior in an interactive bibliographic

retrieval system ﹝D﹞.Alexanda: The University of Michigan,1990.

[56] SAXON. Seventh grade students and electronic information retrieval systems: an exploratory study of mental model formation, completeness and change﹝D﹞.Scharlotte: The University of North Carolina,1997.

[57] Zhang Y. Dimensions and elements of people's mental models of an information-rich Web space[J]. Journal of the American Society for Information Science & Technology, 2010, 61(11):2206-2218.

[58] 李海濤,宋琳琳.用戶使用網站的心智模型測量方法的選擇及應用[J].情報理論與實踐,

2015, 02:11-16.

[59] 甘利人,白晨,朱憲辰.信息用戶檢索決策中的心智模型分析[J].情報學報,2010,

29:641-651.

[60] 韓正彪.基於訪談法的綜合性文獻數據庫用戶心智模型研究[J].圖書情報知識,2014,

(1):90-96. [61] 韓正彪,許海雲.我國綜合性文獻數據庫大學生用戶心智模型結構測量實証研究[J].情報學報,2014,33(7):740-751.

[62] 尤少偉,吳鵬,湯麗娟,等.基於路徑搜索法的政府網站分類目錄用戶心智模型研究——以南京市政府網站為例[J].圖書情報工作,2012,(9):129-135.

[63] 夏子然,吳鵬.基於心智模型完善度的信息檢索用戶心智模型分類研究[J].情報理論與實踐,2013,10:58-62.

[64] Chen H, Dhar V. User misconceptions of information retrieval systems[J]. Clinical Neurophysiology,2013,124(10):127–128.

[65] 韓正彪.綜合性文獻數據庫大學生用戶心智模型影響因素及效用分析:以 CNKI 為例[J].

圖書情報工作, 2014,58:81-91.

2.學術會議

(1)2015年11月25日-27日課題組成員參加由HACETTEPE UNIVERSITY信息管理學院、中山大學資訊管理學院在中國廣州共同舉辦的“第六屆變化世界中的信息管理國際學術研討會”(IMCW2015)。作為大會主要發言人以“ Content and Motivations for Citing Online Encyclopedia Resources among LIS Academic Publications”為題和以“Exploiting Task-functional Units Relationship in Support of Fine-grained Aggregated Search”進行報告與交流。

(2)2014年11月24日-26日課題組成員參加由HACETTEPE UNIVERSITY信息管理學院在土耳其共同舉辦的“第五屆變化世界中的信息管理國際研討會”(IMCW2014)。作為大會主要發言人以“Research on the Measurement Method of the Event Theme Influence of Online Public Opinion”為題進行報告與交流。

(3)2015年11月30日-12月2日課題組成員參加由東北師范大學在中國長春舉辦的第七屆信息資本、資產和信息倫理國際研討會。作為大會主要發言人以“聚合的概念與信息聚合模式研究The Research on the Concept of Aggregation and Aggregation Model”為題進行報告與交流。

(4)2014年12月課題組成員參加由北京大學信息管理學系在中國北京舉辦的第六屆信息資本、資產和信息倫理國際研討會。

(5)2015年10月25日-27日課題組成員參加由武漢大學、全球頂尖信息學院聯盟iSchool、美國圖書情報學教育聯合會在中國武漢舉辦的第四屆中美數字時代圖書館學情報學教育國際研討會。作為大會主要發言人以“論大數據時代下的圖書情報學教育——基於iSchool院校“大數據”相關課程的調查及思考On LIS Education In the Era of Big Data-Based on the Investigation of “Big Data” related Courses in LIS School”為題進行報告與交流。

3.學術交流

課題組專家所帶博士生分別參加吉林大學舉辦的2014年全國情報學博士生學術論壇、南開大學舉辦的2016年全國情報學博士生學術論壇,並在論壇上匯報宣讀論文成果。

③成果宣傳推介情況(成果發布會、《工作簡報》報送情況、國家社科基金專刊投稿及採用情況等)﹔

④研究中存在的主要問題、改進措施,研究心得、意見建議﹔

研究中存在的主要問題:課題研究進度上,尤其是系統開發進度比預期計劃要稍微落后、成果數量尤其是國際性頂尖刊物論文仍然不夠多、學術交流較多但是未建立密切、穩定的國際合作關系。

改進措施:面對課題研究中暴露出的問題,課題組成員以后將在課題研究中積極探索,突破難點,推進課題研究進度,加大課題演技逇深度,針對具體問題進行具體分析,計劃改進的措施包括:按照用戶需求分析和模塊設計得到的原型系統,組織人員加快系統開發的進度﹔針對課題中遇到的理論和實踐問題,多渠道收集資料,提高理論水平和實際問題解決能力,盡量面向國際頂級期刊發表課題研究成果﹔逐步與國際組織和機構建立穩定、密切的合作關系。

研究心得:經過將近三年半的課題研究,經過不斷的深入調查研究,多次的交流探討,課題研究思路愈發清晰,並在實踐中不斷地修正和改進得以順利推進課題研究進展。第一,我們認識到課題研究中的團隊合作與交流十分重要。每周一次或每兩周一次的例會以及主持人在例會上的點評與下一步研究計劃的安排,使得我們能明確自己各自的分工,相互配合與交流,使整個課題朝著一個正確的方向順利推進和開展。第二,通過文獻閱讀追蹤最新學術動態,保持理論始終與實踐相結合。實踐問題的解決需要理論作為支撐,理論學習中文獻閱讀是必不可少的一項工作,通過選擇和閱讀頂級期刊文獻,發現研究的新視角或切入點,建立牢固的理論基礎,以支撐實踐研究過程。第三,做好科研數據的共享與管理。為課題研究過程中產生的各種科研數據、成果、例會報告等資料建立共享資源池,一是可以最大化科研數據的重復利用,同時也可以避免開展重復工作,達到成員之間的資源共享。

二、研究成果情況

①代表性成果介紹

A.論文《知識圖譜研究的脈絡、流派與趨勢——基於SSCI與CSSCI期刊論文的計量與可視化》﹔

基本內容和主要觀點:知識圖譜作為快速興起和發展的跨學科研究領域,在國內外不同學科間的發展軌跡、研究重點等方面總體上存在差異。適時梳理國內外該領域發展歷史上的重要理論和技術發展軌跡,明晰核心人物和團隊,可為當前和今后基於知識圖譜的可視化研究提供理論基礎。文章選取1998—2014 年間SSCI、CSSCI 中以知識圖譜為主題的期刊論文,以SATI、UCINET、NetDraw、CiteSpace 等為數據分析和可視化工具,通過時間分布揭示該領域發展的階段特征,通過節點性論文計算和高頻關鍵詞共現分析揭示該領域發展的內容分布,從而厘清其發展脈絡; 從學科分布、核心期刊和邊緣期刊的判別揭示該領域發展的跨學科概貌,通過核心作者綜合指數計算、合作分析和機構分析揭示該領域研究的人物關系,厘清其發展流派。在此基礎上提出知識圖譜研究的弱化與主題的衍生、知識圖譜的跨學科研究與應用和知識創造者的合作創新三個發展趨勢。

學術價值:該論文發表在圖書情報界影響因子最高的《中國圖書館學報》,並被人民大學《復印報刊資料》全文轉載。

B.論文《基於中文維基百科的領域概念相關性研究》

基本內容和主要觀點:以提高領域概念相關性判斷的准確度為研究宗旨,提出綜合利用中文維基百科的分類體系結構和概念釋義內容進行概念間語義相關度計算的方法。選取中文維基百科分類體系下的圖書情報領域的概念為實驗對象,將基於分類信息和文本信息的加權算法與單獨基於分類信息的語義距離算法和信息量算法,以及基於文本信息的文本重疊算法進行對比分析。實驗結果表明: 加權算法能取得更好的效果,可為實現面向領域的信息檢索、領域本體構建等應用提供重要技術支持。

學術價值:該論文發表至今被引用1次。

C.論文《面向新型智庫建設的知識服務:圖書情報機構的新機遇》

基本內容和主要觀點:新型智庫建設是我國深化改革時期進行科學決策的重要一環,新型智庫的基礎資源是知識資源。圖書情報機構作為存儲和傳播知識的媒介,在新型智庫建設中迎來了新的機遇,文章分析了圖書情報機構服務新型智庫的可行性並提出了為其服務的五種基本途徑。

學術價值:該論文發表至今被引用2次。

D.論文《我國圖書情報領域研究者對網絡信息資源的利用分析》

基本內容和主要觀點:採用引文分析的方法,基於網絡信息資源聚合研究的展開要求,對特定領域研究者網絡信息資源的利用情況和需求進行探討。首先,提出探究研究者網絡信息資源利用的網絡引文分析框架,框架從資源整體利用情況和以單篇論文為單位的個體利用情況兩個方面分析圖書情報領域研究者對網絡信息資源的利用情況。接著,參照框架對2010-2012年發表的圖書情報領域會議論文、期刊論文、博/碩士學位論文分開進行計量分析,揭示其中主題分布、域名分布、類型分布、URL深度分布、研究者利用數量、利用類型、利用目的等的特征,總結圖書情報領域網絡信息資源利用的需求,得到對圖書情報領域網絡信息資源聚合研究的相關啟示。

學術價值:發表在《情報學報》,並被人民大學《復印報刊資料》全文轉載。

E.論文:《Efficient feature selection based on correlation measure between continuous and discrete features》

基本內容和主要觀點:The aggregated search, that assembles different types of content and granularities of retrieval in one interface, is regarded to be a new direction in web information retrieval . For the aggregation of multi genre type of web content can improve the recall rate while granularities of retrieval can improve the accuracy rate at the same time. However, there is no nified standard to classify the aggregated units for various genre types on the web today. How to organize various genre types of information in fine-grained level is still a question. With the purpose to organize different genres of web resources as aggregated units with thematic and functional relations, this study explores how to build a taxonomy of aggregated units for 3 kinds of web resources in discipline of Library and Information Sciences and how to apply it in information organization and visualization. This study can give reference to academic search engine or database design for multi genre information use in a fine-grained level.

學術價值:發表在SSCI期刊Information Processing Letters

F.論文:《A clustering-based feature selection via feature separability》

基本內容和主要觀點:With the extensive increase of the amount of data, such as text categorization, genomic microarray data, bioinformatics and digital images, there are more and more challenges in feature selection. Recently, feature selection has been widely studied in supervised learning, but there is significantly less work in unsupervised learning because of the absence of class information and explicit search criteria. In this work, we introduce a new measure to assess the importance of features in terms of feature separability. A clustering-based feature selection algorithm is then introduced to conduct the feature selection. The proposed algorithm with nearly linear time complexity selects final feature subset through a ranking procedure based on the separabilities of features and it is applicable to datasets of mixed nature. Experimental results on UCI datasets show that our method, by retaining relevant features, can obtain similar or even better results of classification and clustering for most datasets, and it outperforms other traditional supervised and unsupervised feature selection methods in terms of dimensionality reduction and classification accuracy.

學術價值:發表在SSCI期刊 Intelligent & Fuzzy Systems

課題組供稿 

(責編:沈王一)