舊版網站入口

站內搜索

張永偉:智能時代的學習辭書功能探析

張永偉2018年01月23日08:46來源:中國社會科學網

原標題:智能時代的學習辭書功能探析

在發展人工智能技術已納入國家戰略的時代,我們應該抓住機遇、迎接挑戰,積極促進人工智能技術和學習辭書的深度結合,研發新型智能型學習辭書。

國務院於2017年7月20日發布了《新一代人工智能發展規劃》,強調建設安全便捷的智能社會,發展便捷高效的智能服務。智能教育是重要的智能服務之一。人工智能技術已經同許多領域相結合,產生了革命性的智能產品和服務,改變著人類的生產與生活。但是,目前人工智能技術與用於學習的辭書的結合有待進一步加強。隨著人工智能技術的大力推進,學習辭書的智能化是必然趨勢。學習辭書應該具有什麼樣的展示形式、交互方式和使用方式?學習辭書如何借助人工智能技術提供更加個性化、精准、便捷的使用功能?傳統的學習辭書如何進化為智能學習辭書,以升級學習、教育、科研服務?本文試圖對這些問題進行初步探討。

“三多”的辭書形式

“三多”是多媒體、多模態和多環境的簡稱,智能學習辭書應該具有多媒體、多模態、多環境的形式。

智能學習辭書除使用文字外,也可以使用圖形、圖像、動畫、音頻、視頻等多種媒體形式展示詞語信息。與使用純文字描述相比,通過動畫來展示漢字的筆畫筆順則更為直觀,通過音頻展示諸如“隆隆”等擬聲詞則更為形象,通過視頻展示諸如“秧歌”等描繪場景和活動等的詞則更為生動。

智能學習辭書與使用者之間應該有多種交互方式,即多模態的交互方式。使用者既可以使用鍵盤錄入詞語,使用鼠標選擇文稿中的詞語,也可以通過語音講出詞語、通過鏡頭捕捉詞語。智能學習辭書可以借助語音識別、文字識別等人工智能技術擴展使用者查詢詞語的方式。

智能學習辭書應該提供多種使用環境。使用者使用智能學習辭書不再受時空的限制,可以隨時隨地通過多種設備訪問。比如,使用者可以在教室通過平板電腦使用,可以在公交車上通過手機使用,也可以在家裡通過智能音響使用。

詞語查詢的個性化

傳統的紙質辭書在立項編纂之前需要事先明確使用人群,然后依據使用人群的特點設計辭書的收詞量、編纂體例以及編纂細則。紙質辭書由於版面的限制,在體例和內容上隻能有所取舍,隻能滿足特定使用人群的需要。紙質辭書電子化、網絡化以后,有的體例、內容維持不變,有的則融合了更多的體例、內容。后者往往羅列過多的體例、內容,卻不加取舍,需要使用者自己從中選取需要的內容,反而增加了使用者的負擔。

智能學習辭書應該體例全面、內容豐富,可以根據使用者的不同情況定制或智能選擇合適的體例、恰當的內容。也就是說,智能學習辭書可以提供個性化的詞語查詢功能。

為了提供個性化的詞語查詢,智能學習辭書應該建立用戶系統。使用者可以填寫自己的國籍、地區、省份等地域信息,以及自己的母語、專業、學習年級、漢語水平、正在使用的漢語教材等語言學習背景信息。基於這些信息,使用者查詢一個詞語時,智能學習辭書可以為不同身份背景的使用者提供不同的詞語解釋。比如,對於成語典故,智能學習系統可以自動為小學生提供通俗易懂的故事解說,為語言學專業的大學生提供源流演變的歷史信息,為留學生提供針對應用場景相對細致的使用講解。

智能學習辭書建立用戶系統后,可以記錄使用者的使用日志。利用大數據技術對日志進行分析,可以挖掘更多使用者的使用偏好,這些隱藏在后台的信息也可以用於提供個性化的詞語查詢。

 

詞語查詢的精准化、便捷化

智能辭書的查詢結果應該便於使用者閱讀,將使用者最期望的結果優先展示,即讓使用者最先看到的恰好是他最期望看到的內容。

以多義詞的查詢為例。多義詞有多個義項,在紙質辭書中查詢多義詞含義,需要先查找詞語所在的頁碼和頁內位置,瀏覽詞語所有義項,最后找出恰當的義項。電子辭書、網絡辭書不再需要定位詞語所在頁碼和頁內位置,隻需輸入或選擇待查詞語即可,節省了查找詞語的時間,簡化了詞語查詢的過程。使用者為找出所需的釋義,依然需要瀏覽詞語的所有義項。由於現有辭書的義項排列均是固定不變的,所以使用者隻有閱讀完所有義項才能找到最恰當的一個。智能學習辭書可以支持詞語義項的動態排序,將使用者最期望的義項排列在前。詞語義項的動態排序看似天方夜譚,但其實利用人工智能技術完全可以實現。查詢傳統辭書時,詞語義項採用固定的順序,而智能學習辭書還可以獲取該詞語的上下文信息。智能學習辭書在查詢句子中某詞的含義時,可以通過語言信息分析處理技術得知它的詞性,使詞性符合的義項先於其他義項得到優先顯示。

除詞性外,智能學習辭書還可以獲取有關詞語使用環境的信息和其他有用信息,比如詞語所在的語句、所屬篇章的類別、使用者所處的時空環境等。人工智能技術可以利用這些信息進行運算分析,借助詞義排歧(又稱歧義消解)技術,更加准確地判斷詞語含義,按照義項概率的大小對詞語義項進行動態排序。此時,詞語的多個義項順序不再固定。理想情況下,使用者每次查詢時排在前列的義項恰好是使用者本次查詢最期望的結果。

辭書功能的服務化

現有辭書隻能提供詞語查詢功能。使用者查詢詞語,是為了學習詞語的釋義和用法。使用者是否已經掌握詞語的用法?是否需要進一步鞏固學習?不同的學習者或者學習群體間掌握詞語的情況有何差異?使用者經常查詢的詞語是否已經收錄?詞語的釋義是否還可以繼續改進?傳統辭書由於編纂、出版、教學、研究往往相對獨立,無法系統地解決這些問題。智能學習辭書可以關聯所有上述環節,將辭書從單純的查檢工具書升級為詞語學習、教學、科研服務平台。為了解決上述問題,智能學習辭書至少需要提供以下服務或支持。

提供詞語智能學習服務。智能學習辭書顯示詞語查詢結果時,應該提供更豐富的學習手段、學習場景,為使用者推薦關聯詞語,讓使用者可以舉一反三。與此同時,智能學習辭書還應該做好使用記錄,分析使用者掌握詞語的情況﹔借鑒艾賓浩斯記憶遺忘曲線等記憶學成果以及先進的學習方法,為不同的使用者量身定制科學的學習計劃。最后,智能學習辭書可以提供個人詞語學習報表,讓使用者實時掌握自己的詞語學習情況和需要進一步改進的地方。

提供詞語智能教學支持。許多學習辭書的使用者來自學校或培訓機構。所以智能學習辭書除了需要建立用戶系統外,還需要建立靈活的群組系統,比如班級、年級、學校以及學習小組等。單個使用者可以不屬於任何群組,也可以同時屬於某幾個群組。智能學習辭書一方面可以提供群組間詞語教學資源和教學經驗交流,另一方面也可以提供不同使用者、不同群組的詞語習得對比情況。這些信息可以為辭書編纂人員提供編纂依據,為教學提供參考,也可以為教育管理者提供量化數據。

提供詞語智能測試服務。許多漢語學習辭書的使用者要參加各種類型的考試。智能學習辭書應該了解不同類型考試對詞語掌握的要求,分析不同考試類型的常考知識點和拓扑學習序列。根據使用者設定的不同考試類型,智能辭書系統可以提供針對性的練習和測驗。漢語教師也可以借助智能學習辭書完成測試安排、智能批改等工作。

提供詞語研究大數據支持。傳統紙質辭書無法記錄使用者的查詢記錄、學習記錄以及測試記錄,因此很難為詞語研究提供直接的支持。此外,傳統紙質辭書由於出版周期的限制,詞語的最新研究成果以及新詞熱詞等,都無法及時地在辭書中得到反映。基於使用者產生的大數據,智能學習辭書可以為詞語研究人員開辟更多的研究方向。研究人員的最新研究成果也可以被及時地試用、吸收,最終降低試錯成本,加快科研成果轉化,穩定提高辭書質量。

不可否認,人工智能技術依然存在許多局限,智能學習辭書不能僅僅依靠人工智能技術專家實現,它還需要人工智能技術專家與語言學家、辭書編纂專家以及一線教師的密切合作。在發展人工智能技術已納入國家戰略的時代,我們應該抓住機遇、迎接挑戰,積極促進人工智能技術和學習辭書的深度結合,研發新型智能型學習辭書。

 (作者單位:中國社會科學院語言研究所、中國社會科學院辭書編纂研究中心)

(責編:王瑤)