隨后進行數(shù)據(jù)清洗,剔除無效、錯誤或無關(guān)數(shù)據(jù),保證數(shù)據(jù)質(zhì)量。例如,異常的用戶行為記錄、重復(fù)的條目或格式錯誤的數(shù)據(jù)都需要清理。清洗后的數(shù)據(jù)需要轉(zhuǎn)換為適合分析的格式或結(jié)構(gòu),如分類數(shù)據(jù)編碼、連續(xù)變量規(guī)范化等。這是確保數(shù)據(jù)被分析工具正確理解和處理的關(guān)鍵。在數(shù)據(jù)分析階段,通過應(yīng)用統(tǒng)計分析、機器學(xué)習(xí)算法等,從數(shù)據(jù)中挖掘用戶的興趣和行為模式。例如,通過分析用戶的搜索和下載歷史,預(yù)測其可能感興趣的新書或主題,進而實現(xiàn)真正的個性化推薦。上海半坡是專門為圖書館提供文獻知識服務(wù)的公司。四川智慧導(dǎo)讀聯(lián)系方式
個性化閱讀推薦系統(tǒng)的設(shè)計始于高效且精確的數(shù)據(jù)采集、處理與分析。在智慧圖書館中,用戶每天進行搜索、閱讀和下載等互動行為均會產(chǎn)生大量數(shù)據(jù)。以大型智慧圖書館為例,其每月會新增數(shù)千份電子書和期刊,且數(shù)百萬用戶的日常活動會生成海量數(shù)據(jù)記錄,包括搜索查詢、點擊和下載等行為數(shù)據(jù)。這些數(shù)據(jù)是設(shè)計個性化閱讀推薦系統(tǒng)的基礎(chǔ),需要收集和處理,以便后續(xù)進行分析和應(yīng)用。數(shù)據(jù)采集必須***覆蓋用戶數(shù)據(jù),包括用戶的注冊信息、借閱記錄、閱讀習(xí)慣,以及用戶與智慧圖書館資源的交互方式等。依托上述數(shù)據(jù),個性化閱讀推薦系統(tǒng)可掌握用戶的基本興趣和偏好,鑒別用戶潛在的興趣領(lǐng)域和行為模式,從而為推薦給予數(shù)據(jù)方面的支持。四川智慧導(dǎo)讀質(zhì)量各高校圖 書館應(yīng)加強未來學(xué)習(xí)中心試點建設(shè),打造高標(biāo)準(zhǔn)智慧 化的學(xué)習(xí)新體系。
智慧閱讀雖被預(yù)設(shè)為數(shù)字閱讀的高級形態(tài),但其實現(xiàn)面臨多重挑戰(zhàn)。比如:數(shù)字媒介文本具有鏈接、分叉選擇、非順序等特性,讀者閱讀時需要采用與印刷時代迥然不同的閱讀方式,因此,略讀、跳讀、信息檢索式、瞬時性反饋閱讀成為當(dāng)下閱讀的主流;認(rèn)知神經(jīng)科學(xué)研究發(fā)現(xiàn),跳讀導(dǎo)致前額葉皮層***減弱、長時記憶編碼效率降低,人類元認(rèn)知能力面臨衰退的風(fēng)險[10];數(shù)字時代的電子閱讀進一步剝奪作者對文本意義闡釋的權(quán)利,文本的網(wǎng)狀結(jié)構(gòu)使得“它有上千個進出口,讀者可以從這些通道進進出出,作出自己的理解和解釋”[11],這使得讀者的主體性被算法邏輯主導(dǎo),超鏈接架構(gòu)帶來的游牧式閱讀使得人類的認(rèn)知面臨無根的困境。
隨著互聯(lián)網(wǎng)的發(fā)展,內(nèi)容生成方式經(jīng)歷了專業(yè)內(nèi)容生成、用戶生成內(nèi)容、生成式人工智能三個階段。專業(yè)內(nèi)容生成指內(nèi)容創(chuàng)作的主體是平臺,平臺雇用的保障內(nèi)容的專業(yè)性,平臺借助專業(yè)性的原創(chuàng)內(nèi)容得到收益,例如,騰訊、優(yōu)酷、得到等都屬于專業(yè)內(nèi)容生成。圖書館資源與專業(yè)內(nèi)容生成結(jié)合,達成了圖書館從數(shù)據(jù)商購買數(shù)字資源數(shù)據(jù)庫。用戶生成內(nèi)容指用戶成為內(nèi)容創(chuàng)作的主體,用戶從內(nèi)容的消費者變?yōu)閮?nèi)容的創(chuàng)作者,例如,微博等分享見聞的圖文平臺,抖音、快手等分享生活的短視頻平臺,豆瓣、知乎等書籍、電影作品的探討交流平臺。圖書館資源與用戶生成內(nèi)容結(jié)合,構(gòu)成以O(shè)PAC書目下的書評、用戶為自己標(biāo)注的Tag用戶白建生成內(nèi)容。隨著ChatGPT的出現(xiàn),生成式人工智能AIGC成功落地,AI成為新的內(nèi)容創(chuàng)作主體,將圖書館資源與生成式人工智能AIGC結(jié)合,可利用Transformer開源模型對圖書館現(xiàn)有文獻進行訓(xùn)練。智慧導(dǎo)讀可以幫助讀者更快速、更深入地理解文章。
個性化閱讀推薦系統(tǒng)設(shè)計的關(guān)鍵為內(nèi)容資源管理與標(biāo)簽化。智慧圖書館需把內(nèi)容資源進行數(shù)字化管理,并給每本書籍、期刊、文章等都貼上標(biāo)簽,這些標(biāo)簽包括書籍的主題、作者、出版時間、閱讀難易程度等,從而對資源進行有效的分類及標(biāo)簽化處理。當(dāng)用戶請求推薦時,個性化閱讀推薦系統(tǒng)可迅速篩選出契合其需求的書籍或資源。同時,智慧圖書館還能按照讀者的反饋以及借閱頻率來調(diào)整資源標(biāo)簽,使推薦精細(xì)水平提升。在設(shè)計智慧圖書館的個性化閱讀推薦系統(tǒng)時,推薦算法的選擇是關(guān)鍵。統(tǒng)計顯示,個性化閱讀推薦系統(tǒng)可以將用戶滿意度提高至少25%,同時增加用戶訪問圖書館資源的頻率。因此,選擇合適的推薦算法對提升圖書館的服務(wù)質(zhì)量和效率具有***影響。選擇推薦算法時需要考慮多種因素,包括用戶行為數(shù)據(jù)的類型和規(guī)模、系統(tǒng)的性能要求以及不同類型資源的特性。智慧圖書館通常處理大量的用戶行為數(shù)據(jù),從數(shù)百萬到數(shù)十億不等,每天生成數(shù)百萬事件,這要求推薦系統(tǒng)具備強大的計算能力,以高效處理和分析大規(guī)模數(shù)據(jù)。智慧導(dǎo)讀可以根據(jù)讀者的需求和興趣進行個性化推薦。參考智慧導(dǎo)讀有什么用
個性化選擇的界面信息資源搜集與表達方式,各種服務(wù)可以匯集到一個平臺上。四川智慧導(dǎo)讀聯(lián)系方式
學(xué)術(shù)閱讀具有專業(yè)性、持久性和高難度的特點,閱讀過程中會面臨閱讀中輟、閱讀拖延、信息回避、消極情感等,除了自我控制與管理之外,用戶需要閱讀行為管理服務(wù)。比如,上海師范大學(xué)開發(fā)的論文閱讀系統(tǒng)[51],能助力學(xué)生深度閱讀與學(xué)習(xí),旨在提高學(xué)生的元認(rèn)知能力。智慧圖書館等學(xué)術(shù)平臺可記錄、采集、分析用戶在閱讀前、中、后的數(shù)據(jù),加強閱讀行為管理服務(wù)。在閱讀前,學(xué)術(shù)用戶可利用AIGC技術(shù)生成自己的過往閱讀報告、陪伴式答疑、個性化建議等,明確閱讀方向與目標(biāo)。比如,科大訊飛與北京師范大學(xué)聯(lián)合推出“學(xué)科潛能和專業(yè)興趣雙核測評”,幫助學(xué)生了解、認(rèn)識自己的能力,幫助學(xué)生測評在某一方面的水平。在閱讀中,一些學(xué)生不了解自己在閱讀過程中所處位置,也不了解某個階段適用的閱讀策略。AIGC技術(shù)可以支持智慧學(xué)術(shù)閱讀平臺分析學(xué)術(shù)用戶在閱讀過程中的各類數(shù)據(jù),構(gòu)建用戶畫像,幫助用戶了解閱讀狀態(tài)及難點,為用戶生成后續(xù)的個性化閱讀計劃,提供情感支持。在閱讀后,AIGC技術(shù)可以幫助用戶做好實時評估,分析存在問題,設(shè)計改進方案。四川智慧導(dǎo)讀聯(lián)系方式