混合式項目推薦排序演算法於健康知識網站之應用

胡 少杰, 劉 建財

研究成果: 报告类型委託報告

摘要

International Telecommunication Union (ITU) 2006至2009年間對世界各國網際網路人口使用情形的調查,發現使用人數呈現逐年增長的趨勢。除此之外,網際網路上的資源也漸趨豐富與多樣化,其蓬勃發展亦影響了健康產業,有學者發現民眾在網路上搜尋健康相關資訊的數量持續增加且以指數型成長,可看出網際網路已成為民眾接收健康資訊一重要管道。 上網找尋資料的工作隨著資訊過載變得費時且低效率。為了解決問題,兩種普遍的網際網路存取工具,協助使用者提昇查尋結果的可用性:分別為搜尋引擎與提供目錄服務的入口網站系統。使用者從尋找過程中學習健康知識、提升自我健康管理能力、減低醫療成本的花費、提高民眾對醫療服務的滿意度以及醫病關係的改善。但消費者在網路上查找健康資訊時可能面臨,(1)資訊過載(2)紊亂(3)未精煉的資訊(包含相關與不相關)(4)專業化術語成為使用者下達關鍵詞搜尋時的障礙(5)專業的醫療知識與專有名詞增加民眾學習的難度(6)資訊的品質與可信度。 另外,使用者在使用搜尋工具搜尋健康資訊的過程中可能面臨問題(1)過多未精煉的資訊(包含相關與不相關)(2)健康領域專業化術語,造成使用者下達關鍵詞的障礙,為有效的利用搜尋引擎,使用者須明確知道搜尋資料的方向及關鍵字(3)缺乏文字特徵屬性的資料可能搜尋不到或排名順位後面而不易被使用者找到。部分健康宣導性媒體資源 (如:圖檔轉存的pdf),在缺乏文字特徵屬性的情況下,可能增加被搜尋到的困難度。 在目錄服務的入口網站,使用者在網站中由上往下在以階層式分類的網站結構中尋找需要的資訊,雖有網站導覽的協助但階層式的分類、網站結構與異動性等因素降低階層中頁面的可及性(Accessibility)以及增加使用者搜尋上的困難,其因素包含(1)資源異動、網站或網頁消失、網頁功能改變或內容隨著時間被移置到網站中其他位置(2)使用者與網站設計人員對網站結構認知的差異同樣也增加搜尋上的困難(3)階層的增加降低底層網頁被搜尋到的可能性。 研究中我們發現健康九九使用者中有約12.53%用過搜尋引擎,其中有7.86%用過站內搜尋,顯示大部分的使用者未用過搜尋工具。雖然搜尋引擎提供便利迅速的關鍵字搜尋功能,但是使用者為了找到真正想要的資訊必須一一確認所有找到的網頁,導致其精確率(Precision)與目錄服務的入口網站系統相比來得低,而入口網站所收集到的網頁相對來說較少,因此相關的結果會較搜尋引擎少便造成召回率(Recall)較搜尋引擎來得低。為了更有效益且主動的提供資訊與知識,遂有學者提出資訊過濾(Information Filtering),其中代表作就是推薦系統,期望能經由系統分析使用者閱覽紀錄獲取其偏好或興趣,從使用者的興趣中協助找到相關的資源文件,縮短過濾資訊的時間並改善搜尋引擎精確率低的問題。 使用者閱覽紀錄中可能因無意義的回饋評分影響了推薦結果,因此分析前需剔除回饋評分雜訊,再從過濾掉的資訊中找出文章的相關性。可是相關性的強弱會受到網頁可及性(Accessibility)影響,除此之外相關性僅能知道頁面的回饋評分有相似的趨勢,無法得知回饋評分的高低。在本研究方法中,我們考慮相關係數、回饋評分的高低與頁面的可及性,對推薦清單中的頁面重新排序─提出新方法SORS。 為了驗證SORS的效果,使用衛生署國民健康局健康九九網站的網站日誌(IIS log),進行方法的評估。從歷史閱覽資料中根據使用者4比1的比率分成訓練組(Training Data)與測試組(Testing Data),並從訓練組中挑選一篇使用者曾經看過的文章(Target),並訓練組資料中找出與Target相關之其他文章(Top N,N為相關文章數)作為推薦用,從得到的推薦結果利用測試組進行評估。實驗結果根據不同的參數Top N(推薦文章數)、LEN(推薦分析資料的時間區間長度)進行SORS與KNN的Recall、Precision以及系統效能比較。並發現SORS的首N項小於KNN時其Recall與Precision依然有較好的效果。
貢獻的翻譯標題A Hybrid Item-based Recommendation Ranking Algorithm Applied on a Healthcare Website
原文???core.languages.zh_TW???
發行者臺北醫學大學牙周病專科
頁數85
出版狀態已發佈 - 2011

Keywords

  • 協同過濾演算法
  • 可及性
  • 排序
  • 使用者訪問行為
  • 網路日誌

指紋 深入研究「混合式項目推薦排序演算法於健康知識網站之應用」主題。共同形成了獨特的指紋。

引用此