文字挖掘的在各領域的應用

文字挖掘的在各領域的應用 
時間:06/29 (ㄧ) 16:30-17:30
地點:口腔醫學大樓二樓階梯教室
講者:謝邦彥 博士

 由於電腦及網路的快速發展,過去傳統紙質書面資料大多變成電子檔的形式呈現,因此資料的取得比過去要容易許多,大多訊息都可由網站搜尋獲得。但是這些文字資料通常是以半結構化或非結構化的形式儲存。“非結構化資料”是指一般的檔,其內容沒有一定的格式,每份資料間沒有共同的結構性,卻不一定能發現檔中所隱藏的訊息,容易忽略某些對我們有用的重要資訊。 文字挖掘(TextMining)主要定義為“從非結構化的文字中發掘有用的片段、模型、方向、趨勢或規則”,另外也有學者定義為:“是一種編輯、組織及分析大量檔的方法和過程。”一般的統計分析或資料採擷的方法,只適用於結構化的關聯表格資料,無法直接運用到非結構的檔資料上,而一些已發表的文本挖掘研究中結合了資訊檢索(Information Retrieval)、自然語言處理(Natural Language Processing)和語義分析技術,試圖從檔資料中找出重要的專案(Term)、片語(Phrase)、項目間的關聯強度(Association Degree)。 在現今充滿著大數據的時代中,除了能利用量化的資料去分析外,質化的資料中更含有大量的資訊,如何利用「多維度分析」去幫客戶創造價值,正是TextMining的所用之處。並利用文字挖掘分析結果,得出資料價值。並透過各領域的應用,如:商品銷售、行銷導購、社群操作、危機預警、選戰策略、社會網絡等。幫企業及客戶創造價值與利益。