文字挖掘的在各領域的應用

文字挖掘的在各領域的應用 
時間:06/29 (ㄧ) 16:30-17:30
地點:口腔醫學大樓二樓階梯教室
講者:謝邦彥 博士

 由於電腦及網路的快速發展,過去傳統紙質書面資料大多變成電子檔的形式呈現,因此資料的取得比過去要容易許多,大多訊息都可由網站搜尋獲得。但是這些文字資料通常是以半結構化或非結構化的形式儲存。“非結構化資料”是指一般的檔,其內容沒有一定的格式,每份資料間沒有共同的結構性,卻不一定能發現檔中所隱藏的訊息,容易忽略某些對我們有用的重要資訊。 文字挖掘(TextMining)主要定義為“從非結構化的文字中發掘有用的片段、模型、方向、趨勢或規則”,另外也有學者定義為:“是一種編輯、組織及分析大量檔的方法和過程。”一般的統計分析或資料採擷的方法,只適用於結構化的關聯表格資料,無法直接運用到非結構的檔資料上,而一些已發表的文本挖掘研究中結合了資訊檢索(Information Retrieval)、自然語言處理(Natural Language Processing)和語義分析技術,試圖從檔資料中找出重要的專案(Term)、片語(Phrase)、項目間的關聯強度(Association Degree)。 在現今充滿著大數據的時代中,除了能利用量化的資料去分析外,質化的資料中更含有大量的資訊,如何利用「多維度分析」去幫客戶創造價值,正是TextMining的所用之處。並利用文字挖掘分析結果,得出資料價值。並透過各領域的應用,如:商品銷售、行銷導購、社群操作、危機預警、選戰策略、社會網絡等。幫企業及客戶創造價值與利益。

 

Neurostatistics in Clinical Applications

Neurostatistics in Clinical Applications
時間:05/01(五) 14:00-15:30
地點:口腔大樓一樓會議室
講者:劉長萱 教授

 Abstract:In the past 25 years, the emergence of new techniques of measuring brain structures and functions has introduced statistical challenges in validating scientific and clinical findings, for instance, spatial-temporal analysis in functional magnetic resonance imaging (fMRI), statistical models in diffusion tensor imaging (DTI), and spectral analysis in real-life electroencephalography or magnetoencephalography (EEG/MEG) recording. Those techniques have become increasingly available in neuroscience research and clinical diagnoses to support deep understanding of physiologic mechanisms and functional deficits in healthy controls and neurologically diseased patients. In this talks, I will illustrate clinical applications of neurostatistics to fMRI analysis of subcortical deficits in schizophrenic patients during processing verbal working memory tasks, and EEG diagnose of subcortical deficits in Asperger’s patients during processing emotional faces.

報名連結教職員工發展系統 、學術活動網

 

103學年度生物統計研究中心學術演(4/17)

Conditional distance correlation
時間:4月17日(星期五) 14:00-15:30
講者:王學欽 教授 廣州中山大學數學與計算科學學院
地點:口腔大樓一樓會議室

 The speaker will introduce novel biometrical genetic models for Parent–Twin Quartet Data and provide the approaches to doing statistical inference in these models. The works enables us to answer three classical problems in genetic studies partly: (1) the biasness of heritability estimates in classic twin studies; (2) Equal parent–child environmental effects; (3) cultural transmission.


Data, Visualization and EDA
時間:15:40-16:30
講者:陳君厚 中央研究院 統計科學研究所
地點:口腔大樓一樓會議室

 大數據 (Big Data) 與資料科學 (Data Science) 已是大眾耳熟能詳的詞彙,而經由 Drew Conway 的Data Science Venn Diagram1 在網路上廣為流傳,大家也理所當然的認為數 學與統計知識 (Math & Statistics Knowledge) 在處理大數據與進行深層分析 (Deep Analytics) 時乃必備之工具。然而大學四年的統計系與多年的統研所課程,老師教的、自 己學的夠用了嗎?我回顧了下過去自己在大學四年 (1980~1984) 所修的相關課程,如果老 師都認真地教,我也有效率地學習,怎麼會不夠用?再加上這30 年後新的學習環境: 包含 統計諮詢、統計計算、機器學習等新的課程,與網路學習...(繼續瀏覽)

※本校教職員請至教職員工學習發展系統報名:
請登入學習發展平台 → 首頁點選「Conditional distance correlation」→ 點選【報名】
※三院同仁請至學術活動網報名

 

Twin family studies

Twin family studies
時間:4月15日(星期三) 14:30-16:00
講者:王學欽 教授 廣州中山大學數學與計算科學學院
地點:口腔大樓一樓會議室

 The speaker will introduce a nonparametric measure of conditional dependence for multivariate random variables with arbitrary dimensions. It is zero almost surely if and only if two multivariate random variables are conditionally independent given a third random variable. The advantage of the test is even greater when the relationship between the multivariate random variables given the third random variable cannot be expressed in a linear or monotonic function of one random variable versus the other.

※本校教職員請至教職員工學習發展系統報名:
請登入學習發展平台 → 首頁點選「Twin family studies」→ 點選【報名】
※三院同仁請至學術活動網報名

 

Sample size calculation for assessing differential expression analysis in RNA-seq data

日期 講者 主題

2015--1月7日(三)
15:00-16:30

醫學綜合大樓前棟三樓會議室

李俊毅 教授
嘉義大學應用數學系

Sample size calculation for assessing differential expression analysis in RNA-seq data

※本校教職員請至教職員工學習發展系統報名:
請登入學習發展平台
※三院同仁請至學術活動網報名