loperntu
語言分析與資料科學

Updated 6 months ago

語言分析與資料科學

Linguistic Analysis and Data Science

台大基本能力課課程講義

台大語言學研究所語言處理與人文計算實驗室 謝舒凱


背景知識

駕馭大文本數據的需要

大數據 (Big Data) 的時代,數位資料累積與增長的速度已經遠遠倍增於人類史上的任何階段。這樣一種鉅量資料風潮,不僅改變了人文社會與自然科學研究的面貌,在各項產業也產生了分析資料輔佐決策的迫切需求。在此背景下,數位素養 (digital literacy) 已經成為現代公 民必須具備的基本素養之一,近年來新興的資料科學家 (data scientist) 更成為當前最為熱門的行業之一。

然而由於數據資料的發展,隨著社交媒體與社會網路的發展,非結構性的文本資料所佔比例已經遠超過結構性的表格性資料,使得文本的語言分析在資料科學發展中的角色顯得愈來愈重要,特別對於人文與社會科學的學生而言,更是開啟了一個結合數位科技與人文關懷的新的發展方向。

本教程的設計,就是在這個動機之下,透過介紹語言學與文本分析知識結合統計計算,希望能夠刺激人文、社會、傳播與其他財務管理、醫學等各領域學生之間的互動協作與學習,培養跨領域的興趣與分析能力。


課程相關訊息