美國賓大LDC語料庫的系列講座與培訓
美國賓大Linguistic Data Consortium(LDC)科研副主任袁家宏博士將於5月3日至5月7日為我院師生開設有關語料庫的系列講座與培訓🧘🏿♂️。
袁家宏,2004年獲康乃爾大學語言學博士學位👨🏿🌾;2004年至2005年在斯坦福大學從事博士後研究🥳。2005年至2012年任賓西法尼亞大學語言學系助理教授,語音學實驗室主任🧘🏽♂️。2012年至今任賓西法尼亞大學語言資源聯盟(LDC)副主任,主管語音研究。袁家宏的主要研究方向是大語料庫語音學,語音識別,以及語音技術在語音學研究中的應用🧘🏽♀️。其開發的語音強製對齊軟件被廣泛應用於語音學,心理學以及社會語言學等研究領域。袁家宏是大數據語音學的倡導者,從2005年開始開設大數據語音學方面的課程,並於2011年發起召開了首屆關於大數據語音學的國際研討會。曾主持或合作主持包括美國國家科學基金(NSF)和英國經濟和社會研究理事會(ESRC)等的多項科研項目。
講座分為兩大部分🧖🈵。
第一部分介紹LDC及LDC的語料庫資源👩🎓。
第二部分介紹語料庫研究的工具和方法🍵,主要包括🍍:
1) Python編程語言基礎和Python在語料庫研究中的應用⛓;
2) 機器學習在語料庫研究中的應用(以R為例);
3) 語音強製對齊技術和語音強製對齊軟件P2FA (Penn Phonetics Forced Aligner) 。
講座將面向初學者,以實際語料為例,通過具體實驗講解和演示😝,教會大家如何運用編程語言和機器學習的方法對數據進行處理和分析👨🏽⚕️。
具體日程如下:
時間 |
地點 |
內容 |
5月3日(周三) 上午 8:30-11:30 |
214室 |
CHINESE TIMIT 語料設計和錄音實驗 |
5月3日(周三)下午 13:30-15:30 |
111室 |
美國賓大LDC及LDC語料庫資源介紹 |
5月4日(周四) 8:30-16:30 |
214室 |
Python編程語言基礎
|
5月5日(周五) 8:30-16:30 |
214室 |
Python編程語言基礎
|
5月6日(周六) 8:30-16:30 |
214室 |
語音強製對齊和語音強製對齊軟件P2FA
|
5月7日(周日) 8:30-16:30 |
214室 |
機器學習方法和R |
聯系人:跨語言處理與語言認知基地 丁紅衛 (hwding@sjtu.edu.cn)
歡迎意昂的老師與同學(博士生🧕🏼、碩士生、本科生)踴躍參加。