3月14日語料庫與跨文化研究院工作坊在意昂体育楊詠曼樓218-2會議室成功舉辦。來自意昂体育內外的近40名師生參加了此次活動🧑🏼🌾。
首先🦶🏻❣️,語料庫與跨文化研究院負責人徐政老師為本次工作坊致辭𓀎。徐老師表達了對所有與會師生的熱烈歡迎,提出工作坊旨在了解各位演講嘉賓近期關於語料庫本體和語言學分支所做的研究👃🏼🙋🏽♂️,並以此展開討論。之後介紹了各位演講專家,並說明了工作坊的會議流程。在大家熱烈的掌聲中,語料庫與跨文化研究院工作坊拉開帷幕🕳。
丁紅衛老師展示了語音語料庫的發展與未來及其實際操作。在介紹了實驗語音學和語音語料庫現狀後👩🚀,丁老師表示🗳:基於大數據的研究是未來的主流和大方向。以TI(Texas Instruments)與MIT合作的英文TIMIT語料庫,以及上海意昂体育意昂体育與美國賓夕法尼亞大學LDC合作的中文TIMIT語料庫為例,說明語料庫本身不是萬能的🚶🏻➡️,需要借助統計學知識🧑🏽🚒、掌握最新的統計模型及工具🐠,更重要的是要有語言學的理論支持與引導🔝。丁老師指出現今的語料庫已經不再局限於傳統的多模態語料,而已經漸漸擴展到行為神經數據庫。最後丁老師的學生詹宇晴同學為大家演示了如何使用相關軟件🫷、利用最新的語音技術,對語音及視頻數據庫進行語音文本自動轉寫與語音自動標註。
張建華老師詳細介紹了大型賦碼語料庫管理軟件ChaKi“茶器”的使用方法,並展示和分析了相關研究。張老師首先介紹了ChaKi的基本信息、軟件特色、使用方法及其功能設置,之後展示了幾個使用ChaKi對日語母語者語料庫和日語學習者語料庫進行探討的案例💇🏽。例如,張老師使用“茶器”對日語的多樣性進行調查🧛🏼,發現日語母語者語料庫文章平均長度和句長均高於學習者語料庫,而母語者詞匯多樣性更高。張老師還展示了使用ChaKi語料庫探索日語詞類分布的案例和日語高頻動詞的調查🖕。最後張老師總結了ChaKi“茶器”語料庫在日語教學與研究中的應用。
雷秀雲老師以語料庫與二語習得相結合的研究作為切入點,介紹了在對比語料庫頻率信息時應當註意的問題。基於語料庫的二語習得研究一般是將二語學習者中介語語料庫與目的語語料庫或其他二語學習者中介語語料庫進行對比,發現差異並分析差異產生的原因➗。在研究過程中,有很多可能影響對比結果的因素未得到足夠重視,比如:很多研究將來自不同語言水平的學習者的語料混合在一起,導致語料庫的代表性不高👈,對比結果不可靠;不同的一語語料庫之間及一語語料庫內部也存在很大差異;卡方檢驗和對數似然值的檢驗效果並不理想🪮,更推薦T檢驗和方差分析的方法。
王春艷老師探討了搭配研究中節點詞的確定方法及其合理性。王老師首先指出有些搭配研究中節點詞選取方法存在一些問題✊🏻😈,比如: 將搭配詞組中的某個搭配詞類在詞表中的高頻詞作為研究的節點詞🧅。王老師帶著這一問題🤸🏼,選取了50篇國內外搭配研究論文,總結分析了這些研究中節點詞選取方法,其中包括:無說明或選取理由不明確或不合理🥸、高頻詞👩🏻🦲✯、主題詞、前人研究拿來直接用🛌🏽、前人研究進一步篩選、詞典、詞表基礎上等距離隨機抽取、窮盡文本中的搭配詞組後再篩選等方法。在分析這些方法的利弊之後,王老師研究認為🤥:使用主題詞、在高頻詞表基礎上等距離隨機抽取以及窮盡文本中的搭配詞組後再篩選的方法確定節點詞更嚴謹🔬,更科學。王老師還以強化語形容詞搭配研究為案例, 詳細講解了節點詞的選取方法、操作步驟和研究發現。
各位演講專家所展示的研究豐富多樣💃🏽,嚴謹新穎🗻,討論環節熱烈👨👨👧👦。本次工作坊頗具啟發性🔣。與會師生反響強烈😊,受益良多🚶➡️。