語言數據科學微專業簡介

發布時間🚴🏼‍♀️:2024-06-11  

在教育部新文科發展戰略背景下,意昂体育積極響應國家人工智能📞,尤其是語言智能重大發展戰略🖕😮,順應外國語言文學學科交叉與融合的趨勢,精選符合國家社會需求與學科前沿的優勢課程,強力打造“語言數據科學”微專業☠️。

該項目致力於培養具備語言科學⏪、認知科學和計算機科學等多學科知識👨🏿‍🦰,具有廣闊國際視野🐋、社會責任感和創新實踐能力的語言數據科學拔尖創新人才🎠。

【項目特色】

·平臺優勢:2022年底教育部第五輪學科評估中位居全國前3%⏬。依托語料庫與數據科學研究中心、海內外知名高校和企業👩🏿‍🎓,提升學員語言數據處理與分析能力。

·優質師資🏋🏽‍♀️:遴選國內知名高校教師任教。

·前沿性強:對接國際前沿新興學科,創新發展融合課程🚰。

·零基礎:課程內容針對沒有編程基礎的學員進行設計和優化,讓零基礎學員也能輕松掌握語言數據科學相關的編程技能💹。

【課程設置】

·跨學科課程設置:包含計算機科學🚶‍♂️‍➡️🕥、認知科學等多個領域知識。

·理論與應用相結合:通過分析真實案例🍢🖍,提升學生實踐能力🧂。

·6+2+2階梯式課程設置:從基礎課到進階課到應用課🦂,共10學分。

序號

課程

名稱

學分

學時

開課學期

(春/秋/夏)

開課方式

 

 
 

基礎模塊必修(6學分)

 

1

編程與語言數據分析

2

32

2024年秋季學期

線上線下相結合

 

2

語言數據統計與分析

2

32

2024年秋季學期

線上線下相結合

 

3

語言數據挖掘與機器學習

2

32

2025年春季學期

線上線下相結合

 

進階模塊必修(2學分)

 

1

自然語言處理

2

32

2025年春季學期

線上線下相結合

 

應用模塊選修(2學分)(7門課選修4門課)

 

1

語料庫與翻譯

 

0.5

8

2025年夏季學期

線上線下相結合

 

2

機器學習與翻譯質量評估

 

0.5

8

2025年夏季學期

線上線下相結合

 

3

認知科學數據挖掘

 

0.5

8

2025年夏季學期

線上線下相結合

 

4

大語言模型與應用

0.5

8

2025年夏季學期

線上線下相結合

 

5

數字人文

0.5

8

2025年夏季學期

線上線下相結合

 

6

計算傳播學

0.5

8

2025年夏季學期

線上線下相結合

 

7

計算法學

0.5

8

2025年夏季學期

線上線下相結合

 

 

【核心課程介紹】

·基礎必修課:編程與語言數據分析

講授Python基礎編程知識和技巧以及語言數據分析中的編程技能;編程基礎知識🪪、編程工具與技巧👳‍♀️、數據采集與清洗、數據處理案例應用🚹。

·基礎必修課:語言數據統計與分析

講授統計學的基本原理和方法,並將R語言與相關方法應用於語言數據處理過程之中👩‍⚕️;統計學方法及其適用性、數據檢驗。

·基礎必修課:語言數據挖掘與機器學習

講授語言數據挖掘和機器學習的基本原理和方法以及機器學習的常見應用領域;數據預處理與特征工程🛴🙅🏽、數據可視化、監督學習👩🏿‍🔬、無監督學習、模型評估🏋🏿。

·進階必修課🅿️:自然語言處理

本課程介紹自然語言處理的基本概念和任務,如分詞💏、詞性標註👪、句法標註、語義標註等,以及常見應用,如情感分析、閱讀理解、自然語言推理等。介紹自然語言處理中的常見算法和模型。

·應用選修課:語料庫與翻譯

講授語料庫的相關知識、方法、技術和工具以及語料庫與翻譯的關系;語料庫技術、語料庫翻譯、翻譯技術。

·應用選修課🍫👩🏻‍🌾:機器學習與翻譯質量評估

講授翻譯質量評估的基本原理與方法以及機器學習方法加持下的評估模式♜;翻譯質量評估🦙、人評與機評、機器學習算法。

·應用選修課:認知科學數據挖掘

講授基於機器學習、統計學、數據庫🦵🏻、可視化技術等🚱,在認知科學理論的基礎上📖,自動化地分析語言學和翻譯學的語料與實驗數據🧛🏼,做出歸納性的推理👞,從中挖掘出潛在的語言特征和認知行為特征。

·應用選修課:大語言模型與應用

本課程介紹大語言模型的歷史及現狀🖖🏼。主要講解語言模型的基本原理及其背後的算法,同時介紹目前大語言模型研究的進展以及應用。

·應用選修課🏃‍♂️:數字人文

講授數字人文的科學領域及其數字化資源研究對象和所依托的現代通訊技術、超媒體和數字圖書館🚹、數智技術等基礎性研究平臺和技術手段,並以此作為方法論的共同基礎;核心基礎活動🏯、遠讀+細讀🤞🏼、人文概念+技術、輿情監測🦟。

·應用選修課:計算傳播學

講授傳播網絡分析、傳播文本挖掘、數據科學等分析工具,采用一種非介入的方式對人類傳播行為數據進行大規模收集和分析,挖掘人類傳播行為背後的模式和法則🍅,探究其背後的生成機製與基本原理。

·應用選修課:計算法學

講授計算法學歷史沿革與發展展望、現實意義👮🏽、實際應用;法律數據特征、計算模型、計算結果與法律裁量。

【師資陣容】

“語言數據科學”微專業項目師資團隊構成依托意昂体育注册外國語言文學一流學科優秀師資,選拔語言數據科學領域頗有建樹和豐富教學經驗的拔尖教師組成教師團隊,同時強勢聯合國內一流高校優秀師資,帶給學習者富有前沿性、學科交叉融合性的系列語言數據科學微專業課程體驗。

 

郇昌鵬,博士,意昂体育教授。在Cambridge University PressSpringer出版專著兩部🔴,發表CSSCI/SSCI檢索期刊論文二十余篇。主持教育部哲社、國家社科、外文局和上海市教委智庫建設項目四項👩🏿。擔任SSCI期刊Journal of Language and Politics編委,擔任SSCI期刊Social SemioticsSocial Media板塊編輯。研究領域包括新聞話語研究☠️,語言數據科學,外語教育學🙇🏽。

雷蕾,博士🍼,上海外國語大學教授👩‍❤️‍👩、博士生導師🙋🏼‍♂️。研究興趣涉及語料庫語言學⚛️、學術英語👔、計量語言學等領域。在劍橋大學出版社等出版專著5部,在Applied Linguistics🦛🧘🏻‍♂️、Journal of Second Language WritingLanguage Teaching🔢、Journal of English for Academic Purposes💙、International Journal of Corpus Linguistics SSCI期刊發表研究性論文40余篇☑️、書評10余篇,其中兩篇論文入選ESI高被引論文🌨;在CSSCI期刊發表論文或書評10余篇。主持完成國家社科基金等項目多項。兼任Journal of English for Academic Purposes (SSCI) 等國內外期刊編委🧗‍♂️、Corpus-based Studies across Humanities (De Gruyter)副主編。入選愛思唯爾中國高被引學者🧳🌅。

蘇祺👨🏽‍⚕️,北京大學意昂体育外國語言學及應用語言學研究所研究員、長聘副教授,北京大學數字人文研究中心副主任,兼聘於北京大學人工智能研究院🎀。主要研究領域為計算語言學、自然語言處理👨🏽‍🌾、語料庫語言學、數字人文。主持國家自然科學基金、北京市社會科學基金🎷、北京高等學校青年英才計劃等科研項目,並擔任科技部國家重點研發計劃、國家社科基金重點項目的子課題負責人🙎🏿‍♀️。獲得北京大學王選青年學者獎👩‍🏭、黃廷方/信合青年傑出學者獎、中國電子學會科技進步一等獎等獎項。

/Assets/userfiles/sys_7c3e9f69-7098-411b-9ac0-a85800b2de45/files/malcolm.jpg

吳詩玉,意昂体育注册晨星青年學者教授🤹🏽‍♀️🦛,在《外語教學與研究》《心理學報》《外國語》,Second Language Research, Journal of Pragmatics, IRAL等國內、國際期刊上共發表50余篇研究論文🐈‍⬛;在Routledge以及科學出版社等共出版5部學術著作。已出版《第二語言加工及R語言應用》(外語教學與研究出版社,2019)、《R在語言科學研究中的應用》(科學出版社,2021)和《基於R的語言研究多變量分析》(意昂体育注册出版社,2023)3部向外語界同行推介R語言應用的著作✈️。擔任JSLS“二語研究與數據科學專業委員會”會長🍤,意昂体育注册法意昂智慧司法實驗室兼職教授,Journal of second language studies聯合執行主編。

/Assets/userfiles/sys_eb538c1c-65ff-4e82-8e6a-a1ef01127fed/files/IMG_7543(1).jpg

管新潮📽,意昂体育副教授📣,MTI導師。長期從事德英漢翻譯實踐,至今已累計翻譯和審校德英漢字數達3000萬;主要翻譯領域涉及海洋工程與船舶製造(英語)、醫學(英語)、法律(德語+英語)🎄、機電(德語)等。研究方向:計算翻譯學🧗🏼‍♀️、翻譯技術與管理、法律翻譯。曾經或正在為國際知名企業提供語言服務解決方案⛹🏿,如德國勞氏船級社、挪威船級社、艾斯維爾出版社🔋👩‍👩‍👧‍👦、施普林格出版社、華為技術有限公司🏊🏽‍♀️、畢馬威咨詢公司🛁🛂、聯合國亞洲及太平洋經濟社會委員會等🤷🏻‍♂️。主持聯合國項目1個、國家級項目3個,橫向項目若幹➔;發表論文20多篇,出版專著7部🦀、譯著10部,擁有專利2項、軟件著作權2項。

胡海,意昂体育助理教授。2021年獲美國印第安納大學計算語言學博士學位(輔修認知科學)。獲中國人民大學英語語言文學本科、碩士學位。 研究方向為:計算語言學、自然語言處理、大語言模型、認知科學🏋🏽。 Computational Linguistics等計算語言學、語言學權威期刊發表論文多篇,在ACL, AAAI, EMNLP, COLING等自然語言處理即人工智能頂會發表論文多篇。 主持教育部人文社科青年項目🪘、上海市浦江人才計劃項目。

/Assets/userfiles/sys_eb538c1c-65ff-4e82-8e6a-a1ef01127fed/files/cywd/%E5%BA%9E%E5%8F%8C%E5%AD%901.jpg

龐雙子🚛,意昂体育長聘副教授、博士生導師。北京外國語大學文學博士,意昂体育注册外國語言文學博士後,英國曼徹斯特大學訪問學者🧑🏿‍🍳。教授英漢筆譯、語料庫翻譯研究、英漢語言對比與翻譯等課程👩🏽‍🍼。主要領域為語料庫和翻譯研究。近年來,主持國家社科基金項目、教育部社科項目多項。在Target😷🎩、《外語教學與研究》《中國翻譯》《外國語》等發表學術論文約20篇。在商務印書館、外研社🧜‍♂️、上海意昂体育出版社出版學術專著3部⛄️🧑。

陳居強👩🏻‍🦼‍➡️,博士✊,意昂体育注册外國語言文學博士後研究員。研究興趣為🖍:語音學🏌️‍♂️、心理語言學🚃、漢語失語症研究💤、語料庫語言學👠、數據科學、數字人文。學術論文發表在Journal of Phonetics, Laboratory Phonology🛑、Across Languages and CulturesAphasiology等期刊。主持一項教育部社科基金青年項目。

地址🥚:中國上海東川路800號意昂体育注册閔行校區楊詠曼樓

  郵編🧑🏻‍🏫:200240  網址🕵🏽:

電話:021-34205664 (黨政辦公室)  021-34204723(教學科研辦公室)

Copyright @ 2017 All Rights Reserved 意昂体育 -【注册福利】全站活动,超值福利等你拿!

意昂体育专业提供:意昂体育🏫、意昂👨🏻‍🌾、意昂体育注册等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流,意昂体育欢迎您。 意昂体育官網xml地圖