爲工程師提供頂級交流平台CCF TF 第 94 期主題 NLP 技術和産業化進展
2023 年 2 月 23 日 19:00-21:00
長按識别或掃碼報名
報名鏈接:https://conf.ccf.org.cn/TF94
從算法模型,到産業應用,NLP 在各個子領域都在進行突破,也面臨更多的挑戰和機遇。随着 NLP 模型越來越大,參數量迅速膨脹,分布式訓練成爲優秀 NLP 模型的必備技術。在産業應用中,對話是 NLP 最核心的場景,了解對話場景的前沿研究進展,可以幫助我們在許多領域向前繼續進步。
本期邀請到香侬科技 CTO 王思寬、前小米 AILab 高級工程師李嫣然、網易有道 NLP 算法專家程橋三位在自然語言處理領域一線的專家來和大家分享他們對 NLP 技術和産業化進展的觀點和實踐經驗。
會議安排
TF94:NLP 技術和産業化進展 主持人:香侬科技 CTO 王思寬 | ||
時間 | 主題 | 講者 |
19:00-19:10 | 活動介紹及緻辭 | 主持人 |
19:10-19:40 | NLP 訓練中的分布式算子研究 | 王思寬 香侬科技 CTO |
19:40-20:10 | 陪伴型情感對話的前沿探索 | 李嫣然 前小米 AI Lab 高級算法工程師 |
20:10-20:40 | 神經機器翻譯中的語義一緻性數據增強方法 | 程橋 網易有道 NLP 算法專家 |
20:40-20:55 | 參會者提問互動 | 王思寬、李嫣然、程橋 |
20:55-21:00 | 活動總結 | 段亦濤 |
CCF TF 算法與 AI
特邀講者
王思寬
香侬科技 CTO
主題:《NLP 訓練中的分布式算子研究》
主題簡介:随着 NLP 語料越來越豐富,對于模型的訓練效率提出了更高的要求。分布式訓練,是當前 NLP 任務中面臨的重要挑戰。本次分享會介紹在分布式訓練任務中的數據并行、模型并行、算子并行,以及和國産芯片生态的适配與融合。
個人簡介:本科與碩士畢業于北京郵電大學,研究方向包括自然語言處理、分布式系統、機器學習系統 ,2018 年加入香侬科技,負責公司整體研發架構,主導了香侬科技 NLP 分布式訓練平台、GPU 推理性能優化等核心任務。主要關注分布式訓練、GPU 共享等提升 NLP 應用效果的問題。
李嫣然
前小米 AI Lab 高級算法工程師
主題:《陪伴型情感對話的前沿探索 ( Frontiers and Practice of Emotional Support Conversation ) 》
主題簡介:随着後疫情時代社會壓力的加劇,越來越多的人們面臨着情緒困擾。然而,專業的精神衛生服務卻是十分稀缺的。爲了解決供需不平衡,搭建陪伴型對話機器人成爲了日益受關注的研究方向。陪伴型對話也被稱作情感疏導對話,其要求機器理解人類用戶的情緒困擾,并通過提供共情回複和疏導建議給予情感陪伴。本次分享将介紹我們發表在 SIGIR 2021, ACL 2022, SIGIR 2022 和 AAAI 2023 的最新工作成果。
個人簡介:李嫣然博士曾任小米人工智能實驗室高級算法工程師及場景對話團隊研發負責人,同時也兼任着北京大學心理與認知學院的行業導師。其多年擔任 AAAI,ACL,EMNLP 等國際頂級會議的審稿人,并擔任 EMNLP 2022 領域主席。其曾在國際頂級會議及期刊上發表論文二十餘篇,涵蓋情感計算、人機對話、自然語言生成等研究領域,谷歌學術累計引用逾 2000 次。
程橋
網易有道 NLP 算法專家
主題:《Semantically Consistent Data Augmentation for Neural Machine Translation via Conditional Masked Language Model》
主題簡介:數據增強方法是一種有效擴充數據規模的技術,并且在視覺等領域取得了顯著的效果,但是在自然語言處理領域,這項技術還沒有得到很好的應用。我們通過引入條件掩碼語言模型和軟增強改進了機器翻譯訓練中的詞替換數據增強技術,使得在增強的過程中,可以保留源句和目标句的語義以及它們之間的跨語言互譯關系。本次分享會介紹數據增強的技術背景和我們的優化方法。
個人簡介:網易有道 NLP 算法專家。畢業于浙江大學,畢業後一直從事機器翻譯的研發工作,經曆了機器翻譯從 SMT 時代發展到 NMT 時代的過程。在有道參與了 NMT 的工程優化,質量調優,離線翻譯,語音翻譯等的核心研發工作,在機器翻譯方向有豐富的研發經驗。
SIG 主席
段亦濤
網易有道首席科學家
個人簡介:本科與碩士畢業于北京航空航天大學,于 2007 年獲 UC Berkeley 計算機科學專業博士學位,研究方向包括大規模分布式計算,數據挖掘,機器學習,密碼學以及安全和隐私。在博士期間加入有道,參與完成有道底層架構,目前任網易有道首席科學家,負責有道技術創新與相關實踐工作。主要關注以深度學習爲代表的最新 AI 技術在互聯網各個領域的應用,包括機器翻譯,圖像識别等。主導了有道神經網絡機器翻譯 YNMT 等核心技術的研究和開發。
何中軍
百度人工智能技術委員會主席
個人簡介:長期從事機器翻譯研究與開發,研發了全球首個互聯網神經網絡機器翻譯系統及語義單元驅動的機器同傳系統。曾獲國家科技進步二等獎、中國電子學會科技進步一等獎、北京市科技進步一等獎、中國專利銀獎等多項獎勵。
算法與 AI-SIG活動回顧及精彩報告,歡迎掃碼觀看:
參會說明
1、如報名後無法參加,請及時于活動開始前發送郵件申請取消(聯系郵箱:[email protected]),無故缺席将影響下一期活動的參與。
3、會議鏈接和密碼将在活動當天通過郵件、短信通知(活動當天 15:00 後報名請注意查收郵件)。可點擊騰訊會議鏈接,輸入密碼參加。
4、請于活動當天16:00前完成報名,及時獲取會議鏈接。
5、CCF 會員免費參加,非會員 99 元 / 次,加入會員可免費參與全年 47 場活動。
2023 年 2-3 月 TF 活動安排
TF93 | 2023/2/16 | 雲原生年度回顧與展望 |
TF94 | 2023/2/23 | NLP 技術(具體話題待定)産業化之路 |
TF95 | 2023/3/9 | 元宇宙系列(三):行業智能化,産業元宇宙來助力 |
TF96 | 2023/3/16 | 知識圖譜賦能時空 AI |
TF97 | 2023/3/23 | 語音處理前沿及産業化 |
會員權益
會員免費參加 CCF TF 全年 47 場活動,爲自己的技術成長做一次好投資,用高性價比獲取專業知識的絕佳路徑!
專業會員 / 高級會員 / 傑出會員 / 會士:360 元 / 年
學生會員:50 元 / 年。具體權益請點擊查看:CCF 個人會員權益
申請公司會員,可享受更多免費名額、品牌宣傳及其他權益,詳情點擊查看:CCF 公司會員權益或咨詢電話 0512-83912127
長按識别或掃碼入會
參會方式
2023 年 2 月 23 日 19:00-21:00
長按識别或掃碼報名
報名鏈接:https://conf.ccf.org.cn/TF94
歡迎掃碼加入本期活動交流群
聯系方式合作單位
* 本文系量子位獲授權刊載,觀點僅爲作者所有。
— 完 —
量子位 QbitAI
վ ' ᴗ ' ի 追蹤 AI 技術和産品新動态
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~