綜合《科技日報》等消息,北京中科凡語科技有限公司牽頭的“高魯棒性飛譯翻譯平臺”項目、中科凡語(武漢)科技有限公司參與的“大規(guī)模多模態(tài)預訓練模型的研發(fā)與行業(yè)應用”入圍工信部“2021年人工智能產業(yè)創(chuàng)新任務揭榜掛帥項目”立項名單。
?
高魯棒性飛譯翻譯平臺
?
?
優(yōu)勝揭榜單位為:
?
北京中科凡語科技有限公司
中國科學院自動化研究所
?
由北京中科凡語科技有限公司牽頭、中國科學院自動化研究所參與的“高魯棒性飛譯翻譯平臺”項目,圍繞“如何實現跨語言跨領域的知識遷移、如何構建魯棒性訓練與解碼模型以及如何打造多語言通用翻譯引擎等核心技術”等業(yè)界難題,進行創(chuàng)新研究,打造了多語種、多模態(tài)、多領域的飛譯翻譯平臺。
?
?
針對低資源小語種場景,飛譯平臺發(fā)展多語言預訓練技術,利用海量多語言數據構建超大規(guī)模通用機器翻譯引擎,探索跨領域跨場景知識遷移和多類型、多粒度抗噪方法,復雜文檔翻譯方法,提升機器翻譯魯棒性,并最終實現至少10家國防、政府相關單位應用落地,在2套國產化平臺上進行系統(tǒng)適配。
?
大規(guī)模多模態(tài)預訓練模型的研發(fā)與行業(yè)應用
?
?
優(yōu)勝揭榜單位為:
?
中國科學院自動化研究所
中移系統(tǒng)集成有限公司
中科凡語(武漢)科技有限公司
?
由中國科學院自動化研究所牽頭,中科凡語(武漢)科技有限公司等參與的“大規(guī)模多模態(tài)預訓練模型的研發(fā)與行業(yè)應用”項目,聚焦大規(guī)模多模態(tài)預訓練模型的研發(fā)與行業(yè)應用,以自主可控基礎軟硬件平臺為基礎,突破不同領域的共性平臺技術,實現萬億級參數量規(guī)模的大模型分布式訓練,構建覆蓋多語種文本、語音、圖像、視頻的多模態(tài)預訓練大模型,通過在工業(yè)、醫(yī)療、城市、金融、物流、科學研究等行業(yè)領域開展典型應用示范,改變當前單一模型對應單一任務的人工智能研發(fā)范式,推動我國人工智能研發(fā)規(guī)則產生重大變革。
?
此前,中國科學院自動化研究所等已經以昇騰AI基礎軟硬件平臺為基礎,與武漢市東湖高新區(qū)深度合作,依托武漢人工智能計算中心,研發(fā)了面向超大規(guī)模模型的高效分布式訓練架構,在圖、文、音三個基礎模型上加入跨模態(tài)編碼和解碼網絡,利用昇思MindSpore?AI框架打造了全球首個千億參數三模態(tài)大模型“紫東太初”。
?
?
?
?
“紫東太初”大模型開拓性地實現了圖-文-音語義統(tǒng)一表達,首次實現了“語音生成視頻”的功能,邁出朝向人工智能通用化的關鍵一步。并依托紫東太初大模型研發(fā)了跨模態(tài)通用人工智能平臺,打造了多模態(tài)人機對話機器人“小初”,兼具圖文音的理解、推理和生成能力,具有圖像生成、智能問答、語音識別、文字識別、視頻生成、視頻描述、智能翻譯等 30多項功能。目前,“紫東太初”已經與浙江移動、長安汽車、魏橋創(chuàng)業(yè)、愛奇藝、新華社技術局和美亞大千等行業(yè)領軍企業(yè)合作,共同探索了豐富的應用落地場景。
?
此次由工業(yè)和信息化部舉辦的“人工智能產業(yè)創(chuàng)新任務揭榜掛帥項目”旨在面向全社會遴選掌握關鍵核心技術、具備較強創(chuàng)新能力的企業(yè)和科研機構,發(fā)掘培育一批人工智能領域的優(yōu)勢單位,突破一批標志性技術產品,加速新技術、新產品落地應用。
?
中科凡語憑借深厚的技術積累與強大的創(chuàng)新能力,對目前機器翻譯、大規(guī)模預訓練所面臨的難題提出多項解決策略,突破了國外企業(yè)在機器翻譯領域的技術壟斷、探索了豐富的應用落地場景,推動我國人工智能研發(fā)規(guī)則產生重大變革。
?
?
?