綜合《科技日報》等消息,北京中科凡語科技有限公司牽頭的“高魯棒性飛譯翻譯平臺”項目、中科凡語(武漢)科技有限公司參與的“大規(guī)模多模態(tài)預(yù)訓(xùn)練模型的研發(fā)與行業(yè)應(yīng)用”入圍工信部“2021年人工智能產(chǎn)業(yè)創(chuàng)新任務(wù)揭榜掛帥項目”立項名單。
?
高魯棒性飛譯翻譯平臺
?
?
優(yōu)勝揭榜單位為:
?
北京中科凡語科技有限公司
中國科學(xué)院自動化研究所
?
由北京中科凡語科技有限公司牽頭、中國科學(xué)院自動化研究所參與的“高魯棒性飛譯翻譯平臺”項目,圍繞“如何實現(xiàn)跨語言跨領(lǐng)域的知識遷移、如何構(gòu)建魯棒性訓(xùn)練與解碼模型以及如何打造多語言通用翻譯引擎等核心技術(shù)”等業(yè)界難題,進(jìn)行創(chuàng)新研究,打造了多語種、多模態(tài)、多領(lǐng)域的飛譯翻譯平臺。
?
?
針對低資源小語種場景,飛譯平臺發(fā)展多語言預(yù)訓(xùn)練技術(shù),利用海量多語言數(shù)據(jù)構(gòu)建超大規(guī)模通用機(jī)器翻譯引擎,探索跨領(lǐng)域跨場景知識遷移和多類型、多粒度抗噪方法,復(fù)雜文檔翻譯方法,提升機(jī)器翻譯魯棒性,并最終實現(xiàn)至少10家國防、政府相關(guān)單位應(yīng)用落地,在2套國產(chǎn)化平臺上進(jìn)行系統(tǒng)適配。
?
大規(guī)模多模態(tài)預(yù)訓(xùn)練模型的研發(fā)與行業(yè)應(yīng)用
?
?
優(yōu)勝揭榜單位為:
?
中國科學(xué)院自動化研究所
中移系統(tǒng)集成有限公司
中科凡語(武漢)科技有限公司
?
由中國科學(xué)院自動化研究所牽頭,中科凡語(武漢)科技有限公司等參與的“大規(guī)模多模態(tài)預(yù)訓(xùn)練模型的研發(fā)與行業(yè)應(yīng)用”項目,聚焦大規(guī)模多模態(tài)預(yù)訓(xùn)練模型的研發(fā)與行業(yè)應(yīng)用,以自主可控基礎(chǔ)軟硬件平臺為基礎(chǔ),突破不同領(lǐng)域的共性平臺技術(shù),實現(xiàn)萬億級參數(shù)量規(guī)模的大模型分布式訓(xùn)練,構(gòu)建覆蓋多語種文本、語音、圖像、視頻的多模態(tài)預(yù)訓(xùn)練大模型,通過在工業(yè)、醫(yī)療、城市、金融、物流、科學(xué)研究等行業(yè)領(lǐng)域開展典型應(yīng)用示范,改變當(dāng)前單一模型對應(yīng)單一任務(wù)的人工智能研發(fā)范式,推動我國人工智能研發(fā)規(guī)則產(chǎn)生重大變革。
?
此前,中國科學(xué)院自動化研究所等已經(jīng)以昇騰AI基礎(chǔ)軟硬件平臺為基礎(chǔ),與武漢市東湖高新區(qū)深度合作,依托武漢人工智能計算中心,研發(fā)了面向超大規(guī)模模型的高效分布式訓(xùn)練架構(gòu),在圖、文、音三個基礎(chǔ)模型上加入跨模態(tài)編碼和解碼網(wǎng)絡(luò),利用昇思MindSpore?AI框架打造了全球首個千億參數(shù)三模態(tài)大模型“紫東太初”。
?
?
?
?
“紫東太初”大模型開拓性地實現(xiàn)了圖-文-音語義統(tǒng)一表達(dá),首次實現(xiàn)了“語音生成視頻”的功能,邁出朝向人工智能通用化的關(guān)鍵一步。并依托紫東太初大模型研發(fā)了跨模態(tài)通用人工智能平臺,打造了多模態(tài)人機(jī)對話機(jī)器人“小初”,兼具圖文音的理解、推理和生成能力,具有圖像生成、智能問答、語音識別、文字識別、視頻生成、視頻描述、智能翻譯等 30多項功能。目前,“紫東太初”已經(jīng)與浙江移動、長安汽車、魏橋創(chuàng)業(yè)、愛奇藝、新華社技術(shù)局和美亞大千等行業(yè)領(lǐng)軍企業(yè)合作,共同探索了豐富的應(yīng)用落地場景。
?
此次由工業(yè)和信息化部舉辦的“人工智能產(chǎn)業(yè)創(chuàng)新任務(wù)揭榜掛帥項目”旨在面向全社會遴選掌握關(guān)鍵核心技術(shù)、具備較強(qiáng)創(chuàng)新能力的企業(yè)和科研機(jī)構(gòu),發(fā)掘培育一批人工智能領(lǐng)域的優(yōu)勢單位,突破一批標(biāo)志性技術(shù)產(chǎn)品,加速新技術(shù)、新產(chǎn)品落地應(yīng)用。
?
中科凡語憑借深厚的技術(shù)積累與強(qiáng)大的創(chuàng)新能力,對目前機(jī)器翻譯、大規(guī)模預(yù)訓(xùn)練所面臨的難題提出多項解決策略,突破了國外企業(yè)在機(jī)器翻譯領(lǐng)域的技術(shù)壟斷、探索了豐富的應(yīng)用落地場景,推動我國人工智能研發(fā)規(guī)則產(chǎn)生重大變革。
?
?
?