亚洲爱av在线电影,台湾妹子娱乐中文网,探花久久久久,日本久久无毛影院,伊人成人娱乐网,色情视频亚洲天堂,中文无码不卡视频,少妇高潮久久久,久久激情精品

登錄注冊(cè)
新聞 資訊 金融 知識(shí) 財(cái)經(jīng) 理財(cái) 科技 金融 經(jīng)濟(jì) 產(chǎn)品 系統(tǒng) 連接 科技 聚焦

AI文本翻譯系統(tǒng)質(zhì)量提升44% 可高質(zhì)量翻譯200種語(yǔ)言

2022-07-11 16:59:00來(lái)源:至頂網(wǎng)

Meta Platforms今天開放了NLLB-200的系統(tǒng)代碼,NLLB-200是Meta內(nèi)部開發(fā)的一個(gè)人工智能系統(tǒng),可以翻譯200種語(yǔ)言的文本。

Meta還公布了一套工具,旨在幫助研究人員更輕松地將NLLB-200應(yīng)用于軟件項(xiàng)目。

根據(jù)Meta的說(shuō)法,NLLB-200可以理解的200種語(yǔ)言中,許多語(yǔ)言都沒(méi)有得到其他AI翻譯系統(tǒng)的良好支持。目前被廣泛使用的翻譯工具支持的非洲語(yǔ)言不到25種,而NLLB-200 支持多達(dá)55種非洲語(yǔ)言。

Meta表示,翻譯準(zhǔn)確性是NLLB-200優(yōu)于其他工具的另一個(gè)方面。Meta采用的是BLEU評(píng)估系統(tǒng)的準(zhǔn)確性標(biāo)準(zhǔn),BLEU是一種用于衡量機(jī)器翻譯文本質(zhì)量的算法。Meta稱,NLLB-200的BLEU評(píng)分比之前平均高出44%。

Meta首席執(zhí)行官M(fèi)ark Zuckerberg表示:“我們剛剛開源了一個(gè)自主開發(fā)的AI模型,該模型可以翻譯200種不同的語(yǔ)言——其中許多語(yǔ)言未得到當(dāng)前翻譯系統(tǒng)的支持。我們把這個(gè)項(xiàng)目稱之為No Language Left Behind,我們使用的人工智能建模技術(shù)正在為全球數(shù)十億人所使用的語(yǔ)言進(jìn)行高質(zhì)量的翻譯。”

NLLB-200有超過(guò)500億個(gè)參數(shù),這些配置決定了AI系統(tǒng)處理數(shù)據(jù)的方式。人工智能系統(tǒng)參數(shù)越多,準(zhǔn)確性就越高。

NLLB-200具有如此大量的參數(shù),并不是它能夠以高精度支持200種語(yǔ)言的唯一因素,因?yàn)镹LLB-200系統(tǒng)還借鑒了Meta工程師開發(fā)的很多其他AI創(chuàng)新。

Meta使用內(nèi)部開發(fā)的LASER工具包為機(jī)器學(xué)習(xí)相關(guān)研究提供支持。研究人員使用該工具包可以對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以一種語(yǔ)言執(zhí)行某個(gè)特定的任務(wù),然后相對(duì)輕松地使神經(jīng)網(wǎng)絡(luò)適應(yīng)其他語(yǔ)言,這對(duì)于翻譯這一用途來(lái)說(shuō)是很有用處的。Meta開發(fā)了新的NLLB-200系統(tǒng),支持改進(jìn)版LASER——LASER3。

LASER的原始版本包括一個(gè)名為L(zhǎng)STM的神經(jīng)網(wǎng)絡(luò),這是一個(gè)將文本轉(zhuǎn)換為AI系統(tǒng)可以理解的、以數(shù)學(xué)方式表示的專用組件。這種數(shù)學(xué)表示有助于生成更準(zhǔn)確的翻譯結(jié)果。在LASER3中,Meta用Transformer代替了LSTM神經(jīng)網(wǎng)絡(luò),前者是一種高級(jí)自然語(yǔ)言處理模型,可以更有效地執(zhí)行相同的任務(wù)。

Meta還使用了其他幾種方法來(lái)改進(jìn)NLLB-200的功能,例如Meta升級(jí)了用于收集訓(xùn)練數(shù)據(jù)的系統(tǒng),并對(duì)AI訓(xùn)練工作流程進(jìn)行了更改。

Meta使用內(nèi)部開發(fā)的Research SuperCluster超級(jí)計(jì)算機(jī)(如圖)來(lái)訓(xùn)練NLLB-200。今年1月Meta首次介紹Research SuperCluster的時(shí)候稱,該系統(tǒng)配備了6080個(gè)Nvidia最新的A100數(shù)據(jù)中心GPU,最終將升級(jí)到配置16000個(gè)GPU。

Meta計(jì)劃使用NLLB-200在Facebook、Instagram和其他平臺(tái)上提供更好的自動(dòng)翻譯功能,預(yù)計(jì)該系統(tǒng)每天將支持超過(guò)250億次翻譯。

Meta在內(nèi)部努力推廣NLLB-200的同時(shí),還計(jì)劃幫助其他企業(yè)組織將該系統(tǒng)應(yīng)用到他們自己的軟件項(xiàng)目中。

除了NLLB-200之外,Meta還開源了可用于訓(xùn)練AI的代碼,以及一個(gè)名為FLORES-200的數(shù)據(jù)集,用于評(píng)估翻譯的準(zhǔn)確性。Meta將提供高達(dá)200000美元的資金,以幫助非營(yíng)利組織采用NLLB-200。除此之外,Meta還將與Wikimedia Foundation展開合作,將自動(dòng)翻譯技術(shù)應(yīng)用于維基百科文章。

關(guān)鍵詞:

推薦內(nèi)容

熱點(diǎn)
39熱文一周熱點(diǎn)
兴文县| 西充县| 东阿县| 红原县| 稻城县| 康定县| 山东省| 襄垣县| 定兴县| 阆中市| 莱阳市| 石景山区| 英超| 紫金县| 成安县| 德阳市| 庐江县| 格尔木市| 贡嘎县| 利津县| 台南县| 肇庆市| 余江县| 社会| 瓮安县| 富阳市| 水城县| 金溪县| 澄江县| 大厂| 蚌埠市| 晴隆县| 天镇县| 雷山县| 灵寿县| 长沙市| 河北省| 饶河县| 珲春市| 弥勒县| 陵川县|