亚洲爱av在线电影,台湾妹子娱乐中文网,探花久久久久,日本久久无毛影院,伊人成人娱乐网,色情视频亚洲天堂,中文无码不卡视频,少妇高潮久久久,久久激情精品

登錄注冊(cè)
新聞 資訊 金融 知識(shí) 財(cái)經(jīng) 理財(cái) 科技 金融 經(jīng)濟(jì) 產(chǎn)品 系統(tǒng) 連接 科技 聚焦

微軟和英偉達(dá)推出迄今為止訓(xùn)練最大最強(qiáng)的解碼語(yǔ)言模型

2021-10-12 17:12:12來(lái)源:IT之家

10 月 12 日消息 語(yǔ)言模型(Language Model)簡(jiǎn)單來(lái)說(shuō)就是一串詞序列的概率分布,主要作用是為一個(gè)長(zhǎng)度為 m 的文本確定一個(gè)概率分布 P,表示這段文本存在的可能性。

大家之前可能或多或少聽(tīng)說(shuō)過(guò) GPT-3,OpenAI 最新的語(yǔ)言模型,堪稱地表最強(qiáng)語(yǔ)言模型,也被認(rèn)為是革命性的人工智能模型。除此之外還有 BERT、Switch Transformer 等重量級(jí)產(chǎn)品,而且業(yè)內(nèi)其他企業(yè)也在努力推出自家的模型。

微軟和英偉達(dá)今天宣布了由 DeepSpeed 和 Megatron 驅(qū)動(dòng)的 Megatron-Turing 自然語(yǔ)言生成模型(MT-NLG),這是迄今為止訓(xùn)練的最大和最強(qiáng)大的解碼語(yǔ)言模型。

IT之家了解到,作為 Turing NLG 17B 和 Megatron-LM 的繼任者,這個(gè)模型包括 5300 億個(gè)參數(shù),而且 MT-NLG 的參數(shù)數(shù)量是同類現(xiàn)有最大模型 GPT-3 的 3 倍,并在一系列廣泛的自然語(yǔ)言任務(wù)中展示了無(wú)與倫比的準(zhǔn)確性,例如:

完成預(yù)測(cè)

閱讀理解

常識(shí)推理

自然語(yǔ)言推理

詞義消歧

105 層、基于轉(zhuǎn)換器的 MT-NLG 在零、單和少樣本設(shè)置中改進(jìn)了先前最先進(jìn)的模型,并為兩個(gè)模型規(guī)模的大規(guī)模語(yǔ)言模型設(shè)定了新標(biāo)準(zhǔn)和質(zhì)量。

據(jù)悉,模型訓(xùn)練是在基于 NVIDIA DGX SuperPOD 的 Selene 超級(jí)計(jì)算機(jī)上以混合精度完成的,該超級(jí)計(jì)算機(jī)由 560 個(gè) DGX A100 服務(wù)器提供支持,這些服務(wù)器以完整的胖樹(shù)(FatTree)配置與 HDR InfiniBand 聯(lián)網(wǎng)。每個(gè) DGX A100 有 8 個(gè) NVIDIA A100 80GB Tensor Core GPU,通過(guò) NVLink 和 NVSwitch 相互完全連接。微軟 Azure NDv4 云超級(jí)計(jì)算機(jī)使用了類似的參考架構(gòu)。

關(guān)鍵詞: 訓(xùn)練 最大 最強(qiáng)

推薦內(nèi)容

熱點(diǎn)
39熱文一周熱點(diǎn)
枣阳市| 黎川县| 巧家县| 怀仁县| 平顶山市| 阿拉善左旗| 赣榆县| 临安市| 武夷山市| 安乡县| 舞钢市| 福贡县| 定西市| 泾川县| 扶风县| 金阳县| 弥渡县| 珠海市| 金溪县| 彰武县| 西盟| 左贡县| 罗江县| 惠安县| 固阳县| 钦州市| 南开区| 仁寿县| 云龙县| 襄汾县| 定陶县| 黔江区| 洪雅县| 尚志市| 岫岩| 普定县| 潼南县| 迁西县| 乌审旗| 靖西县| 永新县|