阿里云機(jī)器學(xué)習(xí)PAI發(fā)布基于HLO的全自動(dòng)分布式系統(tǒng) TePDist，并宣布開源！

2023-04-24 11:25:25來源：實(shí)況網(wǎng)

近日，阿里云機(jī)器學(xué)習(xí)平臺(tái)PAI正式發(fā)布自研的基于HLO的全自動(dòng)分布式深度學(xué)習(xí)系統(tǒng) TePDist。它通過在HLO上做分布式策略搜索，能夠與用戶模型構(gòu)建語言解耦。并且在保持通用性的同時(shí)，能夠在可接受的策略搜索時(shí)間內(nèi)，追求高性能分布式策略，同時(shí)用戶無需修改模型主體代碼，系統(tǒng)能夠全自動(dòng)地幫助用戶做分布式擴(kuò)展，有效解決了分布式框架長期以來在實(shí)際生產(chǎn)場景中手工優(yōu)化和自動(dòng)分布式工作存在的諸多性能和效率問題。

TePDist不僅僅是一個(gè)分布式Compiler，還擁有自己的分布式Runtime，以解決深度學(xué)習(xí)模型并行策略的自動(dòng)搜索與分布式策略實(shí)施問題。在架構(gòu)方面，TePDist采用Client/Server模式，實(shí)現(xiàn)分布式策略與模型描述的解耦。Server端是TePDist最重要部分，以HLO IR作為輸入，自動(dòng)探索并實(shí)施分布式并行策略；Client端以用戶描述的模型為輸入，將其轉(zhuǎn)換成HLO IR。因此，任何具有轉(zhuǎn)換HLO IR能力的Client，都可經(jīng)過適配后接入Server端。

在功能方面，TePDist分為兩個(gè)部分。一是在HLO IR上進(jìn)行SPMD（Data Parallel和Sharding）和Pipeline并行的策略搜索。并以此構(gòu)建編譯基于Task Graph的執(zhí)行計(jì)劃。二是高效運(yùn)行執(zhí)行計(jì)劃的分布式執(zhí)行引擎。同時(shí)，TePDist提供了不同優(yōu)化級(jí)別，高優(yōu)化級(jí)別更加追求分布式策略質(zhì)量，低優(yōu)化級(jí)別會(huì)額外采取一些Heuristic，以較為微小策略質(zhì)量犧牲，換取更快地搜索時(shí)間，以此滿足落地需求。

性能上，TePDist通過在GPT和MoE模型上SPMD+Pipeline混合策略的模型擴(kuò)展性實(shí)驗(yàn)，TePDist能夠使GPT和MoE分別達(dá)到峰值能力的62%和58%。同時(shí)，在自動(dòng)化方面的通用性上，TePDist也通過了VGG-19，DNABert和UNet等模型實(shí)驗(yàn)驗(yàn)證。

一直以來，大模型在模型效果上被證明具有顯著優(yōu)勢。而ChatGPT的出現(xiàn)，證明了其在工業(yè)生產(chǎn)工具方面具有巨大潛力。阿里云機(jī)器學(xué)習(xí)平臺(tái)PAI也宣布將TePDist開源，與AI開發(fā)者共同打造更快更好的自動(dòng)分布式系統(tǒng)，全面助力AI大模型發(fā)展！

開源地址：https://github.com/alibaba/TePDist

開源釘群：

免責(zé)聲明：市場有風(fēng)險(xiǎn)，選擇需謹(jǐn)慎！此文僅供參考，不作買賣依據(jù)。

關(guān)鍵詞：

亚洲爱av在线电影,台湾妹子娱乐中文网,探花久久久久,日本久久无毛影院,伊人成人娱乐网,色情视频亚洲天堂,中文无码不卡视频,少妇高潮久久久,久久激情精品

阿里云機(jī)器學(xué)習(xí)PAI發(fā)布基于HLO的全自動(dòng)分布式系統(tǒng) TePDist，并宣布開源！

推薦內(nèi)容