精品一区二区三区在线成人,欧美精产国品一二三区,Ji大巴进入女人66h,亚洲春色在线视频

字節(jié)跳動開源大模型訓(xùn)練框架veGiantModel ,性能最高提升6.9倍

新聞 自然語言處理
自然語言處理是人工智能研究的一個重要領(lǐng)域,旨在幫助計算機理解、解釋和運用人類語言。

近日,字節(jié)跳動應(yīng)用機器學(xué)習(xí)團隊開源了一款名為 veGiantModel 的大模型訓(xùn)練框架,該訓(xùn)練框架主要應(yīng)用于自然語言處理領(lǐng)域的大模型訓(xùn)練,最高可將大模型訓(xùn)練的性能提升6.9倍,大幅降低訓(xùn)練系統(tǒng)的壓力。目前,字節(jié)跳動旗下的企業(yè)級技術(shù)服務(wù)平臺火山引擎已在其機器學(xué)習(xí)平臺上原生支持了 veGiantModel,該平臺正在公測中 。

自然語言處理是人工智能研究的一個重要領(lǐng)域,旨在幫助計算機理解、解釋和運用人類語言。近些年,自然語言處理在應(yīng)用方面取得了較為顯著的突破,主要是歸功于 Bert、GPT、GPT-3 等預(yù)訓(xùn)練語言模型的普及。可以說,預(yù)訓(xùn)練語言模型已經(jīng)成為人工智能領(lǐng)域的基礎(chǔ)設(shè)施。由于大模型的算法表現(xiàn)更加出眾,預(yù)訓(xùn)練語言模型在近幾年呈現(xiàn)出迅速向大模型發(fā)展的趨勢。然而,模型體積的快速增長也對現(xiàn)有的訓(xùn)練系統(tǒng)帶來了不小的挑戰(zhàn),主要體現(xiàn)為顯存壓力、計算壓力和通信壓力。

針對現(xiàn)有訓(xùn)練系統(tǒng)在大模型訓(xùn)練場景下的上述挑戰(zhàn), 字節(jié)跳動應(yīng)用機器學(xué)習(xí)團隊提出了大模型訓(xùn)練框架 veGiantModel。

veGiantModel的中文名稱叫做火山引擎大模型訓(xùn)練框架,是基于開源深度學(xué)習(xí)框架 PyTorch 、并在 Megatron 和 DeepSpeed 兩大開源主流訓(xùn)練框架的基礎(chǔ)之上構(gòu)建的高性能大模型訓(xùn)練框架。

veGiantModel 可同時支持數(shù)據(jù)并行、算子切分、流水線并行 3 種分布式并行策略,并支持自動化和定制化的并行策略;基于字節(jié)自研的高性能異步通訊庫 ByteCCL,veGiantModel 的訓(xùn)練任務(wù)吞吐相比其他主流開源框架有 1.2 倍到 3.5倍的提升,并且提供了更友好、靈活的流水線支持,降低了模型開發(fā)迭代所需要的人力;另外,veGiantModel 可在 GPU 上高效地支持數(shù)十億至上千億參數(shù)量的大模型,對網(wǎng)絡(luò)帶寬要求也更低,在私有化部署時無 RDMA 強依賴。

與 Megtraon 和 DeepSpeed 的對比測試顯示,veGiantModel 的性能表現(xiàn)最好、受網(wǎng)絡(luò)帶寬影響最小,在Tesla V100上較上述兩者有1.2 倍到3.5倍的提升,在 Ampere A100上最高可提升6.9倍。


veGiantModel開源 地址:

????https://github.com/volcengine/veGiantModel????

火山引擎機器學(xué)習(xí)平臺 公測地址:

??https://www.volcengine.com/product/ml-platform??


責任編輯:黃顯東 來源: 51CTO
相關(guān)推薦

2022-03-21 15:06:10

模型字節(jié)跳動框架

2022-04-26 15:09:14

優(yōu)化模型訓(xùn)練

2024-11-02 10:28:03

2021-09-17 13:05:55

模型人工智能框架

2022-07-18 17:37:27

字節(jié)跳動人工智能AI模型

2024-11-01 20:25:28

2024-08-01 08:40:00

2022-10-31 15:35:16

開源引擎

2023-04-19 16:51:54

分布式Primus開源

2024-09-27 10:31:22

2024-11-01 13:30:56

2022-06-22 06:49:39

Hertz開源HTTP 框架

2023-04-14 14:42:07

騰訊人工智能

2022-05-11 14:45:48

模型人工智能

2025-02-19 15:17:24

2022-08-25 18:48:29

字節(jié)跳動CSS開源

2024-08-15 15:44:00

2023-09-12 13:43:00

智能技術(shù)

2024-08-08 17:48:56

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 阳朔县| 阿尔山市| 彭水| 灯塔市| 阿鲁科尔沁旗| 岳西县| 东城区| 北票市| 根河市| 景东| 稷山县| 新兴县| 吉林省| 鄂伦春自治旗| 运城市| 宝坻区| 汉源县| 静海县| 玉山县| 东城区| 屏南县| 湖州市| 科技| 虹口区| 济源市| 仲巴县| 固阳县| 太湖县| 临清市| 曲水县| 大埔县| 永兴县| 会同县| 开远市| 彭山县| 南城县| 石首市| 马公市| 海丰县| 武安市| 北安市|