- 全部類別
- 第01類
- 第02類
- 第03類
- 第04類
- 第05類
- 第06類
- 第07類
- 第08類
- 第09類
- 第10類
- 第11類
- 第12類
- 第13類
- 第14類
- 第15類
- 第16類
- 第17類
- 第18類
- 第19類
- 第20類
- 第21類
- 第22類
- 第23類
- 第24類
- 第25類
- 第26類
- 第27類
- 第28類
- 第29類
- 第30類
- 第31類
- 第32類
- 第33類
- 第34類
- 第35類
- 第36類
- 第37類
- 第38類
- 第39類
- 第40類
- 第41類
- 第42類
- 第43類
- 第44類
- 第45類
發(fā)布時間:2020-12-16 14:27:37
微軟已經為深度學習優(yōu)化庫 DeepSpeed 申請了商標保護。該商標于2020年12月8日提交,其中提到“為人工智能處理和深度學習提供臨時使用的在線不可下載的計算機軟件”,這表明微軟可能在考慮通過在線云服務提供 DeepSpeed。
該庫于今年 2 月發(fā)布,可以在適度的硬件上訓練大規(guī)模的人工智能模型。它只需要使用 800 塊 Nvidia V100 顯卡就可以創(chuàng)建具有萬億參數的深度學習模型,是目前世界上最大的模型的 5 倍多。如果沒有DeepSpeed,同樣的任務需要 4000 塊 Nvidia A100(性能比 V100 快2.5倍),而且事件縮短了 100 多天。
在 GPT-3 顯示模型在神經網和數據集越大的情況下繼續(xù)改進后,這個工具特別有用。然而,這確實有可能將最新的創(chuàng)新推到資源較少的小型團隊的范圍之外,但DeepSpeed已經允許這些團隊以最小的硬件與更大的服務競爭。轉移到云處理可能會使大型模型AI訓練更容易獲得。