青云 AI 智算平臺
算力中心建設的新模式,像管理本地資源一樣管理 AI 基礎設施,對 AI 算力進行動態監控調整,以滿足不同業務的需求,提高 AI 算力的整體使用效率和管理效率。

面臨的挑戰

多元資源統一平臺管理瓶頸

GPU 算力、高性能計算(HPC)算力、多存儲系統、模型資源以及數據資源的管理極具挑戰性

高速網絡瓶頸

面對數百甚至數千張 GPU 卡的同時運行,網絡帶寬的性能問題逐漸浮現,成為阻礙計算效率的一大難題

環境搭建繁瑣

在處理大型語言模型、影視渲染、圖片處理、藥物研發等任務時,環境搭建的復雜性往往令人望而卻步,需要投入大量的時間和精力

多業務整合瓶頸

在跨平臺應用場景下,如 AI 推理平臺、AI 訓練平臺、科學計算平臺、容器計算平臺難以整合

缺乏運營服務

在面向多租戶的運營服務方面存在缺失,導致無法實現從計量、計費到客戶服務的全業務運營流程,這無疑對業務的發展帶來了阻礙

產品優勢

多元算力統一調度

AI 智算平臺能夠對多元算力進行統一調度管理,包括 AI 計算多樣顯卡、高速計算網路 InfiniBand 以及 RoCE、本地 NVME 與并行文件存儲支持,實現算力資源按應用、按需求隨時匹配,自動切換

智能化算力調度與管理

AI 智算平臺具備分布式調度與管理能力,能夠自動分配和管理算力資源,大幅縮短任務執行時間,提高工作效率。這使得用戶能夠更加專注于業務創新和應用開發。

國產芯片異構支持

AI 智算平臺能夠統一納管多種異構服務器、存儲、安全等設備,提供多廠商的 GPU 統一管理分發,為上層不同的應用提供蓬勃算力。

智簡運營 精細運維

通過統一平臺實現資源規范化、可視化管理及高效運維,助力精確資源分配與標準化服務運營,并通過多維監控提升算力效率。

智能生態支撐應用

AI 智算平臺提供開放的應用框架和模型服務,提供豐富的 AI 計算環境、集成行業內多家廠商生態應用,打造豐富的 SaaS 應用服務,助力用戶全場景的 AI 業務實現落地。

產品架構

AI 智算平臺是一款具備統一算力管理、多種 AIGC 模型一站式交付以及支持多種應用模式的強大算力產品,旨在提高資源利用率,簡化部署流程,滿足各類復雜任務需求。

產品能力

多區多業務資源整合
整合不同區域、業務、部門的 IT 資源,實現資源的高效利用和跨區域的靈活部署,提高了算力利用率和業務靈活性
分布式調度與管理
可自動分配和管理算力資源,優化算法和任務的調度效率,提高工作效率和任務完成率
多樣異構算力支持
統一管理 NVIDIA GPU 及多類型 GPU、NPU 等資源,構建可靈活調度的算力池,滿足業務需求。支持多樣交付方案及 GPU 虛擬化技術,適應各類計算場景。
混合組網
靈活部署多種網絡架構和拓撲結構,提供穩定可靠的網絡環境,保障數據傳輸和任務運行的穩定性
一站式 AI 計算全流程服務
提供算法開發到模型部署全流程服務支持,內置常用工具鏡像,集成主流深度學習框架及自定義鏡像倉庫
模型倉庫能力
提供模型倉庫(MaaS)和多種 AI 大模型一鍵部署交付,簡化模型的管理和部署流程,提高模型應用的便捷性和效率

合作生態

案例實踐

助力濟南超算中心打造山河云服務模式

基于青云 AI 智算平臺,濟南超算中心實現算力的統一調度與運營,打造超算云服務模式。提高超算中心自身資源的利用率和運行效率,為超算中心用戶提供更靈活和高效的計算服務。

国产精品成人麻豆专区