職位描述

職責描述:
-建設業(yè)界出眾的ai異構(gòu)算力容器平臺,提供高性能、高穩(wěn)定性、高易用性的百舸產(chǎn)品,支持智駕、aigc、金融能源、智算中心客戶ai應用高效部署
-負責云原生ai容器相關產(chǎn)品的架構(gòu)設計和產(chǎn)品研發(fā),引入開源社區(qū)先進的ai框架、ai調(diào)度、ai工作流和ai可觀測能力組件構(gòu)建全棧ai應用云原生解決方案
-構(gòu)建異構(gòu)多元芯算力底座,支持國產(chǎn)化信創(chuàng),支持gpu虛擬化和混部調(diào)度,提升ai應用資源效率
-無縫對接客戶和云上ai開發(fā)平臺,支持文心和開源大模型訓練推理任務部署,提供訓練容錯和彈性伸縮能力
-對接客戶基礎設施環(huán)境構(gòu)建異構(gòu)算力平臺解決方案,支持大模型訓練/推理tob交付
-探索業(yè)界最新技術方向,參與開源社區(qū),提升百度云原生ai核心競爭力
任職要求:
-本科及以上學歷,有一定程度的計算機相關專業(yè)知識背景
-優(yōu)秀的編碼能力,熟悉golang/python/java/c/c++至少一項,有扎實的算法及數(shù)據(jù)結(jié)構(gòu)基礎,有良好的編程習慣
-精通kubernetes基本工作原理,了解調(diào)度器、device-plugin、容器運行時運行機制、容器網(wǎng)絡、rdma通信;有kubeflow、volcano等相關開發(fā)經(jīng)驗優(yōu)先
-熟悉開源大模型glm/llama/gpt3優(yōu)先,熟悉tensorflow/caffe/pytorch框架者優(yōu)先,有大規(guī)模訓練實踐經(jīng)驗者優(yōu)先
-對異構(gòu)芯片虛擬化、cuda編程、rdma有一定了解者優(yōu)先
-優(yōu)秀的團隊協(xié)作能力;具備較強的ownership,以結(jié)果為導向,負責領域內(nèi)善于思考并積極改進
工作地點
地址:荊州


職位發(fā)布者
HR
百度在線網(wǎng)絡技術(北京)有限公司


-
互聯(lián)網(wǎng)·電子商務
-
1000人以上
-
私營·民營企業(yè)
-
北京海淀區(qū)上地十街10號百度大廈