運(yùn)維工程師
3-5.5萬元/月崗位職責(zé)
●Kubernetes運(yùn)維–設(shè)計(jì)、運(yùn)行并優(yōu)化AWS、GoogleCloud以及本地多集群的大規(guī)模
Kubernetes環(huán)境;根據(jù)需要擴(kuò)展至Azure或OracleCloud。
●InfrastructureasCode–使用Terraform/Pulumi管理全部基礎(chǔ)設(shè)施,遵循GitOps工作
流。
●CI/CD–維護(hù)自動(dòng)化構(gòu)建與發(fā)布流水線,實(shí)現(xiàn)安全回滾。
●GPU集群管理–負(fù)責(zé)NVIDIA驅(qū)動(dòng)、MIG分區(qū)、自動(dòng)擴(kuò)縮容及固件更新;如有需要,支持
AMDGPU。
●可觀測性–運(yùn)營并擴(kuò)展Prometheus+Grafana,制定SLI/SLO,并自動(dòng)化容量監(jiān)控。
●事故響應(yīng)–參與值班輪值,主導(dǎo)事后復(fù)盤,持續(xù)完善運(yùn)行手冊。
●標(biāo)準(zhǔn)化與賦能–建立統(tǒng)一的SRE流程,向團(tuán)隊(duì)傳授最佳實(shí)踐。
任職要求
●精通Kubernetes內(nèi)核及大規(guī)模集群運(yùn)維,包含云端與本地部署。
●熟練掌握AWS和GoogleCloud;了解Azure或OracleCloud或Lambda、Nebius等
GPU云更佳。
●精通Terraform、GitOps工具(ArgoCD等)以及CI/CD流水線。
●深入理解Linux系統(tǒng)與網(wǎng)絡(luò)原理。
●具備NVIDIAGPU集群管理經(jīng)驗(yàn);熟悉AMD/ROCm體系者優(yōu)先。
●熟練使用Prometheus與Grafana棧并能應(yīng)對大規(guī)模場景。
●良好的中英文書面與口頭溝通能力,能適應(yīng)跨時(shí)區(qū)協(xié)作。

北京朝陽區(qū)CBD國際大廈
相關(guān)推薦查看更多 >
北京朝陽區(qū)網(wǎng)絡(luò)運(yùn)維工程師。25一35歲。住場單位。
5000-7000元/月現(xiàn)場需要拿mac地址,裝終端軟件帶電腦,帶U盤
面議朝陽區(qū)
相同職位推薦
企業(yè)招聘
職位大全
相關(guān)搜索