声明:本站部分公告与职位内容由本站根据官方招聘公告进行整理编辑。由于用人单位需求专业、学历学位、资格条件、职位编制、备注内容等内容情况复杂且有变化可能,是否符合招聘条件以用人单位公告为准或请联系用人单位确认。本站整理编辑的职位信息仅供求职者参考,如因此造成的损失本站不承担任何责任!
职位详情
基本信息
职位名称:集群调度系统研究员/研究工程师(上海)
工作地点:上海
招聘人数: 若干
报名方式:
其他
截止时间:详见正文
岗位职责
1. 领导万卡规模 AI Infra 集群调度系统的架构设计与研发,优化系统性能,为大规模训练和推理业务提供高效算力调度。2. 基于 Kubernetes 容器平台,设计并研发创新的任务控制器和调度器,实现分布式训练、高可用推理和混部编排调度,提升集群的容灾能力、资源的利用率和任务的执行效率。3. 负责容器运行时、高性能存储、异构芯片插件和高性能网络插件在 Kubernetes 架构中的适配、开发和优化,推动集群调度技术的前沿发展。
任职要求
1. 硕士及以上学历,计算机科学、机器学习、人工智能或相关领域2. 具有 1 年以上在 Kubernetes 容器平台或高性能集群研发领域的工作经验,有***学术会议或期刊成果发表3. 熟练掌握至少一门编程语言如 Golang/Python/C++/C,具备独立承担复杂系统开发的能力4. 深入理解 Docker/Containerd、Kubernetes 及其生态系统,熟悉 Kubeflow, Volcano 等周边组件。5. 熟练掌握系统可观测性工具(如 Grafana、Prometheus),对建立高可靠性系统有深刻见解。6. 具有出色的责任心、团队领导力、沟通协作能力和自驱学习能力
您与该职位匹配度: ***,已超过了 *** 的竞争者,建议************
您在 ?位置
欢迎扫描下方二维码关注高校人才网官方微信(硕博QQ交流群:247884325 ,进微信群请加:gzgxrcw06)
重要风险提示:如招聘单位在招聘过程中向求职者提出收取押金、保证金、体检费、材料费、成本费,或指定医院体检等,求职者有权要求招聘单位出具物价部门批准的收费许可证明材料,若无法提供相关证明,请求职者提高警惕,有可能属于诈骗或违规行为。