邀请应聘

我的投递

我的收藏

猎聘APP

投诉建议

大模型GPU推理加速工程师 80-110k·16薪
上海-徐汇区 3-5年 硕士
收藏
avator
于女士 4小时前在线 已认证
聊一聊
职位介绍
岗位职责 1.负责大模型推理加速,提升大模型推理速度和并发,降低服务器成本 2. 进行大模型国产服务器适配,包括国产服务器训练和推理优化 3.参与基于GPU的高性能计算(HPC)项目设计与开发,负责GPU芯片(NVIDIA/AMD等)的底层性能优化与调优。 4.熟悉vLLM、SGLang等大模型推理框架。 5.熟悉DeepSeek系列模型的工程优化技术,包括但不限于PD分离、MLA、MOE负载均衡、MTP等 任职要求 1.有不错的编码能力,熟悉 Linux 开发环境,熟悉Python或C++语言。 2.对深度学习技术有较好了解,熟悉常用深度学习框架pytorch,并有实际项目应用经验。 3.熟悉大模型训练和微调算法 4.熟悉cuda编程或者华为昇腾显卡编程, 有相关经验者优先
其他信息
行业要求:人工智能

猎聘温馨提示:

1. 如您发现平台内招聘方存在以下违规行为的,请立即举报
  • a. 扣押您的身份证件或者其他证件;
  • b. 要求您提供担保人、担保金或者以其他名义向您收取财物( 如培训费、体检费、资料费、置装费、押金等);
  • c. 强迫您入股或者向您集资;
  • d. 以招聘名义牟取不正当利益;
  • e. 发布虚假招聘广告信息;
  • f. 工作时长违反劳动法规定;
  • g. 存在其他损害您的合法权益的行为。
2. 如您应聘的岗位属于涉外劳务合作/海外岗位的,请务必核实招聘方对外劳务合作资质取得情况,同时注意自身资金安全,防范招聘欺诈。
查看全部

职场助手

猜你喜欢

大数据开发工程师
上海
15-30k
某上海大型电子/半导体/集成电路公司
电子/半导体/集成电路 融资未公开 10000人以上
李先生
实习生
大数据存储研发高级专家
上海
70-100k·14薪
某上海大型互联网公司
互联网 D轮及以上 1000-2000人
张先生
猎头顾问
1 2 3 4
热门
  • 中国内地(大陆)+86
  • 中国香港+852
  • 中国澳门+853
  • 中国台湾+886
  • 美国+1
  • 加拿大+1
  • 新加坡+65
  • 澳大利亚+61
  • 英国+44
  • 马来西亚+60
  • 韩国+82
  • 法国+33
  • 新西兰+64
  • 德国+49
  • 日本+81
  • 西班牙+34
  • 意大利+39