云端AI算法应用工程师 30-50k·15薪
南京-雨花台区 3-5年 硕士
收藏
年终奖金 五险一金 通讯津贴 餐费补贴 领导好 发展空间大 扁平管理 弹性工作 休闲餐点
avator
高女士 4天前在线 已认证
聊一聊
职位介绍
职位概览: 我们正在寻找一位充满激情的云端算法部署工程师,致力于优化和加速算法模型的云端部署,以满足公司日益增长的规模化需求。你将加入一个创新的团队,负责构建高效、低成本的模型部署平台,确保我们的业务能够以高吞吐量和高可用性运行,应对海量数据挑战。 主要职责: 1.模型部署与编排:主导各类深度学习模型的部署工作,支持多模态模型的自由编排与应用,运用前沿技术确保模型在云平台等生产环境中的高效运行 2.服务接入与性能调优:利用Kubernetes等技术开展服务端集群管理,实施负载均衡、批处理、缓存加速等策略,持续优化服务响应时间,提升用户体验。 3.推理加速:结合云端GPU性能,探索半精度(FP16)和整数精度(INT8)的部署策略,实现模型推理的加速。 4.性能瓶颈分析:深入剖析模型如Stable Diffusion、Transformer等的耗时分布,识别并解决pipeline中的性能瓶颈。 5.推理引擎优化:专注于推理引擎如vLLM、TensorRTLLM的适配与优化,包括多步推理、并行计算、attention机制加速及算子融合等,以提升整体推理效率。 6.云端集群调度与优化:负责算法集群的调度与优化工作,确保资源的高效利用和任务的高效执行。 资格要求: 1.学术背景:持有计算机科学或相关领域的研究生学位,具备深厚的理论知识和研究经历。 2.精湛的编程技能:熟练掌握C++与Python,有使用CUDA开发高效层的实践经验者优先。 3.深度学习框架精通:对TensorFlow、PyTorch、ONNX、TensorRT等主流框架的训练与部署有深刻理解,使用过Triton的优先考虑。 4.广泛的技术视野:熟悉常见神经网络架构与训练任务,具备跨领域知识整合能力。 5.分布式系统实战经验:对大规模分布式系统设计有浓厚兴趣,拥有Kubernetes/Docker等容器化技术的实际项目经验,能够应对复杂系统挑战。 6.云端运维经验:了解并掌握云端运维相关工作,确保云端系统的稳定运行。 我们期待你的加入共同推动AI技术在现实世界中的广泛应用,创造更加智能化的未来。如果你对构建高性能、高可用的AI推理系统充满热情,欢迎投递简历,开启你的职业生涯新篇章!
其他信息
行业要求:全部行业

公司简介

深圳比特微电子科技有限公司(中文简称“比特微”,英文简称“MicroBT”)成立于2016 年, 总部位于深圳,在北京、上海、杭州、成都、 南京、苏州、西安等地设有研发中心,是一家 拥有28nm/16nm/8nm/5nm专用芯片设计和产品研发、营销、服务以及提供系统解决方 案的国家高新技术企业。 公司拥有完整的设计流程和大量自主核心技术,凭借雄厚的技术研发实力,持续在低功耗、高算力芯片和人工智能芯片及相关产品领域创新、创造。 公司秉承“极致、共赢、诚信”的理念,积极拥抱半导体产业、人工智能产业,极致追求,开拓创新,致力于成为领先的芯片、产品和解决方案的行业引领者。
查看全部

猎聘温馨提示:

1. 如您发现平台内招聘方存在以下违规行为的,请立即举报
  • a. 扣押您的身份证件或者其他证件;
  • b. 要求您提供担保人、担保金或者以其他名义向您收取财物( 如培训费、体检费、资料费、置装费、押金等);
  • c. 强迫您入股或者向您集资;
  • d. 以招聘名义牟取不正当利益;
  • e. 发布虚假招聘广告信息;
  • f. 工作时长违反劳动法规定;
  • g. 存在其他损害您的合法权益的行为。
2. 如您应聘的岗位属于涉外劳务合作/海外岗位的,请务必核实招聘方对外劳务合作资质取得情况,同时注意自身资金安全,防范招聘欺诈。
查看全部

猜你喜欢

鲁女士
猎头顾问
1 2 3 4