codecamp

字节跳动 具身智能推理性能优化工程师-Seed

  • 北京
  • 正式
  • 研发 - 后端
  • 职位 ID:A15783


职位描述

1、负责具身智能相关模型云侧和端侧模型的性能优化和部署; 

2、运用性能分析工具,对模型推理过程进行性能剖析,定位性能瓶颈,提出有效的优化方案,并通过实验验证优化效果; 

3、通过量化、剪枝、蒸馏、算子融合、Cuda算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致; 

4、与算法部门深度合作,进行算法与系统的联合优化。

职位要求

1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先; 

2、精通C/C++,精通算法与数据结构,熟悉Python; 

3、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架; 

4、熟练使用GPU或NPU高性能编程技术为模型训练或推理加速,例如:CUDA、CUDNN、CUTLASS、Triton等; 

5、具备以下一个或多个能力者优先: 

    1)具备自动驾驶或机器人业务背景,有NVIDIA Jetson开发经验; 

    2)熟悉大模型量化或蒸馏技术,例如:SmoothQuant、GPTQ、LCM、LCM-LoRA等; 

    3)熟练使用开源推理加速工具为模型加速,例如:TensorRT-LLM、vLLM、TVM、Torch.Compile等,并理解其优化原理。




字节跳动 大模型算法工程师-抖音(北京/上海/成都)
温馨提示
下载编程狮App,免费阅读超1000+编程语言教程
取消
确定
目录

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }