職位描述

職位描述
基于NPU平臺,開發高性能計算庫,支撐CV,NLP,大模型等模型運行,包括:
1.完成高性能算子的需求分析與分解,滿足NPU的各種應用場景;
2.與芯片/架構團隊緊密配合,持續優化算子性能,逐步完善軟硬件架構;
3.完成各類算子的軟件方案設計及開發;
4.分析算子/網絡的性能瓶頸,提出性能優化策略,達成性能目標;
職位要求
1.圖像處理、模式識別、機器學習等相關專業碩士及以上學歷;
2.精通C /Python軟件編程語言;
3.熟悉Onnx/TensorFLow/Pytorch一種主流神經網絡框架,熟悉各類算子;
4.熟悉并行/異構計算體系結構,在TPU/NPU/GPU一種平臺有2年以上的開發和優化經驗;
5.具備業界常用高性能庫(TensorRT/cuDNN/CUDA/OPENCV)開發和性能優化經驗者優先;
6.熟悉指令流水,計算機體系結構;
7.良好的團隊溝通能力、技術攻關能力,責任心強,具備一定抗壓能力。
工作地點
地址:北京海淀區北京-海淀區海淀區


職位發布者
HR
小米科技有限責任公司


-
通信/電信/網絡設備/增值服務
-
1000人以上
-
私營·民營企業
-
北京市海淀區清河中街68號華潤五彩城寫字樓