岗位职责
1. 负责大模型推理框架、配套软件栈及SDK的设计、开发与维护,完成各类算子编码、内存管理、任务调度等核心模块开发。
2. 结合公司自研芯片与服务器硬件,完成主流大模型的移植、适配、部署工作,开展量化、稀疏化、剪枝等模型优化,持续提升推理吞吐、降低响应时延。
3. 参与大模型定制化研制与迭代,根据业务及硬件特性对模型结构、运行逻辑进行改造优化,支撑模型高效运行。
4. 分析推理系统运行瓶颈,定位并解决软硬件联调、并发调度、兼容性、稳定性等各类问题,保障线上服务稳定运转。
5. 跟踪大模型推理、异构计算、高性能计算等前沿技术,完成技术调研、方案验证与落地;编写相关技术文档、接口规范及使用手册。
6. 配合算法、硬件、测试等跨部门团队完成联调、测试与交付工作。
任职要求
1. 本科及以上学历,计算机、人工智能、软件工程、电子信息等相关专业。
2. 熟练掌握 C++、Python 编程语言,具备扎实的数据结构、算法基础,熟悉 Linux 开发环境。
3. 了解大模型基本架构与推理流程,熟悉主流AI推理框架,有实际项目开发经验者优先。
4. 掌握多线程、并发编程、计算机体系架构等知识,具备算子开发、模型推理调优经验。
5. 具备良好的问题分析、故障排查能力,逻辑清晰,沟通协作能力强,拥有较强的自主学习能力。
企业招聘登记&简历投递请登录:www.qiankunlt.com
平台质保,招聘靠谱,1天内快速响应推荐人选,1周可关闭职位完成交付,200万高端人才数据库,20年猎头服务,覆盖全国超110座城市。
更多上海猎头职位资讯,请关注乾坤猎头公司:qiankunlt