工作职责:
1. 深度参与大型语言模型与多模态大模型的应用开发,主导AI模型优化及智能Agent工作流等核心模块的架构设计与实现;
2. 负责大模型推理性能优化(量化/蒸馏/KV Cache 等)及高性能部署,设计并落地高可用、可弹性扩展的模型服务化架构;
3. 针对具体产品需求,按时设计与实现算法功能模块,确保技术方案的高效执行与落地;
4. 在项目实施全周期中,主动跟踪、排查并解决产品遇到的技术难题,保障项目顺利推进;
5. 持续关注大模型领域最新进展,探索并推动前沿技术在实际场景中的应用与创新。
任职资格:
1. 硕士及以上学历,3年以上相关工作经验,具备计算机、人工智能、数学等相关专业背景;
2. 掌握坚实的自然语言处理基础理论与机器学习算法,能在智能审核,知识图谱,Agent工作流等一个或多个领域独立开展研发工作;
3. 深入理解Transformer 架构与主流大模型架构原理与训练流程,具备模型微调实战经验者优先;
4. 精通python语言,熟练使用 PyTorch 及 Hugging Face 生态,熟悉GPU集群调度与分布式训练等,具备良好的代码规范与工程化意识;
5. 具备良好的沟通能力、团队合作精神和较强的学习能力。