XPENG(中国)
员工人数:1K-5K 行业分类:机动车制造
AI Infra 模型部署实习生
北京实习互联网 / 电子 / 网游通用智能板块
职位描述
参与公司 AI 基础设施的建设,重点围绕模型部署流程的效率优化。通过工程化手段、智能体(Agent)与自动化工具链,减少人工介入,缩短模型从训练完成到上线的周期,提高部署的可靠性与效率。
岗位职责
模型部署流程的效率优化
- 深度参与现有模型部署,分析各个阶段(模型转换、模型验证、上线等)的耗时与瓶颈,提出并实现改进方案。
- 设计并构建基于 Agent + Skill 的模型验证与发布助手:将模型格式检查、精度校验、性能基准测试等能力封装为可复用的 Skill;通过 Agent 调度这些 Skill,实现部署任务的自动化。
- 设计模型验证等工具,提升多版本或高频部署场景下的效率。
可观测性与问题排查
- 收集并分析部署全流程的日志、耗时、资源占用等数据,建立部署任务的监控看板,展示部署耗时、成功率、资源消耗等关键指标。
- 开发基于 Agent 的故障诊断 Skill:自动识别部署失败常见原因。
- 协助构建部署任务的监控看板,展示部署耗时、成功率、资源消耗等关键指标。
基础设施与工具链建设
- 参与部署平台的设计与开发,推动模型部署从“脚本化”向“服务化+智能化”演进。
- 建设 Agent 与 Skill 的统一管理、调度与观测体系,提升 AI 基础设施的自动化水平。
任职要求
基本要求
- 本科或硕士/博士在读,计算机相关专业,能连续实习 3 个月以上。
- 熟练掌握 Python,有良好的工程代码习惯。
- 了解至少一种深度学习框架(PyTorch / TensorFlow)的基本使用。
- 对模型部署基础概念有认知:例如 ONNX、TensorRT、Docker 中的至少一项。
- 具备脚本开发和问题定位能力,能够独立写小工具提升工作效率。
加分项
- 理解 Agent 基本架构(规划、记忆、工具调用),有 LangChain、LangGraph、Semantic Kernel 或类似框架的实际使用经验。
职位要求
--


