Hai Robotics
员工人数:1K-5K 行业分类:自动化机械制造
工作职责
JD-1:智能决策算法实习(运筹+RL 方向)
base:深圳
实习期:≥3 个月,每周 ≥4 天,可转正
岗位职责
1. 参与调度方案的算法设计,用 RL+OR 方法解决真实场景下的需求预测、时空资源管理协调问题。
2. 参与 RL 实验平台搭建:仿真环境改造(新增动态因素、随机事件)、Embedding 网络设计、Reward 塑形、对比 DQN/DDPG/A2C/PPO 等算法效果。
3. 与工程团队对接,将训练好的模型封装成可热更新的服务,跟进 A/B 实验、指标回收与模型迭代。
任职资格
任职要求
1. 熟练使用 Python,扎实的数据结构与算法基础。
2. 至少熟悉一种深度学习框架(PyTorch/TensorFlow/JAX),能独立实现 RL paper 复现。
3. 对运筹优化或强化学习有项目/科研经验(如 VRP、TSP、Job-Shop、MARL 等)。
4. 习惯用 AI 工具提效:Copilot/Cursor、ChatGPT、Claude 等,相信 10× Engineer 理念。
5. 快速阅读英文 paper、写技术文档不怵,github 有 RL/OR 相关 repo 加分。
收藏


