高德地图
员工人数:1000-9999人 行业分类:互联网
职位描述
这个世界的运行机制是否是可计算的?世界的复杂性是否唯有用AI的复杂性来应对?人类是否可以造出一台机器让未来就像过去一样历历在目?面对这些未知而又迷人的世界级难题,阿里巴巴旗下高德地图将组建一支卓越的AI队伍向世界模型发起冲击。在这里,你将获得无限制的算力,让想象力在算力的加持下尽情驰骋;在这里,你将和顶级的空间智能专家并肩作战,让专业与专注碰撞出世界模型最精彩的火花;在这里,你将接触到高德积累了20年的海量真实世界数据,让包罗万象的数据发挥它本来应有的价值。
一、团队介绍
我们是阿里巴巴旗下高德视觉技术中心的具身世界模型团队。这里有自由探索、开放交流的技术氛围,让每个有价值的idea都得到充分的展现和验证。这里有来自国内外顶尖院校毕业的研究员,知名AI项目/论文的作者可能就坐在你身边,让顶尖智力一起碰撞出最美妙的火花。我们是一支兼具学术界和产业界视角的团队,仰望星空,脚踏实地。
团队gihub主页:https://github.com/amap-cvlab
二、我们要去哪?
1、打造可交互、可控制、物理一致的世界模型,突破空间智能技术边界
2、通过世界模型加速物理智能体的进化
3、探索下一代时空基座模型
三、岗位职责:
1. 3D动/静态生产: 利用三维重建、生成模型、多模态大模型对单图、视频完成动态物体/静态场景重建、生成、编辑,并得到可交互的3D资产与长时序视频;
2. 结合3D表征的视频生成: 研发基于动作、轨迹等条件控制的视频生成算法,确保生成内容具备严格的3D几何一致性与物理规律遵循,实现对场景视角、物体交互的精细化控制,为具身智能体提供高保真的虚拟训练环境;
3. 空间推理: 赋予模型深度的三维空间理解与物理常识推理能力(如物体可供性、碰撞动力学、场景拓扑),使其能理解场景背后的物理因果,辅助下游的复杂决策与规划;
4. 训练闭环搭建: 构建“生成-仿真-评估-优化”的自动化数据闭环,利用生成数据扩充训练集(Data Augmentation),并通过端到端系统的反馈迭代优化世界模型,实现数据飞轮效应;
5. 世界模型构建: 结合具身智能、自动驾驶等数据探索空间智能的统一范式,完成环境感知、智能体预测、决策规划等任务并得到未来状态和未来传感器信息,为强化学习提供基座;
6. 产线落地与性能优化: 与具身智能、自动驾驶、智能导航等业务协同,完善仿真数据链路,优化模型推理效率与显存占用;
7. 前沿追踪: 跟踪学术界和工业界在生成式AI/世界模型相关领域的最新进展,保持公司在该领域的技术领先地位。
职位要求
1、计算机科学、人工智能、机器人、应用数学、自动化或相关专业硕士及以上学历(博士优先);
2、在生成式模型、3D视觉、具身智能或强化学习等领域有深入的研究背景,具备扎实的数理统计/数学物理/深度学习/机器学习基础;
3、核心算法领域(至少精通以下其中一项,熟悉多项):
a.视频/图像生成: 深入理解 Diffusion Model (DDPM, LDM, DiT), VAE, GAN 等生成模型原理;熟悉视频生成架构(如Sora类DiT架构、Video LDM、SVD)及可控生成技术(如ControlNet, Adapter)。
b.3D重建与生成: 精通 NeRF, 3D Gaussian Splatting (3DGS) 等神经渲染技术,或熟悉 Multi-view Stereo (MVS), Structure from Motion (SfM) 等传统三维视觉算法;了解 3D Mesh/Point Cloud 生成模型。
c.世界模型与RL: 熟悉基于模型的强化学习(Model-based RL),了解 World Models (如Dreamer系列, JEPA架构),理解状态空间模型(SSM/Mamba)在长序列预测中的应用。
d.VLM与空间推理:深入理解 CLIP, LLaVA, Qwen 等多模态模型;具备 3D Visual Grounding 能力,能实现语义到3D空间的对齐;熟悉基于 VLM 的空间推理与 CoT 任务规划。
4、精通 Python/C++ 编程,熟练掌握 PyTorch 等主流深度学习框架,具备优秀的工程实现能力和代码规范,有大规模分布式训练经验者优先;
5、工作年限: 1-3年相关领域算法研发经验;
6、有以下内容者优先:在顶级会议(如CVPR、ICCV、SIGGRAPH、NeurIPS、ICML、ICLR)发表过高质量论文;在 GitHub 上有高 Star 开源项目,或作为主要贡献者参与过知名开源社区(如 HuggingFace, OpenMMLab, Threestudio 等)的维护;在Waymo Open Dataset Challenge, CVPR Workshop 等相关国际竞赛中获得过 Top 名次;对Physical AI(物理AI)、Spatial Intelligence(空间智能)有独到见解,曾复现或改进过 DriveDreamer, UniSim, GAIA-1, Sora 等相关工作;
7、对AI充满探索欲和好奇心,感受过创造带来的快乐;励志成为硬核的技术专家,不满足于实现和改造,而是追求每一行代码的彻底理解;具备高度的自驱力和韧性。


