Minimax
员工人数:201-500 employees 行业分类:Software Development
职位描述
- 负责大规模离线数据仓库的模型设计,包括
ODS / DWD / DWS / ADS,保障数据一致性、完整性和可追溯性。 - 深入业务场景,作为业务数据 BP 承接指标口径、数据分析、专题取数、报表建设和数据问题排查等需求,推动数据资产沉淀,包括指标体系、主题域模型、数据质量规则、任务治理和复用型数据服务建设。
- 优化
Hive / Spark SQL任务,解决数据倾斜、资源竞争、任务延迟、产出不稳定等性能和稳定性问题。 - 参与实时数据流处理链路设计,基于
Flink / OLAP实现低延迟的数据清洗、聚合和实时指标计算。 - 结合 AI 实践数据开发、数据分析、口径查询、任务排障等环节的提效。
职位要求
- 具备至少1年数据BP开发经验,熟悉离线数仓建设方法论,精通阿里云dataworks体系或者大数据技术栈。
- 熟悉实时计算框架,如
Flink / Spark Streaming,并了解Kafka / RocketMQ等消息队列,对Hive / Spark离线任务调优有深入实践,包括动态分区裁剪、Join 策略选择、数据倾斜治理、资源参数调优等。 - 有较强的数据质量意识,能够建立数据校验、异常监控、链路追踪和问题复盘机制。
- 熟练使用AI,有agent实践,如规划、记忆、工具调用,或实际使用过 Agent / AI 工具辅助开发、分析、排障者优先。
- 熟悉
ClickHouse / Doris等 OLAP 引擎,有高性能查询、实时数仓或湖仓一体建设经验者优先。


