一、数据部分
1、存储规模有多大
2、有哪些数据类型,多种数据类型需要什么技术来处理
3、数据源是否可以获得
4、数据源的质量如何
二、业务特征
1、以实时处理为主还是批处理为主
2、存储密集型还是计算密集型
三、运维需求
1、设备的安装、维护、管理
2、如何进行快速扩容
3、作业之间是否资源隔离
4、安全性的处理规则,是否独立处理
5、单集群还是多集群部署
6、对各个组件的选择
7、容灾的需求
四、项目约束
1、团队规模
2、可使用资源
3、需满足哪些标准与规范