数据集可以看做是一个数据的集合,它可以是一张数据表,也客户是一个sql语句查询出来的结果,也可以是Excel文件构成的数据。
多个数据集可以进行联合查询,构成一个新的数据集。同一个数据集也可以进行聚合操作,形成一个新的数据集。
一个数据集,往往包含下面3部分内容:
元数据----也就是怎么定义这个数据集字段----这个数据集包含哪些字段,有些字段的基础字段,有些字段可以是根据基础字段派生的衍生字段指标----指标往往是进行聚合计算后的结果,定义指标的计算方法,可以根据最终的情况构造sql语句。
一、数据集
数据集需要有以下一些属性:
数据集ID数据集名称数据集类型---包括sql查询,文件上传、数据连接、多表联合、数据聚合,数据合并