VectorAssembler
VectorAssembler是一个Transformer,用来将数据集中多个属性按次序组合成一个类型为向量vector的属性,以便后续其他适用于向量数据的算法(逻辑回归,决策树,主成分等等)使用。被组合的属性类型可以是数字(numeric),布尔(boolean)以及向量(vector)。
参数
- inputCols: 需要组合的属性名称数组
- outputCol: 组合后的向量属性名称 (默认值: vecAssembler_######_output)
例子
1 | val dataset = spark.createDataFrame( |