MLlib 中的线性代数支持有 Breeze 和 jblas 两种。
Local vector 本地向量
根据存储单元的值分为两个类型:整数型和双精度数值,是存放在一台机器上的。MLlib 支持两种类型的本地向量:稠密和稀疏。稠密向量是由一个 Double 矩阵表示内部元素值的,而稀疏向量则是由两个平行的矩阵表示:索引数组和值数组。例如,向量 (1.0,0.0,3.0) 可以用稠密的方式 [1.0, 0.0, 3.0] 表示或者用稀疏的形式 (3, [0, 2], [1.0, 3.0]) 表示,其中 3 是向量的维度.
1  | import org.apache.spark.mllib.linalg.{Vector, Vectors}  |