Spark学习(八):scala矩阵的基本操作

Breeze是scala用的数值处理库,spark的底层的向量和矩阵是基于Breeze的。本文对矩阵的基本操作做简单介绍,代码主要参考博文,根据自己的习惯做了一些修改。

import breeze.linalg._
import breeze.numerics._
import org.apache.log4j.{Level, Logger}
import org.apache.spark.{SparkConf, SparkContext}

object ArrayAndMetrics {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("Kmeans").setMaster("local")
    val sc = new SparkContext(conf)
    Logger.getRootLogger.setLevel(Level.WARN)

    println("---------------------------Breeze 创建函数-------------------------------")
    val m1 = DenseMatrix.zeros[Double](2,3)   // 2行3列的0矩阵
    val v1 = DenseVector.zeros[Double](3)     // 长度为3的0向量
    val v2 = DenseVector.ones[Double](3)      // 长度为3的1向量
    val v3 = DenseVector.fill(3)(5.0)         // 创建指定元素的向量,长度为3,元素为5
    val v4 = DenseVector.range(1,10,2)        // 根据范围创建向量参数(start,end,step),output: 1 3 5 7 9
    val m2 = DenseMatrix.eye[Double](3)       // 创建对角线为1的矩阵,3行3列的单元矩阵
    val m7 = diag(DenseVector(1.0,2.0,3.0))   // 创建指定对角线元素的矩阵,3行3列,对角元素分别为1 2 3
    val m3 = DenseMatrix((1.0,2.0),(3.0,4.0)) // 根据向量创建矩阵,每个数组就是一行
    val v8 = DenseVector(1,2,3,4)             // 根据元素创建向量
    // 转置
    val m8 = m3.t  // output: ((1 3) (2 4))
    println("m8: " + m8)
    // 根据下标创建向量和矩阵
    val v10 = DenseVector.tabulate(3){i=>2*i}               // output: 0 2 4
    val m4 = DenseMatrix.tabulate(3,2){case(i,j) => i+j}
    println("m4: " + m4)
    // 根据数组创建向量和矩阵
    val v11 = new DenseVector(Array(1,2,3,4))              // 结果同v8
    val m5 = new DenseMatrix(2,3,Array(11,12,12,21,21,11)) // 2行3列,元素分别为Array的元素
    // 创建随机向量和矩阵
    val v12 = DenseVector.rand(4)
    val m6 = DenseMatrix.rand(2,3)

    println("----------------------元素访问------------------------")
    val a = DenseVector(1,2,3,4,5,6,7,8,9) //元素访问
    val ao1 = a(0)            //访问指定的元素
    val ao2 = a(1 to 4)       //访问子元素向量, output: 2 3 4 5
    println("ao2: " + ao2)
    val ao3 = a(5 to 1 by -1) //指定起始和终止位置和补偿, output: DenseVector(6, 5, 4, 3, 2)
    println("ao3: " + ao3)
    val ao4 = a(1 to -1)      // -1代表索引最后的元素,output: DenseVector(2, 3, 4, 5, 6, 7, 8, 9)
    println("ao4: " + ao4)
    val ao5 = a(-1)           // 访问最后元素, output: 9

    val m = DenseMatrix((1.0,2.0,3.0),(4.0,5.0,6.0))
    val mo1 = m(0,1)  // 访问0行1列的元素,output:2
    println("mo1: ", mo1)
    val mo2 = m(::,1) // 访问第1列元素,output: DenseVector(2.0, 5.0)
    println("mo2: " + mo2)
    val mo21 = m.cols // 取矩阵列数,output:3
    val mo3 = m(1,::) // 访问第1行,output: Transpose(DenseVector(4.0, 5.0, 6.0))
    println("mo3: " + mo3)
    val mo31 = m.rows // 取矩阵行数,output:2

    // 元素操作
    val m_1 = DenseMatrix((1.0,2.0,3.0),(4.0,5.0,6.0))
    val m_1o1 = m_1.reshape(3,2)  // 变成3行2列的矩阵
    val m_1o2 = m_1.toDenseVector // 转换成向量, output: DenseVector(1.0, 4.0, 2.0, 5.0, 3.0, 6.0)
    println("m_1o2: " + m_1o2)

    val m_3 = DenseMatrix((1,2,3),(4,5,6),(7,8,9))
    val m_3o1 = lowerTriangular(m_3)// 取下三角,output:((1 0 0) (4  5  0) (7  8  9))
    println("m_3o1: " + m_3o1)
    val m_3o2 = upperTriangular(m_3)// 取上三角,output: ((1 2 3) (0 5 6) (0 0 9))
    println("m_3o2: " + m_3o2)
    val m_3o3 = m_3.copy            // copy生成一个新的矩阵
    val m_3o4 = diag(m_3)           // 对角线生成一个向量,output: DenseVector(1, 5, 9)
    println("m_3o4: " + m_3o4)
    m_3(::,2) := 5                  // 将第2列的元素全部改成5
    println("m_3: " + m_3)
    m_3(1 to 2,1 to 2) := 5
    println("m_3: " + m_3)

    // 矩阵的连接(向量的连接和矩阵类似)
    val a1 = DenseMatrix((1,2,3),(4,5,6))
    val a2 = DenseMatrix((1,1,1),(2,2,2))
    val a12V = DenseMatrix.vertcat(a1,a2) // 竖直的连接, output: ((1 2 3) (4 5 6) (1 1 1) (2 2 2))
    println("a12V: " + a12V)
    val a12H = DenseMatrix.horzcat(a1,a2) // 水平连接,output: ((1 2 3 1 1 1) (4 5 6 2 2 2))
    println("a12H: " + a12H)
    
    println("-------------------数值计算-----------------------")
    val a_3 = DenseMatrix((1,2,3),(4,5,6))
    val b_3 = DenseMatrix((1,1,1),(2,2,2))
    val ab31 = a_3 + b_3       // 对应元素相加
    println("ab31: " + ab31)
    val ab32 = a_3 :* b_3      // 对应元素相乘
    println("ab32: " + ab32)
    val ab33 = a_3 :/ b_3      // 对应元素取商,注意输出为整数商
    println("ab33: " + ab33)
    val ab34 = a_3 :< b_3      // 对应元素进行判断
    println("ab34: " + ab34)
    val ab35 = a_3 :== b_3     // 对应元素是否相等
    println("ab35: " + ab35)
    a_3 :+= 1                   // 所有元素+1,注意此时a_3已经改变
    println("a_3: " + a_3)
    a_3 :*= 2                   // 所有元素*2
    println("a_3: " + a_3)
    val aMax = max(a_3)         // 求最大值,output: 14
    println("aMax: " + aMax)
    val aMaxIndex = argmax(a_3) // 最大值位置的索引, output: (1, 2)
    println("aMaxIndex: " + aMaxIndex)
    val ab38 = DenseVector(1,2,3,4) dot DenseVector(1,1,1,1) // 内积,output: 10
    println("ab38: " + ab38)

    //------------------求和函数-----------------
    val a_4 = DenseMatrix((1,2,3),(4,5,6),(7,8,9))
    val a41 = sum(a_4)         // 所有元素求和,output: 45
    val a42 = sum(a_4,Axis._0) // 每一列进行求和, output: DenseVector(12, 15, 18)
    val a43 = sum(a_4,Axis._1) // 每一行进行求和, output: DenseVector(6, 15, 24)
    val a44 = trace(a_4)       // 对角线求和, output: 15
    val a45 = accumulate(DenseVector(1,2,3,4)) // 分别求前1,2,3,4个元素的和,output: DenseVector(1, 3, 6, 10)

    //------------------布尔函数--------------------
    val a_5 = DenseVector(true,false,true)
    val b_5 = DenseVector(false,true,true)
    val ab51 = a_5 :& b_5 // 对应元素“与”
    val ab52 = a_5 :| b_5 // 对应元素“或”
    val ab53 = !a_5       // 取“非”

    val a_5_2 = DenseVector(7, 8, 9)
    val ab54 = any(a_5_2)//任意一个元素 > 0 即为true
    val ab55 = all(a_5_2)//所有元素 > 0 则为true
  }
}

输出结果:

---------------------------Breeze 创建函数-------------------------------
m8: 1.0  3.0  
2.0  4.0  
m4: 0  1  
1  2  
2  3  
----------------------元素访问------------------------
ao2: DenseVector(2, 3, 4, 5)
ao3: DenseVector(6, 5, 4, 3, 2)
ao4: DenseVector(2, 3, 4, 5, 6, 7, 8, 9)
(mo1: ,2.0)
mo2: DenseVector(2.0, 5.0)
mo3: Transpose(DenseVector(4.0, 5.0, 6.0))
m_1o2: DenseVector(1.0, 4.0, 2.0, 5.0, 3.0, 6.0)
m_3o1: 1  0  0  
4  5  0  
7  8  9  
m_3o2: 1  2  3  
0  5  6  
0  0  9  
m_3o4: DenseVector(1, 5, 9)
m_3: 1  2  5  
4  5  5  
7  8  5  
m_3: 1  2  5  
4  5  5  
7  5  5  
a12V: 1  2  3  
4  5  6  
1  1  1  
2  2  2  
a12H: 1  2  3  1  1  1  
4  5  6  2  2  2  
-------------------数值计算-----------------------
ab31: 2  3  4  
6  7  8  
ab32: 1  2   3   
8  10  12  
ab33: 1  2  3  
2  2  3  
ab34: false  false  false  
false  false  false  
ab35: true   false  false  
false  false  false  
a_3: 2  3  4  
5  6  7  
a_3: 4   6   8   
10  12  14  
aMax: 14
aMaxIndex: (1,2)
ab38: 10
最后编辑于
?著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,100评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,308评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,718评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,275评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,376评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,454评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,464评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,248评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,686评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,974评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,150评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,817评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,484评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,140评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,374评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,012评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,041评论 2 351