博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
GraphX实现N度关系
阅读量:6340 次
发布时间:2019-06-22

本文共 1826 字,大约阅读时间需要 6 分钟。

背景

本文给出了一个简单的计算图中每一个点的N度关系点集合的算法,也就是N跳关系。

之前通过学习和理解了一下GraphX的计算接口。

N度关系

目标:

在N轮里。找到某一个点的N度关系的点集合。

实现思路:

1. 准备好边数据集。即”1 3”, “4, 1” 这种点关系。

使用GraphLoader 的接口load成Graph

2. 初始化每一个Vertice的属性为空Map
3. 使用aggregateMessagesVerticeIDtotalRounds传播出度点上,出度点把收集到的信息合成一个大Map
4. 更新后的Vertice与原图进行”Join”,更新图中的变化过的点属性
5. 反复步骤3和4,最后输出更新了N轮之后的有关系的Vertice

spark-shell下可运行的代码:

import org.apache.spark._import org.apache.spark.graphx._import org.apache.spark.rdd.RDDval friendsGraph = GraphLoader.edgeListFile(sc, "data/friends.txt")val totalRounds: Int = 3 // total N roundvar targetVerticeID: Long = 6 // target vertice// round onevar roundGraph = friendsGraph.mapVertices((id, vd) => Map())var roundVertices = roundGraph.aggregateMessages[Map[Long, Integer]](  ctx => {    if (targetVerticeID == ctx.srcId) {      // only the edge has target vertice should send msg      ctx.sendToDst(Map(ctx.srcId -> totalRounds))    }  },   _ ++ _)for (i <- 2 to totalRounds) {  val thisRoundGraph = roundGraph.outerJoinVertices(roundVertices){ (vid, data, opt) => opt.getOrElse(Map[Long, Integer]()) }  roundVertices = thisRoundGraph.aggregateMessages[Map[Long, Integer]](    ctx => {      val iterator = ctx.srcAttr.iterator      while (iterator.hasNext) {        val (k, v) = iterator.next        if (v > 1) {          val newV = v - 1          ctx.sendToDst(Map(k -> newV))          ctx.srcAttr.updated(k, newV)        } else {          // do output and remove this entry        }      }    },    (newAttr, oldAttr) => {      if (oldAttr.contains(newAttr.head._1)) { // optimization to reduce msg        oldAttr.updated(newAttr.head._1, 1) // stop sending this ever      } else {        oldAttr ++ newAttr      }    }  )}val result = roundVertices.map(_._1).collect

数据和输出

2 14 11 26 37 37 66 73 74 31 66 1
Array(6, 1, 3, 7)

总结

实现的比較naive。还有很多能够优化的地方。

全文完 :)

转载地址:http://bqhoa.baihongyu.com/

你可能感兴趣的文章
C#之MemberwiseClone与Clone
查看>>
Android性能优化之利用Rxlifecycle解决RxJava内存泄漏
查看>>
转: 如何为你的开源项目选择一个合适的开源协议?
查看>>
关系型数据库和NOSQL数据库对比
查看>>
Atitit 记录方法调用参数上下文arguments
查看>>
webstorm常用功能FTP,及常用快捷键
查看>>
eclipse html 打开方式
查看>>
[求助] win7 x64 封装 出现 Administrator.xxxxx 的问题
查看>>
人类投资经理再也无法击败电脑的时代终将到来了...
查看>>
一个最小手势库的实现
查看>>
HoloLens开发手记 - Vuforia开发概述 Vuforia development overview
查看>>
Android支付之支付宝封装类
查看>>
<亲测>CentOS中yum安装ffmpeg
查看>>
【分享】马化腾:产品设计与用户体验
查看>>
【机器学习PAI实践十】深度学习Caffe框架实现图像分类的模型训练
查看>>
全智慧的网络:思科十年来最具颠覆性的创新
查看>>
怎样将现有应用迁移到 VMware NSX
查看>>
赛门铁克收购以色列移动安全初创公司Skycure 旨在构建网络安全防御平台
查看>>
《Photoshop蒙版与合成(第2版)》目录—导读
查看>>
“最佳人气奖”出炉!4月27号,谁能拿到阿里聚安全算法挑战赛的桂冠?
查看>>