pyspark间接好友推荐

# 先统计所有可能的对,并且区分是否是直接好友或者间接好友
# 累加
# 过滤
# -*- coding: UTF-8 -*-
from pyspark import SparkContext
def fun1(line):
    result = []
    arrs = str(line).split(" ")
    me = arrs[0]
    for x in range(1, len(arrs)):
        friendA = arrs[x]
        resultA = (me + "_" + friendA, 0) if hash(me) > hash(friendA) else (friendA + "_" + me, 0)
        result.append(resultA)
        for y in range(x + 1, len(arrs)):
            friendB = arrs[y]
            resultB = (friendA + "_" + friendB, 1) if hash(friendA) > hash(friendB) else (friendB + "_" + friendA, 1)
            result.append(resultB)
    return result
def fun2(x):
    flag = False
    t = tuple(x)
    count = 0
    name = t[0]
    Iterable = t[1]
    for y in Iterable:
        if y == 0:
            flag = True
        else:
            count = count + 1
    if flag == True:
        return ("直接好友", 0)
    else:
        return (name, count)
if __name__ == "__main__":
    """
        需求：对本地文件系统URI为：/root/friend.txt 的数据统计间接好友的数量
    """
    # ********** Begin **********#
    sc = SparkContext("local", "pySpark")
    result = sc.textFile("/root/friend.txt").flatMap(fun1).groupByKey().map(fun2).filter(
        lambda x: tuple(x)[1] != 0).collect()
    print(result)
    # ********** End **********#

全部评论

推荐最新楼层

05-15 16:48

上海大学 Java

轻网科技 Java 笔试题

忙碌的芝士选钝角：招侦探?

点赞评论收藏

05-16 10:40

已编辑

清华大学 BSP工程师

24年毕业生平均薪资

为啥薪资一年比一年少啊。不是都在倒挂吗！！！！全网最受欢迎的嵌入式面经面经一共32篇文章，12w+字数，包含全部最新的面试必问考点，4.7w+同学学习，2800+订阅，非常适合在找工作面经薄弱的同学，3000+订阅还会涨价，提前订阅提前享受，持续更新中。原帖链接：https://www.nowcoder.com/creation/manager/columnDetail/MJNwoMc

LemontreeN：19级年薪的意思是，19毕业到现在5年经验的年薪，不是当初校招年薪

硬件人的简历怎么写你遇到过哪些神仙同事

点赞评论收藏

05-09 13:22

门头沟学院 Java

让室友感受一下牛u的热情

室友爬虫简历 让我帮发 求牛u锐评

Two_Shadow：中间空着的是让hr写的吗

点赞评论收藏

05-07 17:58

门头沟学院 Java

27届找日常实习，简历求锐评

处女简历，项目是点评加外卖，打算五月中旬八股背得差不多就投，求各位大佬提建议#简历中的项目经历要怎么写# #简历被挂麻了，求建议# #我的简历长这样#

wuwuwuoow：1.简历字体有些怪怪的，用啥写的？ 2.Redis 一主二从为什么能解决双写一致性？ 3.乐观锁指的是 SQL 层面的库存判断？比如 stock > 0。个人认为这种不算乐观锁，更像是乐观锁的思想，写 SQL 避免不了悲观锁的 4.奖项证书如果不是 ACM，说实话没什么必要写 5.逻辑过期时间为什么能解决缓存击穿问题？逻辑过期指的是什么其实也没什么多大要改的。海投吧

简历中的项目经历要怎么写简历被挂麻了，求建议

点赞评论收藏