2020-07-13 23:51 贵州水利水电职业技术学院算法工程师

关注

[visualization]nextworkx_example - graphic data visualization

buid and modify graph

import networkx as nx

graph = nx.Graph()

graph.add_node(1)

graph.add_nodes_from(range(2,4))

graph.add_nodes_from(['u','v'])

graph.nodes()

[1, 2, 3, 'u', 'v']

graph.add_edge(1,2)

graph.add_edge('u','v')

graph.add_edges_from([(1,3),(1,4),(1,5),(1,6)]) # automatically ignore the repeated edges

graph.add_edge('u','w')

graph.edges()

[(1, 2), (1, 3), (1, 4), (1, 5), (1, 6), ('u', 'v'), ('u', 'w')]

graph.nodes()

[1, 2, 3, 4, 'u', 6, 'w', 5, 'v']

graph.remove_node(2)

graph.nodes()

[1, 3, 4, 'u', 6, 'w', 5, 'v']

graph.edges()

[(1, 3), (1, 4), (1, 5), (1, 6), ('u', 'v'), ('u', 'w')]

graph.remove_nodes_from([4,5])

graph.nodes()

[1, 3, 'u', 6, 'w', 'v']

graph.edges()

[(1, 3), (1, 6), ('u', 'v'), ('u', 'w')]

graph.remove_edge(1,3)

graph.remove_edges_from([(1,2),('u','v')]) # ignore the non-exist edges

graph.number_of_nodes()

graph.number_of_edges()

visualize graph

g = nx.karate_club_graph() # a dataset from its install package

import matplotlib.pyplot as plt

kw = {'with_labels':True, 'node_color':'lightblue', 'edge_color':'gray'}

%matplotlib inline

nx.draw(g,**kw)

g.degree() # key is node id , value is degree

{0: 16,
 1: 9,
 2: 10,
 3: 6,
 4: 3,
 5: 4,
 6: 4,
 7: 4,
 8: 5,
 9: 2,
 10: 3,
 11: 1,
 12: 2,
 13: 5,
 14: 2,
 15: 2,
 16: 2,
 17: 2,
 18: 2,
 19: 3,
 20: 2,
 21: 2,
 22: 2,
 23: 5,
 24: 3,
 25: 3,
 26: 2,
 27: 4,
 28: 3,
 29: 4,
 30: 4,
 31: 6,
 32: 12,
 33: 17}

g.degree(33)

g.number_of_nodes()

g.number_of_edges()

random graph ER model

from scipy.stats import bernoulli

bernoulli.rvs(p=0.1)

bernoulli.rvs(p=0.5)

bernoulli.rvs(p=0.5)

bernoulli.rvs(p=0.5)

import itertools

g = nx.Graph()
n_nodes = 20
p = 0.2
g.add_nodes_from(range(n_nodes))
for node1, node2 in itertools.combinations(range(20),2):
    if bernoulli.rvs(p=p):
        g.add_edge(node1,node2)

nx.draw(g)

plot the degree distribution

def plot_degree_distribution(g):
    values = list(g.degree().values())
    plt.hist(values, histtype='step', normed=True)
    plt.xlabel('degree $k$')
    plt.ylabel('frequency $P(k)$')
    plt.title('degree distribution')

plot_degree_distribution(g)

def er_graph(n_nodes, p):
    g = nx.Graph()
    n_nodes = 20
    p = 0.2
    g.add_nodes_from(range(n_nodes))
    for node1, node2 in itertools.combinations(range(20),2):
        if bernoulli.rvs(p=p):
            g.add_edge(node1,node2)
    return g

import numpy as np

a1 = np.loadtxt('./adj_allVillageRelationships_vilno_1.csv',delimiter=',')

a2 = np.loadtxt('./adj_allVillageRelationships_vilno_2.csv',delimiter=',')

a1.shape, a2.shape

((843, 843), (877, 877))

g1 = nx.to_networkx_graph(a1)

g2 = nx.to_networkx_graph(a2)

def basic_net_stats(g):
    print('number of nodes ', g.number_of_nodes())
    print('number of edges ', g.number_of_edges())
    print('average degree ', np.mean(list(g.degree().values())))

basic_net_stats(g1)

number of nodes  843
number of edges  3405
average degree  8.07829181495

basic_net_stats(g2)

number of nodes  877
number of edges  3063
average degree  6.98517673888

plot_degree_distribution(g1) 
# er model is not fit in humman relationship in this case.

Largest Connected Component

gen = nx.connected_component_subgraphs(g1)

next(gen).number_of_nodes()

next(gen).number_of_nodes()

next(gen).number_of_nodes()

next(gen).number_of_nodes()

next(gen).number_of_nodes()

next(gen).number_of_nodes()

next(gen).number_of_nodes()

next(gen).number_of_nodes()

next(gen).number_of_nodes()

---------------------------------------------------------------------------

StopIteration                             Traceback (most recent call last)

<ipython-input-80-992d1a5e6975> in <module>()
----> 1 next(gen).number_of_nodes()


StopIteration:

len(g1) == g1.number_of_nodes()

True

g1_lcc = max(nx.connected_component_subgraphs(g1), key=len)

plt.figure()
nx.draw(g1_lcc, node_color='red',edge_color='gray',node_size=20) # be patient

g2_lcc = max(nx.connected_component_subgraphs(g2), key=len)

g1_lcc.number_of_nodes(), g2_lcc.number_of_nodes()

(825, 810)

g1_lcc.number_of_nodes()/len(g1), g2_lcc.number_of_nodes()/len(g2)

(0.9786476868327402, 0.9236031927023945)

全部评论

推荐最新楼层

11-21 21:01

蚌埠高新教育集团第三实验小学 Java

DerbySoft德比软件-Java开发一面（挂）

2025.11.21 问的很偏向基础底层，HR一开始邀请我线下二面，我说我还以为我挂了，然后她重新和面试官沟通了下说下周和其他候选人面完再对比下看是否邀请我线下二面，应该就是挂了[TOC]🔥1. 一面1.自我介绍2.内存栅栏：突然给我问懵了，其实就是内存屏障3.ThreadLocal为什么不是线程安全：本质是线程副本，操作共享变量就不是线程安全4.linux的文件句柄：本质就是OS向进程分配的整数索引，用户打开资源标识5.tomcat的什么底层来着：搞忘记了，太底层了6.然后就是springboot的加载，基本业务之类的

查看6道真题和解析

点赞评论收藏

11-26 11:46

360集团_运维开发工程师(准入职员工)

360集团内推，360集团内推码

360真的超好，也碰到了很好的mentor，小组氛围巨好。实习期间完整的做了两个项目，感谢mentor的信任，愿意把一些实打实的内容让我做，完全没有做一些dirty work，可以说是充实的过了三个月，感觉抵得上在学校一年，后悔没有早点来这里。360对实习生真的巨好，不管是mentor还是能给到的资源，感觉在大厂中也是少见的，我为360打call!!! 在360这样的企业里，管理上非常的扁平化，没有严苛的上下级关系，这一点就非常让人舒服。 同时公司也会给员工很多成长和锻炼的机会，比如说定期的各类型专业知识的培训啊，还有很多接触大项目的机会。只要你肯学习和努力，就一定会有收获。 同事之间的关系也...

360集团公司氛围 407人发布

点赞评论收藏

10-24 20:50

滴滴_金融_测开(实习员工)

当我脱离ai写代码

图一为自己纯手写的代码，1024拉了坨大的

zmc曦：我嘞个O(n ^ 4)的复杂度

点赞评论收藏

10-18 19:46

已编辑

山东师范大学 C++

虎牙三面完，腾讯系就是舒服

面试官问能不能提前实习后面确认了一下,实际上是先hr面,然后直接发offer,自愿去提前实习,这里不是强制的,之前没有了解清楚hr面很舒服嘻嘻可恶字节十轮全挂😖😖

Ncsbbss：宝宝你到家了吗

找工作中的小确幸

点赞评论收藏

11-24 09:42

字节跳动_国际电商-营销平台_后端(实习员工)

到底哪些需求算好需求？

后端实习中的 “好需求”，核心定义是能支撑面试深度讨论、可向外延伸多维度知识点的需求—— 本质是能让你在面试官拷打时，有足够空间展现技术积累、解决问题的能力，而非仅完成简单 CRUD。结合面试反推逻辑，具体可分为三类，且都具备 “可延伸、有讨论点” 的共性。本质上是这个需求要支撑你能给面试官吹牛逼。典型的垃圾需求：或许有的同学可能还不理解什么叫做可以吹牛逼的需求，我举一个最简单的反例，很多同学写苍穹外卖的时候，总爱把一个需求写到简历上：  基于OSS处理用户上传图片，获取OSS返回URL，实现用户远程上传图片。这就是个最典型的垃圾需求。因为你发现论代码链路，他没什么可讲的。论各种新潮技术，他也...

反装笔大队长：分情况吧。需求分业务需求和技术需求，技术需求你说的是对的。像CRM、OA、NC等等，这些业务系统很多时候对技术要求并不高的，不可否认的是这些需求还是很不错的。 NC系统的进销存。实际上只是对仓库、库位、库存量、入库出库单价、数据报表等数据的统计与计算。CRM的市场活动、人面画像分析与统计、客户信息管理等，这些无非都是一些增删改查。对于业务需求面试官通常都是问你对业务的理解与过往对该业务的处理方案，并不会死磕技术。技术肯定是多多益善，但在业务开发中正在有意义的是你的经历。

投递字节跳动等公司10个岗位