2020-01-13 19:16 门头沟学院 golang

关注

Python之检测XML文件中URL是否存在

import os, urllib2,urllib
from xml.dom.minidom import parse

要解析URL中的XMl文件，必须先把这个xml文件下载下来再解析，所以：

def downLoadURL(file_name,URL):
    PATH=os.path.abspath('.')+r'\result'
    dest_dir = os.path.join(PATH, file_name)
    try:
        urllib.urlretrieve(URL, dest_dir)
        print 'saving xml in the:', dest_dir
    except:
        print '\tError retrieving the URL:', dest_dir
#file_name为下载的xml保存的文件名，URL为要解析的xml网址


dom = parse(dest_dir)
root = dom.documentElement
itemlist = root.getElementsByTagName('package')
urls=[]
username = '******' password = '******' values = {'Username': username, 'Password': password}     #对于xml的链接中需要登录的网址，需要填入用户名和密码
for item in itemlist:
    als = item.getAttribute("articleUrl")
    urls.append(als)
url_all=tuple(set(urls))                                  #去除xml中重复的链接网址
for url_each in url_all:  url_each = url_each.encode("utf-8")  if url_each!="":
        try:
            data = urllib.urlencode(values)
            req = urllib2.Request(url_each, data)
            response = urllib2.urlopen(req,timeout=30)
            if response.code == 200:                      #response.code=200则证明这个网址存在
                print 'Exist!'  except urllib2.HTTPError,e:
            print url_each
            print e.code,e.reason

全部评论

推荐最新楼层

05-31 19:12

第一拖拉机制造厂拖拉机学院 Java

腾讯面试官问CLAUDE.md维护，我只说了两个词，他当场愣住了！！

前两天有个读者私信我，说腾讯二面问了这样一个问题：“CLAUDE.md 你是怎么维护的？”他知道的就是“/init 一下”，别的平常也没怎么关注。 这就好比面试官想让你回答“数据库怎么优化的”，结果你回答了“装个 MySQL 就行了”。 说了，但又好像没说。  /init 只是起点。 CLAUDE.md 这个文件，写好了就是超级外挂，你的代码交付质量杠杠的。 写烂了就是 token 噪音。今天这篇内容，给大家来一次硬核拆解。  系好安全带，我们粗粗粗发～  01、CLAUDE.md 到底是个什么东西 先把概念捋清楚。 CLAUDE.md 不是 README，不是注释，不是文档，它是 Claud...

点赞评论收藏

分享

昨天 09:37

武汉大学 C++

阿里嵌入式面经一面

我先说一下，我这个是嵌入式应用层的开发。 早上在公司接到的阿里的面试，他问我什么时候有时间，我直接坦白了我在实习了，白天不行，问问可不可以安排在晚上，他答应了，安排的晚上八点，我面试完就煮了碗面吃了就开始整理，害怕等久了我就忘了。 首先说一下整体感受，面试官人挺好的，我整个面试过程也特别自信。我感觉面试官对我印象应该还行，当然，其实我也不是他问的所有东西都知道，只是我了解的不够就明说，了解的就多说些，以前面的时候多少有些紧张，现在想通了，反正也就这样，大不了面不过嘛，又不是多大个损失。可能因为我是面试老油条了，面试一点都不慌。我还是强调一下，现在是提前批，很多大公司提前批招人就招的差不多了，所...

查看12道真题和解析

点赞评论收藏

分享

05-19 00:31

腾讯_测试开发工程师

再见🍊，你好🐧

终于到了 Lastday，社招不到一年光速跳槽说是。在滴滴确经历了虽然短暂但是特别温馨的一年，也学到了不少东西，收获了难得的记忆。有缘再见！

AI时代，哪些岗位最容易...

点赞评论收藏

分享

06-01 15:17

门头沟学院产品经理

给你看看我浏览器书签栏，找实习三个月就剩这几个

有人问我每天找实习都上哪些网站。 我截了张浏览器书签栏，发现三个月前有一大排，现在常点的就剩几个。 第一个，一个每天更新的汇总表。之前我收藏了七八个公众号、三个求职群、两个论坛，每天来回切。现在早上睁眼先刷这个表，五分钟知道今天哪些公司开了、哪些快截止了。其他的？取关了。不是他们不好，是我懒得一个个翻了。第二个，我自己搭的飞书表格。很丑，但实用。公司名、岗位、投了没、到哪一步了、下次该干嘛。之前用脑子记，记到第十五家的时候彻底乱了。现在表格一打开，清清楚楚。 第三个，我的简历文件夹。里面躺着三份简历：前端偏工程版、前端偏可视化版、全栈版。投哪家用哪个，看岗位JD决定。之前一份简历投所有，挂得怀...

27届求职交流

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我的实习日记 #

4142439次浏览 33188人参与

# 秋招投递记录 #

429486次浏览 3311人参与

# 第3届现代汽车Code Faster急速编程挑战赛 #

26393次浏览 476人参与

# 你投递的公司有几家约面了？ #

174899次浏览 1047人参与

# 你投了多少家公司？进展是___ #

252226次浏览 1472人参与

# 今年形式下双非本找得到工作吗 #

339805次浏览 1797人参与

# 实习返校后，你的精神状态是__？ #

47698次浏览 174人参与

# 你认为小厂实习有用吗？ #

153163次浏览 807人参与

# 产品实习，你更倾向大公司or小公司 #

234803次浏览 2169人参与

# 为了找工作你投递了多少公司？ #

121864次浏览 769人参与

# 秋招提前批，你开始投了吗 #

772398次浏览 8499人参与

# 重来一次，你会对开始求职的自己说 #

55408次浏览 516人参与

# 实习生的生存小技巧 #

42127次浏览 366人参与

# 如何看待应届生身份？ #

261257次浏览 2364人参与

# 我的租房踩坑经历 #

231305次浏览 1322人参与

# 你找工作想离家近 or 离家远？ #

55194次浏览 403人参与

# 通信/硬件求职避坑tips #

179625次浏览 1177人参与

# 如果有时光机，你最想去到哪个年纪？ #

81913次浏览 863人参与

# 发工资后，你做的第一件事是什么 #

109071次浏览 350人参与

# 你小时候最想从事什么职业 #

170951次浏览 2080人参与

# 蚂蚁求职进展汇总 #

180356次浏览 1302人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务