shell题解 | 统计爬虫抓取404的次数
nginx日志分析5-统计爬虫抓取404的次数
https://www.nowcoder.com/practice/3a3573822a854710a259d89066aad695
#!/bin/bash
# 思路:
# awk 默认空格分隔的情况下 404 在$9 百度 在$15
# if 判断 $9 == 404 和 $15 ~ /baidu/ 然后 sum++
# 另一个思路:2个grep 1个wc
# grep 'baidu' | grep '404' | wc -l
awk '
BEGIN{sum = 0}
{
if ($9 == 404 && $15 ~ /baidu/)
sum++
}
END{
print sum
}
' nowcoder.txt
END
小天才公司福利 1282人发布