什么是网络爬虫

花落一肩 1个月前已收到2个回答举报

共回答了221个问题采纳率：96.7% 评论

网络爬虫是一种用来自动浏览万维网的网络机器人。其目的一般为编纂网络索引。网络搜索引擎等站点通过爬虫软件更新自身的网站内容或其对其他网站的索引。网络爬虫可以将自己所访问的页面保存下来，以便搜索引擎事后生成索引供用户搜索。

爬虫访问网站的过程会消耗目标系统资源。不少网络系统并不默许爬虫工作。因此在访问大量页面时，爬虫需要考虑到规划、负载，还需要讲“礼貌”。不愿意被爬虫访问、被爬虫主人知晓的公开站点可以使用robots.txt文件之类的方法避免访问。这个文件可以要求机器人只对网站的一部分进行索引，或完全不作处理。

互联网上的页面极多，即使是最大的爬虫系统也无法做出完整的索引。因此在公元2000年之前的万维网出现初期，搜索引擎经常找不到多少相关结果。现在的搜索引擎在这方面已经进步很多，能够即刻给出高质量结果。

爬虫还可以验证超链接和HTML代码，用于网络抓取（参见数据驱动编程）。

21小时前

葬人情 1星

共回答了161个问题评论

人们常常会用这样一个比喻：如果把互联网比喻成一张网，那么网络爬虫就可以认为是一个在网上爬来爬去的小虫子，它通过网页的链接地址来寻找网页，通过特定的搜索算法来确定路线，通常从网站的某一个页面开始，读取网页的内容，找到在网页中的其它链接地址，然后通过这些链接地址寻找下一个网页，这样一直循环下去，直到把这个网站所有网页都抓取完为止

19小时前

可能相似的问题

网络爬虫是什么意思

一朵薔薇花

查看 678

回答 2
呀西呀嘞广东话什么意思

偽妳鎻訫

查看 798

回答 1
网络爬虫是什么意思

猪的老婆

查看 24

回答 3
网络爬虫是什么

強咱挚爱

查看 860

回答 1
女生说啊嘞嘞是什么意思

乄两手盖地

查看 29

回答 2
网络爬虫是什么

鬼魂小邪

查看 154

回答 4
啊嘞是什么意思

薆想淰

查看 160

回答 1
什么是网络爬虫

藏匿的爱丿

查看 490

回答 1
阿咧什么意思啊

乐尕妈

查看 714

回答 1
网络爬虫是什么

别走啊回来

查看 47

回答 2

猜你喜欢的问题

热门问题推荐

小孩感冒流鼻涕能吃双黄连颗粒吗

3个月前1个回答
傻瓜的中文歌词

3个月前1个回答
4人玩的游戏室外

3年前3个回答
关于少年的唯美句子

3个月前1个回答
隐秘的角落秦昊的老婆是谁演的

1个月前1个回答
阿迪为什么停产椰子

3个月前1个回答
目前世界第一高楼是哪个前几名怎么排的

3个月前1个回答
台球打法基本技巧指法

3个月前1个回答
过火这首歌是说的个什么意思

1个月前2个回答