F:\Pycharm_Projects\meitulu-spider\venv\Scripts\python.exe F:\Pycharm_Projects\meitulu-spider\xrmnw.py **************************************************************************************************** 秀人美女网爬虫 Verson: 22.12.03 Blog: http://www.h4ck.org.cn **************************************************************************************************** USAGE: spider -h <help> -a <all> -q <search> Arguments: -a <download all site images> -q <query the image with keywords> -h <display help text, just this> Option Arguments: -p <image download path> -r <random index category list> -c <single category url> -e <early stop, work in site crawl mode only> -s <site url eg: http://www.xiurenji.vip (no last backslash "/")> ****************************************************************************************************
好久没有写爬虫了,上次更新貌似还是9月份,这几天发现秀人集的网站一直无法访问,但是发现了另外一个网站。于是今天做了个爬虫,开始爬取另外一个网站,使用方法参考以前的爬虫。
爬取效果,多进程:
网站截图:
下载效果:
半小时下载量:
文件哈希:
名称: xrmnw_win_20221203.7z
大小: 11608945 字节 (11 MiB)
CRC32: FF5B4632
CRC64: CDDA6CC5717F36B6
SHA256: 783e51ec79ecf985124b4918a13e3b79d49bc4a88303b4365f80b698d35e8c0b
SHA1: 6b3c1b383d2b94c4245f3b5f9eccd90b4f1f05fd
BLAKE2sp: b373469d6c310680686668dc5e244cf7d9ad25cdad400befdb453b3e36d9d738
下载地址:
47 comments
棒棒棒
欢迎使用~~~
头图有素材了!
这个必须有
给力啊
好东西,,试一下
5进程一天下载量:
哈哈 我就说前面下的不能用,
闪现下CMD 就退出来了
一样的程序,那你这也用不了。
需要啥环境啊?老大指点下
搜一下怎么运行命令行工具吧
大佬nb
大佬太nb了
学习
小白报道学习
大佬牛逼
大佬,下载过程中提示https connection time out,是不是要挂梯子下载?
他们的图片服务器访问不大稳定,下个版本修复一下。
发现你每次发爬虫,下面评论一堆~
这就是广大兄弟们的需求啊,我就是这么乐于助人
大佬nb
感谢感谢
感谢感谢
占楼
感谢感谢
秀人集不稳定 试试这个
试试看
感谢分享
试试 很厉害
感谢
感谢感谢,学习了。
大佬流弊
感谢大佬的分享!
大佬nb
66666
求代码