参数说明: **************************************************************************************************** USAGE: spider -h <help> -a <all> -q <search> Arguments: -a <download all site images> -q <query the image with keywords> -h <display help text, just this> Option Arguments: -p <image download path> -s <site url eg: http://www.xiurenji.vip (no last backslash "/")> ****************************************************************************************************
更新日志:
22.1.18 1.兼容更新后的秀人集网站,支持搜索以及全站爬取。 2.修改默认域名为https://www.xiurenji.net(暂时可以不使用-s 参数)。 22.1.20 1.修复页面异常可能导致的异常终止文件哈希:
xiurenji_20220118.7z md5:57df7c4f0b48252f4207454d53dba9f0 sha256: 0eabd2b04388ae567e1321d832986d07141b5f6f8caf789cb1d664e9cf0cadfe 名称: xiurenji_20220120.7z 大小: 6571454 字节 (6417 KiB) CRC32: E20E2F4D CRC64: EEF9E5CCD07DAF03 SHA256: 0455dfa2cb817732aedd0ff086a09bf69dfce4c1b61e75c546f8cb92b0f13552 SHA1: b312e5aa4d72123dda5cebc80df14b59b88c230a BLAKE2sp: 8ab209002739adcfebd8a3623089e5ddc3252575ede36b57cf006bdb4d41f38e
旧版本: http://h4ck.org.cn/2021/09/%E7%A7%80%E4%BA%BA%E9%9B%86%E7%88%AC%E8%99%AB-%E3%80%9021-9-21%E3%80%91%E3%80%90windows%E3%80%91/
147 comments
?好家伙,我刚刚在看你的其他文章,回来一看,竟然又多了一篇文章,感谢分享
长夜漫漫,无心睡眠
感谢大佬,真快
感谢大佬,真快!
下载
更新·~
好东西,感谢分享!
好东西,感谢分享!
好东西!
感谢大佬
感谢大佬!
-q参数是否有问题?
“`python
Traceback (most recent call last):
File “xiurenji.py”, line 387, in
File “xiurenji.py”, line 380, in main
File “xiurenji.py”, line 345, in search_crawler
File “xiurenji.py”, line 324, in get_search_sub_pages
File “xiurenji.py”, line 90, in log_text
File “colorama\ansitowin32.py”, line 41, in write
File “colorama\ansitowin32.py”, line 162, in write
File “colorama\ansitowin32.py”, line 190, in write_and_convert
File “colorama\ansitowin32.py”, line 195, in write_plain_text
UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position 94: illegal multibyte sequence
[15952] Failed to execute script xiurenji
“`
编码问题 后面看一下吧
问一下,你的搜索关键字是什么?
随便指定个人
搜索没问题,你版本不对吧?新版没有gbk编码
Xiazai
感谢大佬!
大佬真强,又有新版本了,支持!
感谢大佬感谢
;厉害
感谢大佬
感谢大佬
谢谢大佬
试一试
谢谢大佬
好评
谢谢大佬,原来安卓上用的一个因为没有源码,在我多次修修改改后终于因为网站重构再也用不了了
这两版不用-p改地址的话,没有G盘的人都报错,好像默认写在G盘。
而且好像是单线程的,略有点慢。。不过还是谢谢楼主
慢慢跑吧
姐姐更新了,支持多进程跑了
http://h4ck.org.cn/2022/01/%E7%A7%80%E4%BA%BA%E9%9B%86%E7%88%AC%E8%99%AB-%E3%80%9022-1-24%E3%80%91%E3%80%90windows%E3%80%91/
我想加入
我要
好东西!
试试看看
good
冲冲冲好人一生平安
好人