MyGit

AndreDommond/Python-jmtt

Fork: 27 Star: 49 (更新于 2024-12-16 00:06:46)

license: GPL-3.0

Language: Python .

Python-jmtt爬虫,可下载每个分类下的所有漫画,已经打包成EXE文件并放入Releases里,喜欢就点个Watched和Star.

最后发布版本: version-3.0 ( 2021-02-06 18:19:04)

GitHub网址

Python-jmtt爬虫

Python-jmtt爬虫已经打包成exe文件

使用时需自备代理

最终结果展示:

新增功能:

1.可下载单本漫画及其目录

方法如下:(想要爬取的页数输入1即可)

2.对反扒处理辨别更加准确(基本100%了)

3.修复爬取量过大时,exe自动闪退(只要你梯子不断连20s以上,就保证能完成任务)

这里推荐使用Clash代理,会自动测试url连通性并切换到最快的那个

4.增加随机useragent功能

5.爬取完成后exe文件自动关闭

6.链接通用性增加

只要是使用jmtt右上角搜索到的然后复制上面的链接都可以

主要功能如下:

1.可爬取每个分类里的所有漫画

2.可自己控制所爬的页数(也可控制想爬的分类)

连接类型

类似于这种,去掉后面的(&page=2)的链接类型也可以

3.有分类的会自动爬取

4.直接下载到所指定目录

5.对网站新出的反扒机制进行判断:

哪些漫画被进行了反爬处理,哪些没有被进行反扒处理

6.对新的反扒图片进行处理,使其更改为正常图片

7.可指定对需要反扒处理的漫画保存路径(与不需要处理的是分开的)

8.此代码为本人一时兴起所写并且本人为新手,代码有很多不足,许多方面没有处理好,有需要的可自己进行优化使用

9.没有加入多线程、多进程、随机user-agent、代理ip池等功能(后续可能会更新也可能不会)

10.使用时需要自行安装模块

11.代码讲解放在注释里了自行查看

使用步骤

注意:复制后需要将符号' \ '改为' / '再进行输入,变成D:/Adults/漫画/

----------------图中忘记加/了,切记切记切记!(最后面不加/保存会有点问题。。)

就是变成这样

输入四个变量后按回车即可,exe没有东西出现是正常现象,漫画会自动放到输入的路径里

最后enjoy!

使用此代码即默认同意不可用于商业用途,如果过度使用出现追责与刑事纠纷本人不负任何责任。

最近版本更新:(数据更新于 2024-12-23 07:52:03)

2021-02-06 18:19:04 version-3.0

AndreDommond/Python-jmtt同语言 Python最近更新仓库

2024-12-22 18:18:34 LeslieLeung/heimdallr

2024-12-22 09:03:32 ultralytics/ultralytics

2024-12-21 13:26:40 notepad-plus-plus/nppPluginList

2024-12-21 11:42:53 XiaoMi/ha_xiaomi_home

2024-12-21 04:33:22 comfyanonymous/ComfyUI

2024-12-20 18:47:56 home-assistant/core