MyGit

v0.3.0

NaiboWang/EasySpider

版本发布时间: 2023-05-15 00:03:01

NaiboWang/EasySpider最新发布版本:v0.6.2(2024-04-22 06:37:17)

如果下载速度慢,可以考虑中国境内下载地址:中国境内下载地址

Windows 64位Beta版已上传,欢迎大家测试,如果发现问题和bug请及时提issue,其余版本将于5月底前上线。

强烈建议大家观看新特性讲解视频

B站最新版特性视频已上传,新视频非常有用,推荐大家观看。

【重要】自定义条件判断之使用循环项内的JS命令返回值 - 第二弹

如何执行自己写的JS代码和系统代码 (自定义操作)

如何自定义循环和判断条件 - 第一弹

如何对元素和网页截图及(无头模式)命令行执行指南

OCR识别元素内容功能

注意,v0.3.0版本任务task文件夹内.json文件和v0.2.0版本不兼容,请重新设计v0.3.0版本任务。

更新说明

  1. 高级操作:

image

  1. 判断条件和循环条件中同样增加了执行自定义脚本,并根据自定义脚本的返回值是否为真来作为条件判断和循环的判断条件,同样极大的增加了任务的可操作性。循环中增加了用代码break的操作设定(正式版)。 image

  2. 可同时生成多种XPath供用户选择,并预装了XPath Helper扩展供大家调试XPath。

  3. 增加采集元素背景图片地址,当前页面标题,当前页面URL地址功能。

  4. 增加保存元素截图功能,如要截图某元素或整个网页页面,可以用此功能(配合无头模式效果更好)。

  5. 增加下载图片功能(正式版,Beta版没有)。

  6. 增加OCR识别元素功能(使用此功能需首先自行安装Tesseract库:https://blog.csdn.net/u010454030/article/details/80515501

  7. 可直接提取对元素执行JavaScript代码后的返回值,实现如正则表达式,获得元素背景颜色等功能。

image

  1. 大幅增加使用提示和说明,使软件更易用(如增加了iframe标签的处理方式说明,各个选项的参数意义,以及循环项XPath的修改说明等等)。
  2. 执行命令时增加了如何用命令行执行任务的提示:https://github.com/NaiboWang/EasySpider/wiki/Argument-Instructionimage
  3. 增加无头模式,即无浏览器界面模式配置。
  4. 修复了使用用户配置浏览器模式下的中文路径不能正确识别的问题。
  5. 修复了条件分支没有无条件分支时会卡死的问题。
  6. 修复了保存任务后会输入框卡死的问题。
  7. 打开网页操作和点击元素操作新增设置页面最长加载等待时间。
  8. 增加版本更新提示。
  9. 更新chrome版本为113。

Update Instruction

https://tesseract-ocr.github.io/tessdoc/Installation.html

相关地址:原始地址 下载(tar) 下载(zip)

1、 Download_Link_Address_in_China_Mainland.txt 514B

2、 EasySpider_0.3.0_Beta_windows_amd64.7z 344.27MB

查看:2023-05-15发行的版本