
软件介绍
火车采集器(LocoySpider)是一个功能强大的数据采集软件,利用该软件就可以轻易在网页上抓取文字、图片、文件等等需要的资源。软件还支持远程下载图片文件、探测文件真实地址、防盗链的采集、采集数据直接入库和模仿人手工发布等等。
软件特色
1、通用性强
无论新闻、论坛、视频、黄页、图片、下载类网站,只要通过浏览器能看到的结构化的内容,通过指定匹配规则,都能采集到您所需要的内容。
2、稳定、高效
五年磨一剑,软件不断更新进步,采集速度快,性能稳定,占用资源少。
3、扩展性强、适用范围广
自定义web发布,自定义主流的数据库的保存和发布,自定义本地php及.net外部编程接口处理数据,让数据都能为你所用。
基本功能
1、规则自定义 - 通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。
2、多任务,多线程 - 可以同时进行多个信息获取任务,每个任务可以使用多个线程。
3、所见即所得 - 任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中。
4、数据保存 - 数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。
5、断点续采 - 信息收集任务可以在停止后从断点开始继续采集,从此你用不再担心你的采集任务意外中断了。
6、网站登录 - 支持网站Cookie,支持网站可视化登录,即使登录时需要验证码的网站也能采集。
7、计划任务 - 通过这个功能可以让你的采集任务定时、定量或者一直循环执行。
8、采集范围限制 - 可以根据采集的深度和网址的标识来限制采集的范围。
9、文件下载 - 可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。
10、结果替换 - 可以将采集的结果根据规则替换成你定义的内容。
更新日志
2021-03-15
火车采集器V9.30版
1、优化标签数据处理中字符替换。
2、对文件探测无效导致文件下载失败问题优化。
3、处理用户名包含特殊符号不能登录问题。
4、修复数据管理批量操作数据有异常弹窗提示。
5、修复二级代理卡死问题。
6、完善自动获取cookie失败问题。
7、发布到word,自动转义“<”、“>”为“《”、“》”。
8、修复:勾选发布选项,采集最大数无效。
9、修复oracle链接问题。
10、支持oss存储。
11、修复:下载地址后面有斜杠,下载文件时无后缀名。
软件综述
火车采集器是一款功能强大的数据采集软件,它可以帮助用户从各种网站、数据库和文件等来源中批量地采集数据。火车采集器的主要特点包括:
- 强大的数据采集功能:火车采集器可以从各种不同的来源中采集数据,包括网站、数据库、文本文件、Excel文件等。它支持多种数据格式,如HTML、JSON、XML和CSV等。
- 方便易用的图形化界面:火车采集器具有简单易用的图形化界面,用户可以通过拖放的方式设置数据采集任务。只需将需要采集数据的网站或文件拖到软件界面中,然后选择要采集的数据字段,就可以轻松地完成数据采集任务的设置。
- 强大的数据处理功能:火车采集器提供了强大的数据处理功能,用户可以对采集到的数据进行各种操作,如过滤、排序、统计和导出等。
- 支持多线程和代理:火车采集器支持多线程和代理,可以同时执行多个数据采集任务,并且可以设置代理服务器来隐藏自己的IP地址,避免被网站封锁。
- 强大的数据导出功能:火车采集器支持多种数据导出格式,如CSV、Excel、JSON、XML和数据库等,用户可以轻松地将采集到的数据导出到其他软件或系统中使用。
总的来说,火车采集器是一款功能强大、使用方便的数据采集软件,它可以帮助用户从各种不同的来源中批量地采集数据,并对采集到的数据进行各种处理和导出操作。