vivi小偷程序是以php语言进行开发的网站采集系统,只需要输入目标站地址就能全自动采集,高智能的采集程序,支持子域名自动采集,支持站点高达98%,规则制作十分简单,菜鸟也能制作采集规则,采集不求人。
功能简介:
后台配置采集节点,输入目标站地址即可全自动智能转换自动全站采集
支持https、支持POST获取、支持搜索、支持cookie、支持代理、支持破解防盗链、支持破解防采集
全自动分析,内外链接自动转换、图片地址、css、js,自动分析CSS内的图片使得页面风格不丢失
广告标签,方便在规则里直接替换广告代码
支持自定义标签,标签可自定义内容、自由截取、内容正则截取。可以放在模板里,也可以在规则里替换
支持自定义模板,可使用标签diy个性模板,真正做到内容上移花接木
调试模式,可观察采集性能,便于发现和解决各种错误
多条采集规则一键切换,支持导入导出
内置强大替换和过滤功能,标签过滤、站内外过滤、字符串替换、等等
IP屏蔽功能,屏蔽想要屏蔽IP地址让它无法访问
蜘蛛访问记录
高级功能
url过滤功能,可过滤屏蔽不采集指定链接
伪原创,近义词替换有利于seo
伪静态,url伪静态化,有利于seo
自动缓存自动更新,可设置缓存时间达到自动更新,css缓存
简繁体互转
代理IP、伪造IP、随机IP、伪造user-**ent、伪造referer来路、自定义cookie,以便应对防采集措施
url地址加密转换,个性化url,让你的url地址与众不同
关键词内链功能
插件机制,内容灵活控制
还有更多功能等你发现……
ftp上传需使用二进制上传方式,方法请百度
data文件夹需要读写权限
首次使用程序请到后台进行相关设置,否则出现错位、空白等现象
默认后台:http://网站地址/@admin/index.php 默认账号: admin 默认密码: admin
程序使用环境 php5.2 - php7.0
vivi小偷程序 更新日志:
v6.1 更新
1.增强ajax编码的识别
2.增加json、字体等文件的缓存识别
3.增加判断过滤屏蔽未设置错误页时,自动跳转到首页
4.修改当未设置子域名映射TDK时,tdk取至目标站
5.修复后台无法清除首页缓存
6.修复首页多后缀识别
v6.0 主要更新
全面支持php7,性能提升70%
增加支持特殊语种网站,如:日语、韩语、俄语等
增加URL路由,实现全站URL变换,个性化本站URL地址(强!!)
增加前台支持指定编码输出(完美解决某些UTF-8站点(如:搜索引擎)导致的乱码)
增加支持设置缓存路径,根据URL路径方式、hash文件分布式方式(方便查找/修改缓存文件)
超级模板增加栏目、文章缓存功能,可多页面调用文章
超级模板增加移动模板、自定义栏目功能
增加文本内容调用,可随机调用文本内容到标签
增加指定URL规则设置缓存,可实现不同页面不同缓存时间
增加模拟终端浏览器,可实现采集类似Discuz论坛的移动端(破防采集处设置)
增加域名重定向到www
增加首页多后缀识别,如:index.html,index.php,default.html等等
增加自动获取301、302重定向的采集,解决跳WWW,跳https采集
增加支持自定义标签双向替换(字符串替换),此前仅支持替换后
增加百度主动推送,加速收录【插件】
增强中文URL的兼容,如:搜索乱码(接近完美)
增加跟随cookie选项,实现部分站点的注册、登录等功能