原理:问答库的每个ip有几次的免费查询答案的机会,所以随机模拟IP,每次查询的随机生成ip进行访问,然后截取网页获得题目,答案,选项。理论上可实现无限爬题。
该源码实现自动截取搜索结果的第一个题目(可以自己写循环,我把循环代码省掉了),每搜索一次可自动转存入本地数据库。实现实时爬题~
代码内的转存入数据库被我注释掉了,有需要的可以自己打开,不需要的可以直接上传到网站内使用~
演示地址:http://149.129.113.103/ask.php?tm=题目
只是测试服务器,求求各位自己搭建,千万别爬我~~~~~
下面是存入数据库的步骤,不需要转存的不用看,直接将源码上传即可用,例如http://你的域名/ask.php?tm=题目
----------------------------------------------------------------------------------------------------------------------------------------
第一步:安装好php环境和mysql,phpmyamin管理
新建一个数据库,如数据库名为tiku.然后打开phpmyadmin,在SQL内输入
create table ask(
id int not null auto_increment primary key,
tm varchar(255) not null,
answer varchar(255) not null,
options varchar(255) not null
);

新建一个表ask,表内3个字段answer,tm,options。
第二步:上传源码至网站,将下面的注释删除


第三步:访问该文件即可,例如http://你的域名/ask.php?tm=题目
让用户每一次搜题,返回的题目,答案,选项都会转存到你自己的数据库中,一举俩得。你们都是我的工具人!