curl ——爬取网页数据
使用CURL的PHP扩展完成一个HTTP请求的发送一般有以下几个步骤:
1、初始化连接句柄;
2、 配置参数;
3、执行并获取结果;
4、释放CURL连接句柄。
下面是curl模拟get请求 ,抓取网页内容:
$url="http://book.zongheng.com/chapter/672340/36898237.html";
//1.初始化curl $ch=curl_init($url);//第一步,我们通过函数curl_init()创建一个新的curl会话 //2.设置传输选项(向服务器端发送请求) //curl_setopt($ch,CURLOPT_URL,$url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); //3.执行curl请求(接收服务器端发送的数据) $output=curl_exec($ch); //4.关闭curl curl_close($ch); //匹配标题第一章 惊蛰preg_match_all("/(.*?)<\/div>/", $output, $title); //匹配p标签段落内容二月二,龙抬头。
preg_match_all("/(.*?)<\/p>/", $output, $match); //. 是任意字符 可以匹配任何单个字符, //.*? 表示匹配任意字符到下一个符合条件的字符 $a=$match[0]; echo implode( ' ',$a);