php关键词抓取链接源码

admin 2021年8月9日23:39:31评论101 views字数 1125阅读3分45秒阅读模式

<?php


    error_reporting(E_ERROR);


    set_time_limit(0);


    $keyword= '飓风'; // 批量关键字


    $filedir= "test.txt";


    $timeout= 20; 


    $startpage= 1; 


    $lastpage= 4; //


    $list= ReadBaiduList($keyword,$timeout,$startpage,$lastpage);


    $num= count($list);


    $fp= fopen("$filedir",w);


    if($fp) {


        for($i=0;$i<=$num;$i++) {


            fwrite($fp,$list[$i]."n");


        }


    }else{


        echo'<font color=red>can not open file';


    }


    fclose($fp);


 


//http://www.baidu.com/s?wd=飓风&pn=40&ie=utf-8&usm=1


functionReadBaiduList($keyword,$timeout,$startpage,$lastpage) {


   for($i=$startpage; $i<$lastpage; $i++) {


        $nowpage= ($i-1)*10;


        $fp= @fsockopen('www.baidu.com',80,$errno,$errstr,$timeout);


        @fputs($fp,"GET /s?wd=".urlencode($keyword)."&pn=".$nowpage." HTTP/1.1rnHost:

rnConnection: Closernrn");


        while($fp&& !feof($fp))


        $data.= fread($fp, 1024);


        @fclose($fp);


        preg_match_all("/<span class="g">(.*)</span>/iU",$data,$tmp);


    }


        foreach($tmp[1] as$value) {


            $list= explode('/',$value);


            $lastlist[] = $list[0];


        }


        $lastlist= array_unique($lastlist);


        return$lastlist;


 }


 


?>


本文始发于微信公众号(飓风网络安全):php关键词抓取链接源码

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2021年8月9日23:39:31
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   php关键词抓取链接源码http://cn-sec.com/archives/359558.html

发表评论

匿名网友 填写信息