大神,我用php中的正则获取小说的章节内容,为什么获取的是空的,我不知道哪里错了.

求大神帮忙看看,谢谢
这是要匹配的://<li><a href="/chapter/7733231.html" title="章节名:第一章 承业帝其人 章节字数:3127 更新日期:2017-04-23">第一章 承业帝其人</a><li>
这是代码:
<?php
$url = "网站地址";
$url = file_get_contents($url);
preg_match_all("!<li><a href=\"(.*?).html\" title=\"(.*?)\">(.*?)</a></li>!",$url,$result);
var_dump($result);

第1个回答  2017-07-22
echo "\n\n抓取网页=======================================\n";
function getHTTPS($url) {
$ch = curl_init ();
curl_setopt ( $ch, CURLOPT_SSL_VERIFYPEER, FALSE );
curl_setopt ( $ch, CURLOPT_HEADER, false );
curl_setopt ( $ch, CURLOPT_FOLLOWLOCATION, true );
curl_setopt ( $ch, CURLOPT_URL, $url );
curl_setopt ( $ch, CURLOPT_REFERER, $url );
curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, TRUE );
$result = curl_exec ( $ch );
curl_close ( $ch );
return $result;
}
$result = getHTTPS ( "当前网址" );

if (preg_match_all ( "/<li>(?:(?!<\/li>)[\s\S])*<\/li>/i", $result, $m )) {
for($j = 0; $j < count ( $m [0] ); $j ++) {
echo $m [0] [$j] . "\n";
}
}

本回答被网友采纳
第2个回答  2020-04-30
内容中有(")(')(换行符)等等,需要用array把这些替换成空
function myTrim($str){$search = array(" "," ","\n","\r","\t","<br/>"," ","<br>","'",'"');$replace = array("","","","","","","","","","");return str_replace($search, $replace, $str);}

调用:
$页面 = myTrim($页面);//去空格..

相关了解……

你可能感兴趣的内容

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 非常风气网