正则表达式用于打印URL中包含特定单词的任何网页中的URL

织梦狗教程 php问题

2022-01-01

regex to print url from any webpage with specific word in url(正则表达式用于打印URL中包含特定单词的任何网页中的URL)

本文介绍了正则表达式用于打印URL中包含特定单词的任何网页中的URL的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我正在使用下面的代码从网页中提取url，它工作得很好，但我想要过滤它。它将显示页面中所有URL，但我只想要由单词"Super"组成的URL

     $regex='|<a.*?href="(.*?)"|';
preg_match_all($regex,$result,$parts);
$links=$parts[1];
foreach($links as $link){
echo $link."<br>";

       }

所以它应该只在单词SUPER出现的地方回显uls。例如，它应该忽略url

       http://xyz.com/abc.html

但它应该回显

        http://abc.superpower.com/hddll.html

因为它由url中必需的单词Super组成

更新：以下是使用DOM解析器的代码：

$request_url ='1900girls.blogspot.in/';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $request_url);    
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); 
$result = curl_exec($ch);

$doc = new DOMDocument();
libxml_use_internal_errors(true);
$doc->loadHTML($result); // loads your html
$xpath = new DOMXPath($doc);
$needle = 'blog';

$nodelist = $xpath->query("//a[contains(@href, '" . $needle . "')]");
for($i=0; $i < $nodelist->length; $i++) {
    $node = $nodelist->item($i);
    echo $node->getAttribute('href') . "
";
}

这篇关于正则表达式用于打印URL中包含特定单词的任何网页中的URL的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持编程学习网！

织梦狗教程

本文标题为：正则表达式用于打印URL中包含特定单词的任何网页中的URL