nov 3 2008

Crawler em PHP para capturar os links de qualquer site

<html>
<head><title>PHP Website Crawler</title></head>
<body>
<font face="verdana" color=#66ccff">
<form id="crawl" method="post" action="">
 
<label>URL:
<input name=”url” type=”text” id=”url” value=<?php $url; ?>http://website.com” size=”70″ maxlength=”255″ />
</label>
<br />
<br />
<label>
<input type=”submit” name=”Submit” value=”Crawl!/>
</label>
<br />
</form>
</body>
</html>
<?php
if (isset($_POST['url'])) {
$url = $_POST['url'];
$f = @fopen($url,”r”);
while( $buf = fgets($f,1024) )
{
$buf = fgets($f, 4096);
preg_match_all(/<\s*a\s+[^>]*href\s*=\s*[\"']?([^\"' >]+)[\"' >]/isU”,$buf,$words);
for( $i = 0; $words[$i]; $i++ )
{
for( $j = 0; $words[$i][$j]; $j++ )
{
$cur_word = strtolower($words[$i][$j]);
print “$cur_word<br>”;
}
}
}
}
?>
TAGS:


2 Comentários:

Trackbacks

  1. Edmar diz:
    Interessante esse artigo, especialmente aos nossos amigos que gostam de uma boa linguagem dinamica.

    Flww

    dezembro 30th, 2010 às 5:54 pm
  2. Viconcursos diz:
    muito bom esse artigos php da pra fazer muita coisa.. grande abraço
    outubro 11th, 2011 às 10:30 am

DEIXE UM COMENTÁRIO

Subscrever

Subscreve o Blog



Publicidade

Comentários Recentes

  • shirley Balazs: Parabéns!! Informações de utilidade publica e de primeira, foi muito útil a mim.Obrigada!!
  • Jefferson Ferreira de brito: eu quero muito
  • thiago valente: Eu quero um para mim
  • Lucas martins balieiro: Eu não fiz o enem mesmo assim eu posso me inscrever no site essa é minha dúvida, só queme...
  • Francisca Marli Oliveira: quero saber quanto tenho no meu fgts

Links

Leitores Recentes

VALE O CLIQUE!

Site Seguro Ocioso

Divulgue o blog Infomaroto em seu site e tenha seu link ou banner aqui.
Blog Infomaroto