Comunidad de diseño web y desarrollo en internet online

extraer cierta información de un resultado arrojado en php

Citar            
MensajeEscrito el 08 Nov 2011 04:00 am
hola buenas tengo una duda corrí un archivo spider para capturar los links de un sitio web para enumerarslos en un directorio el tema es el siguiente necesito que los resultados que se encuentren entre las "http://" se almacenen en mi bd aqui un ejemplo del resultado.

Código PHP :

Fetching http://www.cristalab.com/ [OK]
Fetching http://www.cristalab.com/#header [OK]
Fetching http://www.cristalab.comblog/entrevista-a-puelo-games-creadores-de-juegos-flash-c101724l [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comblog/entrevista-a-puelo-games-creadores-de-juegos-flash-c101724l [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comblog/entrevista-a-puelo-games-creadores-de-juegos-flash-c101724l [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/juegos [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/flash [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/pixelart [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/samsung [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/telefonos [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/moviles [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/wtf [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/android [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comblog/barcamp-patagonia-2011-c101433l [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comblog/barcamp-patagonia-2011-c101433l [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comblog/barcamp-patagonia-2011-c101433l [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/argentina [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/eventos [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comblog/la-revolucion-de-javascript-c101359l [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comblog/la-revolucion-de-javascript-c101359l [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comblog/la-revolucion-de-javascript-c101359l [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/javascript [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/jquery [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/nodejs [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/html5 [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/coffeescript [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/dart [Not fetched] (robots.txt rules, meta tags rules or error)
Fetching http://www.cristalab.comtags/google [Not fetched] (robots.txt rules, meta tags rules or error)


esto es lo que necesito extraer gracias.

Por oldcid

1 de clabLevel



 

chrome
Citar            
MensajeEscrito el 08 Nov 2011 12:08 pm
¿Entre las "http://"?, pero si solo hay una... :S

Por DriverOp

Claber

2510 de clabLevel



 

opera
Citar            
MensajeEscrito el 08 Nov 2011 02:06 pm
no es clara tu necesidad, explícate un poco más!

Por jpcw

Claber

1715 de clabLevel

1 tutorial

Genero:Masculino  

AlgoritmicBrainDesigner

chrome
Citar            
MensajeEscrito el 10 Nov 2011 01:31 pm
disculpas por haber sido tan breve y no explicativo bueno lo que quería decirles es que necesito extraer de ese texto todas las url y almacenarlas en mi bd para luego poder acceder a ellas.

Por oldcid

1 de clabLevel



 

chrome
Citar            
MensajeEscrito el 10 Nov 2011 04:24 pm
Pues con expresiones regulares:

Código PHP :

preg_match_all("/^Fetching\s(.*?)\s\[/im",$cadena,$resultado);
echo "<pre>"; var_dump($resultado[1]); echo "</pre>";

Por DriverOp

Claber

2510 de clabLevel



 

opera

 

Cristalab BabyBlue v4 + V4 © 2011 Cristalab
Powered by ClabEngines v4, HTML5, love and ponies.