Cómo extraer contenido de un HTML con htmlSQL

Con la popularización del RSS es muy fácil obtener contenido de ciertos sitios web para manipular esa información de diferentes maneras, pero ¿qué hacemos cuando no tenemos RSS ni nada por el estilo? para esto existe htmlSQL que se trata de una clase escrita en PHP que te permite acceder a los valores de un documento HTML de una manera muy fácil tal y cómo se hace una consulta en SQL. Esto quiere decir que no tendrás que escribir funciones complejas o expresiones regulares para extraer valores específicos de un HTML. Un ejemplo sencillo de una consulta es la siguiente:

htmlsql_example.png

Esta consulta da cómo resultado una matriz (array) con todos los enlaces href y títulos title de las etiquetas a que contienen el atributo: class="list".

Cómo usar htmlSQL

Soalmente tienes que incluir los archivos “snoopy.class.php” y “htmlsql.class.php” en tus scripts PHP al descargar vienen algunso ejemplos para que veas su modo de uso que es muy simple.

Página de descarga y demo cabe destacar que la licencia de este script es la BSD license.

3 Comentarios (Agrega el tuyo)

  1. Comentado 12 Noviembre 2007 a las 4:53 | Permalink | Responder ↓

    excelente!! como no lo vi antes!?? :)

    muy bueno el blog.. abrazo.

  2. miguel
    Comentado 1 Diciembre 2007 a las 21:06 | Permalink | Responder ↓

    hola quisiera como sacarl el contenido el video de una pagina que es de pago….e tratado con el programa (web copier) y me saca todos los documentos html de la pagina pero mi prolema es como sacar solo el video de que esta dentro del documento html
    para poder tenerlo en mi pc o quemarlo en un cd
    con el tiempo..gracias por tu ayuda …si tienen alguna ayuda escriban a wlinviter@hotmail.com

Escribe un Comentario

Su correo nunca será publicado ni compartido. Los campos requeridos están marcados *

*
*

Un Trackback (URL del trackback)

  1. [...] Descubro en el blog de Carlos Leopoldo una genial librería escrita en php, que nos permite acceder a contenido html de sitios web remotos desde nuestra aplicación, mediante consultas tipo SQL: htmlSQL. [...]