Tecnología

Inicio

¿Cómo hacer que raspa contenido

¿Cómo hacer que raspa contenido


El raspado es utilizado por los desarrolladores web para aplicar rápidamente el contenido de sus páginas web terminadas. La herramienta busca y adquiere información a través de la World Wide Web para rellenar las páginas que han creado. codificadores sofisticados pueden crear sus propios programas de raspado web, o puede comprar uno de los estantes. Los programas también están disponibles para su compra que se puede personalizar.

Instrucciones

1 Abra un programa de desarrollo Web, como el Notepad de Windows. Descargar una librería PHP para facilitar las funciones que necesita para su código.

2 Instalar otra herramienta de desarrollo Web o Firebug. Esto permitirá que usted pueda inspeccionar la estructura de datos de los sitios web que están raspando.

3 Elija un término de búsqueda para insertar en una búsqueda en Internet y raspar desde cualquier página de la web. Base el término de búsqueda en su preferencia o uso previsto.

4 Utilice el programa de desarrollo Web para analizar la estructura de datos de las páginas haciendo clic en un enlace en una de las páginas que aparecen después de realizar su búsqueda. Su programa de desarrollo Web destacará donde está contenido el contenido.

5 Determinar donde el contenido se encuentra en la página. Si está dentro de una etiqueta de párrafo <p> con el nombre id "línea", contenido de extracto con el siguiente código:

$ data = $ html-> find ( 'p [id = línea]');

echo $ datos [0] -> los niños (1);

Coloque esto en su programa de HTML con el enlace web. La función de los niños se usa para raspar los enlaces patrocinados también.