Tecnología

Inicio

Cómo capturar un título de la página Uso de PHP

Cómo capturar un título de la página Uso de PHP


Cuando usted necesita para obtener el título de una página Web en un script PHP y buscar en la documentación para una constante predefinida que contiene el título, que no encontrará uno. Sin embargo, ya que usted sabe que el título de una página Web, se encuentra dentro de la etiqueta <title> en su código HTML, puede idear una solución que lee el código y encuentra el título. Utilizar una expresión regular para extraer el título hace que sea una tarea bastante simple en PHP.

Instrucciones

1 Crear una expresión regular entre mayúsculas y minúsculas que extrae los caracteres entre la apertura y el cierre de etiquetas <title>. Por ejemplo:

<? Php
$ Title_regex = '(. +)% <Title> <\ / title>% i';

2 File_get_contents utilizar para almacenar el contenido de la página HTML en una variable. Por ejemplo:

$ Page = file_get_contents ( "http://example.com/index.html&quot;);

3 Analizar el código HTML usando la expresión regular. Pasar una matriz vacía para PHP para poblar con todo el partido como el primer elemento de la matriz y el texto entre las etiquetas de título como el segundo elemento. Por ejemplo:

$ Coincidencias = array ();
/ Toda partido será en $ coincidencias [0] y el texto del título estará en $ coincidencias [1] /
si (preg_match ($ title_regex, página $, $ coincide) && isset ($ coincidencias [1]))
partidos title = $ $ [1];
más
$ Title = "no encontrado";
?>

Consejos y advertencias

  • Si va a abrir una página Web que tiene espacios o caracteres especiales en la URL, codificarlo con urlencode. Por ejemplo:
  • $ page = file_get_contents (urlencode ( "http://example.com/my pagina.html"))
  • Algunos servidores Web pueden no permitirá obtener el contenido de un archivo HTML con file_get_contents ().