Tecnología

Inicio

Cómo extraer texto entre etiquetas HTML

Cómo extraer texto entre etiquetas HTML


A pesar de que puede ser que sepa lo que está en su página web, su página web puede que no. páginas Web consisten en HTML. HTML es el lenguaje de marcado que define cómo una página se ve. HTML consiste en etiquetas tales como etiquetas "H1", que definen las partidas. Etiquetas vienen en pares. Hay una etiqueta inicial y una etiqueta final. desarrolladores web colocan texto entre estas etiquetas. Por ejemplo, para crear un párrafo en una página, insertar un par de etiquetas "p". A veces, el código de la página Web necesita para extraer el texto entre estas etiquetas HTML. Puede hacer que el uso de JavaScript.

Instrucciones

1 Bloc de notas abierto y pega el código HTML siguiente:

<! DOCTYPE html PUBLIC "- // W3C // DTD XHTML 1.0 Transitional // EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<Html xmlns = "http://www.w3.org/1999/xhtml">

<Head>

&lt;title>Test Text Extraction&lt;/title>

<Script type = "text / javascript">

// FUNCIONES INSERT JAVASCRIPT ABAJO

</ Script>

</ Head>

<Body>

<H2 id = "encabezado1"> Este es un encabezado </ h2>

<Input type = "button" id = valor "HeadingButton" = "Mostrar el texto de encabezamiento" onclick = "showHeading ()" />

<P id = "el apartado 1"> Esto es un párrafo </ p>

<Input type = "button" id = "ParagraphButton" value = "Mostrar el párrafo de texto" onclick = "showParagraph ()" />

</ Body>

</ Html>

Esto crea un encabezamiento con un botón y un párrafo con un botón. Al hacer clic en la opción "Mostrar texto de encabezamiento de" botón llamar a una función de JavaScript que extrae el texto entre las etiquetas de título. Al hacer clic en el botón "Mostrar texto de párrafo" llamará a una función que extrae el texto entre las etiquetas de párrafo.

2 Pegue la siguiente función de JavaScript en la sección <script> del documento:

showHeading función () {

epígrafe var = document.getElementById ( 'Heading1');

var = HeadingText heading.innerHTML;

alert ( "La partida de texto es ->" + HeadingText);

}

showParagraph función () {

el párrafo var = document.getElementById ( 'El apartado 1');

var = paragraphText paragraph.innerHTML;

alert ( "El texto de párrafo es ->" + paragraphText);

}

La función "showHeading" utiliza el método document.getElementById para hacer el HTML de la partida visible en el código JavaScript. A continuación, extrae el texto de la partida mediante la recuperación de su propiedad "innerHTML" y almacenarlo en la variable llamada "HeadingText." La función "showParagraph" realiza la misma tarea utilizando el objeto del párrafo del HTML.

3 Pulse la tecla "Ctrl + S" para abrir el Bloc de notas de "Guardar como" ventana. Escriba un nombre para el archivo en el cuadro de texto "Nombre de archivo". Dar al archivo una extensión de .html. Por ejemplo, si desea asignar un nombre al archivo "MyTest," tipo "MyTest.html" (sin las comillas) en el cuadro de texto y haga clic en "Guardar" para guardar el documento como un archivo HTML.

4 Pulse "Windows + E" para abrir el Explorador de Windows y navegue hasta el archivo HTML. Haga doble clic en él. Su navegador se abrirá y mostrará el archivo. Haga clic en los botones. Las funciones de JavaScript mostrará el texto entre las etiquetas de título y de párrafo.

Consejos y advertencias

  • Utilice la propiedad "innerHTML" para establecer o recuperar el texto de cualquier elemento HTML que contiene texto. Cada elemento debe tener un ID, como se muestra en estos ejemplos.