Tecnología

Inicio

Cómo detectar Sustantivos en Python

Cómo detectar Sustantivos en Python


La detección de los sustantivos en Python llama a las habilidades de un programador y un lingüista. El idioma Inglés en sí pone trampas para el lingüista computacional intrépido con su rica ambigüedad morfológica. Por ejemplo, la palabra "cruza" podría ser un sustantivo en plural o una tercera persona verbo en tiempo presente. Afortunadamente, los creadores del módulo Python Natural Language Toolkit han desarrollado un etiquetador parte de discurso que da cuenta de estas dificultades y puede etiquetar las palabras de frases en inglés con sus respectivas partes del discurso, incluyendo sustantivos.

Instrucciones

1 Descargar e instalar el módulo de Python Natural Language Toolkit desde el sitio web ntlk.org proyecto. Es posible que tenga que instalar módulos adicionales para apoyar NLTK.

2 Abra una ventana de terminal y comenzar una sesión de Python Python tecleando en el indicador de línea de comandos. Cuando Python está en funcionamiento, invocar el módulo de NLTK con el NLTK importación de comandos. Las indicaciones y comando sería similar a este en Mac OS X:

Mi-MacBook Pro-: ~ $ pna1 pitón

Python 2.6.1 (R261: 67515 24 Jun 2010 21:47:49)

[GCC 4.2.1 (Apple Inc. construir 5646)] en Darwin

Tipo de "ayuda", "derecho de autor", "créditos" o "licencia" para obtener más información.

NLTK importación

3 Invocar la parte de etiquetador de voz e introduzca la frase en la que desea detectar sustantivos escribiendo los siguientes comandos y datos en el interfaz de Python:

text = nltk.word_tokenize ( "El hombre cruza la calle para vender cruces.")

nltk.pos_tag (texto)

4 Pulse la tecla de retorno después de >>> nltk.pos_tag (texto)

[( 'El', 'DT'), ( 'hombre', 'NN'), ( 'cruza', 'VBZ'), ( 'la', 'DT'), ( 'calle', 'NN') , ( 'a', 'a'), ( 'vender', 'VB'), ( 'cruces', 'NNS'), ( '.', '.')]

NLTK ha etiquetado correctamente cada palabra en la oración. En particular, se ha detectado los sustantivos y los etiquetados como sustantivos singulares con NN (hombre, calle) y los nombres plurales con NNS (cruces) y ha marcado correctamente la primera aparición de cruces como un verbo con el VBZ etiqueta.

Consejos y advertencias

  • Si quieres ver lo que hay bajo el capó de un módulo de procesamiento de lenguaje como NLTK, debe tomar cursos en Procesamiento del Lenguaje Natural y lingüística computacional.