Tecnología

Inicio

Cómo definir la distancia de edición entre dos cadenas

Cómo definir la distancia de edición entre dos cadenas


El algoritmo Levenshtein, comúnmente conocida como distancia de edición, es el número mínimo de operaciones de edición necesarias para transformar una cadena de datos, la cadena de origen, en otro, la cadena objetivo. Secuencias de letras o números comprenden cadenas de datos. operaciones de edición válidos incluyen la sustitución, inserción o deleción. Los programas como herramientas del corrector ortográfico y de corrección automática utilizan este algoritmo en su operación. Si bien el sistema algoritmo utilizado por los ordenadores y teléfonos inteligentes parece desalentador de comprender, el proceso básico de definir una distancia de edición es relativamente simple.

Instrucciones

1 Escribir o escriba las dos cadenas en una página lo que la cadena fuentes se alinea directamente por encima de la cadena de destino. Por ejemplo:

gato (cadena de origen)
el destino (cadena de destino)

2 Identificar los puntos de datos en una cadena difiere de la otra. Por ejemplo:

Gato (cadena de origen)
Fate (cadena de destino)

Las letras difieren en el primer punto (C y F), y la cadena de destino tiene un punto de datos adicional (E).

3 Aplicar el menor número de operaciones de edición (inserción, supresión, sustitución) posibles para cambiar la cadena de origen a la cadena de destino. Contar las ediciones. Por ejemplo:

Gato -> F sustituto para C e inserte E -> El destino

El cambio requiere dos operaciones de edición, una sustitución y una inserción, y no se puede completar en menos. Por lo tanto, la distancia de edición entre "gato" y "destino" es dos.