Zum Inhalt springen

Levenshtein-Afstand

Vun Wikipedia

De Levenshtein-Afstand von twee Tekenkeden gifft an, wo faken een Teken ännern, rutnehmen oder tofögen mutt, üm de een Tekenkeed in de annere ümtowanneln. Nöömt is dit Maat na’n russ’schen Mathematiker Wladimir Iossifowitsch Lewenstein, de em 1965 opbröcht hett.

De Levenshtein-Afstand von de Tekenkeden „Katt“ un „Koort“ is 3:

0. Katt
1. Ännern von ‚a‘ to ‚o‘: Kott
2. Ännern von ‚t‘ to ‚r‘: Kort
3. Infögen von ‚o‘: Koort

In de Praxis warrt de Levenshtein-Afstand to’n Bispeel bi de Rechtschrievkorrektur oder bi dat Kennen von dubbelte Indrääg in Datenbestänn bruukt. Ok in de Computerlinguistik warrt he bruukt. Dör dat Bereken von Levenshtein-Afstänn von Dialektwöör lett sik en Maat opstellen, wo dicht Dialekten verwandt sünd, wat sik denn wedder in Dialektkoorten dorstellen lett (Bispelen ünner de Weblenken).