Der Algorithmus wurde zur Grundlage der difflib-Bibliothek in Python, welche mit der Version 2.1 eingeführt wurde.^[1] Aufgrund des ungünstigen Laufzeitverhaltens des Ähnlichkeitsmaßes wurden drei Methoden implementiert, von denen zwei eine obere Schranke in einer schnelleren Laufzeit zurückgeben können.^[1] Die schnellste Variante vergleicht lediglich die Länge der beiden Teilstrings:^[5]

D_{rqr}={\frac {2\cdot \min(|S1|,|S2|)}{|S1|+|S2|}}

,

# Drqr Implementierung in Python
def real_quick_ratio(s1: str, s2: str) -> float:
    """Return an upper bound on ratio() very quickly."""
    l1, l2 = len(s1), len(s2)
    length = l1 + l2

    if not length:
        return 1.0

    return 2.0 * min(l1, l2) / length

Die zweite obere Schranke setzt die doppelte Summe aller verwendeten Zeichen aus $S_{1}$ , die in $S_{2}$ vorkommen, ins Verhältnis zur Länge beider Zeichenketten. Die Zeichenfolgen bleiben dabei unberücksichtigt.

D_{qr}={\frac {2\cdot {\big |}\{\!\vert S1\vert \!\}\cap \{\!\vert S2\vert \!\}{\big |}}{|S1|+|S2|}}

,

# Dqr Implementierung in Python
def quick_ratio(s1: str, s2: str) -> float:
    """Return an upper bound on ratio() relatively quickly."""
    length = len(s1) + len(s2)

    if not length:
        return 1.0

    intersect = collections.Counter(s1) & collections.Counter(s2)
    matches = sum(intersect.values())
    return 2.0 * matches / length

Trivialerweise gelten:

0\leq D_{ro}\leq D_{qr}\leq D_{rqr}\leq 1

und

0\leq K_{m}\leq |\{\!\vert S1\vert \!\}\cap \{\!\vert S2\vert \!\}{\big |}\leq \min(|S1|,|S2|)\leq {\frac {|S1|+|S2|}{2}}

.

Komplexität

Die Laufzeit dieser speziellen Python-Implementierung ist $O(n^{2})$ im schlechtesten Fall und $O(n)$ im besten Fall.^[1]

Algorithmus

Beispiel

Eigenschaften

Komplexität

Kommutativgesetz

Anwendungsbereiche

Komplexität

Belege

Literatur

Siehe auch