OSMOZ-IT — Projekt semantisches Matching
Kontext
OSMOZ-IT hat Schwierigkeiten bei der Identifizierung von Serienepisoden: Titel und Nummern variieren je nach Ausstrahlungsland, was die Zuordnung komplex macht. Ein kurzer Pilot mit OpenSearch bestätigte die Machbarkeit eines semantischen Matching-Ansatzes für Synopsen.
Gelieferte Lösung
- Vektormotor : OpenSearch in Docker für die semantische Suche.
- Mehrsprachige Embeddings : Umwandlung von Synopsen in Embedding-Vektoren über mehrsprachige Modelle.
- Import und Suche : Datenerfassung in mehreren Sprachen, Suche über Dev Tools und REST-API.
- Vergleichender Benchmark : Modellbewertung, Suchstrategien und statistische Analyse.
- Schlüsselfertige Lieferung : Dockerfile, Docker Compose, technische Zusammenfassung, Demo-Notebook und Testergebnisse.
Benchmark
Ein Benchmark-Ansatz wurde durchgeführt, um die Lösung zu validieren: Vergleich von Embedding-Modellen (proprietär vs. Open Source), Analyse von Suchstrategien (Mindest-Score-Schwelle, Top-k) und statistische Auswertung (Präzision, Recall, MRR, NDCG). Das Ziel war eine korrekte Matching-Rate von über 90 % bei einer repräsentativen Stichprobe.
Kundenstimme
„Ich habe Ninoh und Joël mit der Entwicklung eines Prototyps für semantisches Matching von Serienepisoden beauftragt. Die Qualität der Lieferung und die Präzision ihres Berichts übertrafen meine Erwartungen bei weitem. Ich empfehle Ninoh und Joël wärmstens jedem Unternehmen, das zuverlässige und gründliche KI-Experten sucht.“
— Marc OZONNE, Mitgründer, OSMOZ-IT