Institut für Programmstrukturen und Datenorganisation

Terminkalender

ABBRECHEN || neuen Vortrag anmelden | Vorträge durchsuchen
Monat zurück | Vorträge dieser Monat | Monat vor


Fr, 08.07.2016 Herr Martin Fietz (Diplomarbeit) ID: 100223
Incremental duplicate detection in bibliographical databases
Betreuer: Georg Steinbuß
Kurzfassung:
Bibliographien wie RefBank erlauben es ihren Nutzern, den Datenbestand selbst mit neuen Literaturangaben zu erweitern. Da Referenzen sehr anfällig für Fehler sind, führt dies ohne geeignete Maßnahmen unweigerlich zu Duplikaten. Um dies zu vermeiden, sollen Duplikate umgehend nach dem Hinzufügen erkannt werden. Dazu stellen wir ein inkrementelles Verfahren zur effizienten Duplikaterkennung mit Schwerpunkt auf Bibliographien vor. Dabei untersuchen wir die Eignung verschiedener Datenbanktechnologien im Hinblick auf ihre Skalierbarkeit. Außerdem evaluieren wir ausführlich verschiedene Einstellungen (Blocking).
Passwort: