Institut für Programmstrukturen und Datenorganisation

Terminkalender

ABBRECHEN || neuen Vortrag anmelden | Vorträge durchsuchen
Monat zurück | Vorträge dieser Monat | Monat vor


Fr, 02.12.2016 Herr Jochen Gietzen (Bachelorthesis) ID: 100256
Konzeption eines internen Evaluationsmaßes für verschiedene Ausreißer Erkennungen
Betreuer: Georg Steinbuß
Kurzfassung:
Das Erkennen von Ausreißern in Datenbeständen ist eines der aktuellsten Themen im Bereich Data Mining. In der Praxis findet die Ausreißer-Erkennung ihre Anwendung, beispielsweise in der Kreditkarten-Betrugserkennung. In der Theorie werden noch immer neue Verfahren - wie das z.B. das HiCS-Verfahren entwickelt. Oft steht der Benutzer dabei vor dem Problem, dass er nicht weiß, welches Verfahren für seinen Fall am Besten geeignet ist. Im verwandten Clustering werden sogenannte interne Qualitätsmaße benutzt, wie der DUNN-Index, um eine Evaluation der Methoden vorzunehmen. Eine solche - anerkannte - interne Qualitätsmessung ist für die Ausreißer-Erkennung bisher noch nicht bekannt. Es ist jedoch für jedes Ausreißer- oder Clusteringverfahren essentiell, ein Qualitätsmaß zu besitzen, um zwischen guten und schlechten Ergebnissen unterscheiden zu können. Diese Arbeit soll eine Untersuchung von statistischen Maßen und deren Zusammenhang zu den Ergebnissen von Ausreißerverfahren, sowie ein erstes mögliches internes Qualitätsmaß bieten.
Passwort:  
 
Herr Kay Schmitteckert (Bachelorthesis) ID: 100259
Semi-automatische Generierung von aktiven Ontologien aus Webformularen
Betreuer: Martin Blersch
Kurzfassung:
Zunehmend sollen intelligente Sprachassistenten den Nutzern die Bedienung des Gerätes erleichtern und einfach Aufgaben wie beispielsweise das Erstellen von Kalendereinträgen übernehmen. Apples bekannter Sprachassistent Siri nutzt für die Verarbeitung natürlicher Sprache aktive Ontologien. Eine aktive Ontologie muss dazu für jede Domäne erzeugt werden. Das manuelle Erzeugen von aktiven Ontologien ist ein zeit- und arbeitsintensiver Prozess. Deshalb befasst sich das Projekt EASIER des Lehrstuhls IPD Tichy mit der Aufgabe, diesen Vorgang möglichst zu automatisieren. Diese Arbeit wurde als Bestandteil von EASIER erstellt und befasst sich mit der semi-automatischen Generierung aktiver Ontologien aus Webformularen. Dazu wurde zum einen ein Konstruktionsplan zur Zusammenführung von Webformularen einer Domäne erstellt. Außerdem wurden Ableitungsregeln definiert, welche vorgeben wie Webformulare zum Erzeugen aktiver Ontologien verarbeitet werden müssen. Auf der Grundlage dieser Vorarbeit wurde ein Werkzeug entwickelt, welches aus zusammengeführten Webformularen einer Domäne teilautomatisch über die Ableitungsregeln und Benutzerinteraktionen aktive Ontologien erzeugt.
Passwort:  
 
Herr Lukas Reister (Proposal) ID: 100263
Improving Outlier Score Combination in Subspaces
Betreuer: Holger Trittenbach
Kurzfassung:
Ausreißer bezeichnen, im Vergleich zum Rest, ungewöhnliche Daten in einem Datensatz. Um Ausreißer zu finden gibt es Ausreißer-Modelle die verschiedene Eigenschaften, wie Dichte oder Winkel, der Daten ausnutzen. Viele der Modelle berechnen einen Score zu jedem Datum, um die Ausreißereigenschaft zu quantifizieren. Scores hängen sowohl von Modell als auch den Daten ab und lassen sich oftmals schlecht vergleichen oder kombinieren. In hochdimensionalen Daten funktionieren diese Modelle nicht mehr gut. Man sucht daher in niedrig dimensionalen Projektionen, sogenannten Subspaces, nach Ausreißern. Diese Arbeit untersucht, wie durch Skalieren und Kombinieren der Scores aus den verschiedenen Subspaces ein bestmöglicher finaler Score berechnet werden kann. Es wird untersucht welche Kombination (z.B. Maximum oder Summation) und Skalierung die Interpretation der Scores verbessern kann. Dabei können dem Nutzer zusätzliche Informationen, wie z.B. der Subspace mit höchstem Score, als Information bereitgestellt werden.
Passwort:  
 
Frau Ines Machinek (Proposal) ID: 100264
Exploiting Neighborhood Relationships to Detect Outliers in Subspaces
Betreuer: Holger Trittenbach
Kurzfassung:
Fraud and novelty detection are two examples of the large research area of outlier detection. For high dimensional data, many outliers only appear in subspaces, i.e., lower dimensional projections of the data space. Identifying a good set of subspaces is challenging because the number of subspaces grows exponentially with the number of dimensions. In this work, we explore how neighborhood relationships of data objects can be used to improve subspace search methods. And how can those properties be used to increase the interpretability of outliers? Mainly two kinds of neighborhood relationships will be considered: k-nearest neighbor (knn) and reverse nearest neighbour (rnn) count. The rnn count is how often objects appear in the k-nearest neighborhood of other objects. Hubness has not been considered in subspaces until now.
Passwort:  
 
Herr Christian Olms (Proposal) ID: 100265
Active Learning for Outlier Detection in Subspaces
Betreuer: Holger Trittenbach
Kurzfassung:
Outlier detection algorithms are often unsupervised because obtaining labeled examples of outliers is expensive and difficult in many domains. However, even a small number of labeled objects can improve the detection result. For classification tasks, the use of active learning reduces the number of required examples significantly for many applications. The core idea of active learning is that the algorithm can query a human for feedback on selected objects in the dataset. In this thesis, we adapt the active learning paradigm to outlier detection. We apply active learning to high-dimensional datasets by combining the result of the same outlier score applied in different subspaces in a weighted model. In contrast to existing approaches, our adaption of active learning considers subspaces and do not rely on specific statistic models.
Passwort:  

Fr, 09.12.2016 Herr Sigmar Walter (Bachelorthesis) ID: 100255
Intelligente Algorithmenwahl durch Optimierung nomineller Parameter
Betreuer: Martin Tilmann
Passwort:  

Fr, 16.12.2016 Frau Robine Pene Magne (Diplomarbeit) ID: 100257
Extended Data Correctness for BPMN Processes
Betreuerin: Jutta Mülle
Kurzfassung:
Das Ziel dieser Arbeit ist die Erweiterung der Datenfluss-Korrektheit für BPMN2.0-Prozesse. Wir unterscheiden zwischen Datenfluss-Korrektheit als Datenverfügbarkeit und Datenfluss-Korrektheit mit datenzentrierten Compliance-Regeln. Der Schwerpunkt der Arbeit liegt auf der Datenfluss-Korrektheit als Datenverfügbarkeit. Die Ergebnisse einer früheren Arbeit zu BPMN2.0.Datenflusskorrektheit werden erweitert durch Festlegung und Berücksichtigung weiterer Parameter. Das Ziel ist, einen breiteren Bereich von Datenflussfehlern in BPMN-Prozessen zur Entwurfszeit abzudecken, die zu unerwünschten Prozessabläufen führen. Zunächst definieren und analysieren wir verschiedene Anforderungen an Datenflusskorrektheit. In einem zweiten Schritt erweitern wir die Datenunterstützung in BPMN2.0 mit neuen Datenelementen. Darauf aufbauend definieren wir verschiedene Datenflussfehler mittels "Data-Flow-Anti-Patterns". Für ihre Verifikation dem Modell-Checker LoLa, wird eine BPMN2PetriNet-Transformation von BPMN-Elementen und den zusätzlich angelegten Datenelementen erforderlich. Hierbei ist die Ausführungssemantik zu berücksichtigen. Die Formalisierung der "Data-Flow Anti-Patterns"wird durch die formale Sprache CTL erreicht.
Passwort:  
 
Herr Kai-Uwe Kirsch (Diplomarbeit) ID: 100267
Entwicklung und Evaluation einer flexiblen Plattform für Mehrgüterauktionen
Betreuerin: Jutta Mülle
Kurzfassung:
Der Vortrag befasst sich mit dem Entwurf und der Implementierung einer flexiblen Auktionsplattform. Flexibilität bezeichnet in diesem Zusammenhang die Fähigkeit einer solchen Plattform, den Entwurf und die Durchführung bekannter sowie neuer und modifizierter Auktionsformen zu ermöglichen. Bisherige Ansätze verwenden ein statisches, parametrierbares Modell zum Beschreiben von Auktionen. Die notwendigen Parameter werden durch die Analyse existierender Auktionsformen gewonnen und ermöglichen eine einfache Konfiguration bzw. Beschreibung unterschiedlicher Auktionsformen. Allerdings wirkt sich die Starrheit solcher Modelle nachteilig auf die Flexibilität aus. So erzwingen beispielsweise Änderungen eines Auktionsdesigns, die sich nicht auf die identifizierten Parameter beziehen, eine Erweiterung des Modells und eine Anpassung der Implementierung. Dem Ansatz dieser Arbeit liegt mehrstufiges Konfigurationskonzept zu Grunde mit deutlich höheren Grad an Flexibilität. Ausgangspunkt bildet die Modellierung einer konkreten Auktion als Prozessablauf (Workflow). Eine ausdrucksstarke Prozessbeschreibungssprache sowie der Einsatz von Geschäftsregeln (Business-Rules) ermöglichen sowohl den strukturellen Ablauf als auch das Verhalten einer Auktion detailliert zu spezifizieren.
Passwort: