Om Identifizierung von Schriftstellern anhand von Graphemen
Die Handschrift ist eine der verhaltensbiometrischen Techniken zur Identifizierung von Personen. Die Identifizierung von Schriftstellern ist ein Forschungsgebiet, das sich auf die Bestimmung der Urheberschaft eines bestimmten Textes konzentriert. Dies kann durch verschiedene Techniken und Methoden geschehen, die oft linguistische Analysen, maschinelles Lernen und computergestützte Ansätze beinhalten. Im Folgenden werden einige wichtige Aspekte und Methoden im Zusammenhang mit der Identifizierung von Autoren genannt. Diese Algorithmen können auf einem Datensatz bekannter Autoren trainiert werden, um Muster und Merkmale zu erlernen, die für jeden Autor spezifisch sind. Die vorliegende Arbeit basiert auf handschriftlichen strukturellen Primitiven, die als Grapheme bezeichnet werden. Der verwendete Datensatz ist die IAM Offline English Database. Zunächst werden Bilder von Handschriften in Grapheme segmentiert und dann werden die Grapheme als Projektionsprofil dargestellt, d.h. die Positionen jedes schwarzen Pixels der erhaltenen Segmentkurve werden aufgezeichnet. Dann wird ein Wörterbuch aus den trainierten Bildern der Handschrift mit Hilfe von k-means clustering erstellt. Anhand des Wörterbuchs werden nun die Merkmalsvektoren der Handschrift generiert und mit der Bezeichnung der Handschrift gespeichert.
Vis mer