On Tuesday, August 26, 2025, at 18:00, Mrs. Despina Konstantinidou of the
graduate
program “Data Science and Information Technologies”, track on “Big Data
and Artificial
Intelligence”, will present her MSc thesis titled:
Text Line Detection in Greek Polytonic Documents: A Comparative Analysis
of CRAFT, EAST, PaddleOCR and YOLO.
Abstract
Text line detection is a critical preprocessing step in historical
document analysis and Optical Character Recognition (OCR), especially in
complex scripts such as Greek polytonic texts. These documents, rich in
diacritical marks and varying layouts, pose unique challenges for line
segmentation. In this thesis, we propose a comparative approach using
three deep learning-based methods: the Character-Region Awareness For Text
detection (CRAFT) detector, the Efficient and Accurate Scene Text (EAST)
detector, the PaddleOCR model and two recent state-of-the-art versions of
the YOLO family of object detection models: YOLOv11-seg and YOLOv11-obb. A
curated dataset of scanned Greek polytonic manuscripts and printed
materials was used with line-level ground truth annotations. Our pipeline
includes preprocessing, model training, and evaluation using precision,
recall, f1 score and speed. Results indicate that YOLOv11-obb outperforms
the rest of the models in dense text regions. This work contributes to
improved text line segmentation in digitization efforts and downstream
polytonic OCR tasks.
EXAMINATION COMMITTEE:
Dr. Stavros Perantonis, Research Director, National Center for Scientific
Research “Demokritos”
Dr Vasileios Gatos, Researcher, National Center for Scientific Research
“Demokritos”
Dr. Panagiotis Stamatopoulos, Assistant Professor, National and
Kapodistrian University of Athens
26 August 2025
18:00 – 19:00 (GTB)
Meeting link: Defense of Master’s Thesis | Zoom | Meetup-Join
Την Τρίτη 26 Αυγούστου 2025, στις 18:00, η κ. Δέσποινα Κωνσταντινίδου
μεταπτυχιακή
φοιτήτρια του προγράμματος «Επιστήμη Δεδομένων και Τεχνολογίες
Πληροφορίας», με
ειδίκευση «Μεγάλα δεδομένα και τεχνητή νοημοσύνη», θα παρουσιάσει
διαδικτυακά την
διπλωματική εργασίας της με τίτλο:
Ανίχνευση Γραμμών Κειμένου σε Πολυτονικά Ελληνικά Έγγραφα: Συγκριτική
Ανάλυση των CRAFT, EAST, PaddleOCR και YOLO.
Περίληψη
Η ανίχνευση γραμμών κειμένου αποτελεί κρίσιμο προπαρασκευαστικό βήμα στην
ανάλυση ιστορικών εγγράφων και στην Οπτική Αναγνώριση Χαρακτήρων (OCR),
ιδιαίτερα σε σύνθετα συστήματα γραφής όπως τα ελληνικά πολυτονικά κείμενα.
Τα έγγραφα αυτά, πλούσια σε διακριτικά σημεία και ποικίλες διατάξεις,
παρουσιάζουν μοναδικές προκλήσεις για τον διαχωρισμό γραμμών. Στην παρούσα
διπλωματική εργασία προτείνουμε μία συγκριτική προσέγγιση με χρήση τριών
μεθόδων βασισμένων σε νευρωνικά δίκτυα βάθους: τον ανιχνευτή
Character-Region Awareness For Text (CRAFT), τον ανιχνευτή Efficient and
Accurate Scene Text (EAST), το μοντέλο PaddleOCR, καθώς και δύο πρόσφατες
υπερσύγχρονες εκδόσεις της οικογένειας μοντέλων ανίχνευσης αντικειμένων
YOLO: YOLOv11-seg και YOLOv11-obb. Χρησιμοποιήθηκε ένα επιμελημένο σύνολο
δεδομένων από σαρωμένα πολυτονικά ελληνικά χειρόγραφα και έντυπα, με
ετικέτες σε επίπεδο γραμμής. Η διαδικασία περιλαμβάνει προεπεξεργασία,
εκπαίδευση των μοντέλων και αξιολόγηση μετρικών όπως η ακρίβεια
(precision), η ανάκληση (recall), f1 score και η ταχύτητα. Τα αποτελέσματα
δείχνουν ότι το YOLOv11-obb υπερέχει των υπόλοιπων μοντέλων σε περιοχές με
πυκνό κείμενο. Η εργασία αυτή συμβάλλει στην καλύτερη κατάτμηση γραμμών
κειμένου για έργα ψηφιοποίησης και στην περαιτέρω βελτίωση της OCR για
πολυτονικά ελληνικά.
ΕΞΕΤΑΣΤΙΚΗ ΕΠΙΤΡΟΠΗ:
Δρ. Σταύρος Περαντώνης, Διευθυντής Ερευνών, Εθνικό Κέντρο Έρευνας Φυσικών
Επιστημών “Δημόκριτος”
Δρ. Βασίλειος Γάτος, Ερευνητής, Εθνικό Κέντρο Έρευνας Φυσικών Επιστημών
“Δημόκριτος”
Δρ. Παναγιώτης Σταματόπουλος, Επίκουρος Καθηγητής, Εθνικό και
Καποδιστριακό Πανεπιστήμιο Αθηνών
26 Αυγούστου 2025
18:00 – 19:00 (GTB)
Meeting link: Defense of Master’s Thesis | Zoom | Meetup-Join
Leave A Comment