Παρασκευή 19 Απριλίου 2024
weather-icon 21o
Εκατομμύρια εικόνες παλαιών βιβλίων ελεύθερα διαθέσιμες στο Flickr

Εκατομμύρια εικόνες παλαιών βιβλίων ελεύθερα διαθέσιμες στο Flickr

Οι αναξιοποίητες εικόνες 600 εκατομμυρίων σελίδων από παλαιά βιβλία που έχει ψηφιοποιήσει ο μη κερδοσκοπικός οργανισμός Internet Archive ανεβαίνουν σταδιακά στο Flickr, με την συμβολή του ακαδημαϊκού Kalev Leetaru. Υπολογίζεται ότι το σάιτ φιλοξενίας φωτογραφιών της Yahoo θα πλημμυρίσει από 12 εκατομμύρια ιστορικές εικόνες -σκίτσα, ζωγραφιές, σχέδια- που έχουν περάσει στο public domain, οι οποίες χρονολογούνται από το 1500 έως το 1922.

Οι αναξιοποίητες εικόνες 600 εκατομμυρίων σελίδων από παλαιά βιβλία που έχει ψηφιοποιήσει ο μη κερδοσκοπικός οργανισμός Internet Archive ανεβαίνουν σταδιακά στο Flickr, με την συμβολή του ακαδημαϊκού Kalev Leetaru. Υπολογίζεται ότι το σάιτ φιλοξενίας φωτογραφιών της Yahoo θα πλημμυρίσει από 12 εκατομμύρια ιστορικές εικόνες -σκίτσα, ζωγραφιές, σχέδια- από το 1500 έως το 1922 που έχουν περάσει στο public domain και θεωρούνται κοινό κτήμα, χωρίς περιορισμούς στην χρήση τους.

Οι εικόνες προέρχονται από βιβλία δημόσιων βιβλιοθηκών τα οποία επί χρόνια ψηφιοποιούνται από το Internet Archive, εντούτοις καταλήγουν σε μορφή αρχείου PDF ή απλού κειμένου χωρίς δυνατότητα αναζήτησης των φωτογραφιών.

Το λογισμικό του Kalev Leetaru σε αντίθεση με το λογισμικό οπτικής αναγνώρισης χαρακτήρων δεν παρακάμπτει τις εικόνες. Αξιοποιεί μάλιστα την αδυναμία του OCR, υποθέτοντας πως ότι παρακάμπτει είναι εικόνα και το αποθηκεύει σε μορφή αρχείου εικόνας Jpeg. Επιπλέον, επιχειρεί να συνοδεύσει τα αρχεία εικόνας με επεξηγηματικό κείμενο υπό μορφή λεζάντας, επιλέγοντας το κείμενο που διάβασε το OCR πριν και μετά την φωτογραφία της σκαναρισμένης σελίδας.

Φιλοδοξία του καθηγητή Leetaru είναι να αξιοποιηθούν οι εικόνες αυτές –2,6 εκατομμύρια από τις οποίες έχουν ήδη γίνει upload στο Flick– από τους συντάκτες της Wikipedia για να εμπλουτίσουν το περιεχόμενό της, ιδιαίτερα όταν το λήμμα αφορά σε ιστορικά γεγονότα. Eμφανίζεται δε πρόθυμος να διαθέσει τον κώδικά του σε βιβλιοθήκες ανά τον κόσμο για να εξάγουν και τις εικόνες από τα βιβλία που επιχειρούν να μετατρέψουν σε ψηφιακή μορφή, μεταφέρει το BBC.

Πάντως, οι χρήστες του Flickr παραπονιούνται ότι από τον Ιούλιο οπότε το Internet Archive έγινε μέλος της υπηρεσίας, οι εικόνες του πλημμύρισαν το σάιτ και εμφανίζονται πολύ συχνά στα αποτελέσματα χωρίς δυνατότητα εξαίρεσης χρήστη.

In.gr Τεχνολογία

Sports in

Γιατί δεν παίζουν στην Αγγλία ο Μασούρας και ο Ντόη

Ο Ολυμπιακός θα κοντραριστεί με την Άστον Βίλα στις 2 Μαϊου χωρίς τους δύο ποδοσφαιριστές του.

Ακολουθήστε το in.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις

in.gr | Ταυτότητα

Διαχειριστής - Διευθυντής: Λευτέρης Θ. Χαραλαμπόπουλος

Διευθύντρια Σύνταξης: Αργυρώ Τσατσούλη

Ιδιοκτησία - Δικαιούχος domain name: ΑΛΤΕΡ ΕΓΚΟ ΜΜΕ Α.Ε.

Νόμιμος Εκπρόσωπος: Ιωάννης Βρέντζος

Έδρα - Γραφεία: Λεωφόρος Συγγρού αρ 340, Καλλιθέα, ΤΚ 17673

ΑΦΜ: 800745939, ΔΟΥ: ΦΑΕ ΠΕΙΡΑΙΑ

Ηλεκτρονική διεύθυνση Επικοινωνίας: in@alteregomedia.org, Τηλ. Επικοινωνίας: 2107547007

ΜΗΤ Αριθμός Πιστοποίησης Μ.Η.Τ.232442

Παρασκευή 19 Απριλίου 2024