4Νοέ

Το Google διαβάζει και σκαναρισμένα κείμενα

, 4 Νοεμβρίου 2008 | ΜΗΧΑΝΕΣ ΑΝΑΖΗΤΗΣΗΣ | 3 Σχόλια

Όπως λέει και το επίσημο blog του Google, μια εικόνα αξίζει όσο 1000 λέξεις, πόσο μάλλον μια εικόνα από 1000 λέξεις! Το Google σε πρόσφατο Post του στο http://googleblog.blogspot.com ανακοίνωσε πως έχει πλέον την τεχνολογία να μπορεί να «διαβάζει» .pdf αρχεία που περιέχουν σαρωμένα κείμενα υπό μορφή εικόνας.

Συνδυάζοντας την τεχνολογία του Optical Character Recognition (OCR) με τον αλγόριθμο της μηχανής αναζήτησης, το Google κατάφερε να ενσωματώσει στα SERP’s του ένα μεγάλο αριθμό νέας πληροφορίας που προέρχεται από σκαναρισμένα κείμενα ενσωματωμένα σε .pdf αρχεία. Η τεχνολογία OCR επιτρέπει σε έναν υπολογιστή να αναγνωρίζει χαρακτήρες και λέξεις που βρίσκονται μέσα σε μια εικόνα. Οπότε, αν και μια εικόνα μπορεί να μοιάζει εμφανισιακά με ένα κείμενο, για να διαβαστεί το κείμενο σε αυτή, θα πρέπει να χρησιμοποιηθεί η τεχνολογία OCR.

Για να μας δείξει το Google πόσο πετυχημένη είναι η ενσωμάτωση της τεχνολογίας OCR στα SERP’s της, μας παρέθεσε μια σειρά από Links που οδηγούν σε SERP’s όπως αυτά που περιγράφουμε.

Επισκεφτείτε το πρώτο αποτέλεσμα με την ένδειξη [PDF] σε κάθε περίπτωση.

[repairing aluminum wiring]
[spin lock performance]
[Mumps and Severe Neutropenia]
[Steady success in a volatile world]

Αυτό που πετυχαίνει το Google είναι πράγματι εκπληκτικό όσον αφορά το SEO. Αν χρησιμοποιηθεί η τεχνολογία αυτή σε μενού που είναι βασισμένα σε γραφικά ή σε παλαιότερα site που χρησιμοποιούν, λανθασμένα, εικόνες με κείμενα αντί για καθαρά κείμενα, τότε τα αποτελέσματα των αναζητήσεων θα αλλάξουν σταδιακά και ίσως και όλος ο τρόπος με τον οποίο είμαστε συνηθισμένοι να δουλεύουμε.

ΧΡΗΣΙΜΗ ΠΛΗΡΟΦΟΡΙΑ: Το άρθρο Το Google διαβάζει και σκαναρισμένα κείμενα γράφτηκε από το WebDesignBlog. Η ομάδα μας σας υπενθυμίζει πως αν θέλετε να ενημερώνεστε για τα νέα του διαδικτύου και για επιλεγμένα άρθρα μας, μπορείτε να γραφτείτε εύκολα στο Newsletter μας ή στο RSS Feed μας.

Ο Σπύρος Παπασπυρόπουλος είναι βραβευμένος Web Professional που δραστηριοποιείται στον χώρο του επαγγελματκού Web Design και του Search Engine Optimisation (SEO) από το 1999. Το 2004 ίδρυσε μαζί με τον Γιάννη Ευσταθίου την βραβευμένη εταιρία x2interactive Web Agency και το 2008 το Web Design Blog.

3 comments so far

  • Giorgos Theodorakis Says: Νοεμβρίου 4, 2008 at 8:14 μμ

    Ontos arketa pragmata allazoun! episis se beta stadio exoume kai «Google Audio Indexing» pou epitrepei stous xristes tou youtube na kanoun anazitiseis sta video vasi tis glosas tou omiliti !!!!

    Απάντηση
  • προώθηση ιστοσελίδων Says: Σεπτέμβριος 8, 2009 at 12:13 μμ

    Καταπληκτικό!!

    Βέβαια για να το δούμε σε πλήρη εφαρμογή θα πρέπει να περάσουν λίγα ακόμα χρόνια…

    Χρήστος

    Απάντηση

Σχολιάστε

Back to top

Recent comments

  • Ευχαριστούμε για το σχόλιο Ευγενία. Δυστυχώς δεν γνωρίζουμε αν υπάρχει παρόμοια γραμματοσειρά με την ENGLAND HAND στα Ελληνικά.

    10 δωρεάν καλλιγραφικές γραμματοσειρές
  • Πολύ χρήσιμο άρθρο. Ο αλγόριθμος της Google εξελίσσεται και μαζί του και η τέχνη του seo. Θα έλεγα ότι ωθεί τους seo experts σε μια πιο ολιστική προσέγγιση της online παρουσίας των πελατών τους. Αυτο σημαίνει ότι θα πρέπει να εμπλακούν σε θέματα content strategy, branding και social media γιατί η Google συνυπολογίζει όλα αυτά όταν αποφασίζει για το ranking μιας ιστοσελίδας. Ειδικά το content είναι το κλειδί στην νέα εποχή του search engine optimization. Θα πρέπει να δημιουργείται έχοντας στο μυαλό μας κυρίως τον επισκέπτη της ιστοσελίδας μας και λιγότερο τις μηχανές αναζήτησης. Θα πρέπει να προσθέτει πραγματικό value στους αναγνώστες του και ιδεατά να έχει χαρακτηριστικά που να συμβάλλουν στη δημιουργία buzz στα social media. Με τον τρόπο αυτό θα δημιουργηθούν με φυσικό τρόπο

    Google Panda 3.3, Google Venice και 38 επιπλέον αλλαγές στον αλγόριθμο της Google

Latest From Twitter