Log In

Λογισμικό που μπορεί να διαβάσει τα χείλη των ανθρώπων

Thunder's picture

  Μια ομάδα επιστημόνων του πανεπιστημίου της Οξφόρδης, της οποίας επικεφαλής είναι ο ελληνικής καταγωγής ερευνητής Γιάννης Ασσαέλ, ανέπτυξε ένα σύστημα τεχνητής νοημοσύνης, που ονομάζεται LipNet, το οποίο μπορεί να διαβάσει τα χείλη των ανθρώπων πολύ καλύτερα από τους ίδιους τους ανθρώπους.

  Συγκεκριμένα, το εν λόγω σύστημα παρακολουθεί βίντεο (χωρίς ήχο) με ανθρώπους που μιλούν και αναγνωρίζει τις λέξεις που λέει ο ομιλητής παρατηρώντας τις κινήσεις του στόματος του. Το LipNet μπορεί να μαντέψει λέξεις με ποσοστό ακρίβειας 93%. Με μέσο ποσοστό σφάλματος μόλις 6.6%, το LipNet είναι με διαφορά πιο αποτελεσματικό από τους ανθρώπους που έχουν ποσοστό σφάλματος περίπου 48% (ακόμα και από τους επαγγελματίες, τα ποσοστά σφάλματος των οποίων δεν πέφτουν κάτω από το 40%).

  Για την ανάπτυξη του συστήματος αυτού υπήρξε εν μέρη χρηματοδότηση από την θυγατρική εταιρεία της Google, Deep Mind. Η τεχνολογία αυτή μπορεί να χρησιμοποιηθεί για πολλόυς διαφορετικούς σκοπούς όπως για την βελτίωση των ακουστικών βαρηκοΐας, την αυτόματη μετατροπή ομιλιών σε κείμενο, την αναγνώριση ομιλίας σε περιβάλλον με θόρυβο και την βιομετρική ταυτοποίηση ατόμων.