Ξεκινώντας την ερευνητική μου δραστηριότητα πάνω στο κομμάτι των φωτονικών νευρωνικών δικτύων σε αρκετές από τις συζητήσεις με φίλους, οι οποίοι δεν είναι εξοικειωμένοι με τον κλάδο της Πληροφορικής και ειδικότερα με τον κλάδο της Τεχνητής Νοημοσύνης (Artificial Intelligence), συχνά με ρωτάνε τι είναι το νευρωνικό δίκτυο;

Πράγματι ειδικά με το πέρασμα των ετών και λόγω των αυξημένων αναγκών επεξεργασίας όλο και μεγαλύτερου όγκου δεδομένων, ακόμα και στις τηλεπικοινωνίες με την ανάπτυξη της 5ης, ακόμα και της 6ης γενιάς επικοινωνιών, συχνά ακούμε τον όρο Τεχνητή Νοημοσύνη. Τι είναι όμως η τεχνητή νοημοσύνη, από πού εμπνεύστηκε το όνομα και που χρησιμοποιείται;

Γενικά όπως τα περισσότερα πράγματα που μπορούμε να φανταστούμε (παρεμπιπτόντως σε αυτό το σημείο σας προκαλώ να προσπαθήσετε να σκεφτείτε, κάτι, οτιδήποτε, ζώο, όν, συσκευή που δεν έχετε δει ποτέ και πρέπει να  κατασκευάσετε από το μηδέν!), έχουν αναπτυχθεί από κάτι υπαρκτό του οποίο θέλουμε να προσομοιώσουμε τη λειτουργία.

Η ανάπτυξη των τεχνητών νευρωνικών λοιπόν, προήλθε από τους βιολογικούς νευρώνες τους οποίους κάθε όν με εγκεφαλική λειτουργία διαθέτει. Όπως λοιπόν ένας βιολογικός νευρώνας μέσω κάποιων συνάψεων μεταφέρει ένα ηλεκτρικό σήμα σε επόμενους νευρώνες έτσι και στους τεχνητούς νευρώνες κάθε νευρώνας μεταφέρει το σήμα το οποίο έφτασε σε αυτόν στους υπόλοιπους που είναι συνδεδεμένοι με εκείνον.

Παραμένοντας στους τεχνητούς νευρώνες το σήμα στο οποίο αναφερόμαστε και το οποίο τροφοδοτείται ως είσοδος στο σύστημα είναι πραγματικοί αριθμοί (ακόμα και στην αναγνώριση εικόνων αυτό το οποίο επεξεργάζεται το δίκτυο είναι αριθμοί, γενικά κάθε υπολογιστικό σύστημα δεν είναι σε θέση να αναγνωρίσει οτιδήποτε άλλο πέρα από αριθμούς) το σύνολο όλων αυτών των αριθμών, μέσω μιας μη γραμμικής συνάρτησης δίνει στην έξοδο του νευρώνα κάποιον άλλο πραγματικό αριθμό ο οποίος θα συνεχίσει να διαδίδεται στο δίκτυο μέχρι την τελική έξοδο.

Θα με ρωτήσετε όμως και με το δίκιο σας πως ένα νευρωνικό δίκτυο εκπαιδεύεται προκειμένου να επιτελέσει μια συγκεκριμένη λειτουργία. Γενικά τα νευρωνικά δίκτυα είναι ένα μαύρο κουτί, το οποίο ονομάζεται hidden layer, το συγκεκριμένο επίπεδο μπορεί να αποτελείται από περισσότερα από ένα υπό-επίπεδα. Στο δίκτυο εισάγεται μια ή περισσότερες είσοδοι γίνεται η επεξεργασία στο hidden layer η οποία με τη σειρά της αλλάζει κάποια βάρη και εξαιτίας της εν λόγω αλλαγής των βαρών το νευρωνικό δίκτυο εκπαιδεύεται και είναι σε θέση για παράδειγμα να κάνει ταξινόμηση εικόνων (πχ να αναγνωρίζει γάτες και σκύλους). Η αλλαγή αυτών των βαρών βέβαια γίνεται με συγκεκριμένες μεθόδους μηχανικής μάθησης και εδώ είναι ίσως και το μεγαλύτερο και πιο ενδιαφέρον κομμάτι της επιστήμης που ονομάζεται Τεχνητή Νοημοσύνη. Κάθε μέθοδος μηχανικής μάθησης ειδικεύεται σε συγκεκριμένη αποστολή, για παράδειγμα ο αλγόριθμός K-nearest neighbors (KNN) χρησιμοποιείται εξαιρετικά συχνά για ταξινόμηση (classification). Επιπλέον υπάρχουν διάφορες τοπολογίες τεχνητών νευρωνικών δικτύων όπως είναι τα νευρωνικά δίκτυα με ανατροφοδότηση ή Recurrent Neural Networks (RNNs) τα οποία ως τεχνικές εκπαίδευσης χρησιμοποιούν το Reservoir Computing (RC) ή το Long short-term memory (LSTM). Τα συγκεκριμένα νευρωνικά δίκτυα  χρησιμοποιούνται για την πραγματοποίηση διάφορων λειτουργιών όπως είναι η ταξινόμηση, η αναγνώριση φωνής και η πρόβλεψη. Το παρακάτω σχήμα ίσως σας βοηθήσει να καταλάβετε τη δομή ενός νευρωνικού δικτύου.

[πηγή: https://en.wikipedia.org/wiki/Artificial_neural_network#/media/File:Colored_neural_network.svg]

Γενικά οι εφαρμογές των νευρωνικών δικτύων είναι άπειρες τη σημερινή εποχή και γίνονται ακόμα περισσότερες με τη δικτύωση πραγμάτων ή καλύτερα όπως είναι ο αγγλικός όρος Internet of Things (IoT). Σκεφτείτε μόνο πως το YouTube χρησιμοποιεί νευρωνικά δίκτυα για να σας εμφανίζει βίντεο της προτίμησής σας ή η Google για να συμπληρώνει τις λέξεις που πληκτρολογείτε στη μηχανή αναζήτησής της, εδώ να συμπληρώσω ότι συνήθως αυτά τα νευρωνικά είναι τα RNN τα οποία αναφέρονται παραπάνω. Επιπλέον να τονιστεί ότι ένα νευρωνικό δίκτυο μπορεί να γίνει τόσο “καλό” όσο “καλή” είναι η βάση δεδομένων με την οποία εκπαιδεύτηκε. Όσο πιο πλούσια σε δεδομένα είναι η εν λόγω βάση δεδομένων τόσο καλύτερα θα εκπαιδευτεί το δίκτυο. Σε επόμενο άρθρο ίσως αναφερθώ και σε αυτή τη μεγάλη τεχνολογία των τελευταίων δεκαετιών που ονομάζεται IoT η οποία αναφέρθηκε προηγουμένως, όπως επίσης μπορούμε να μιλήσουμε για περισσότερες λειτουργίες και εφαρμογές των νευρωνικών δικτύων.