The Robot Smiles Back

0

 

Ενώ οι εκφράσεις του προσώπου μας παίζουν τεράστιο ρόλο στην οικοδόμηση εμπιστοσύνης, τα περισσότερα ρομπότ εξακολουθούν να έχουν το κενό και στατικό βλέμμα ενός επαγγελματία παίκτη πόκερ. Με την αυξανόμενη χρήση ρομπότ σε τοποθεσίες όπου τα ρομπότ και οι άνθρωποι πρέπει να συνεργαστούν στενά, από τα γηροκομεία έως τις αποθήκες και τα εργοστάσια, η ανάγκη για ένα πιο ανταποκρινόμενο, πολύ ρεαλιστικό ρομπότ αυξάνεται πιο επείγουσα.

Oι ερευνητές στο Creative Machines Lab της Columbia Engineering εργάζονται για πέντε χρόνια για να δημιουργήσουν το EVA, ένα νέο αυτόνομο ρομπότ με ένα απαλό και εκφραστικό πρόσωπο που ανταποκρίνεται στις αντιστοιχίες των κοντινών ανθρώπων. Η έρευνα θα παρουσιαστεί στο συνέδριο του ICRA στις 30 Μαΐου 2021 και τα σχεδιαγράμματα ρομπότ είναι ανοιχτού κώδικα στο Hardware-X (Απρίλιος 2021).

«Η ιδέα για την EVA διαμορφώθηκε πριν από λίγα χρόνια, όταν οι μαθητές μου και εγώ αρχίσαμε να παρατηρούμε ότι τα ρομπότ στο εργαστήριό μας μας κοιτάζουν πίσω από πλαστικά, γοητευτικά μάτια», δήλωσε ο Hod Lipson, James και Sally Scapa Καθηγητής Καινοτομίας Μηχανολόγων Μηχανικών) και διευθυντής του εργαστηρίου Creative Machines.


 

Ο Lipson παρατήρησε μια παρόμοια τάση στο μανάβικο, όπου συνάντησε ρομπότ που συσκεύαζαν με κονκάρδες ονομάτων, και σε μια περίπτωση, στολισμένο με ένα ζεστό, πλεκτό ρούχο. «Οι άνθρωποι φάνηκαν να εξανθρωπούν τους ρομποτικούς συναδέλφους τους δίνοντάς τους μάτια, μια ταυτότητα ή ένα όνομα», είπε. "Αυτό μας έκανε να αναρωτιόμαστε, αν τα μάτια και τα ρούχα λειτουργούν, γιατί να μην φτιάξουμε ένα ρομπότ που έχει ένα εξαιρετικά εκφραστικό και ανταποκρινόμενο ανθρώπινο πρόσωπο;"

Αν και αυτό ακούγεται απλό, η δημιουργία ενός πειστικού ρομποτικού προσώπου ήταν μια τρομερή πρόκληση για τους ρομποτικούς. Για δεκαετίες, ρομποτικά μέρη του σώματος είναι κατασκευασμένα από μέταλλο ή σκληρό πλαστικό, υλικά που ήταν πολύ δύσκαμπτα για ροή και κίνηση του ανθρώπινου ιστού. Το ρομποτικό υλικό ήταν εξίσου ακατέργαστο και δύσκολο να εργαστεί - τα κυκλώματα, οι αισθητήρες και οι κινητήρες είναι βαριοί, εντάσεως ισχύος και ογκώδεις.

Η πρώτη φάση του έργου ξεκίνησε στο εργαστήριο της Lipson πριν από αρκετά χρόνια όταν ο προπτυχιακός φοιτητής Zanwar Faraj οδήγησε μια ομάδα μαθητών στην κατασκευή των φυσικών «μηχανημάτων» του ρομπότ. Κατασκεύασαν το EVA ως μια αποδυναμωμένη προτομή που έχει έντονη ομοιότητα με τους σιωπηλούς αλλά κινούμενους καλλιτέχνες του Blue Man Group. Το EVA μπορεί να εκφράσει τα έξι βασικά συναισθήματα του θυμού, της αηδίας, του φόβου, της χαράς, της θλίψης και της έκπληξης, καθώς και μια σειρά από πιο αποχρωματισμένα συναισθήματα, χρησιμοποιώντας τεχνητούς «μύες» (δηλαδή καλώδια και κινητήρες) που τραβούν συγκεκριμένα σημεία στα EVA πρόσωπο, μιμείται τις κινήσεις των περισσότερων από 42 μικροσκοπικών μυών που συνδέονται σε διάφορα σημεία του δέρματος και των οστών των ανθρώπινων προσώπων.


 H μεγαλύτερη πρόκληση για τη δημιουργία EVA ήταν ο σχεδιασμός ενός συστήματος που ήταν αρκετά συμπαγές ώστε να χωράει μέσα στα όρια ενός ανθρώπινου κρανίου, ενώ εξακολουθεί να είναι αρκετά λειτουργικό για να παράγει ένα ευρύ φάσμα εκφράσεων του προσώπου», σημείωσε ο Faraj.

Για να ξεπεράσει αυτήν την πρόκληση, η ομάδα βασίστηκε σε μεγάλο βαθμό στην τρισδιάστατη εκτύπωση για να κατασκευάσει εξαρτήματα με πολύπλοκα σχήματα που ενσωματώθηκαν απρόσκοπτα και αποτελεσματικά στο κρανίο της EVA. Μετά από εβδομάδες σύρματος καλωδίων για να κάνει το EVA να χαμογελάσει, να παραφρονηθεί ή να αναστατωθεί, η ομάδα παρατήρησε ότι το μπλε, αδύναμο πρόσωπο της EVA θα μπορούσε να προκαλέσει συναισθηματικές απαντήσεις από τους συνεργάτες τους. «Μου έβλεπε τη δουλειά μου μια μέρα όταν η EVA μου έδωσε ξαφνικά ένα μεγάλο, φιλικό χαμόγελο», θυμάται ο Lipson. «Ήξερα ότι ήταν καθαρά μηχανικό, αλλά ανακλαστικά χαμογελάω».

Μόλις η ομάδα ήταν ικανοποιημένη με τους «μηχανικούς» της EVA, άρχισαν να αντιμετωπίζουν τη δεύτερη μεγάλη φάση του έργου: προγραμματίζοντας την τεχνητή νοημοσύνη που θα καθοδηγούσε τις κινήσεις του προσώπου της EVA. Ενώ τα ζωντανά ρομπότ animatronic χρησιμοποιούνται σε θεματικά πάρκα και σε κινηματογραφικά στούντιο εδώ και χρόνια, η ομάδα της Lipson σημείωσε δύο τεχνολογικές προόδους. Η EVA χρησιμοποιεί τεχνητή νοημοσύνη βαθιάς μάθησης για να «διαβάσει» και μετά να αντικατοπτρίσει τις εκφράσεις στα κοντινά ανθρώπινα πρόσωπα. Και η ικανότητα της EVA να μιμείται ένα ευρύ φάσμα διαφορετικών ανθρώπινων εκφράσεων του προσώπου μαθαίνεται από δοκιμή και λάθος από την παρακολούθηση βίντεο της.

Οι πιο δύσκολες ανθρώπινες δραστηριότητες για αυτοματοποίηση περιλαμβάνουν μη επαναλαμβανόμενες φυσικές κινήσεις που λαμβάνουν χώρα σε περίπλοκα κοινωνικά περιβάλλοντα. Ο Boyuan Chen, φοιτητής διδακτορικού διπλώματος του Lipson που ηγήθηκε της φάσης λογισμικού του έργου, συνειδητοποίησε γρήγορα ότι οι κινήσεις του προσώπου της EVA ήταν πολύ περίπλοκες για μια διαδικασία που δεν διέπεται από προκαθορισμένα σύνολα κανόνων. Για να αντιμετωπίσει αυτήν την πρόκληση, ο Τσεν και μια δεύτερη ομάδα μαθητών δημιούργησαν τον εγκέφαλο της EVA χρησιμοποιώντας διάφορα νευρωνικά δίκτυα Deep Learning. Ο εγκέφαλος του ρομπότ χρειάστηκε να κυριαρχήσει σε δύο δυνατότητες: Πρώτον, να μάθει να χρησιμοποιεί το δικό του περίπλοκο σύστημα μηχανικών μυών για να δημιουργήσει συγκεκριμένη έκφραση του προσώπου και, δεύτερον, να γνωρίζει ποια πρόσωπα πρέπει να κάνει διαβάζοντας τα πρόσωπα των ανθρώπων.

Για να διδάξει την EVA πώς έμοιαζε το πρόσωπό της, ο Τσεν και η ομάδα μαγνητοσκόπησαν ώρες βίντεο από το EVA κάνοντας μια σειρά τυχαίων προσώπων. Στη συνέχεια, όπως ένας άνθρωπος που παρακολουθούσε τον εαυτό του στο Zoom, τα εσωτερικά νευρικά δίκτυα της EVA έμαθαν να συνδυάζουν τη μυϊκή κίνηση με τα βίντεο του δικού του προσώπου. Τώρα που το EVA είχε μια πρωτόγονη αίσθηση για το πώς δούλεψε το πρόσωπό του (γνωστό ως «αυτο-εικόνα»), χρησιμοποίησε ένα δεύτερο δίκτυο για να ταιριάξει τη δική του εικόνα με την εικόνα ενός ανθρώπινου προσώπου που τραβήχτηκε στη βιντεοκάμερα. Μετά από αρκετές βελτιώσεις και επαναλήψεις, η EVA απέκτησε τη δυνατότητα να διαβάζει χειρονομίες ανθρώπινου προσώπου από μια κάμερα και να αποκρίνεται αντανακλώντας την έκφραση του προσώπου αυτού του ανθρώπου.

Οι ερευνητές σημειώνουν ότι το EVA είναι ένα εργαστηριακό πείραμα και η μίμηση από μόνη της εξακολουθεί να απέχει πολύ από τους πολύπλοκους τρόπους με τους οποίους οι άνθρωποι επικοινωνούν χρησιμοποιώντας εκφράσεις του προσώπου. Αλλά τέτοιες τεχνολογίες ενεργοποίησης θα μπορούσαν κάποια μέρα να έχουν ωφέλιμες, πραγματικές εφαρμογές. Για παράδειγμα, ρομπότ ικανά να ανταποκρίνονται σε μια μεγάλη ποικιλία γλώσσας του ανθρώπινου σώματος θα ήταν χρήσιμα σε χώρους εργασίας, νοσοκομεία, σχολεία και σπίτια.

«Υπάρχει ένα όριο στο πόσο εμείς οι άνθρωποι μπορούμε να αλληλεπιδράσουμε συναισθηματικά με chatbots που βασίζονται σε σύννεφο ή αποσυναρμολογημένα smart-home ηχεία», δήλωσε ο Lipson. «Ο εγκέφαλός μας φαίνεται να ανταποκρίνεται καλά σε ρομπότ που έχουν κάποιο είδος αναγνωρίσιμης φυσικής παρουσίας».

Ο Τσεν πρόσθεσε: «Τα ρομπότ είναι συνυφασμένα στη ζωή μας με όλο και περισσότερους τρόπους, επομένως η οικοδόμηση εμπιστοσύνης μεταξύ ανθρώπων και μηχανών είναι όλο και πιο σημαντική».

 

Δημοσίευση σχολίου

0 Σχόλια
* Please Don't Spam Here. All the Comments are Reviewed by Admin.

Please Select Embedded Mode To show the Comment System.*

To Top