Χημεία: Μπορούν οι υπολογιστές να μας βοηθήσουν να συνθέσουμε νέα υλικά;

Ένα σύστημα νευρωνικών δικτύων (μάθησης-μηχανής) βρίσκει μοτίβα σε «συνταγές» για υλικά, ακόμη και όταν δεν υπάρχουν δεδομένα για την εκπαίδευση της μηχανής.

Ένα νέο σύστημα μάθησης-μηχανής για την ανάλυση "συνταγών" για υλικά χρησιμοποιεί έναν μεταβλητό αυτόματο κωδικοποιητή, ο οποίος συμπιέζει δεδομένα (αριστεροί κύκλοι) σε μια πιο συμπαγή μορφή (οι δύο κεντρικοί κύκλοι) πριν προσπαθήσει να ξανααναπτύξει (τα δεδομένα) στην αρχική τους μορφή (οι κύκλοι στα δεξιά). Αν ο αυτόματος κωδικοποιητής είναι εκπαιδευμένος με επιτυχία, η συμπαγής αναπαράσταση (στο κέντρο) θα έχει καταγράψει τα πιο ιδιαίτερα χαρακτηριστικά των δεδομένων.

Εικόνα: Chelsea Turner / MIT

Από τον Larry Hardesty | Γραφείο Ειδήσεων του MIT στις 21 Δεκεμβρίου 2017

στο http://news.mit.edu/2017/machine-learning-system-synthesizes-new-materials-recipes-1221

Τον περασμένο μήνα τρεις επιστήμονες της επιστήμης υλικών του MIT και οι συνάδελφοί τους δημοσίευσαν ένα έγγραφο που περιγράφει ένα νέο σύστημα τεχνητής νοημοσύνης, το οποίο μπορεί να πορευθεί μέσω των επιστημονικών εργασιών, ώστε να εκπαιδευτεί από αυτές, και να εξαγάγει "συνταγές" για την παραγωγή συγκεκριμένων τύπων υλικών.

Αυτό το έργο θεωρήθηκε ως το πρώτο βήμα προς ένα σύστημα που μπορεί να δημιουργήσει συνταγές για υλικά που έχουν περιγραφεί μόνο θεωρητικά. Τώρα, σε ένα άρθρο του περιοδικού npj Computational Materials, οι ίδιοι τρεις επιστήμονες των υλικών, με έναν συνάδελφο από το Τμήμα Ηλεκτρολόγων Μηχανικών και Επιστήμης Υπολογιστών του MIT, κάνουν ένα ακόμα βήμα προς αυτή την κατεύθυνση, με ένα νέο σύστημα τεχνητής νοημοσύνης που μπορεί να αναγνωρίσει μοτίβα υψηλότερου επιπέδου που είναι συνηθισμένα στις συνταγές.

Για παράδειγμα, το νέο σύστημα ήταν σε θέση να εντοπίσει συσχετισμούς μεταξύ χημικών «πρόδρομων» ουσιών που χρησιμοποιούνται στις συνταγές υλικών και των κρυσταλλικών δομών των προϊόντων που προκύπτουν. Οι ίδιοι συσχετισμοί, όπως αποδείχθηκε, είχαν τεκμηριωθεί στη βιβλιογραφία.

Το σύστημα βασίζεται επίσης σε στατιστικές μεθόδους που παρέχουν έναν φυσικό μηχανισμό για τη δημιουργία πρωτότυπων συνταγών. Στο έγγραφο, οι ερευνητές χρησιμοποιούν αυτόν τον μηχανισμό για να προτείνουν εναλλακτικές συνταγές για γνωστά υλικά, και οι προτάσεις συμφωνούν καλά με τις πραγματικές συνταγές.

Όπως πολλά από τα καλύτερα συστήματα τεχνητής νοημοσύνης των τελευταίων 10 ετών, το νέο σύστημα των ερευνητών του MIT είναι ένα λεγόμενο νευρωνικό δίκτυο, το οποίο μαθαίνει να εκτελεί υπολογιστικές εργασίες αναλύοντας (μαθαίνοντας από) τεράστια σύνολα δεδομένων εκπαίδευσης. Παραδοσιακά, οι προσπάθειες να χρησιμοποιηθούν νευρωνικά δίκτυα για τη δημιουργία συνταγών για νέα υλικά έρχονται αντιμέτωπες με δύο προβλήματα, τα οποία οι ερευνητές περιγράφουν ως αραιότητα και έλλειψη.

Οποιαδήποτε συνταγή για ένα υλικό μπορεί να αναπαρασταθεί ως ένα διάνυσμα, το οποίο είναι ουσιαστικά ένας μακρύς κατάλογος αριθμών. Κάθε αριθμός αντιπροσωπεύει ένα χαρακτηριστικό της συνταγής, όπως είναι η συγκέντρωση μιας συγκεκριμένης χημικής ουσίας, ο διαλύτης στον οποίο διαλύεται ή η θερμοκρασία στην οποία λαμβάνει χώρα μια αντίδραση.

Δεδομένου ότι οποιαδήποτε δεδομένη συνταγή θα χρησιμοποιεί μόνο μερικές από τις πολλές χημικές ουσίες και διαλύτες που περιγράφονται στη βιβλιογραφία, οι περισσότεροι από αυτούς τους αριθμούς θα είναι μηδενικοί. Αυτό το λένε οι ερευνητές "αραιές".

Ομοίως, για να μάθουμε πώς οι τροποποιήσεις των παραμέτρων της αντίδρασης - όπως οι χημικές συγκεντρώσεις και οι θερμοκρασίες - μπορούν να επηρεάσουν τα τελικά προϊόντα, ένα νευρωνικό δίκτυο θα έπρεπε ιδανικά να εκπαιδευτεί σε ένα τεράστιο αριθμό παραδειγμάτων στα οποία οι παράμετροι αυτές ποικίλλουν. Αλλά για ορισμένα υλικά - ιδιαίτερα τα νεότερα - η βιβλιογραφία δεν μπορεί παρά να περιέχει μόνο λίγες συνταγές. Αυτή είναι η έλλειψη.

"Οι άνθρωποι σκέφτονται ότι με τη μηχανική μάθηση, χρειάζεστε πολλά δεδομένα και εάν η παροχή δεδομένων είναι αραιή, χρειάζεστε περισσότερα δεδομένα", λέει ο Kim. "Όταν προσπαθείτε να εστιάσετε σε ένα πολύ συγκεκριμένο σύστημα, όπου είστε αναγκασμένοι να χρησιμοποιήσετε δεδομένα μεγάλων διαστάσεων αλλά δεν έχετε πολλά, μπορείτε ακόμα και τότε να χρησιμοποιήσετε αυτές τις τεχνικές νευρωνικής μηχανικής μάθησης;"

Τα νευρικά δίκτυα είναι συνήθως διατεταγμένα σε στρώματα, το καθένα από τα οποία αποτελείται από χιλιάδες απλές μονάδες επεξεργασίας ή κόμβους. Κάθε κόμβος συνδέεται με διάφορους κόμβους στα στρώματα πάνω και κάτω. Τα δεδομένα τροφοδοτούνται στο κάτω στρώμα, το οποίο τα χειρίζεται και τα μεταφέρει στο επόμενο στρώμα, το οποίο τα χειρίζεται και τα μεταβιβάζει στο επόμενο, και ούτω καθεξής. Κατά τη διάρκεια της εκπαίδευσης, οι συνδέσεις μεταξύ των κόμβων αναπροσαρμόζονται συνεχώς μέχρι η έξοδος του τελικού στρώματος να προσεγγίζει σταθερά το αποτέλεσμα κάποιων υπολογισμών.

Το πρόβλημα με αραιά, μεγάλης διαστάσεως δεδομένα είναι ότι για οποιοδήποτε δεδομένο εκπαιδευτικό παράδειγμα, οι περισσότεροι κόμβοι στο κάτω στρώμα δεν λαμβάνουν δεδομένα. Θα χρειαζόταν ένα απαγορευτικά μεγάλο σετ εκπαίδευσης για να διασφαλιστεί ότι το δίκτυο συνολικά θα βλέπει αρκετά δεδομένα για να μάθει να κάνει αξιόπιστες γενικεύσεις.

Περισσότερα στο:

http://news.mit.edu/2017/machine-learning-system-synthesizes-new-materials-recipes-1221

Χημεία

Categories

Κυριακή 28 Ιανουαρίου 2018

Μπορούν οι υπολογιστές να μας βοηθήσουν να συνθέσουμε νέα υλικά;

Ένα σύστημα νευρωνικών δικτύων (μάθησης-μηχανής) βρίσκει μοτίβα σε «συνταγές» για υλικά, ακόμη και όταν δεν υπάρχουν δεδομένα για την εκπαίδευση της μηχανής.

Αναφορά κατάχρησης

Ετικέτες