IA Πόκερ - Ποιος κερδίζει;

Έχουν περάσει πλέον είκοσι χρόνια από τον περίφημο αγώνα μεταξύ του παγκόσμιου πρωταθλητή σκακιού Garry Kasparov και του Deep Blue - του υπερυπολογιστή της IBM. Κάσπαροφ έχασε στο Deep Blue - και συνέχισε να κατηγορεί τον υπολογιστή ότι είχε ελεγχθεί από έναν πραγματικό, ανθρώπινο πλοίαρχο. Στην ουσία, ο Κάσπαροφ ονόμασε shenanigans. Ο πλοίαρχος του σκακιού αρνήθηκε να πιστέψει ότι μια ψυχρή, υπολογιστική μηχανή θα μπορούσε να νικήσει έναν συλλογισμό, σκέψη, ανθρώπινο ον. Η πραγματικότητα ήταν ότι ήταν πιθανότατα ακριβώς λόγω της άκαμπτης, υπολογιστικής φύσης του Deep Blue που το μηχάνημα κατάφερε να νικήσει τον ανθρώπινο ομόλογό του.

Το Deep Blue δεν είχε την ικανότητα να είναι δημιουργικό ή να εφαρμόσει οποιαδήποτε μορφή «φωτισμένου» συλλογισμού - τα ίδια τα πράγματα που συχνά καταλήγουν να παρεμβαίνουν στην ορθή κρίση. Το Deep Blue είχε να κάνει με την εφαρμογή των κανόνων του παιχνιδιού του σκακιού με τον βέλτιστο δυνατό τρόπο για να επιτευχθεί ένα συγκεκριμένο αποτέλεσμα. Η απόδοση και η επακόλουθη νίκη του Deep Blue ανακοίνωσαν την αυγή μιας νέας εποχής: την εποχή της τεχνητής νοημοσύνης και την ικανότητά της να ξεπερνά, να ξεπερνά και να σκέφτεται την ανθρωπότητα.

Ο Deep Blue ταξινομήθηκε στην εποχή του Big Data.

Ορίζοντας το ασυναγώνιστο

Παρά την εκπληκτική επιτυχία του Deep Blue - υπάρχουν παιχνίδια που έχουν προκαλέσει το παροιμιαίο ξύσιμο του κεφαλιού. ακόμη και κεφαλές που μοιάζουν με μηχανή. Ένα από αυτά είναι το StarCraft - ένα παιχνίδι στρατηγικής σε πραγματικό χρόνο που περιλαμβάνει την ανάπτυξη μιας στρατιωτικής βάσης ενός παίκτη και την επακόλουθη επίθεση εναντίον εκείνων που ανήκουν σε άλλους παίκτες. Το StarCraft ήταν το πρώτο παιχνίδι eSports ποτέ - και οι ερευνητές που εργάζονταν για γίγαντες όπως το Facebook και η Microsoft έχουν δημοσιεύσει άρθρα σχετικά με την αδυναμία του StarCraft και της AI να σπάσουν τις αλεξίσφαιρες εσωτερικές λειτουργίες του παιχνιδιού, κυρίως λόγω του φαινομενικά ατελείωτου αριθμού μεταβλητών που θέτει το παιχνίδι .

Οι μηχανές ξέρουν πότε πρέπει να κρατήσουν;

Προφανώς η απάντηση είναι ναι. Οι προγραμματιστές AI DeepStack έχουν αναπτύξει τεχνητή νοημοσύνη που είναι σε θέση να ανταγωνιστεί τις καλύτερες στην (ανθρώπινη) επιχείρηση πόκερ. Το μυστικό για την επιτυχία του DeepStack; Βαθιά μηχανική εκμάθηση. Το DML μιμείται τον ανθρώπινο εγκέφαλο στις βασικές του διαδικασίες σκέψης και στην ουσία επιτρέπει στη μηχανή να διδάσκει νέα κόλπα.

Η ίδια η φύση του Texas Hold'em Poker βασίζεται στο ανθρώπινο χαρακτηριστικό της διαίσθησης. Η μηχανική εκδοχή της διαίσθησης ανακαλύπτεται προφανώς ότι απομακρύνεται από την προηγούμενη στρατηγική που χρησιμοποιούν τα συστήματα AI που περιελάμβαναν την προσπάθεια υπολογισμού κάθε βήματος για το υπόλοιπο του παιχνιδιού - και αντ 'αυτού, παρακολουθώντας τις εξελίξεις με λίγα μόνο βήματα τη φορά.

Ο νέος τρόπος τεχνητής νοημοσύνης (όπως χρησιμοποιείται από το DeepStack) περιλαμβάνει τον επανυπολογισμό των αλγορίθμων και τη μελλοντική στρατηγική του καθώς γίνονται διαθέσιμες νέες πληροφορίες. Πώς δίδαξε η DeepStack αυτήν την ιδιαίτερη ικανότητα στο ταπεινό της πρωτότυπο; Πετώντας πάνω από 10 τυχαίες καταστάσεις παιχνιδιού πόκερ σε αυτό.

Βάπτιση με πυρκαγιά

Το 2016 η Διεθνής Ομοσπονδία του Πόκερ επέλεξε τριάντα τρεις επαγγελματίες παίκτες του Πόκερ και τους έβαλε αντιμέτωπους με τις στρατηγικές του DeepStack. Μετά το διαχωρισμό των περιπτώσεων όπου η τύχη οδήγησε σε νίκη από τις περιπτώσεις στρατηγικής, επιτεύχθηκε ένα συμπέρασμα: Το ποσοστό νίκης του DeepStack έφτασε περισσότερο από 10 φορές αυτό από αυτό που οι επαγγελματίες παίκτες θεωρούν ως αξιοπρεπές περιθώριο.

Το συμπέρασμα και τα ευρήματα συμφωνούν με την πρόσφατη επιτυχία που απολάμβανε ο Libratus - μια τεχνητή νοημοσύνη που παίζει πόκερ και εγκεφάλου ερευνητών στο Πανεπιστήμιο Carnegie Mellon στο Πίτσμπουργκ. Ο Libratus αντιμετώπισε έναν από τους καλύτερους επαγγελματίες του Texas Hold'em Poker στον κόσμο σε μια εντυπωσιακή σειρά 120,000 χεριών του Poker. Ο Libratus απέκρουσε τέσσερις από αυτούς.

Ο Ντονγκ Κιμ ήταν ένας από τους παίκτες που ξεπέρασε το μηχάνημα, αναφέροντας στη συνέχεια ότι μέχρι το μισό του σημείου, είχε αρχίσει να υποψιάζεται ότι ο Libratus θα μπορούσε στην πραγματικότητα να δει τα χαρτιά του. Συνέχισε λέγοντας ότι δεν κατηγορεί τον Libratus για εξαπάτηση από μόνος του, αλλά ότι το AI ήταν απλά τόσο καλό.

Είμαστε πολλοί

Οι χαρούμενοι άντρες του Carnegie Mellon δεν φαινόταν πρόθυμοι να αποκαλύψουν πολλά για τον Libratus ή για τις εσωτερικές λειτουργίες της λήψης αποφάσεων κατά τη διάρκεια του stand-off, αλλά αργότερα αποκαλύφθηκε ότι ο Libratus δεν ήταν μοναδικός AI - σύστημα οδόντων που εργάζονται μαζί για έναν κοινό στόχο.

Στηριζόμενη στην εκμάθηση ενίσχυσης, ουσιαστικά μια μέθοδο δοκιμής και σφάλματος, ο Libratus πέτυχε παίζοντας παιχνίδι μετά από παιχνίδι εναντίον του. Ξεκινώντας, δεν ήξερε τίποτα για ειδικές στρατηγικές πόκερ ή παρόμοια - απλώς ενημερώθηκε για τους κανόνες του παιχνιδιού. Παίζοντας επανειλημμένα ενάντια στον εαυτό του, στο πλαίσιο του τριπλού δικτύου του, διερεύνησε κάθε πιθανή λεωφόρο και συνδυασμό - εξοπλίζοντας έτσι τον εαυτό του με επιτυχία για το έργο πριν από αυτό.

Σε κάθε δικαιοσύνη, πρέπει να αναφερθεί ότι ο Libratus έλαβε τα οφέλη από το όφελος ότι θα μπορούσε να κάνει απολογισμό της κατάστασης, όπως ήταν, κάθε βράδυ μετά από τους γύρους της ημέρας.

Ακόμα, όλα τα πράγματα είναι ίσα, ο Libratus υπερέβη τις προσδοκίες των ανθρώπινων δημιουργών του.

Spin Palace Χωρίς Κατάθεση Μπόνους Καζίνο >>


πηγή: spinpalace.com
IA Πόκερ - Ποιος κερδίζει; ΕΠΙΚΑΙΡΟΠΟΙΗΜΕΝΟ: Ιούνιος 18, 2019 Συγγραφέας: Damon