Ομιλητής: Μπουρνέτας Αποστόλης (ΕΚΠΑ).
Μέρος, ώρα : Παρασκευή 06 Μαρτίου 2020 & ώρα 13:05, στην Αίθουσα Σεμιναρίων του Τομέα Μαθηματικών, κτ. Ε΄, 2ος όροφος.
Τίτλος : Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς.
Περίληψη : “Το μοντέλο multi-armed bandit είναι ένα γενικό πλαίσιο βελτιστοποίησης στοχαστικών συστημάτων υπό ελλιπή πληροφόρηση. Αναφέρεται σε ένα σύνολο στατιστικών πληθυσμών από τους οποίους οι διαδοχικές παρατηρήσεις ακολουθούν πλήρως ή εν μέρει άγνωστες κατανομές. Σε κάθε βήμα ένας αποφασίζων επιλέγει ένα πληθυσμό από τον οποίον παίρνει μια παρατήρηση. Οι παρατηρήσεις θεωρούνται ως κέρδος ή αμοιβή για τον αποφασίζοντα, που επομένως θέλει να μεγιστοποιήσει τη συνολική αναμενόμενη αμοιβή του κάτω από κατάλληλα ορισμένα κριτήρια. Το πρόβλημα εντοπίζεται στην εύρεση πολιτικών επιλογής πληθυσμών που συνδυάζουν αποτελεσματικά την εκμάθηση των άγνωστων κατανομών των αμοιβών και τη συγκέντρωση μεγάλων αμοιβών.
Το παραπάνω γενικό πλαίσιο μπορεί να χρησιμοποιηθεί για την εύρεση προσαρμοστικά βέλτιστων λύσεων σε μεγάλη πλειάδα στοχαστικών συστημάτων υπό ελλιπή πληροφόρηση. Στην ομιλία θα γίνει μια εισαγωγή στα κριτήρια βελτιστοποίησης μέσω ελαχιστοποίησης της απώλειας λόγω ελλιπούς πληροφόρησης (regret) και θα συζητηθεί η περίπτωση όπου η λήψη παρατηρήσεων από κάθε πληθυσμό επιφέρει ένα διαφορετικό κόστος και υπάρχει ένας περιορισμός στο συνολικό κόστος δειγματοληψίας.”