Tip:
Highlight text to annotate it
X
Для початку введемо базову термінологію,
що використовується в штучному інтелекті для розрізнення різних типів задач.
Найперші терміни - це повістю та частково доступний для огляду.
Середовище називається повністю доступним для огляду, якщо інформації, яку агент може сприйняти
в будь-який момент часу, достатньо для прийняття оптимального рішення.
Таким чином, наприклад, в багатьох іграх в карти,
коли всі карти лежать настолі, моментального огляду всіх карт
справді достатньо для того, щоб зробити оптимальний вибір.
Напроти, існують середовища, де агентові потрібна пам'ять,
щоб прийняти найкраще можливе рішення.
Наприклад, при ігрі в покер, карти не лежать відкрито на столі,
а запам'ятовування попердніх ходів допоможе зробити краще рішення.
Щоб повністю зрозуміти різницю, давайте перенесемо взаємодію агента
з середовищем на його сенсори і приводи,
така взаємодія відбувається протягом багатьох циклів,
і її часто називають циклом сприйняття і дії.
В багатьох оточеннях, зручно вважати,
що оточення має щось на зразок внутрішнього стану.
Наприклад, у грі в карти, в якій карти не лежать відкрито на столі,
цей стан може зводитись до тих карт, які знаходяться в вашій руці.
Середовище повністю доступне для огляду, якщо сенсори завжди бачать
повний стан середовища.
Середовище частково доступне для огляду, якщо сенсори можуть бачити тільки частину стану,
і в цей же час запам'ятовування минулих замірів частки стану, дає нам додаткову інформацію про те,
що в даний момент недоступне для огляду.
Таким чином, будь-яка гра, в якій минулі ходи дають інформацію про те, які карти
можуть знаходитись в руці у гравця, має частково доступне для огляду середовище,
а воно вимагає окремих конкретних процедур для вирішення завдання.
Дуже часто агенти, які взаємодіють з частково доступними для огляду середовищами,
повинні мати внутрішню пам'ять, щоб розуміти,
в якому стані знаходиться середовище, а ми поговоримо про це більш детально,
коли будемо вивчати приховані моделі Маркова і те, як в такій структурі
організована внутрішня пам'ять.
Наступна частина термінології дає нам поняття того, чи є середовище
детерміноване чи стохастичне.
Детерміноване середовище - це середовище, в якому дії агента
дать однозначний результат.
Таким чином, наприклад, в шахах, насправді, немає жодних випадковостей при виконанні ходу.
Результат руху фігури є повністю визначеним
незалежно від того, куди я збираюсь перемістити одну і ту ж фігуру.
Це ми називаємо детермінованим.
Ігри в кості, наприклад, нарди, є стохастичними.
І хоча ви рухаєте фігури детерміновано,
результат дії також включає кидання костей,
а результат цієї дії передбачити неможливо.
В результаті кидання костей є певна доля випадковості,
саме тому ми називаємо таке середовище стохастичним.
Тепер поговоримо про дискретні та неперервні середовища.
В дискретному середовищі існує кінцева кількість варіантів вибору,
і кінцева кількість речей, які може сприймати сенсор.
Таким чином, наприклад, в шахах, існує кінцева кількість станів дошки,
і кінцева кількість речей, які можна зробити.
Інша ситуація в неперервних середовищах,
де простір можливих дій чи речей, які можуть сприймати сенсори може бути безкінечним.
Так, наприклад, якщо ви кидаєте дротики, існує безкінечна кількість кутів і
прискорень, які ви можете їм надати.
І останнє, ми розрізняємо сприятливе та вороже середовища.
В сприятливих середовищах, оточення може бути випадковим.
Воно може бути стохастичним, але саме по собі не переслідує ніякої цілі,
що буде перешкоджати нашим цілям.
Так, наприклад, погода - сприятливе середовище.
Вона може бути випадковою. Вона може впливати на результат ваших дій.
Але вона не старається протистояти вам.
І навпаки, є ворожі середовища, наприклад, в шахах,
де ваш опонент переслідує ціль вашого програшу.
Виявляється, що в ворожих середовищах набагато важче прийняти правильне рішення,
оскільки опонент активно оглядає вас і протидіє досягненню ваших цілей,
на відміну від сприятливих середовищ, які хоча і можуть бути стохастичними,
проте не зацікавлені в тому, щоб погіршити ваше життя.
Отже, давайте визначимо, наскільки добре ви сприйняли матеріал
вирішуючи наступне завдання.
Отже, є 4 концепції: частково та повністю доступне для огляду середовише,
стохастичне та детерміноване, неперервне і дискретне,
вороже та сприятливе.
А зараз питання буде стосуватись гри в шашки.
Відмітьте один чи всі атрибути, які можна застосувати.
Отже, якщо ви вважаєте, що шашки частково доступні для огляду, відмітьте тут.
В іншому випадку, не відмічайте.
Якщо ви думаєте, що вони стохастичні - відмітьте тут,
неперервні - тут, ворожі - тут.
Якщо ви не знаєте, що таке шашки,
пошукайте інформацію про них в Вебі.