Окремі випадки задач оптимального стохастичного керування

6923
знака
0
таблиц
2
изображения

ОКРЕМІ ВИПАДКИ ЗАДАЧ ОПТИМАЛЬНОГО СТОХАСТИЧНОГО КЕРУВАННЯ


1. Зовнішній інтеграл

Функції  і  можуть бути довільними, а математичні сподівання можна обчислювати, якщо  як функція від  є вимірною.

Якщо ж оптимальна стратегія, отримана в результаті оптимізації, виявиться невимірною, то і функція  може виявитися невимірною. У цьому випадку математичне сподівання невизначено.

Для розв’язання цієї проблеми застосовують два підходи. Перший полягає в накладенні на функції  і  таких обмежень, які забезпечували б вимірність підінтегральної функції на кожному кроці оптимізації : функції  і , , повинні бути неперервними по своїх аргументах і повинна існувати щільність імовірності розподілу випадкової величини , а множини  значень припустимих стратегій повинні бути компактними.

На жаль, на практиці ці вимоги не завжди виконуються. Тому другий підхід пов’язаний з використанням зовнішнього інтеграла.

Позначимо через  простір елементарних подій, що є довільною множиною, а  – деяка система підмножин множини .

Математичним сподіванням випадкової величини , заданої на імовірнісному просторі , називається число , якщо інтеграл з правої частини існує.

Нехай  і  – борелівські простори, ,  є -алгеброю в . Функція  називається -вимірною, якщо  для будь-якої множини . Тут  – борелівська -алгебра простору .

Для функції , () зовнішній інтеграл за мірою  визначається як нижня грань інтегралів від всіх вимірних функцій  (), що мажорують , тобто

, .

Тут  – функція розподілу випадкової величини , що відповідає ймовірнісній мірі .

Для довільної функції  має місце співвідношення:

,

де , , і вважають, що .

Оскільки зовнішній інтеграл визначений для будь-якої функції, як для вимірної, так і для невимірної, то ніяких додаткових обмежень на функції  і  накладати не треба.

Для вимірних функцій обидва види математичних сподівань співпадають. Отже, у постановках задач можна замінити звичайне математичне сподівання на зовнішнє, і навіть якщо знайдена при цьому функція  виявиться вимірною, то отримана стратегія керування не перестане бути оптимальною.

Зовнішня міра множини  визначається співвідношенням .

Для будь-якої множини

,


де  – це індикатор множини , що визначається як

а) якщо , то ;

б) якщо  і , то ;

в) якщо  або , то ;

г) якщо  задовольняє рівності , то для будь-якої функції  має місце рівність ;

д) якщо , то  для будь-якої функції ;

е) якщо  і , то . Якщо при цьому хоча б одна з функцій  або  -вимірна, то останнє співвідношення вірно зі знаком рівності.

Позначимо через  дійсну пряму, а через  – розширену дійсну пряму і надалі у всіх висновках замість дійсної прямої використовуватимемо поняття розширеної дійсної прямої.

Вважатимемо, що для розширеної дійсної прямої мають місце всі співвідношення порядку додавання і множення, які було введено для , і припустимо, що  і .

Позначимо через  множину всіх дійсних у розширеному розумінні функцій , де  – простір станів.

 – банахів простір всіх обмежених дійсних функцій  з нормою, що визначається за формулою

, .


Позначатимемо , якщо , ,  і , якщо , , .

Для будь-якої функції  і будь-якого числа  позначимо через  функцію, що приймає значення  в кожній точці , так, що

, .

Припущення монотонності. Для будь-яких станів , керування  і функцій  мають місце нерівності

 якщо  і ;

, якщо  і ;

, якщо ,  і .

Для будь-якого  стратегія  називається -оптимальною при горизонті , якщо

і -оптимальною, якщо

Багато задач послідовної оптимізації, що становлять практичний інтерес, можуть розглядатися як окремі випадки задач загального виду. Розглянемо деякі з них:

·  задачі детермінованого оптимального керування;

·  задачі стохастичного керування зі зліченним простором збурень;

·  задачі стохастичного керування із зовнішнім інтегралом;

·  задачі стохастичного керування з мультиплікативним функціоналом витрат;

·  задачі мінімаксного стохастичного керування.

2. Детерміноване оптимальне керування

Розглянемо відображення , що задане формулою

, , , (1)

за таких припущень:

функції  і  відображають множину  відповідно в множини  і , тобто , ; скаляр  додатний.

За цих умов відображення  задовольняє припущенню монотонності. Якщо функція  дорівнює нулю, тобто , , то відповідна -крокова задача оптимізації (1) набуває вигляду:

, (2)

. (3)

Ця задача є задачею детермінованого оптимального керування зі скінченним горизонтом. Задача з нескінченним горизонтом має наступний вигляд:


, (4)

. (5)

Границя в (4) існує, якщо має місце хоча б одна з наступних умов:

·  , , ;

·  , , ;

·  , , ,  і деякого .

У задачі (4) – (5) може бути уведене додаткове обмеження на стан системи , . У такому разі, якщо , позначатимемо .

3. Оптимальне стохастичне керування: зліченний простір збурень

Розглянемо відображення , що задане формулою

, (6)

за таких припущень:

параметр  приймає значення зі зліченної множини  з заданим розподілом ймовірностей , що залежать від  і ; функції  і  відображають множину  відповідно в множини  і , тобто , ; скаляр  додатний.

Якщо , , – елементи множини ,  – довільний розподіл ймовірностей на , а  – деяка функція, то математичне сподівання визначається за формулою


,

де ,

,

.

Оскільки , то математичне сподівання  визначене для будь-якої функції  і будь-якого розподілу ймовірностей  на множині .

Зокрема, якщо , ,… – розподіл ймовірностей  на множині , то формулу (6) можна переписати так:

При використанні цього співвідношення треба пам’ятати, що для двох функцій ,  рівність  має місце, якщо виконується хоча б одна з трьох умов:

 та ;

 та ;

 та .

Відображення  задовольняє припущенню монотонності. Якщо функція  – тотожний нуль, тобто , , то за умови , , функцію витрат за  кроків можна подати у вигляді:


(7)

де , .

Ця умова означає, що математичне сподівання обчислюється послідовно по всіх випадкових величинах .

При цьому зміна порядку операцій додавання і узяття математичного сподівання припустима, тому що , , і для довільних простору з мірою , вимірної функції  і числа  має місце рівність .

Якщо виконується одна з двох нерівностей

 або

,

то функцію витрат за  кроків  можна записати у вигляді:

,


де математичне сподівання обчислюється на добутку мір на , а стани , , виражаються через  за допомогою рівняння .

Якщо функція  допускає подання у такому вигляді для будь-якого початкового стану  та будь-якої стратегії , то -крокова задача може бути сформульована так:

, (8)

. (9)

Відповідна задача з нескінченним горизонтом формулюється так:

, (10)

. (11)

Границя в (10) існує при виконанні будь-якої з трьох наступних умов:

·  , , , ;

·  , , , ;

·  , , , ,  і деякого .

Математичне сподівання визначається і як звичайний інтеграл, і як зовнішній інтеграл з -алгеброю в множині , що складається із всіх підмножин , в залежності від вимірності або невимірності функцій.

Для багатьох практичних задач виконується припущення про зліченність множини .

Якщо ж множина  незліченна, то справа ускладнюється необхідністю обчислення математичного сподівання

для будь-якої функції . Подолання цих труднощів і пов’язане з використанням зовнішнього інтеграла.


Информация о работе «Окремі випадки задач оптимального стохастичного керування»
Раздел: Коммуникации и связь
Количество знаков с пробелами: 6923
Количество таблиц: 0
Количество изображений: 2

Похожие работы

Скачать
11275
0
1

... провести, то одержимо співвідношення . Це означає, що різним реалізаціям випадкового збурення  для одного початкового стану  відповідатимуть різні оптимальні стратегії керування . 4 Формальна постановка задачі оптимального стохастичного керування Розглянемо систему (2) із цільовим функціоналом (3). Надалі, якщо інше не обговорено спеціально, будемо вважати, що оптимальні керування на ...

Скачать
135325
38
7

... "Баланс" за 2007 – 2008 роки (додаток В); -          форма № 2 "Звіт про фінансові результати" за 2007 – 2008 роки (додаток Г). 3 Підвищення ефективності виробництва МКВП "Дніпроводоканал" на підставі методів Економіко-математичного моделювання У грудні 2008 року Дніпропетровський міськвиконком та комунальне Підприємство "Дніпроводоканал", яке знаходиться у власності м. Дніпропетровська ...

Скачать
43077
0
1

... регулирования движения судов: Отчет о НИР (промежуточный) // ХАИ. – 501-4/2002; – Харьков, 2002. – 30 с. АНОТАЦІЯ   Жеребятьєв Д.П. Методи обробки динамічних сцен при впливі нестаціонарних завад у радіотехнічних системах супроводження надводних протяжних об'єктів. – Рукопис. Дисертація на здобуття наукового ступеня кандидата технічних наук за фахом 05.12.17 – радіотехнічні та телевізійні ...

Скачать
147909
3
0

... тоді вони їй будуть заважати, а не допомагати. Отже, використання програм реабілітації сприяє усвідомленню дитиною необхідності позбавитися від хімічної залежності та скорішому одужанню, поверненню до нормального життя. 2.3 Психокорекційна робота Психологічна корекція базується на консультуванні і припускає цілеспрямований психологічний вплив на клієнта або пацієнта з метою приведення його ...

0 комментариев


Наверх