Оптимальное управление. Оптимальные системы автоматического управления Метод динамического программирования

Для проектирования оптимальной САУ необходима полная информация об ОУ, возмущающих и задающих воздействиях, начальном и конечном состояниях ОУ. Далее требуется выбрать критерий оптимальности. В качестве такого критерия можно использовать один из показателей качества системы. Однако требования к отдельным показателям качества, как правило, противоречивы (например, повышение точности системы достигается уменьшением запаса устойчивости). Кроме того, оптимальная система должна иметь минимально возможную ошибку не только при отработке какого-то конкретного управляющего воздействия, но в течение всего времени работы системы. Следует также учитывать, что решение задачи оптимального управления зависит не только от структуры системы, но и от параметров составляющих ее элементов.

Достижение оптимального функционирования САУ во многом определяется тем, как осуществляется управление во времени, какова программа, или алгоритм управления. В связи с этим для оценки оптимальности систем используют интегральные критерии, вычисляемые как сумма значений интересующего проектировщиков параметра качества системы за все время процесса управления.

В зависимости от принятого критерия оптимальности рассматривают следующие виды оптимальных систем.

1. Системы , оптимальные по быстродействию , которые обеспечивают минимальное время перевода ОУ из одного состояния в другое. В этом случае критерий оптимальности выглядит следующим образом:

где / н и / к - моменты начала и окончания процесса управления.

В таких системах длительность процесса управления минимальна. Простейший пример - система управления двигателем, обеспечивающая минимальное время разгона его до заданной частоты вращения с учетом всех имеющихся ограничений.

2. Системы , оптимальные по расходу ресурсов , которые гарантируют минимум критерия

где к - коэффициент пропорциональности; U(t) - управляющее воздействие.

Такая система управления двигателем обеспечивает, например, минимальный расход топлива за все время управления.

3. Системы , оптимальные по потерям управления (или по точности), которые обеспечивают минимальные ошибки управления на основании критерия где e(f) - динамическая ошибка.

В принципе задача проектирования оптимальной САУ может быть решена простейшим методом перебора всех возможных вариантов. Конечно, такой метод требует больших затрат времени, но современные ЭВМ позволяют в некоторых случаях им воспользоваться. Для решения задач оптимизации разработаны специальные методы вариационного исчисления (метод максимума, метод динамического программирования и др.), позволяющие учесть все ограничения реальных систем.

В качестве примера рассмотрим, каким должно быть оптимальное по быстродействию управление электродвигателем постоянного тока, если подаваемое на него напряжение ограничено предельной величиной {/ лр, а сам двигатель можно представить в виде апериодического звена 2-го порядка (рис. 13.9, а).

Метод максимума позволяет рассчитать закон изменения и(г), обеспечивающий минимальное время разгона двигателя до частоты вращения (рис. 13.9, б). Процесс управления данным двигателем должен состоять из двух интервалов, в каждом из которых напряжение u(t) принимает свое предельное допустимое значение (в интервале 0 - /,: u(t) = +?/ пр, в интервале /| - / 2: u(t) = -?/ пр)* Для обеспечения такого управления в состав системы должен быть включен релейный элемент.

Как и обычные системы, оптимальные системы бывают разомкнутыми, замкнутыми и комбинированными. Если оптимальное управление, переводящее ОУ из начального состояния в конечное и не зависящее или слабо зависящее от возмущающих воздействий, может быть задано как функция времени U = (/(/), то строится разомкнутая система программного управления (рис. 13.10, а).

В программное устройство ПУ закладывается оптимальная программа П, рассчитанная на достижение экстремума принятого критерия оптимальности. По такой схеме осуществляется управ-

Рис. 13.9.

а - с обшим управляющим устройством; б - с двухуровневым управляющим

устройством

Рис. 13.10. Схемы оптимальных систем: а - разомкнутой; б - комбинированной

ление станками с числовым программным управлением и простейшими роботами, производится вывод ракет на орбиту и т.д.

Наиболее совершенными, хотя и наиболее сложными, являются комбинированные оптимальные системы (рис. 13.10, б). В таких системах разомкнутый контур осуществляет оптимальное управление по заданной программе, а замкнутый контур, оптимизированный по минимуму ошибки, отрабатывает отклонение выходных параметров. Используя канат измерения возмущений /*, система становится инвариантной относительно всего множества задающих и возмущающих воздействий.

Для того чтобы реализовать столь совершенную систему управления, необходимо точно и быстро измерять все возмущаюшие воздействия. Однако такая возможность имеется далеко не всегда. Гораздо чаще о возмущающих воздействиях известны только усредненные статистические данные. Во многих случаях, особенно в системах телеуправления, даже задающее воздействие поступает в систему вместе с помехами. А так как помеха представляет собой в общем случае случайный процесс, то удается синтезировать только статистически оптимальную систему. Такая система не будет оптимальной для каждой конкретной реализации процесса управления, но она будет в среднем наилучшей для всего множества его реализаций.

Для статистически оптимальных систем в качестве критериев оптимальности используют усредненные вероятностные оценки. Например, для следящей системы, оптимизированной по минимуму ошибки, в качестве статистического критерия оптимальности используют математическое ожидание квадрата отклонения выходного воздействия от заданного значения, т.е. дисперсию:

Используются и другие вероятностные критерии. Например, в системе обнаружения целей, где важно только наличие или отсутствие цели, в качестве критерия оптимальности применяют вероятность ошибочного решения Р ош:

где Р п ц - вероятность пропуска цели; Р ЛО - вероятность ложного обнаружения.

Во многих случаях рассчитанные оптимальные САУ оказываются практически не реализуемыми ввиду их сложности. Как правило, требуется получение точных значений производных высоких порядков от входных воздействий, что технически очень трудно осуществимо. Зачастую даже теоретический точный синтез оптимальной системы оказывается невозможен. Однако методы оптимального проектирования позволяют строить квазиоптимальные системы, хотя и упрощенные в той или иной степени, но все- гаки позволяющие достичь значений принятых критериев оптимальности, близких к экстремальным.

Материал об оптимальном управлении, который здесь представлен, объединяет теорию и практику оптимального управления. Прежде чем он был написан и представлен, создавались реальные оптимальные системы, результаты которых послужили основой для создания управляемых систем в конструкторе EFFLY. Как показали исследования, работа оптимальных систем созданных в программном конструкторе, принципиально не отличается от работы систем, реальных условиях.

Это хорошее известие, поскольку теперь вы можете практиковаться, наблюдать работу оптимальных систем и исследовать принципы оптимального управления, сидя у экрана монитора. С этой целью здесь размещены ссылки на файлы действующих оптимальных систем. Все что нужно, для того чтобы получить доступ к практике, это среда Excel.

Буду очень признателен, если вы напишете несколько слов о том, чем необходимо дополнить, по Вашему мнению, чтобы материал стал доступней и полезней, то есть, оптимальней :-). Ссылки для связи есть дальше по тексту.

1. Введение

Для достижения своих целей мы осуществляем самые разнообразные операции. Тем не менее, в повседневной жизни мы редко задумываемся над тем, что создается для проведения операции и насколько эффективно ее осуществляют. Иное дело, когда однотипные операции осуществляются на регулярной основе в виде технологического процесса, и от эффективности таких операций зависят темпы развития и конкурентоспособность бизнеса. В этом случае мы стремимся к тому, чтобы осуществляемые операции были максимально эффективными, самыми лучшими или, что тоже, оптимальными .

Оптимизация и оптимальное управление – очень модные и популярные понятия. Но, наверное, я вас очень удивлю, если скажу что об оптимальном управлении, несмотря, на несметное количество публикаций в самых разнообразных источниках, действительно качественной информации содержится очень мало. Обычно пересказываются некоторые образные фразы о «рулях», базовые понятия об ограничениях на процесс управления и безграничности управлений в рамках наложенных ограничений. Также обычно много говорится о критериях оптимального управления (как будто их может быть много). И даже приводятся конкретные выражения критериев оптимизации, которые на предмет адекватности никто не проверял.

Если говорить коротко, оптимальное управление это технологический процесс, состоящий из множества операций с такими параметрами, которые к определенному моменту времени обеспечат получение максимального по величине целевого продукта.

Для того чтобы понимать о каком целевом продукте идет речь, нужно получить представление о физике процесса и его кибернетике , а затем разобраться с процессом оптимизации.

2. Физика общих процессов производственных систем

Для того чтобы разобраться с принципами оптимального управления , не обойтись без понимания физики процессов, которые лежат в основе любой технологической операции. Принципы эти общие, поэтому разобравшись с ними на примере одного конкретного процесса, можно смело использовать полученные знания, опираясь на обобщенную кибернетическую модель исполнительного механизма операции.

В качестве примера мы с вами подробно рассмотрим операцию нагрева жидкости. При этом вы можете параллельно проводить собственные исследования, если у вас есть необходимое несложное оборудование и некоторый опыт. Также можно воспользоваться наблюдением за процессами управляемой системы нагрева собранной в среде EFFLY. Или же вы можете просто осваивать материал, анализируя готовые данные, отображенные на диаграммах.

Итак, нам нужно в цикле осуществлять операции нагрева жидкости, с выходом в оптимальный режим нагрева. Для осуществления операции нагрева будем использовать электрический нагреватель – тэн, с регулятором мощности. Тэн опускается в емкость с жидкость, а скорость нагрева зависит от мощности передаваемой электроприбору.

В чем состоит суть управления в данном случае? Все очень просто. Мы устанавливаем определенную величину подачи электроэнергии и проводим операцию нагрева. Установка регулятора мощности в одно из возможных положений это и есть управление. Поэтому, в зависимости от управления будет изменяться скорость нагрева, величина расхода электроэнергии и износ механизма нагрева тэна (рис.1-3).

Из графика (рис.1) следует, что увеличение подачи электроэнергии приводит к снижению расхода электроэнергии на проведение операции. Как это можно объяснить?

Рис.1 Изменение энергопотребления операции нагрева от управления

Все дело в том, что при низкой скорости нагрева, нагреваемая жидкость успевает отдавать большое количество тепла в окружающую среду. Чем выше скорость нагрева, тем меньше тепловые потери. Для процессов с высоким КПД технологического механизма это типичная картина. Почему у тэна высокий КПД? Потому что он погружен в жидкость и практически полностью отдает ей свою энергию (небольшая часть энергии теряется в проводах).

Также из графика изменения износа от управления (рис.2) следует, что чем выше производительность процесса, тем выше износ технологического механизма.

Рис.2 Изменение износа механизма операции нагрева от управления

Причем, при повышении производительности износ возрастает непропорционально, а в степенной зависимости. Коэффициент степенной функции износа механизма от производительности определяется экспериментально. В общем случае необходимо говорить об износе каждого механизма системы .

Ну и, конечно, чем больше величина подаваемой энергии, тем выше скорость процесса, а, соответственно, меньше время операции (рис.3). Это понятно. А реальная зависимость тоже нелинейная, как видно из графика.

Рис.3 Изменение времени операции нагрева от управления

Таким образом, каждому управлению соответствует свой расход энергетического продукта, свой износ механизмов операции и свое время операции. Характер изменений нам теперь доступен.

Вот собственно и все, что необходимо знать о физике процесса нагрева жидкости с погруженным в нее тэном, для того чтобы понимать суть природных механизмов лежащих в основе технологии оптимального управления .

Написать автору.

3. Кибернетика процессов производственных систем

Мы живем в мире, который подчиняется вполне определенным законам. Эти законы делятся на два класса. Знание законов первого класса позволяет нам ответить на вопрос: «Почему так происходит?». К классу таких наук относятся: физика, химия, астрономия.

Ко второму классу относятся науки, которые дают ответ на вопрос: «Зачем, или с какой целью?». Ярким представителем этого класса наук является кибернетика.

3.1 Миссия и цель управления производственных систем

В процессе оптимального управления решаются две достаточно независимые задачи, за решение которых отвечают две самостоятельные структуры производственной системы.

Первая задача, это создание продукта имеющего заданные потребительские качества. В нашем случае потребительским продуктом операции является нагретая жидкость. В общем случае можно говорить о том, что миссией системы является создание полезного продукта с заданными потребительскими качествами. Полезный продукт создается технической подсистемой под управлением технологической подсистемы. Эту технологическую подсистему часто называют системой управления.

Но, полезный продукт никто не будет создавать любой ценой. Поэтому параметры входных продуктов операции, а, следовательно, и параметры процесса, необходимо выбирать такими, чтобы экспертная оценка входных продуктов операции была меньше экспертной оценки выходных продуктов операции. В экономических системах оперируют не экспертными оценками, а стоимостными.

К примеру, нам нужно перевезти груз из точки А в точку Б. Для этого необходимо транспортное средство и энергетический продукт. Операцию осознанно мы будем проводить только в том случае, если стоимость более изношенного транспортного средства, остаток топлива и продукт в точке Б ценится нами выше, чем менее изношенный транспорт, неизрасходованное топливо и груз в точке А. То есть, мы боремся за повышение разности стоимостных оценок на входе и выходе.

Максимизация разности экспертных оценок выходных и входных продуктов цикла управляемых операций и является целью управления (это вторая задача управления), а сама разность является целевым продуктом . За максимизацию величины целевого продукта производственной системы отвечает подсистема оптимизации .

Обратите внимание на то, что речь идет о цикле операций (процессе), а не об отдельной операции . К этому моменту мы вернемся чуть позже, а пока поговорим о том, как перейти от натуральных показателей входных и выходных продуктов, к сопоставимым показателям.

3.2 Приведение количественных параметров продуктов операции к сопоставимым величинам

Проведение любой операции требует от нас определенных вложений. Для операции нагрева жидкости нам необходима сама порция холодной жидкости, определенное количеством энергии, и частью ресурса механизма, которая в процессе операции будет изношена. Мы по-разному оцениваем вклад каждого из этих продуктов в операцию. Эта оценка связана с понятием экспертная оценка продукта операции, которая выражается через экспертную оценку единицы продукта и его количественную оценку. Поскольку систему нагрева можно считать технико-экономической системой, будем использовать более привычное экономическое понятие «стоимостная оценка», вместо кибернетического понятия – «экспертная оценка».

В общем случае стоимостная оценка любого входного продукта операции определяется из выражения RE i =RS i ·RQ i , где RQ i – количество i-го продукта операции; RS i - стоимость единицы i-го продукта продукта операции; RE i – стоимостная оценка i-го продукта продукта операции.

Так, для проведения операции мы используем 1 кубический метр жидкости. Примем, что стоимостная оценка кубического метра жидкости составляет 0.8 ден. ед. Тогда стоимостная оценка кубометра жидкости будет равна RE cw =RQ cw ·RS cw =1·0,8=0,8 ден.ед., где RQ cw – объем жидкости необходимый для проведения операции; RS cw - стоимостная оценка куба жидкости; RE cw – стоимостная оценка объема жидкости операции.

Поскольку объем холодной жидкости необходимый для проведения очередной операции от управления не изменяется, график стоимостной оценки жидкости в зависимости от управления RE cw (U) будет иметь вид горизонтальной прямой линии (рис.4).

Расход энергетического продукта от операции к операции изменяется, поэтому стоимостная оценка расхода электроэнергии также будет изменяться от операции к операции. Приняв, что один кВт.ч. электроэнергии стоит 0.3 ден. ед., можно получить зависимость изменения энергетических затрат RE e от управления U, где RE e (U) - стоимостная оценка потребляемой электроэнергии операции от управления (рис.4).

Осталось определить изменение потерь ресурса механизма операции от управления в сопоставимых стоимостных величинах (RE w (U)), учитывая, что единица потери ресурса оценивается в 3 ден.ед. (рис.4).

Рис.4 Изменение стоимостных оценок необходимого объема электроэнергии, жидкости и степени износа тэна операции нагрева от управления

Теперь, поскольку все входные продукты операции выражены в сопоставимых стоимостных величинах, для каждого управления можно определить одно значение совокупных стоимостных затрат RE=RE cw +RE e +RE w (рис.5).

На этой же диаграмме удобно представить зависимость стоимостной оценки нагретой жидкости от управления PE(U) и время операции от управления T op (U) на дополнительной оси.

Рис.5 Изменение стоимостных оценок входных, выходных продуктов операции нагрева и времени операции от управления

Энергетический продукт, сама холодная жидкость и механизм нагрева представляют для нас вполне определенную ценность. Поэтому операции нагрева жидкости мы будем проводить только в том случае, если экспертная оценка входных продуктов операции меньше экспертной оценки результативного продукта операции. В данном случае мы примем, что стоимость куба нагретой жидкости оценивается на уровне PS=55 ден.ед.

Обратите внимание, базовые показатели RE, PE и T op являются кибернетическими, поскольку могут быть получены для любой операции, независимо от природы процессов и вида управляемой системы. Построив функции RE(U), PE(U) и Top(U) мы сделали еще один шаг к раскрытию сущности оптимального управления .

Какие для вас были сложности в восприятии материала? Написать автору.

3.3 Критерий оптимального управления производственных систем

Теперь, когда мы понимаем, что за процесс преобразования входных продуктов отвечает техническая подсистема, за качество результативного продукта – технологическая подсистема, а за максимизацию целевого продукта подсистема оптимизации, можно подойти к вопросу выбора оптимального варианта.

Примем, что у нас есть два варианта выбора параметров управления. Предположим, что устанавливая первый набор параметров управления, мы получаем циклически повторяющиеся операции с такими базовыми показателями: RE=4 ден. ед., PE=7 ден.ед., T op =7 час (рис.6).

Рис.6 Процесс формирования целевого продукта для первого управления

Как происходит процесс достижения цели? Верхний левый прямоугольник, это стоимостная оценка ресурсов операции. Таких ресурсов у нас 10 ден.ед. Поскольку для проведения операции необходимы ресурсы величиной 4 ден.ед., этот объем ресурсов передается для проведения первой операции, которая обозначена стрелочкой под номером 1.

Выполнение операции занимает 7 часов, и мы приняли, что стоимостная оценка продуктов операции составляет 7 единиц. Так как для проведения второй операции снова необходимо четыре единицы ресурса, оставшиеся три, мы передаем в склад целевого продукта.

В цикле у нас выполняется три операции, после чего можно определить величину абсолютного значения целевого продукта операции. Это 16 ден.ед. через 21 час работы.

Теперь изменяем управление, и получаем цикл операций с новыми базовыми показателями: RE=5 ден. ед., PE=7 ден.ед., Top=3 час (рис.7).

Рис.7 Процесс формирования целевого продукта для второго управления

Прирост целевого продукта за время проведения одной операции здесь меньше – 2 ден.ед. Однако, и время операции короче. Как вы можете видеть, к концу последней операции, через 21 час, мы получим 19 ден.ед. целевого продукта.

То есть, если у нас есть только два варианта проведения операций, то второй вариант предпочтительней. Поэтому управление по второму варианту и является оптимальным управлением.

Возникает вопрос: «Как, не осуществляя выполнения операций в цикле, сразу определить, какая операция выгоднее, а, соответственно, определить параметры оптимального управления?».

Для этого необходим показатель эффективности, который можно использовать в качестве критерия оптимизации.

В данном случае можно использовать простую формулу эффективности, которая представляет собой аналитическое выражение для расчета простых операций. Именно она связывает между собой три базовых показателя: стоимостную оценку входных продуктов операции (RE), стоимостную оценку выходных продуктов операции (PE) и время операции (T op). Если обозначить эффективность символом «Е», то формула для расчета показателя эффективности будет иметь вид

где Т p – единичный интервал времени, необходимость использования которого рассматривается в теории эффективности.

Подставив значения базовых показателей операций в формулу эффективности, получим значение Е=0.00656 для первой операции и Е=0.0127 для второй операции.

Как видим, показатель эффективности сразу указал на то, что второй тип операций предпочтительней операций первого типа. Следовательно, приведенный показатель является критерием оптимизации.

На рис.8 показано, как меняется эффективность при изменении управления. Красным цветом выделены параметры соответствующие максимальной эффективности.

Рис.8 Процесс формирования целевого продукта для второго управления

Вот собственно теперь можно ответить на вопрос, что такое оптимальное управление.
Оптимальное управление это процесс, который обеспечивает максимизацию целевого продукта при циклическом выполнении системных операций.
Выбор такого управления обеспечивает критерий оптимизации .

Как видно, в производственных системах выйти в оптимальный режим можно опираясь на абсолютный показатель – максимум приращения финансового потенциала, но этот процесс занимает очень много времени.

Может показаться, что решить вопрос выхода в оптимум можно и без критерия оптимизации – путем математического моделирования, используя результаты одной операции. Однако, влияние погрешностей датчиков приводит к очень большим отклонениям от точки оптимума.

Какие для вас были сложности в восприятии материала? Написать автору.

Для того чтобы посмотреть на работу оптимальной системы, нужно загрузить саму оптимальную систему собранную в конструкторе EFFLY . О том, как замустить работу системы, можно узнать .

После нажатия кнопки "Пуск" открывается лист, на котором будут отображены графики поиска оптимума системы. Первая точка появляется через пару минут, посколько для выхода на нее проходит несколько операций. Нужно немного подождать.

Задачи оптимального управления относятся к теории экстремальных задач, то есть задач определения максимальных и минимальных значений. Уже то обстоятельство, что в этой фразе встретилось несколько латинских слов (maximum - наибольшее, minimum - наименьшее, extremum - крайнее, optimus - оптимальное), указывает, что теория экстремальных задач была предметом исследования с древних времен. О некоторых таких задачах писали еще Аристотель (384-322 годы до н.э.), Евклид (III в. до н.э.) и Архимед (287-212 годы до н.э.). Основание города Карфагена (825 год до н.э.) легенда ассоциирует с древнейшей задачей определения замкнутой плоской кривой, охватывающей фигуру максимально возможной площади. Подобные задачи именуются изопериметрическими.

Характерной особенностью экстремальных задач является то, что их постановка была порождена актуальными запросами развития общества. Более того, начиная с XVII века доминирующим становится представление о том, что законы окружающего нас мира являются следствием некоторых вариационных принципов. Первым из них был принцип П. Ферма (1660 год), в соответствии с которым траектория света, распространяющегося от одной точки к другой, должна быть такова, чтобы время прохождения света вдоль этой траектории было минимально возможным. Впоследствии были предложены раз- личные широко используемые в естествознании вариационные принципы, например: принцип стационарного действия У.Р. Гамильтона (1834 год), принцип виртуальных перемещений, принцип наименьшего принуждения и др. Параллельно развивались и методы решения экстремальных задач. Около 1630 года Ферма сформулировал метод исследования на экстремум для полиномов, состоящий в том, что в точке экстремума производная равняется нулю. Для общего случая этот метод получен И. Ньютоном (1671) и Г.В. Лейбницем (1684), работы которых знаменуют зарождение математического анализа. Начало развития классического вариационного исчисления датируется появлением в 1696 году статьи И. Бернулли (ученика Лейбница), в которой сформулирована постановка задачи о кривой, соединяющей две точки А и В, двигаясь по которой из точки А в В под действием силы тяжести материальная точка достигнет В за минимально возможное время.

В рамках классического вариационного исчисления в XVIII-XIX веках установлены необходимые условие экстремума первого порядка (Л. Эйлер, Ж.Л. Лагранж), позднее развиты необходимые и достаточные условия второго порядка (К.Т.В. Вейерштрасс, А.М. Лежандр, К.Г.Я. Якоби), построены теория Гамильтона-Якоби и теория поля (Д. Гиль- берт, А. Кнезер). Дальнейшее развитие теории экстремальных задач привело в XX веке к созданию линейного программирования, выпуклого анализа, математического программирования, теории минимакса и некоторых иных разделов, одним из которых является теория оптимального управления.

Эта теория подобно другим направлениям теории экстремальных задач, возникла в связи с актуальными задачами автоматического регулирования в конце 40-х годов (управление лифтом в шахте с целью наискорейшей остановки его, управление движением ракет, стабилизация мощности гидроэлектростанций и др.). Заметим, что постановки отдельных задач, которые могут быть интерпретированы как задачи оптимального управления, встречались и ранее, например в “Математических началах натуральной философии” И. Ньютона (1687). Сюда же относятся и задача Р. Годдарда (1919) о подъеме ракеты на заданную высоту с минимальными затратами топлива и двойственная ей задача о подъеме ракеты на максимальную высоту при заданном количестве топлива. За прошедшее время были установлены фундаментальные принципы теории оптимального управления: принцип максимума и метод динамического программирования.

Указанные принципы представляют собой развитие классического вариационного исчисления для исследования задач, содержащих сложные ограничения на управление.

Сейчас теория оптимального управления переживает период бурного развития как в связи с наличием трудных и интересных математических проблем, так и в связи с обилием приложений, в том числе и в таких областях, как экономика, биология, медицина, ядерная энергетика и др.

Все задачи оптимального управления можно рассматривать как задачи математического программирования и в таком виде решать их численными методами.

При оптимальном управлении иерархическими многоуровневыми системами, например, крупными химическими производствами, металлургическими и энергетическими комплексами, применяются многоцелевые и многоуровневые иерархические системы оптимального управления. В математическую модель вводятся критерии качества управления для каждого уровня управления и для всей системы в целом, а также координация действий между уровнями управления.

Если управляемый объект или процесс является детерминированным, то для его описания используются дифференциальные уравнения. Наиболее часто используются обыкновенные дифференциальные уравнения вида. В более сложных математических моделях (для систем с распределёнными параметрами) для описания объекта используются дифференциальные уравнения в частных производных. Если управляемый объект является стохастическим, то для его описания используются стохастические дифференциальные уравнения.

Если решение поставленной задачи оптимального управления не является непрерывно зависящим от исходных данных (некорректная задача), то такая задача решается специальными численными методами.

Система оптимального управления, способная накапливать опыт и улучшать на этой основе свою работу, называется обучающейся системой оптимального управления.

Реальное поведение объекта или системы всегда отличается от программного вследствие неточности в начальных условиях, неполной информации о внешних возмущениях, действующих на объект, неточности реализации программного управления и т.д. Поэтому для минимизации отклонения поведения объекта от оптимального обычно используется система автоматического регулирования.

Иногда (например, при управлении сложными объектами, такими как доменная печь в металлургии или при анализе экономической информации) в исходных данных и знаниях об управляемом объекте при постановке задачи оптимального управления содержится неопределённая или нечёткая информация, которая не может быть обработана традиционными количественными методами. В таких случаях можно использовать алгоритмы оптимального управления на основе математической теории нечётких множеств (Нечёткое управление). Используемые понятия и знания преобразуются в нечёткую форму, определяются нечёткие правила вывода принимаемых решений, затем производится обратное преобразование нечётких принятых решений в физические управляющие переменные.

Оптимальное управление технологическими процессами (Лекция)

ПЛАН ЛЕКЦИИ

1. Основные понятия нахождения экстремума функции

2. Классификация методов оптимального управления

1. Основные понятия нахождения экстремума функции

Всякая математическая постановка оптимальной задачи часто равносильна или эквивалентна задаче отыскания экстремума функции одной или многих независимых переменных. Поэтому для решения таких оптимальных задач могут быть использованы различные методы поиска экстремума.

В общем случае задача оптимизации формулируется следующим образом:

Найти extr функции R (x ), где ХХ

R (x ) – называется целевой функцией или функцией или критерием оптимизации или оптимизируемой функцией

Х – независимая переменная.

Как известно необходимые условиям существования экстремума у непрерывной функции R (x ) могут быть получены из анализа первой производной . При этом функция R (x ) может иметь экстремальные значения при таких значениях независимой переменной Х, где первая производная равна 0. т.е. =0. Графически равенство нулю производной означает, что касательная к кривой R (x ) в этой точке параллельна оси абсцисс.

Равенство производной =0 есть необходимое условие экстремума.

Однако равенство нулю производной еще не означает, что в этой точке существует экстремум. Для того, чтобы окончательно убедится, что в этой точке действительно существует экстремум необходимо провести дополнительные исследования, которые заключаются в следующих способах:

1. Способ сравнения значений функций

Сравнивают значение функции R (x ) в «подозреваемой» на экстремум точке Х К две соседние значения функции R (x ) в точках Х К-ε и Х К+ε , где ε- малая положительная величина. (Рис. 2)

Если оба рассчитанных значения R (Х К+ε) и R (Х К-ε), окажутся меньше или больше R (Х К), то в точке Х К существует максимум или минимум функции R (х).

Если же R (Х К) имеет промежуточное значение между R (Х К-ε) и R (Х К+ε), то функция R (х) не имеет ни максимума ни минимума.

2. Способ сравнения знаков производных

Опять рассмотрим функцию R (Х К) в окрестностях точки Х К, т.е. Х К+ε и Х К-ε . При этом способе рассматривается знак производной в окрестности точки Х К. Если знаки производной в точках Х К-ε и Х К+ε различные, то в точке Х К существует экстремум. При этом вид экстремума (min или max ) может быть найден по изменению знака производной при переходе от точки Х К-ε к точке Х К+ε.

Если знак меняется с «+» на «-», то в точке Х К – максимум (рис. 3б), если наоборот с «-» на «+», то минимум. (Рис. 3а)

3. Способ исследования знаков высших производных.

Этот способ применяют в тех случаях, когда в точке «подозреваемой» на экстремум существуют производные высших порядков, т.е. функция R (Х К) не только сама непрерывна, но имеет также непрерывные производные и .

Способ сводится к следующему:

В точке Х К «подозреваемой» на экстремум, для которой справедливо

вычисляется значение второй производной .

Если при этом , то в точке Х К – максимум,

если , то в точке Х К – минимум.

При решении практических задач оптимизации требуется отыскать не какое-нибудь min или max значение функции R (Х К), а наибольшее или наименьшее значение этой функции, которое называется глобальным экстремумом. (Рис. 4)

В общем случае задача оптимизации состоит в отыскивании экстремума функции R (Х), при наличии тех или иных ограничений на уравнения математической модели.

В том случае, если R (Х) является линейной, а область допустимых решений задается линейными равенствами и неравенствами, то задача отыскания экстремумов функции относится к классу задач линейного программирования.

Часто множество Х определяют как систему функции

Тогда запись математической постановки задачи линейного программирования выглядит так:

В том случае, если или целевая функция R (Х) или какая-либо из ограничений не является линейной функцией, то задача отыскания экстремума функции R (Х) относится к классу задач нелинейного программирования.

В том случае, если на переменные Х не наложено никаких ограничений, то такая задача называется задачей на безусловный экстремум.

Пример типовой задачи оптимизации

Задача о коробке максимального объема.

Из этой заготовки следует вырезать четыре ровных квадрата по ее углам, а полученную фигуру (рис.5 б) согнуть так, чтобы получилась коробка без верхней крышки (рис.6.5 в). при этом необходимо так выбрать размер вырезаемых квадратов, чтобы получилась коробка максимального объема.

На примере данной задачи можно проиллюстрировать все элементы постановки задач оптимизации.

Рис. 5. Схема изготовления коробки из прямоугольной заготовки фиксированного размера

Оценочной функцией в данной задаче служит объем изготовленной коробки. Проблема заключается в выборе размера вырезаемых квадратов. Действительно, если размер вырезаемых квадратов слишком мал, то будет получена широкая коробка малой высоты, а значит и объем окажется невелик. С другой стороны, если размер вырезаемых квадратов будет слишком большой, то будет получена узкая коробка большой высоты, а значит, и ее объем также окажется невелик.

В то же время на выбор размера вырезаемых квадратов оказывает влияние ограничение размера исходной заготовки. Действительно, если вырезать квадраты со стороной, равной половине стороны исходной заготовки, то задача теряет смысл. Сторона вырезаемых квадратов также не может превышать половину сторон исходной заготовки, поскольку это невозможно из практических соображений. Из этого следует, что в постановке данной задачи должны присутствовать некоторые ограничения.

Математическая постановка задачи о коробке максимального объема . Для математической постановки данной задачи необходимо ввести в рассмотрение некоторые параметры, характеризующие геометрические размеры коробки. С этой целью дополним содержательную постановку задачи соответствующими параметрами. С этой целью будем рассматривать квадратную заготовку из некоторого гибкого материала, которая имеет длину стороны L (рис. 6). Из этой заготовки следует вырезать четыре ровных квадрата со стороной по ее углам, а полученную фигуру согнуть, так чтобы получилась коробка без верхней крышки. Задача состоит в таком выборе размера вырезаемых квадратов, чтобы в результате получилась коробка максимального объема.

Рис. 6. Схема изготовления из прямоугольной заготовки с указанием ее размеров

Для математической постановки данной задачи необходимо определить переменные соответствующей задачи оптимизации, задать целевую функцию и специфицировать ограничения. В качестве переменной следует взять длину стороны вырезаемого квадрата r , которая в общем случае, исходя из содержательной постановки задачи, принимает непрерывные действительные значения. Целевой функцией является объем полученной коробки. Поскольку длина стороны основания коробки равна: L - 2r , а высота коробки равна r , то ее объем находится по формуле: V (r) = (L -2r ) 2 r . исходя из физических соображений, значения переменной r не могут быть отрицательными и превышать величину половины размера исходной заготовки L , т.е. 0,5L .

При значениях r = 0 и r = 0,5 L соответствующие решения задачи о коробке являются выраженными. Действительно, в первом случае заготовка остается без изменения, а во втором случае она разрезается на 4 одинаковых части. Поскольку эти решения имеют физическую интерпретацию, задачу о коробке для удобства ее постановки и анализа можно считать оптимизации с ограничениями типа нестрогих неравенств.

С целью унификации, обозначим переменную через х = r , что не оказывает влияния на характер решаемой задачи оптимизации. Тогда математическая постановка задачи о коробке максимального объема может быть записана в следующем виде:

где (1)

Целевая функция данной задачи является нелинейной, поэтому задача о коробке максимального размера относится к классу задач нелинейного программирования или нелинейной оптимизации.

2. Классификация методов оптимального управления

Оптимизация процесса заключается в нахождении оптимума рассматриваемой функции или оптимальных условий проведения данного процесса.

Для оценки оптимума, прежде всего, необходимо выбрать критерий оптимизации. Обычно, критерий оптимизации выбирает из конкретных условий. Это могут быть технологический критерий (например, содержание Сu в отвальном шлаке) или экономический критерий (минимальная стоимость продукта при заданной производительности труда) и др. На основании выбранного критерия оптимизации составляется целевая функция, представляющая собой зависимость критерия оптимизации от параметров влияющих на его значение. Задача оптимизации сводится к нахождению экстремума целевой функции. В зависимости от характера рассматриваемых математических моделей принимаются различные математические методы оптимизации.

Общая постановка задачи оптимизации заключается в следующем:

1. Выбирается критерий

2. Составляется уравнение модели

3. Накладывается система ограничения

4. Решение

модель - линейная или нелинейная

Ограничения

В зависимости от структуры модели применяются различные методы оптимизации. К ним относятся:

1. Аналитические методы оптимизации (аналитический поиск экстремума, метод множителей Лагранжа, Вариационные методы)

2. Математическое программирование (линейное программирование, динамическое программирование)

3. Градиентные методы.

4. Статистические методы (Регрессионный анализ)

Линейное программирование . В задачах линейного программирования критерий оптимальности представляется в виде:

где - заданные постоянные коэффициенты;

Переменные задачи.

Уравнения модели представляют собой линейные уравнения (полиномы) вида на которые накладывается ограничения в виде равенства или неравенства, т.е. (2)

В задачах линейного программирования обычно предполагается, что все независимые переменные Х j неотрицательны, т.е.

Оптимальным решением задачи линейного программирования является такая совокупность неотрицательных значений независимых переменных

Которая удовлетворяет условия (2) и обеспечивает в зависимости от постановки задачи max или min значение критерия.

Геометрическая интерпретация имеет вид: - критерий при наличии ограничении на переменных Х 1 и Х 2 типа равенств и неравенств

R имеет постоянное значение вдоль линии l . Оптимальное решение будет в точке S , т.к. в этой точке критерий будет max .Одним из методов решения задачи оптимизации линейного программирования является симплекс-метод.

Нелинейное программирование . Математическая постановка задачи нелинейного программирования заключается в следующем: Найти экстремум целевой функции , которая имеет вид нелинейности.

На независимые переменные налагаются различные ограничения типа равенств или неравенств

в настоящее время для решения задач нелинейного программирования применяются довольно большое число методов.

К ним относится: 1) Градиентные методы (метод градиента, метод наискорейшего спуска, метод образов, метод Розенброка и т.д.)

2) Безградиентные методы (метод Гауса-Зейделя, метод сканирования).

Градиентные методы оптимизации

Эти методы относятся к численным методам поискового типа. Сущность этих методов заключается в определении значений независимых переменных, дающих наибольшее (наименьшее) изменение целевых функции. Обычно это достигается при движении вдоль градиента, ортогонального к контурной поверхности в данной точке.

Рассмотрим метод градиента. В этом методе используется градиент целевой функции. В методе градиента шаги совершаются в направлении наибыстрейшего уменьшения целевой функции.

Рис. 8. Поиск минимума методом градиента

Поиск оптимума производится в два этапа:

1-этап: - находят значения частных производных по всем независимым переменным, которые определяют направление градиента в рассматриваемой точке.

2-этап: - осуществляется шаг в направлении обратном направлению градиента, т.е. в направлении наибыстрейшего убывания целевой функции.

Алгоритм градиентного метода может быть записан следующим образом:

(3)

Характер движения к оптимуму методом наискорейшего спуска заключается в следующем (рис. 6.9), после того как в начальной точке найден градиент оптимизируемой функции и тем самым определено направление ее наибыстрейшего убывания в указанной точке, в данном направлении делается шаг спуска. Если значение функции в результате этого шага уменьшилась, то производится очередной шаг в том же направлении, и так до тех пор, пока в этом направлении не будет найден минимум, после чего вычисляется снова градиент и определяется новое направление наибыстрейшего убывания целевой функции.

Безградиентные методы поиска экстремума. Эти методы, в отличии от градиентных, используют в процессе поиска информации, получаемую не при анализе производных, а от сравнительной оценки величины критерия оптимальности в результате выполнения очередного шага.

К безградиентным методам поиска экстремума относится:

1. метод золотого сечения

2. метод с использованием чисел Фибония

3. метод Гауса-Зейделя (метод получения изменения переменной)

4. метод сканирования и т.д.

Любая автоматическая система предназначена для управления каким-либо объектом, должна быть построена таким образом, чтобы осуществляемое ею управление было оптимальным, т.е наилучшем в том или ином смысле. Задачи оптимального управления чаще всего возникают в подсистемах управления технологическими процессами. В каждом случае существует некоторая технологическая задача, для выполнения которой предназначается соответствующая машина или установка (объект управления), снабженная соответствующая системой управления, т.е. речь идет о некоторой САУ, состоящей из объекта управления и совокупности устройств, которые обеспечивают управление этим объектом. Как правило эта совокупность включает в себя измерительные, усилительные преобразовательные и исполнительные устройства. Если объединить усилительные, преобразовательные и исполнительные устройства в одно звено, называемое управляющим устройством или регулятором, то функциональная схема САУ может быть приведена к виду на рис. 1. 1.

Рис. 1. 2 Функциональная схема оптимальной системы

На вход управляющего устройства поступает задающее воздействие, которое содержит инструкцию о том, каково должно быть состояние объекта - так называемое «желаемое состояние».

На объект управления может поступать возмущающие воздействие z, представляющие нагрузку или помеху. Измерение координат объекта измерительным устройством может производиться с некоторыми случайными погрешностями x (ошибка) .

Таким образом, задачей управляющего устройства является выработка такого управляющего воздействия, чтобы качество функционирования САУ в целом было бы наилучшим в некотором смысле. Для определения алгоритма управляющего устройства необходимо знать характеристики объекта и характер информации об объекте и возмущениях, которая поступает в управляющее устройство.

Под характеристиками объекта понимают зависимость выходных величин объекта от входных

где F, в общем случае,-- оператор, который устанавливает закон соответствия между двумя множествами функций. Оператор F объекта может быть задан различными способами: с помощью формул, таблиц, графиков. Его задают и в виде системы дифференциальных уравнений, которая в векторной форме записывается так

где и задавалось начальное и конечное значения вектора.

Существует много различных путей решения рассматриваемой задачи. Но только один способ управления объектом дает наилучший в некотором смысле результат. Этот способ управления и реализующую его систему называют оптимальными.

Чтобы иметь количественные основания для предпочтения одного способа управления всем другим, необходимо определить цель управления, а затем ввести меру, характеризующую эффективность достижения цели -критерий оптимальности управления. Обычно критерий оптимальности - это числовая величина, зависящая от изменяющихся во времени и пространстве координат и параметров системы так, что каждому закону управления соответствует определенное значение критерия. В качестве критерия оптимальности могут быть выбраны различные технические и экономические показатели рассматриваемого процесса.

Иногда к системе управления предъявляются различные, подчас противоречивые требования. Законы управления, которые одновременно наилучшим образом удовлетворяли бы каждому требованию, не существует. Поэтому из всех требований нужно выбрать одно главное, которое должно удовлетворяться наилучшим образом. Другие требования играют роль ограничений. Следовательно, выбор критерия оптимальности должен производиться, только на основании изучения технологии и экономики рассматриваемого объекта и среды. Эта задача выходит за рамки теории ОУ.

При решении задач оптимального управления наиболее важным является задание цели управления, что математически можно рассматривать как задачу достижения экстремума некоторой величины Q -- критерия оптимальности. В математике такую величину называют функционалом. В зависимости от решаемой задачи необходимо достижение минимума либо максимума Q. Например, запишем критерий оптимальности, в котором Q должно быть минимально

Как видно, величина Q зависит от функций.

В качестве критерия оптимальности могут быть приняты различные технические и технико-экономические показатели и оценки. Выбор критерия оптимальности -- это инженерная и инженерно-экономическая задача, которая решается на основе глубокого и всестороннего изучения управляемого процесса. В теории управления широко распространены интегральные функционалы, характеризующие качество функционирования системы. Достижение максимального или минимального значения этого функционала указывает на оптимальное поведение или состояние системы. Интегральные функционалы обычно отражают условия работы объектов управления и учитывают ограничения (по нагреву, прочности, мощности источников энергии и т. д.), накладываемые на координаты .

Для процессов управления использоваться такие критерии:

1. оптимальное быстродействие (время переходного процесса)

2. минимум среднеквадратичного значения ошибки.

3. минимум расхода затрачиваемой энергии.

Таким образом, критерий оптимальности может относиться к переходному или к установившемуся процессу в системе.

В зависимости от критерия оптимальности оптимальные системы можно разделить на два основных класса -- оптимальные по быстродействию и оптимальные по точности.

Системы оптимального управления в зависимости от характера критерия оптимальности можно разделить на три типа:

а) равномерно-оптимальные системы;

б) статистически-оптимальные системы;

в) минимаксно-оптимальные системы.

Равномерно-оптимальная -- это такая система, у которой каждый отдельный процесс является оптимальным. Например, в оптимальных по быстродействию системах при любых начальных условиях и любых возмущениях система приходит наикратчайшим во времени путем к требуемому состоянию.

В статистически-оптимальных системах критерий оптимальности имеет статистический характер. Такие системы должны быть наилучшими в среднем. Здесь не требуется или невозможна оптимизация в каждом отдельном процессе. В качестве статистического критерия чаще всего фигурирует среднее значение какого-либо первичного критерия, например математическое ожидание выхода некоторой величины за определенные пределы.

Минимаксно-оптимальные -- это такие системы, которые в наихудшем случае дают возможно наилучший результат. Они отличаются от равномерно-оптимальных тем, что в ненаихудшем случае могут дать худший результат, чем какая-либо другая система .

Оптимальные системы можно также подразделить на три типа в зависимости от способа получения информация об управляемом объекте:

оптимальные системы с полной информацией об объекте;

оптимальные системы с неполной информацией об объекте и пассивным ее накоплением;

оптимальные системы с неполной информацией об объекте и активным ее накоплением в процессе управления (системы дуального управления).

Существует две разновидности задач синтеза оптимальных систем:

Определение оптимальных значений параметров регулятора при заданных параметрах объекта и заданной структуре системы;

Синтез структуры и определение параметров регулятора при заданных параметрах и структуре объекта управления.

Решение задач первого типа возможно различными аналитическими методами при минимизации интегральных оценок, а также с помощью вычислительной техники (моделирование на ЭВМ), рассматривая заданный критерий оптимальности.

Решение задач второго типа основано на использовании специальных методов: методы классического вариационного исчисления, принципа максимума Понтрягина и динамического программирования Беллмана, а также методы математического программирования. Для синтеза оптимальных систем при случайных сигналах используются методы Винера, вариационные и частотные методы. При разработке адаптивных систем наиболее широкое применение имеют градиентные методы, позволяющие определить законы, изменения настраиваемых параметров.