Loading AI tools
Из Википедии, свободной энциклопедии
Оптимальное управление — задача проектирования системы, обеспечивающей для заданного объекта управления или процесса закон управления или управляющую последовательность воздействий, обеспечивающих максимум или минимум заданной совокупности критериев качества системы[1].
Оптимальное управление |
---|
Задача оптимального управления включает в себя расчет оптимальной программы управления и синтез системы оптимального управления. Оптимальные программы управления, как правило, рассчитываются численными методами нахождения экстремума функционала или решения краевой задачи для системы дифференциальных уравнений[2]. Синтез систем оптимального управления с математической точки зрения представляет собой задачу нелинейного программирования в функциональных пространствах[3].
Для решения задачи определения программы оптимального управления строится математическая модель управляемого объекта или процесса, описывающая его поведение с течением времени под влиянием управляющих воздействий и собственного текущего состояния[4].
Если математическая модель управляемого объекта или процесса заранее неизвестна, то для её определения необходимо провести процедуру идентификации управляемого объекта или процесса[5]
Математическая модель для задачи оптимального управления включает в себя: формулировку цели управления, выраженную через критерий качества управления; определение дифференциальных или разностных уравнений[6], описывающих возможные способы движения объекта управления; определение ограничений на используемые ресурсы в виде уравнений или неравенств[7].
Все задачи оптимального управления можно рассматривать как задачи математического программирования и в таком виде решать их численными методами.[8][9]
При оптимальном управлении иерархическими многоуровневыми системами, например, крупными химическими производствами, металлургическими и энергетическими комплексами, применяются многоцелевые и многоуровневые иерархические системы оптимального управления. В математическую модель вводятся критерии качества управления для каждого уровня управления и для всей системы в целом, а также координация действий между уровнями управления[10][11].
Если управляемый объект или процесс является детерминированным, то для его описания используются дифференциальные уравнения. Наиболее часто используются обыкновенные дифференциальные уравнения вида . В более сложных математических моделях (для систем с распределёнными параметрами) для описания объекта используются дифференциальные уравнения в частных производных. Если управляемый объект является стохастическим, то для его описания используются стохастические дифференциальные уравнения.
Для решения задач оптимального управления в условиях конфликта или неопределенности используется теория дифференциальных игр.[12]
Если решение поставленной задачи оптимального управления не является непрерывно зависящим от исходных данных (некорректная задача), то такая задача решается специальными численными методами.[13]
Для решения задач оптимального управления с неполной исходной информацией и при наличии ошибок измерений используется метод максимального правдоподобия[14].
Система оптимального управления, способная накапливать опыт и улучшать на этой основе свою работу, называется обучающейся системой оптимального управления[15].
Реальное поведение объекта или системы всегда отличается от программного вследствие неточности в начальных условиях, неполной информации о внешних возмущениях, действующих на объект, неточности реализации программного управления и т. д. Поэтому для минимизации отклонения поведения объекта от оптимального обычно используется система автоматического регулирования.[16]
Иногда (например, при управлении сложными объектами, такими как доменная печь в металлургии или при анализе экономической информации) в исходных данных и знаниях об управляемом объекте при постановке задачи оптимального управления содержится неопределённая или нечёткая информация, которая не может быть обработана традиционными количественными методами. В таких случаях можно использовать алгоритмы оптимального управления на основе математической теории нечётких множеств (нечёткое управление). Используемые понятия и знания преобразуются в нечёткую форму, определяются нечёткие правила вывода принимаемых решений, затем производится обратное преобразование нечётких принятых решений в физические управляющие переменные.[17][11]
Для решения задач оптимального управления очень большой размерности, не позволяющей их решать методами классической математики, используются методы ситуационного управления.
Для оптимального управления экономическими процессами применяются методы экономической кибернетики, теории игр, теории графов[18]
Наиболее широко при проектировании систем управления детерминированными объектами c сосредоточенными параметрами, описываемыми обыкновенными дифференциальными уравнениями, применяются следующие методы: вариационное исчисление, принцип максимума Понтрягина и динамическое программирование Беллмана[1].
Сформулируем задачу оптимального управления:
здесь — вектор состояния — управление, — начальный и конечный моменты времени.
Задача оптимального управления заключается в нахождении функций состояния и управления для времени , которые минимизируют функционал.
Рассмотрим данную задачу оптимального управления как задачу Лагранжа вариационного исчисления[19]. Для нахождения необходимых условий экстремума применим теорему Эйлера-Лагранжа[19]. Функция Лагранжа имеет вид: , где — граничные условия. Лагранжиан имеет вид: , где , , — n-мерные вектора множителей Лагранжа.
Необходимые условия экстремума, согласно этой теореме, имеют вид:
Необходимые условия (3-5) составляют основу для определения оптимальных траекторий. Написав эти уравнения, получаем двухточечную граничную задачу, где часть граничных условий задана в начальный момент времени, а остальная часть — в конечный момент. Методы решения подобных задач подробно разбираются в книге[20]
Необходимость в принципе максимума Понтрягина возникает в случае, когда нигде в допустимом диапазоне управляющей переменной невозможно удовлетворить необходимому условию (3), а именно .
В этом случае условие (3) заменяется на условие (6):
В этом случае согласно принципу максимума Понтрягина величина оптимального управления равна величине управления на одном из концов допустимого диапазона. Уравнения Понтрягина записываются при помощи функции Гамильтона , определяемой соотношением . Из уравнений следует, что функция Гамильтона связана с функцией Лагранжа следующим образом: . Подставляя из последнего уравнения в уравнения (3—5), получаем необходимые условия, выраженные через функцию Гамильтона:
Необходимые условия, записанные в такой форме, называются уравнениями Понтрягина. Более подробно принцип максимума Понтрягина разобран в книге[19].
Пусть требуется решить задачу минимизации функционала:
Функция Гамильтона в данном случае имеет вид:
Из условий 9) и 10) находим, что:
Получаем:
Максимум этой функции по , , достигается при , где
По условию, . Значит:
Из , получаем . Из условия непрерывности в точке найдем постоянную .
Таким образом:
Можно проверить, что найденные и составляют оптимальное решение данной задачи[21]
Принцип максимума особенно важен в системах управления с максимальным быстродействием и минимальным расходом энергии, где применяются управления релейного типа, принимающие крайние, а не промежуточные значения на допустимом интервале управления.
За разработку теории оптимального управления Л. С. Понтрягину и его сотрудникам В. Г. Болтянскому, Р. В. Гамкрелидзе, и Е. Ф. Мищенко в 1962 году была присуждена Ленинская премия.
Метод динамического программирования основан на принципе оптимальности Беллмана, который формулируется следующим образом: оптимальная стратегия управления обладает тем свойством, что каково бы ни было начальное состояние и управление в начале процесса, последующие управления должны составлять оптимальную стратегию управления относительно состояния, полученного после начальной стадии процесса[22]. Более подробно метод динамического программирования изложен в книге[23]
Достаточные условия оптимальности управляемых процессов были получены в 1962 году В. Ф. Кротовым, на их основе были построены итерационные вычислительные методы последовательного улучшения, позволяющие находить глобальный оптимум в задачах управления[24][25][26].
В задачах оптимального управления такими объектами, как проходная нагревательная печь, теплообменный аппарат, установка для нанесения покрытия, сушильный агрегат, химический реактор, установка для разделения смесей, доменная или мартеновская печь, коксовая батарея, прокатный стан, печь индукционного нагрева и т. д. управляемый процесс описывается дифференциальными уравнениями в частных производных, интегральными уравнениями и интегро-дифференциальными уравнениями.
Теория оптимального управления в этом случае разработана лишь для отдельных видов этих уравнений: эллиптического, параболического и гиперболического типа.
В некоторых простых случаях удается получить аналог принципа максимума Понтрягина.[27][28]
Если решения систем уравнений имеют неустойчивости, точки разрыва, точки бифуркации, кратные решения, то для их получения используется ряд специальных методов[29].
С целью формулировки принципа максимума для систем с распределёнными параметрами вводится функция Гамильтона: , где вспомогательные функции должны удовлетворять уравнениям и граничным условиям при , при , .
Если - оптимальное управление и - получающиеся при оптимальном управлении функции, удовлетворяющие уравнениям , то функция , рассматриваемая как функция от аргумента достигает максимума в области при , то есть почти для всех точек выполняется равенство
Если система является линейной системой вида , то выполняется теорема
Для оптимальности управления в линейном случае необходимо и достаточно, чтобы выполнялся принцип максимума.
Доказательство этих двух теорем смотри в книге[28].
В этом случае управляемый объект или процесс описывается линейными стохастическими дифференциальными уравнениями. В этом случае решение задачи оптимального управления осуществляется на основе уравнения Риккати[30].
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.