|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Методы оптимизации
Введение Оптимизация — это целенаправленная деятельность, заключающаяся в получении наилучших результатов при соответствующих условиях. Постановка задачи оптимизации предполагает наличие объекта оптимизации, будь то человеческая деятельность в течение определенного периода времени или производственный процесс. Решение любой задачи оптимизации начинают с выявления цели оптимизации, т. е. формулировки требований, предъявляемых к объекту оптимизации. От того, насколько правильно выражены эти требования, может зависеть возможность решения задачи. Каждый человек время от времени оказывается в ситуации, когда достижение некоторого результата может быть осуществлено не единственным способом. В таких случаях приходится отыскивать наилучший способ. Однако в различных ситуациях наилучшими могут быть совершенно разные решения. Все зависит от выбранного или заданного критерия. Пусть, например, ученик живет далеко от школы и может добраться до школы на трамвае за 30 минут или же часть пути проехать на трамвае, а потом пересесть на троллейбус и затратить при этом всего 20 минут. Оценим оба решения. Очевидно, второе решение будет лучшим, если требуется попасть в школу за минимальное время, т. е. оно лучшее по критерию минимизации времени. По другому критерию (например, минимизации стоимости или минимизации числа пересадок) лучшим является первое решение. На практике оказывается, что в большинстве случаев понятие «наилучший» может быть выражено количественными критериями — минимум затрат, минимум отклонений от нормы, максимум скорости, прибыли и т. д. Поэтому возможна постановка математических задач отыскания оптимального {optimum—наилучший) результата, так как так как принципиальных различий в отыскании наименьшего или наибольшего значения нет. Типичным случаем неправильной постановки условий задачи оптимизации является распространенная ошибка, когда предлагается найти оптимальные значения нескольких величин одновременно, например «получить максимальный выход продукции при минимальном расходе сырья». Поскольку минимальный расход сырья, очевидно, равен нулю, ни о каком максимальном выходе продукции здесь нельзя говорить. Правильная постановка оптимальной задачи при этом будет в любом из следующих вариантов: «получить максимальный выход продукции при заданном расходе сырья» или «для заданного выхода продукции обеспечить минимальный расход сырья». В каждой такой формулировке соблюдается требование нахождения оптимального значения только одной величины, что является необходимым условием постановки оптимальной задачи. Для решения задач оптимизации нужно располагать ресурсами оптимизации, под которыми понимают свободу выбора значений некоторых параметров оптимизируемого объекта. Другими словами, объект оптимизации должен обладать определенными степенями свободы — управляющими воздействиями, которые позволяют изменять его состояние в соответствии с теми или иными требованиями. Наконец, еще одно условие правильной постановки оптимальной задачи заключается в наличии количественной оценки интересующего качества объекта оптимизации. Это условие также необходимо, поскольку лишь при его выполнении можносравнивать эффекты от выбора тех или иных управляющих воздействий. Количественная оценка оптимизируемого качества объекта обычно называется критерием оптимальности или целевой функцией, функцией качества, экономическим критерием и т. д. Вид критерия оптимальности определяется конкретным содержанием решаемой задачи оптимизации и может оказывать существенное влияние на выбор метода решения. В конечном итоге достигаемое значение критерия оптимальности дает количественную оценку эффекта оптимизации. Таким образом, для правильной постановки оптимальной задачи необходимо выполнение следующих условий: 1) Требование оптимизации только одной величины; 2) Наличие степеней свободы у оптимизируемого объекта — управляющих воздействий; 3) Возможность количественной оценки оптимизируемой величины.
Задачи на отыскание оптимального решения называются оптимизационными задачами. Оптимальный результат, как правило, находится не сразу, а в результате процесса, называемого процессом оптимизации. Применяемые в процессе оптимизации методы получили название методов оптимизации. В простейших случаях мы сразу переводим условие задачи на математический язык и получаем её, так называемую, математическую формулировку. §1. Этапы решения задачи На практике процесс формализации задачи достаточно сложен. Пусть, например, требуется распределить различные виды обрабатываемых в данном цехе изделий между различными типами оборудования таким образом, чтобы обеспечить выполнение заданного плана выпуска изделий каждого вида с минимальными затратами. Весь процесс решения задачи представляется в виде следующих этапов. 1) Изучение объекта. При этом требуется понять происходящий 2) Описательное моделирование - установление и словесная фиксация основных связей и зависимостей между характеристиками процесса с точки зрения оптимизируемого критерия. 3). Математическое моделирование — перевод описательной модели на формальный математический язык. Все условия записываются в виде соответствующей системы ограничений (уравнения и неравенства). Любое решение этой системы называется допустимым решением. Критерий записывается в виде функции, которую обычно называют, целевой. Решение задачи оптимизации состоит в отыскании на множестве решений системы ограничений максимального или минимального значения целевой функции. 4). Выбор (или создание) метода решения задачи. Так как задача уже записана в математической форме, ее конкретное содержание нас не интересует. Дело в том, что совершенно разные по содержанию задачи часто приводятся к одной и той же формальной записи. Поэтому при выборе метода решения главное внимание обращается не на содержание задачи, а на полученную математическую структуру. Иногда специфика задачи может потребовать какой-либо модификации уже известного метода или даже разработки нового. 5). Выбор или написание программы для решения задачи на ЭВМ. Подавляющая часть задач, возникающих на практике, из-за большого числа переменных и зависимостей между ними могут быть решены в разумные сроки только с помощью ЭВМ. Для решения задачи на ЭВМ прежде всего следует составить (или использовать уже готовую, если аналогичная задача уже решалась на ЭВМ) программу, реализующую выбранный метод решения. 6). Решение задачи на ЭВМ. Вся необходимая информация для решения задачи на ЭВМ вводится в память машины вместе с программой. В соответствии с программой решения ЭВМ производит необходимую обработку введенной числовой информации, получает соответствующие результаты, которые выдает человеку в удобной для него форме. 7). Анализ полученного решения. Анализ решения бывает двух видов: формальный (математический), когда проверяется соответствие полученного решения построенной математической модели (в случае несоответствия проверяются программа, исходные данные, работа ЭВМ и т. д.), и содержательный (экономический, технологический и т. п.), когда проверяется соответствие полученного решения тому объекту, который моделировался. В результате такого анализа в модель могут быть внесены изменения или уточнения, после чего весь разобранный процесс повторяется. Модель считается построенной и завершенной, если она с достаточной точностью характеризует деятельность объекта по выбранному критерию. Только после этого модель может быть использована для расчета. В настоящем курсе, дающем первоначальное представление о методах оптимизации, реальные объекты естественно не рассматриваются, а содержательные формулировки задач есть как бы описательные модели, по которым требуется построить модели математические. Поэтому каждую математическую формулировку задачи будем рассматривать как математическую модель некоторой реальной ситуации. В данном курсе отсутствует материал, касающийся вопросов реализации решения задачи на ЭВМ. Это сделано по следующим соображениям. Во-первых, все предлагаемые в курсе задачи могут быть решены вручную, а, во-вторых, вопросы реализации решения задачи на ЭВМ не связаны с содержанием самой задачи и поэтому не могут быть рассмотрены как составная часть данного курса. Настоящее пособие посвящено в основном математическому моделированию, методам решения задач, формальному и содержательному анализу полученного решения. В пособии рассматривается достаточно большое число задач, частично оригинальных, а частично заимствованных из источников, указанных в списке использованной литературы.
§2. Некоторые сведения из линейной алгебры.
Матрицы
Произвольная система элементов совокупности К, расположенная в виде прямоугольной таблицы, содержащей m строк и n столбцов, называется (m, n) матрицей или просто матрицей над К". Чтобы записать матрицу, выписывают в надлежащем порядке обозначения ее элементов и получившуюся таблицу заключают в скобки или ограничивают двойными чертами. Таким образом, общий вид (m, n) – матрицы будет
где – обозначения элементов из К. Часто вместо такой подробной записи употребляют сокращенную: или Если число строк матрицы равно числу ее столбцов, то матрица называется квадратной, а число ее строк, равное числу столбцов, называется порядком квадратной матрицы. В частности, квадратная матрица порядка 1 – это просто элемент из К. Матрицу, имеющую только одну строку, называют просто строкой. В дальнейшем матрицы будут обозначаться большими буквами латинского алфавита. Две матрицы называются равными, если числа строк и столбцов у них соответственно равны и если равны числа, стоящие на соответственных местах этих матриц. Основными матричными операциями являются умножение числа на матрицу или матрицы на число, сложение и перемножение двух матриц. По определению, чтобы умножить число на матрицу А или матрицу А на число , нужно умножить на все элементы матрицы А. Например,
.
Матрица, все элементы которой равны нулю, называется нулевой матрицей и обозначается . Если желают указать явное число строк и столбцов нулевой матрицы, то пишут . Ясно, что для каждой матрицы А над К и каждых имеют место соотношения:
1. 2. 3.
Суммой двух матриц А и В, имеющих соответственно равные числа строк и столбцов, называется матрица, имеющая те же числа строк и столбцов и элементы, равные суммам соответствующих элементов матриц А, В. Например,
.
Из этого определения непосредственно вытекают соотношения: 4. 5. 6. 7. 8. Доказательства предоставляются читателю. В частности, применяя свойства 1 и 6, получим Вводя обозначение будем иметь также Для краткости вместо обыкновенно пишут .
Умножение матриц. В отличие от операций сложения и умножения на число операция умножения матрицы на матрицу определяется более сложным образом. Пусть заданы две матрица А и В, причем число столбцов первой из них равно числу строк второй.
Если , ,
то матрица
где то есть Аmn * Bnp = Cmp
называется произведением А и В и обозначается АВ. Например,
Правило умножения матриц иногда формулируют следующим образом: чтобы получить элемент, стоящий в i-й строке и j-ом столбце произведения двух матриц, нужно элементы i-й строки первой матрицы умножить на сооветственные элементы j-го столбца второй и полученные произведения сложить. Докажем теперь основные свойства умножения матриц. 9. Пусть , . Пользуясь правилом умножения матриц, мы получим для элемента, находящегося в i- й строке и k -м столбце матрицы , следующее выражение: Аналогично для элемента, находящегося в той же i -й строке и k -м столбце матрицы , получим следующее выражение: Так как оба выражения равны, то первое из равенств 9 доказано. Такими же вычислениями доказываются и остальные два равенства из 9, а также и свойтва: 10. 11. Квадратная матрица, все диагональные элементы которой равны 1, а остальные – нулю, называется единичной и обозначается или , где – её порядок. Таким образом,
Непосредственным вычислением для любой квадратной матрицы А получим равенство , выражающее основное свойство матрицы . Матрицы, имеющие вид
называются диагональными. Из правил действий непосредственно вытекает, что сумма и произведение диагональных матриц будут снова диагональными матрицами:
Транспонирование матриц. Рассмотрим произвольную матрицу
Матрица
получающаяся из А заменой строк столбцами, называется транспонированной по отношению к А. В дальнейшем штрихом всегда будет обозначаться переход к транспонированной матрице. Для произвольных матриц имеют место следующие правила транспонирования:
, где – какие-либо числа. Докажем, например, второе из этих равенств. Элемент, стоящий в i- й строке и j- м столбце матрицы , равен элементу, стоящему в j- й строке и i- м столбце матрицы AB, т.е. равен
где элементы матриц А, В. Но это выражение есть сумма произведений элементов i- й строки матрицы на соответственные элементы j- го столбца матрицы Если А – произвольная квадратная матрица и то называется симметрической; если же то – кососимметрической. Элементы, расположенные симметрично относительно главной диагонали, у симметрической матрицы равны, а у кососимметрической противоположны. В частности, все диагональные элементы кососимметрической матрицы равны нулю. Из правила транспонирования суммы непосредственно вытекает, что сумма симметрических матриц есть матрица симметрическая, а сумма кососимметрических – матрица кососимметрическая. Произведение симметрических матриц может и не быть симметрической матрицей, например:
Однако, если две симметрические матрицы А, В перестановочны, то их произведение будет снова матрицей симметрической. Действительно, в этом случае Квадратная матрица А над кольцом К называется обратимой ( над К), если существует квадратная матрица Х над К, удовлетворяющая соотношениям Каждая матрица Х, удовлетворяющая условиям (1), называется матрицей, обратной к А, или обращением матрицы A. У каждой обратимой матрицы А существует лишь одно обращение. Действительно, если наряду с матрицей Х условиям (1) удовлетворяет матрица Y, то, умножая обе части равенства
слева на Х, получим или Обращение матрицы А, если оно существует, обозначается через Таким образом, по определению В условия (1) матрицы А и Х входят симметрично, и потому, если Х есть обращение А, то А есть обращение Х, иными словами, Если квадратные матрицы одного и того же порядка обратимы, то их произведение также обратимо и т.е. обращение произведения матриц равно произведению обращений сомножителей, расположенных в противоположном порядке. Для доказательства надо проверить лишь равенства являющиеся очевидными следствиями соотношений (2) и аналогичных отношений для матриц Для каждой обратимой матрицы А наряду с натуральными степенями рассматривают и ее целые отрицательные степени, полагая по определению Дробные степени матриц рассматриваются редко, так как во многих случаях обычные определения не дают однозначных значений для таких степеней. Из соотношений (2), (4) следует, что для любой обратимой матрицы А и любых целых (не обязательно положительных) чисел имеют место обычные правила действий со степенями
И если матрицы обратимы и , то Посмотрим теперь, как связаны операции транспонирования и обращения. Применяя правило транспонирования произведения матриц к соотношениям (1), получаем
т.е. в результате транспонирования обратимой матрицы А получается снова обратная матрица и
Квадратная матрица А называется ортогональной, если т.е. если транспонированная матрица обратна к исходной. Отсюда, частности, следует, что каждая ортогональная матрица обратима. Так как , то из (6) вытекает, что обращение ортогональной матрицы есть ортогональная матрица. Далее, если матрицы ортогональны, то и, значит, Иными словами, произведение ортогональных матриц есть ортогональная матрица. Рассмотрим еще одну матричную операцию. Пусть А – произвольная матрица, элементы которой являются комплексными числами. Заменим в А каждый элемент комплексно сопряженным числом. Полученная таким способом новая матрица называется комплексно сопряженной с А и обозначается . Операция перехода к комплексно сопряженной матрице обладает следующими свойствами:
Доказательство их весьма просто и предоставляется читателю. Матрицы и называются эрмитово-сопряженными. Если то называется эрмитовой или эрмитово-симметрической. Матрица , удовлетворяющая соотношению называется унитарной. Таким же способом, как и для ортогональных матриц, доказывается, что матрица, обратная к унитарной матрице, является унитарной и что произведение унитарных матриц является снова унитарной матрицей. Если все элементы матрицы А – числа вещественные, то и, следовательно, для вещественных матриц понятия симметричности и эрмитовой симметричности, унитарности и ортогональности соответственно совпадают. Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.022 сек.) |