Топ питань
Часова шкала
Чат
Перспективи

Нерівність Єнсена

З Вікіпедії, вільної енциклопедії

Нерівність Єнсена
Remove ads

Нерівність Єнсена — зв'язує визначений інтеграл опуклої функції та значення цієї функції від інтеграла. Вона була доведена данським математиком Йоганом Єнсеном у 1906 році.[1]

Thumb
Нерівність Єнсена узагальнює твердження, що січна лінія опуклої функції лежить над її графіком.
Візуалізація опуклості і нерівності Єнсена.

Враховуючи свою загальність, нерівність проявляється у багатьох формах залежно від контексту, деякі з яких представлені нижче. У найпростішому випадку нерівність стверджує, що значення опуклого перетворення є меншим або дорівнює значенню отриманого після опуклого перетворення; це простий наслідок того, що обернене твердження вірне щодо перетворень увігнутих функцій.

Нерівність Єнсена узагальнює твердження, що січна опуклої функції лежить над графіком функції (нерівність Єнсена для двох точок): січна лінія утворюється ваговими середніми значеннями опуклої функції (для ),

у той час як графік функції є опуклою функцією зважених середніх значень

Отже, нерівність Єнсена має вигляд

У контексті теорії ймовірності нерівність як правило подається у наступному вигляді: якщо випадкова величина, а — опукла функція, то

Різниця між двома частинами нерівності,

називається проміжком Єнсена [2].

Remove ads

Формулювання

Класична форма нерівності Єнсена включає декілька чисел і вагових коефіцієнтів. Нерівність можна сформулювати у досить загальному вигляді, використовуючи або мову теорії міри, або (що еквівалентно) теорії ймовірності. У термінах теорії ймовірності нерівність можна узагальнити далі.

Дискретний випадок

Узагальнити
Перспектива

Для дійсної опуклої функції φ, та чисел з її області визначення та додатних чисел ai, справджується:

нерівність міняє знак, коли φ угнута функція:

Рівність виконується тоді і тільки тоді, коли або є лінійною на її області визначення, що містить . Частковим випадком є

Позначивши отримаємо еквівалентне формулювання:

де

За допомогою нерівності Єнсена в даному вигляді можна довести:

Remove ads

Інтегральне та ймовірнісне формулювання

Узагальнити
Перспектива

Нехай ймовірнісний простір, тобто . Якщо — дійснозначна функція, яка є інтегровною, опукла функція на дійсній прямій, тоді [3]

У аналізі функцій однієї змінної може знадобитися оцінка для

де та — невід'ємна функція, яка інтегровна за Лебегом. У цьому випадку міра Лебега відрізка не обов'язково має дорівнювати одиниці. Однак, за допомогою інтегрування з використанням заміни змінних, інтервал може бути відмасштабований так, що міра дорівнюватиме одиниці. Тоді можна застосувати нерівність Єнсена і отримаємо[4]

Аналогічний результат можна сформулювати у термінах теорії ймовірності за допомогою простої зміни позначень. Нехай ймовірністний простір, інтегровна дійснозначна випадкова величина, а опукла функція. Тоді[5]

У цьому ймовірнісному формулюванні міра визначається як ймовірність , інтеграл відносно як математичне сподівання , а функція як випадкова величина .

Зауважимо, що рівність буде мати місце тоді і лише тоді, коли є лінійною функцією на деякій множині такій, що (це випливає з наведеного нижче інтегрального доведення).

Remove ads

Загальна нерівність в ймовірнісному формулюванні

Більш загально, нехай — дійсний топологічний векторний простір, -значна інтегровна випадкова величина. У цих загальних умовах інтегровний означає, що в просторі існує елемент , такий, що для будь-якого елемента із спряженого простору до простору : та . Тоді для будь-якої вимірної опуклої функції та під--алгебри у -алгебрі :

Тут є умовним математичним сподіванням відносно -алгебри . Це загальне твердження зводиться до попередніх, якщо топологічний векторний простір є дійсною віссю, а є тривіальною -алгеброю (де порожня множина}, а простір елементарних подій)[6].

Remove ads

Уточнена та узагальнена форма

Узагальнити
Перспектива

Нехай — одновимірна випадкова величина із математичним сподіванням та дисперсією . Нехай — двічі диференційована функція, визначимо функцію

Тоді[7]

Зокрема, якщо — опукла функція, то і стандартний вигляд нерівності Єнсена безпосередньо випливає, якщо додатково вважати функцію двічі диференційованою.

Remove ads

Доведення

Узагальнити
Перспектива
Thumb
Графічне доведення нерівності Єнсена для ймовірнісного випадку. Пунктирна крива вздовж осі є гіпотетичним розподілом , тоді як пунктирна крива вздовж осі є відповідним розподілом значень . Зауважимо, що опукле відображення дедалі більше ``розтягує розподіл для збільшення значень .
Thumb
Доведення нерівності Єнсена для змінних без слів. Без втрати загальності вважаємо, що сума додатних вагових коефіцієнтів дорівнює 1. Звідси випливає, що вагома точка знаходиться в опуклій оболонці вихідних точок, яка лежить над самою функцією за означенням опуклості. Звідси випливає відповідне твердження.[8]

Нерівність Єнсена можна довести декількома способами, і нижче буде запропоновано три різні доведення, що відповідають вищезазначеним твердженням. Однак перед тим як приступати до цих математичних доведень варто проаналізувати інтуїтивно зрозумілий графічний аргумент на основі ймовірнісного випадку, де є дійсним числом (див. рисунок). Припускаючи гіпотетичний розподіл значень , можна одразу визначити положення математичного сподівання та його образу на графіку. Враховуючи, що для опуклих відображень відповідний розподіл значень є зростаючим і розтягується при зростаючих значеннях , легко зрозуміти, що розподіл є ширшим в інтервалі, що відповідає і вужчим при для будь-якого . Зокрема, це також справедливо для .

Отже, на цьому рисунку математичне сподівання для завжди зміщуватиметься вгору по відношенню до положення . А налогічне міркування справедливе, якщо розподіл охоплює спадну частину опуклої функції, або одночасно спадну і зростаючу його частини. Це доводить нерівність, тобто

яка перетворюється у рівність, якщо не є строго опуклою функцією, наприклад, якщо вона є прямою, або, якщо має вироджений розподіл (тобто є константою).

Наведені нижче доведення формалізують це інтуїтивне поняття.

Доведення 1 (дискретна форма)

Якщо і — два довільні невід'ємні дійсні числа такі, що , то з опуклості випливає

Цю нерівність можна легко узагальнити: якщо — невід'ємні дійсні числа такі, що , тоді

для будь-яких . Цю скінченну форму нерівності Єнсена можна довести за допомогою методу математичної індукції: за припущення опуклості твердження справедливе для . Припустимо, що воно справедливе і для деякого , потрібно довести нерівність для . Щонайменше одне з є додатним і строго меншим 1, нехай ; тоді з означення опуклості:

Оскільки

то можна застосувати індукційні гіпотези до останнього члена в попередній формулі для того, щоб отримати результат, а саме кінцеву форму нерівності Єнсена.

Для того, щоб отримати загальну нерівність з цієї кінцевої форми, необхідно використовувати аргумент щільності. Скінченну форму можна переписати як

де — міра, що задається довільною опуклою комбінацією дельта-функцій Дірака:

Оскільки опуклі функції є неперервними, й опуклі комбінації дельта-функцій Дірака є слабко щільними в множині ймовірнісних мір (що можна легко перевірити), то загальне твердження отримується легко за допомогою граничного переходу.

Доведення 2 (інтегральне формулювання)

Нехай — дійснозначна -інтегровна функція у ймовірностному просторі , а — опукла дійснозначна функція. Оскільки опукла, то для кожного дійсного значення маємо непусту множину субдиференціалів, які можна розглядати як лінії, що дотикаються до графіка функції в точці , але які знаходяться над графіком функції або нижче нього у всіх точках (опорні лінії графіка).

Тепер, якщо визначимо

то внаслідок існування субдиференціалів для опуклих функцій можемо вибрати та такі, що

для всіх дійсних і Але тоді маємо, що для всіх . Оскільки маємо ймовірнісну міру, то інтеграл є монотонним з , так що

що й треба було довести.

Remove ads

Зауваження

Якщо функція угнута (опукла догори), то знак в нерівності змінюється на протилежний.

Примітки

Джерела

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads