Метад максімальнай праўдападобнасці

From Wikipedia, the free encyclopedia

Remove ads

Метад максімальнай праўдападобнасці (ММП) — метад ацэньвання[en] параметраў[en] меркаванага размеркавання імавернасцей на аснове выбаркі назіранняў. Ацэнка дасягаецца максімізацыяй[en] функцыі праўдападобнасці[en] такім чынам, каб згодна з меркаванай статыстычнай мадэллю[en] назіранні[en] былі найбольш праўдабадобнымі. Пункт[en] у прасторы параметраў[en], які максімізуе функцыю праўдападобнасці, называецца ацэнкай максімальнай праўдападобнасці[1]. Логіка метаду адначасова інтуіцыйная і гнуткая, таму ён стаў дамінуючым сродкам статыстычнага высноўвання[en][2][3][4].

Калі функцыя праўдападобнасці дыферэнцавальная[en], можна прымяніць метад вытворнай[en] для знаходжання яе максімумаў. У некаторых выпадках максімум функцыі праўдападобнасці можна знайсці аналітычна; напрыклад, ацэнка звычайным метадам найменшых квадратаў[en] для мадэлі лінейнай рэгрэсіі максімізуе праўдападобнасць, калі мяркуецца, што ўсе назіранні маюць нармальнае размеркаванне з роўнай дысперсіяй[5].

З пункту гледжання баесаўскага высноўвання[en], ацэнка максімальнай праўдападобнасці, як правіла, эквівалентная ацэнцы апастэрыёрнага максімуму[en] з раўнамерным апрыёрным размеркаваннем (або нармальным апрыёрным размеркаваннем з бесканечным стандартным адхіленнем). У частотным высноўванні[en] метад максімальнай праўдападобнасці — асаблівы выпадак экстрэмальнай ацэнкі[en] з мэтавай функцыяй роўнай праўдападобнасці.

Remove ads

Прынцыпы

Набор назіранняў мадэлюецца як выпадковая выбарка[en] з невядомага супольнага размеркавання, якое задаецца наборам параметраў[en]. Мэта метаду максімальнай праўдападобнасці — знайсці параметры, для якіх назіранні маюць найбольшую супольную імавернасць. Параметры, якія задаюць супольнае размеркаванне, запісваюцца як вектар , таму кажуць, што гэтае размеркаванне адносяцца да параметрычнага сямейства[en] , дзе  — прастора параметраў[en], канечнамернае падмноства Еўклідавай прасторы[en]. Падстаўляючы назіранні у функцыю шчыльнасці супольнага размеркавання, атрымліваем рэчаісназначную функцыю

якая называецца функцыяй праўдападобнасці[en]. Для незалежных і аднолькава размеркаваных выпадковых велічынь[en], можна запісаць як здабытак аднамерных функцый шчыльнасці імавернасці:

Мэта метаду максімальнай праўдападобнасці — знайсці такія значэнні параметраў мадэлі з прасторы параметраў, для якіх функцыя праўдападобнасці будзе максімальнай[6]:

Інтуітыўна, знойдзенае такім чынам значэнне параметраў робіць назіранні найбольш імавернымі. Значэнне , якое максімізуе функцыю праўдападобнасці , называецца значэннем ацэнкі максімальнай праўдападобнасці. Калі існуе вымерная функцыя[en] , то такая функцыя называецца функцыяй ацэнкі[en] максімальнай праўдападобнасці. Звычайна гэтая функцыя задаецца на прасторы элементарных падзей і яе аргументам выступае пэўная выбарка. Дастатковая, але не неабходная[en] ўмова яе існавання — непарыўнасць функцыі праўдападобнасці на кампактнай прасторы[en] параметраў[7]. Для адкрытага мноства[en] , функцыя праўдападобнасці можа павялічвацца не дасягаючы супрэмуму.

На практыцы часта бывае зручна працаваць з натуральным лагарыфмам функцыі праўдападобнасці, які называецца лагарыфмам праўдападобнасці[en]:

Праз тое што лагарыфм — манатонная функцыя[en], максімум дасягаецца пры тым самым значэнні , што і максімум [8]. Калі  — дыферэнцавальная функцыя[en] на , то неабходныя[en] для максімуму (мінімуму) умовы

называюцца раўнаннямі праўдападобнасці. Для некаторых мадэляў удаецца знайсці іх аналітычныя развязкі , але агульнага аналітычнага развязка задачы максімізацыі не існуе, і ацэнка максімальнай праўдападобнасці можа быць знойдзена толькі з дапамогай лікавай аптымізацыі[en]. Іншая праблема ў тым, што для канечных выбарак можа існаваць некалькі каранёў раўнанняў праўдападобнасці[9]. Гесіян[en], матрыца частковых вытворных другога парадку, можа выкарыстоўвацца каб зразумець ці з’яўляецца знойдзены максімум лакальным:

Калі гесіян адмоўна паўвызначаны[en] ў , то функцыя лакальна ўвагнутая[en]. Зручна тое, што найбольш вядомыя размеркаванні — у прыватнасці экспанентавае сямейства[en] — лагарыфмічна ўвагнутыя[en][10][11].

Абмежаваная прастора параметраў

Хаця звычайна абсяг вызначэння функцыі праўдападобнасці (прастора параметраў[en]) — канечнамернае падмноства Еўклідавай прасторы[en], часам на яго могуць накладацца дадатковыя абмежаванні[en]. У такім выпадку прастору параметраў можна запісаць як

дзе  — вектар-функцыя[en] з у . Тады знайсці ацэнку максімальнай праўдападобнасці параметра з мноства значыць знайсці , для якога дасягаецца максімум функцыі праўдападобнасці пры выкананні ўмоў .

Тэарэтычна, самы натуральны падыход да гэтай задачы ўмоўнай аптымізацыі[en] — метад падстаноўкі. Гэта значыць дапаўненне ўмоў да мноства такім чынам, што  — ін’екцыя з у , і рэпараметрызацыя функцыі праўдападобнасці ўвядзеннем [12]. Праз эквіварыянтнасць функцыі ацэнкі максімальнай праўдападобнасці, уласцівасці распаўсюджваюцца і на абмежаваныя ацэнкі[13]. Напрыклад, для многавымернага нармальнага размеркавання матрыца каварыяцыі[en] мусіць быць дадатна вызначанай матрыцай[en]; гэта абмежаванне можна выканаць падстаноўкай , дзе  — рэчаісная верхнетрохвугольная матрыца[en], а  — транспанаваная (гл. раскладанне Халецкага[en] для доказу ін’ектыўнасці)[14].

На практыцы ўмовы звычайна накладаюцца метадам множнікаў Лагранжа[en], які прыводзіць да раўнанняў абмежаванай праўдападобнасці:

і

дзе  — вектар-слупок множнікаў Лагранжа, а  — матрыца Якобі частковых вытворных памеру k × r [12]. Натуральна, калі абмежаванні не ўплываюць на максімум, множнікі Лагранжа маюць быць роўнымі нулю[15]. Гэта, у сваю чаргу, дазваляе правесці статыстычную праверку валіднасці абмежавання, вядомую як тэст множнікаў Лагранжа[en].

Remove ads

Уласцівасці

Ацэнка максімальнай праўдападобнасці — ацэнка экстрэмуму[en], якая максімізуе па θ мэтавую функцыю[en] . Калі назіранні незалежныя і аднолькава размеркаваныя[en], маем

што ёсць выбаркавым аналагам матэматычнага спадзявання лагарыфму праўдападобнасці , узятага па сапраўднай шчыльнасці.

Ацэнка максімальнай праўдападобнасці не мае аптымальных уласцівасцей для канечных выбарак у тым сэнсе, што іншыя ацэнкі на канечных выбарках могуць мець большую канцэнтрацыю вакол сапраўднага значэння параметру[16]. Аднак, як і іншыя метады ацэнкі, ацэнка максімальнай праўдападобнасці мае шэраг прывабных абмежавальных уласцівасцей[en]: калі памер выбаркі павялічваецца да бясконцасці, паслядоўнасць ацэнак максімальнай праўдападобнасці мае наступныя ўласцівасці:

  • Слушнасць[en]: паслядоўнасць ацэнак максімальнай праўдападобнасці збягаецца паводле імавернасці да ацэньваемага значэння.
  • Функцыянальная інварыянтнасць: Калі  — ацэнка максімальнай праўдападобнасці для , а  — адвольнае пераўтварэнне над , то ацэнка максімальнай праўдападобнасці для роўная .
  • Эфектыўнасць[en]: ацэнка дасягае ніжняй мяжы Крамера-Раа[en], калі памер выбаркі імкнецца к бесканечнасці. Гэта значыць, што ніводная слушная ацэнка не мае меншай асімптатычнай сярэднеквадратычнай памылкі[en], чым ацэнка максімальнай праўдападобнасці (або іншыя ацэнкі, якія дасягаюць гэтай мяжы). Гэта таксама значыць, што для ацэнкі максімальнай праўдападобнасці ўласцівая асімптатычная нармальнасць[en].
  • Эфектыўнасць другога парадку пасля карэкцыі ўхілу.

Слушнасць

Пры выкананні прыведзеных ніжэй умоў, ацэнка максімальнай праўдападобнасці слушная[en]. Гэта значыць, што калі даныя былі ўтвораны функцыяй і мы маем дастаткова вялікую колькасць назіранняў , то магчыма знайсці значэнне з адвольнай дакладнасцю. У матэматычных тэрмінах гэта значыць, што калі імкнецца да бесканечнасці, ацэнка збягаецца паводле імавернасці[en] да сапраўднага значэння:

Пры трохі стражэйшых умовах, ацэнка збягаецца амаль напэўна[en] (або моцна):

На практыцы, даныя ніколі не ўтвараюцца . Наадварот,  — гэта мадэль, часта ў ідэалізаванай форме, працэсу, які ўтварае даныя. Паводле распаўсюджанага ў статыстыцы афарызму, усе мадэлі хібныя[en]. Такім чынам, сапраўдная слушнасць ніколі не дасягаецца на практыцы. Тым не менш, слушнасць часта ўважаецца пажаданай уласцівасцю для ацэнак.

Для слушнасці дастаткова наступных умоў.[17]

  1. Ідэнтыфікавальнасць[en] мадэлі: Іншымі словамі, розным параметрам адпавядаюць розныя размеркаванні мадэлі. Калі гэтая ўмова не выконваецца, існуе пэўнае значэнне , такое што і утвараюць роўныя размеркаванні даных. Тады немагчыма адрозніць гэтыя параметры нават з бясконцай колькасцю даных. Такія параметры называюцца назіральна эквівалентнымі[en].
    Ідэнтыфікавальнасць неабходная для слушнасці ацэнкі максімальнай праўдападобнасці. Калі гэтая ўмова выконваецца, абмежаваная функцыя лагарыфму праўдападобнасці мае адзіны глабальны максімум у .
  2. Кампактнасць: прастора параметраў мадэлі кампактная[en].
    Thumb

    Умова ідэнтыфікавальнасці гарантуе, што ў лагарыфма праўдападобнасці існуе адзіны глабальны максімум. Кампактнасць азначае, што праўдападобнасць не можа імкнуцца к максімальнаму значэнню ў нейкім іншым месцы (напрыклад як паказана на рысунку справа).
    Кампактнасць — толькі дастатковая, але не неабходная ўмова. Яна можа быць заменена некаторымі іншымі ўмовамі, такімі як:
    • адначасовая ўвагнутасць[en] функцыі лагарыфму праўдападобнасці і кампактнасць некаторага з яе непустых мностваў узроўню[en], або
    • існаванне кампактнага наваколля[en] для , такога што па-за наваколлем функцыя лагарыфму праўдападобнасці меншая за максімум прынамсі на некаторы .
  3. Непарыўнасць: функцыя непарыўная ў для амаль усіх значэнняў : Непарыўнасць можа быць замененая слабейшай умовай верхняй паўнепарыўнасці[en].
  4. Дамінантнасць: існуе інтэгравальная па размеркаванні функцыя , такая што Паводле раўнамернага закона вялікіх лікаў, умова дамінантнасці разам з непарыўнасцю гарантуе раўнамерную збежнасць паводле імавернасці лагарыфма праўдападобнасці: Умова дамінантнасці можа быць выкарыстана ў выпадку незалежных аднолькава размеркаваных велічынь[en]. Інакш, раўнамерная збежнасць паводле імавернасці можа быць забяспечана тым, што стахастычна роўнаступенна непарыўная[en].

Калі неабходна прадэманстраваць, што ацэнка максімальнай праўдападобнасці збягаецца да амаль напэўна[en], то мае выконвацца стражэйшая ўмова непарыўнай збежнасці амаль напэўна:

Акрамя таго, у дапушчэнні што даныя былі ўтвораны функцыяй , пры пэўных умовах можна паказаць, што ацэнка максімальнай праўдападобнасці збягаецца паводле размеркавання[en] к нармальнаму размеркаванню[18]

,

дзе  — матрыца інфармацыі Фішэра[en].

Функцыянальная інварыянтнасць

Калі  — ацэнка максімальнай праўдападобнасці для , а  — трансфармацыя над , то ацэнка максімальнай праўдападобнасці для роўная[19]

Яна максімізуе так званую профільную праўдападобнасць[en]:

Акрамя таго, ацэнка максімальнай праўдападобнасці інварыянтная ў дачыненні некаторых трансфармацый даных. Калі , дзе  — біекцыя, якая не залежыць ад ацэньваемых параметраў, то функцыя шчыльнасці адпавядае

і функцыі праўдападобнасці для і адрозніваюцца толькі множнікам, які не залежыць ад параметраў мадэлі.

Напрыклад, ацэнка максімальнай праўдападобнасці параметраў лог-нармальнага размеркавання такая самая як і ў нармальнага размеркавання, атрыманая на лагарыфмаваных даных.

Remove ads

Крыніцы

Літаратура

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads