Метад максімальнай праўдападобнасці
From Wikipedia, the free encyclopedia
Remove ads
Метад максімальнай праўдападобнасці (ММП) — метад ацэньвання параметраў меркаванага размеркавання імавернасцей на аснове выбаркі назіранняў. Ацэнка дасягаецца максімізацыяй функцыі праўдападобнасці такім чынам, каб згодна з меркаванай статыстычнай мадэллю назіранні былі найбольш праўдабадобнымі. Пункт у прасторы параметраў , які максімізуе функцыю праўдападобнасці, называецца ацэнкай максімальнай праўдападобнасці[1]. Логіка метаду адначасова інтуіцыйная і гнуткая, таму ён стаў дамінуючым сродкам статыстычнага высноўвання[2][3][4].
Калі функцыя праўдападобнасці дыферэнцавальная , можна прымяніць метад вытворнай для знаходжання яе максімумаў. У некаторых выпадках максімум функцыі праўдападобнасці можна знайсці аналітычна; напрыклад, ацэнка звычайным метадам найменшых квадратаў для мадэлі лінейнай рэгрэсіі максімізуе праўдападобнасць, калі мяркуецца, што ўсе назіранні маюць нармальнае размеркаванне з роўнай дысперсіяй[5].
З пункту гледжання баесаўскага высноўвання , ацэнка максімальнай праўдападобнасці, як правіла, эквівалентная ацэнцы апастэрыёрнага максімуму з раўнамерным апрыёрным размеркаваннем (або нармальным апрыёрным размеркаваннем з бесканечным стандартным адхіленнем). У частотным высноўванні метад максімальнай праўдападобнасці — асаблівы выпадак экстрэмальнай ацэнкі з мэтавай функцыяй роўнай праўдападобнасці.
Remove ads
Прынцыпы
Набор назіранняў мадэлюецца як выпадковая выбарка з невядомага супольнага размеркавання, якое задаецца наборам параметраў . Мэта метаду максімальнай праўдападобнасці — знайсці параметры, для якіх назіранні маюць найбольшую супольную імавернасць. Параметры, якія задаюць супольнае размеркаванне, запісваюцца як вектар , таму кажуць, што гэтае размеркаванне адносяцца да параметрычнага сямейства , дзе — прастора параметраў , канечнамернае падмноства Еўклідавай прасторы . Падстаўляючы назіранні у функцыю шчыльнасці супольнага размеркавання, атрымліваем рэчаісназначную функцыю
якая называецца функцыяй праўдападобнасці . Для незалежных і аднолькава размеркаваных выпадковых велічынь , можна запісаць як здабытак аднамерных функцый шчыльнасці імавернасці:
Мэта метаду максімальнай праўдападобнасці — знайсці такія значэнні параметраў мадэлі з прасторы параметраў, для якіх функцыя праўдападобнасці будзе максімальнай[6]:
Інтуітыўна, знойдзенае такім чынам значэнне параметраў робіць назіранні найбольш імавернымі. Значэнне , якое максімізуе функцыю праўдападобнасці , называецца значэннем ацэнкі максімальнай праўдападобнасці. Калі існуе вымерная функцыя , то такая функцыя называецца функцыяй ацэнкі максімальнай праўдападобнасці. Звычайна гэтая функцыя задаецца на прасторы элементарных падзей і яе аргументам выступае пэўная выбарка. Дастатковая, але не неабходная ўмова яе існавання — непарыўнасць функцыі праўдападобнасці на кампактнай прасторы параметраў[7]. Для адкрытага мноства , функцыя праўдападобнасці можа павялічвацца не дасягаючы супрэмуму.
На практыцы часта бывае зручна працаваць з натуральным лагарыфмам функцыі праўдападобнасці, які называецца лагарыфмам праўдападобнасці :
Праз тое што лагарыфм — манатонная функцыя , максімум дасягаецца пры тым самым значэнні , што і максімум [8]. Калі — дыферэнцавальная функцыя на , то неабходныя для максімуму (мінімуму) умовы
называюцца раўнаннямі праўдападобнасці. Для некаторых мадэляў удаецца знайсці іх аналітычныя развязкі , але агульнага аналітычнага развязка задачы максімізацыі не існуе, і ацэнка максімальнай праўдападобнасці можа быць знойдзена толькі з дапамогай лікавай аптымізацыі . Іншая праблема ў тым, што для канечных выбарак можа існаваць некалькі каранёў раўнанняў праўдападобнасці[9]. Гесіян , матрыца частковых вытворных другога парадку, можа выкарыстоўвацца каб зразумець ці з’яўляецца знойдзены максімум лакальным:
Калі гесіян адмоўна паўвызначаны ў , то функцыя лакальна ўвагнутая . Зручна тое, што найбольш вядомыя размеркаванні — у прыватнасці экспанентавае сямейства — лагарыфмічна ўвагнутыя[10][11].
Абмежаваная прастора параметраў
Хаця звычайна абсяг вызначэння функцыі праўдападобнасці (прастора параметраў ) — канечнамернае падмноства Еўклідавай прасторы , часам на яго могуць накладацца дадатковыя абмежаванні . У такім выпадку прастору параметраў можна запісаць як
дзе — вектар-функцыя з у . Тады знайсці ацэнку максімальнай праўдападобнасці параметра з мноства значыць знайсці , для якога дасягаецца максімум функцыі праўдападобнасці пры выкананні ўмоў .
Тэарэтычна, самы натуральны падыход да гэтай задачы ўмоўнай аптымізацыі — метад падстаноўкі. Гэта значыць дапаўненне ўмоў да мноства такім чынам, што — ін’екцыя з у , і рэпараметрызацыя функцыі праўдападобнасці ўвядзеннем [12]. Праз эквіварыянтнасць функцыі ацэнкі максімальнай праўдападобнасці, уласцівасці распаўсюджваюцца і на абмежаваныя ацэнкі[13]. Напрыклад, для многавымернага нармальнага размеркавання матрыца каварыяцыі мусіць быць дадатна вызначанай матрыцай ; гэта абмежаванне можна выканаць падстаноўкай , дзе — рэчаісная верхнетрохвугольная матрыца , а — транспанаваная (гл. раскладанне Халецкага для доказу ін’ектыўнасці)[14].
На практыцы ўмовы звычайна накладаюцца метадам множнікаў Лагранжа , які прыводзіць да раўнанняў абмежаванай праўдападобнасці:
- і
дзе — вектар-слупок множнікаў Лагранжа, а — матрыца Якобі частковых вытворных памеру k × r [12]. Натуральна, калі абмежаванні не ўплываюць на максімум, множнікі Лагранжа маюць быць роўнымі нулю[15]. Гэта, у сваю чаргу, дазваляе правесці статыстычную праверку валіднасці абмежавання, вядомую як тэст множнікаў Лагранжа .
Remove ads
Уласцівасці
Ацэнка максімальнай праўдападобнасці — ацэнка экстрэмуму , якая максімізуе па θ мэтавую функцыю . Калі назіранні незалежныя і аднолькава размеркаваныя , маем
што ёсць выбаркавым аналагам матэматычнага спадзявання лагарыфму праўдападобнасці , узятага па сапраўднай шчыльнасці.
Ацэнка максімальнай праўдападобнасці не мае аптымальных уласцівасцей для канечных выбарак у тым сэнсе, што іншыя ацэнкі на канечных выбарках могуць мець большую канцэнтрацыю вакол сапраўднага значэння параметру[16]. Аднак, як і іншыя метады ацэнкі, ацэнка максімальнай праўдападобнасці мае шэраг прывабных абмежавальных уласцівасцей : калі памер выбаркі павялічваецца да бясконцасці, паслядоўнасць ацэнак максімальнай праўдападобнасці мае наступныя ўласцівасці:
- Слушнасць : паслядоўнасць ацэнак максімальнай праўдападобнасці збягаецца паводле імавернасці да ацэньваемага значэння.
- Функцыянальная інварыянтнасць: Калі — ацэнка максімальнай праўдападобнасці для , а — адвольнае пераўтварэнне над , то ацэнка максімальнай праўдападобнасці для роўная .
- Эфектыўнасць : ацэнка дасягае ніжняй мяжы Крамера-Раа , калі памер выбаркі імкнецца к бесканечнасці. Гэта значыць, што ніводная слушная ацэнка не мае меншай асімптатычнай сярэднеквадратычнай памылкі , чым ацэнка максімальнай праўдападобнасці (або іншыя ацэнкі, якія дасягаюць гэтай мяжы). Гэта таксама значыць, што для ацэнкі максімальнай праўдападобнасці ўласцівая асімптатычная нармальнасць .
- Эфектыўнасць другога парадку пасля карэкцыі ўхілу.
Слушнасць
Пры выкананні прыведзеных ніжэй умоў, ацэнка максімальнай праўдападобнасці слушная . Гэта значыць, што калі даныя былі ўтвораны функцыяй і мы маем дастаткова вялікую колькасць назіранняў , то магчыма знайсці значэнне з адвольнай дакладнасцю. У матэматычных тэрмінах гэта значыць, што калі імкнецца да бесканечнасці, ацэнка збягаецца паводле імавернасці да сапраўднага значэння:
Пры трохі стражэйшых умовах, ацэнка збягаецца амаль напэўна (або моцна):
На практыцы, даныя ніколі не ўтвараюцца . Наадварот, — гэта мадэль, часта ў ідэалізаванай форме, працэсу, які ўтварае даныя. Паводле распаўсюджанага ў статыстыцы афарызму, усе мадэлі хібныя . Такім чынам, сапраўдная слушнасць ніколі не дасягаецца на практыцы. Тым не менш, слушнасць часта ўважаецца пажаданай уласцівасцю для ацэнак.
Для слушнасці дастаткова наступных умоў.[17]
- Ідэнтыфікавальнасць мадэлі: Іншымі словамі, розным параметрам адпавядаюць розныя размеркаванні мадэлі. Калі гэтая ўмова не выконваецца, існуе пэўнае значэнне , такое што і утвараюць роўныя размеркаванні даных. Тады немагчыма адрозніць гэтыя параметры нават з бясконцай колькасцю даных. Такія параметры называюцца назіральна эквівалентнымі .
Ідэнтыфікавальнасць неабходная для слушнасці ацэнкі максімальнай праўдападобнасці. Калі гэтая ўмова выконваецца, абмежаваная функцыя лагарыфму праўдападобнасці мае адзіны глабальны максімум у . - Кампактнасць: прастора параметраў мадэлі кампактная .
Умова ідэнтыфікавальнасці гарантуе, што ў лагарыфма праўдападобнасці існуе адзіны глабальны максімум. Кампактнасць азначае, што праўдападобнасць не можа імкнуцца к максімальнаму значэнню ў нейкім іншым месцы (напрыклад як паказана на рысунку справа).
Кампактнасць — толькі дастатковая, але не неабходная ўмова. Яна можа быць заменена некаторымі іншымі ўмовамі, такімі як:- адначасовая ўвагнутасць функцыі лагарыфму праўдападобнасці і кампактнасць некаторага з яе непустых мностваў узроўню , або
- існаванне кампактнага наваколля для , такога што па-за наваколлем функцыя лагарыфму праўдападобнасці меншая за максімум прынамсі на некаторы .
- Непарыўнасць: функцыя непарыўная ў для амаль усіх значэнняў : Непарыўнасць можа быць замененая слабейшай умовай верхняй паўнепарыўнасці .
- Дамінантнасць: існуе інтэгравальная па размеркаванні функцыя , такая што Паводле раўнамернага закона вялікіх лікаў, умова дамінантнасці разам з непарыўнасцю гарантуе раўнамерную збежнасць паводле імавернасці лагарыфма праўдападобнасці: Умова дамінантнасці можа быць выкарыстана ў выпадку незалежных аднолькава размеркаваных велічынь . Інакш, раўнамерная збежнасць паводле імавернасці можа быць забяспечана тым, што стахастычна роўнаступенна непарыўная .
Калі неабходна прадэманстраваць, што ацэнка максімальнай праўдападобнасці збягаецца да амаль напэўна , то мае выконвацца стражэйшая ўмова непарыўнай збежнасці амаль напэўна:
Акрамя таго, у дапушчэнні што даныя былі ўтвораны функцыяй , пры пэўных умовах можна паказаць, што ацэнка максімальнай праўдападобнасці збягаецца паводле размеркавання к нармальнаму размеркаванню[18]
- ,
дзе — матрыца інфармацыі Фішэра .
Функцыянальная інварыянтнасць
Калі — ацэнка максімальнай праўдападобнасці для , а — трансфармацыя над , то ацэнка максімальнай праўдападобнасці для роўная[19]
Яна максімізуе так званую профільную праўдападобнасць :
Акрамя таго, ацэнка максімальнай праўдападобнасці інварыянтная ў дачыненні некаторых трансфармацый даных. Калі , дзе — біекцыя, якая не залежыць ад ацэньваемых параметраў, то функцыя шчыльнасці адпавядае
і функцыі праўдападобнасці для і адрозніваюцца толькі множнікам, які не залежыць ад параметраў мадэлі.
Напрыклад, ацэнка максімальнай праўдападобнасці параметраў лог-нармальнага размеркавання такая самая як і ў нармальнага размеркавання, атрыманая на лагарыфмаваных даных.
Remove ads
Крыніцы
Літаратура
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads