錦州市廣廈電腦維修|上門維修電腦|上門做系統(tǒng)|0416-3905144熱誠服務,錦州廣廈維修電腦,公司IT外包服務
topFlag1 設為首頁
topFlag3 收藏本站
 
maojin003 首 頁 公司介紹 服務項目 服務報價 維修流程 IT外包服務 服務器維護 技術文章 常見故障
錦州市廣廈電腦維修|上門維修電腦|上門做系統(tǒng)|0416-3905144熱誠服務技術文章
隱馬爾可夫模型及其算法

作者: 佚名  日期:2023-07-26 13:53:58   來源: 本站整理

一、說明

        根據(jù)L.R Rabiner等人[1]的說法,隱馬爾可夫模型是一個雙重嵌入的隨機過程,其潛在的隨機過程是不可觀察的(它是隱藏的),但只能通過另一組產生觀察序列的隨機過程來觀察。

        基本上,隱馬爾可夫模型 (HMM) 是觀察一系列排放,但不知道模型生成排放所經歷的狀態(tài)序列的模型。我們分析隱馬爾可夫模型,以從觀察到的數(shù)據(jù)中恢復狀態(tài)序列。聽起來很混亂吧...

 

二、馬爾可夫過程

2.1 馬爾可夫模型和馬爾可夫鏈

        要理解HMM,我們首先需要了解什么是馬爾可夫模型。馬爾可夫模型是一種隨機模型,用于對偽隨機變化狀態(tài)進行建模。這意味著當前狀態(tài)不依賴于以前的狀態(tài)。最簡單的馬爾可夫模型是馬爾可夫鏈。在這種情況下,當前狀態(tài)僅取決于上一個狀態(tài)。

馬爾可夫鏈

2.2 什么是HMM和馬爾可夫鏈......

        Rob 參加了一個游戲,在該游戲中,飛鏢擊中靶心后會頒發(fā)獎品。獎品保存在屏幕后面的 3 個不同的盒子(紅色、綠色和藍色)中,F(xiàn)在,分發(fā)獎品的人會根據(jù)他早上是否被堵在交通中來發(fā)放獎品。這些稱為狀態(tài)。現(xiàn)在,由于 rob 知道該地區(qū)交通的總體趨勢,他可以將其建模為馬爾可夫鏈。但是他沒有任何關于交通的確切信息,因為他無法直接觀察它們。他們對他是隱藏的。他也知道獎品將從綠色、紅色或藍色的盒子中挑選出來。這些稱為觀察。由于他無法觀察到狀態(tài)和觀測結果之間的相關性,因此該系統(tǒng)是HMM的系統(tǒng)。

隱馬爾可夫模型

2.2.1 轉移概率

        轉移概率是從一種狀態(tài)移動到另一種狀態(tài)的概率。在這種情況下,如果今天我們有流量,明天有 55% 的可能性會有流量,明天有 45% 的可能性沒有流量。同樣,如果我們今天沒有流量,明天有 35% 的可能性沒有流量,明天有 65% 的可能性會有流量。

2.2.2 排放概率

        它們是觀察者可以觀察到的輸出概率。在這里,連接狀態(tài)和觀測值的概率是發(fā)射概率。

        HMM 在 python 中的表示

三、HMM的基本結構 

        正如我們之前所討論的,隱馬爾可夫模型具有以下參數(shù):

  • 隱藏狀態(tài)集(M)
  • 交易概率矩陣 (A)
  • 一系列觀測值(t)
  • 發(fā)射概率矩陣(也稱為觀測似然)(B)
  • 參數(shù)的初始概率分布

3.1 HMM 的核心問題

  •         評估

        第一個問題是找到觀察到的序列的概率。

  •         譯碼

        第二個問題是找到最可能的隱藏狀態(tài)序列——維特比算法、正向-后向算法

  •         學習

        第三個問題是找到最大化觀測數(shù)據(jù)可能性的參數(shù)——鮑姆-韋爾奇算法

3.2 關于HMM的假設

        馬爾可夫假設

        由于HMM是馬爾可夫模型的增強形式,因此以下假設成立:未來狀態(tài)將僅依賴于當前狀態(tài)。

它表示如下:

3.2.1 馬爾可夫假設

        輸出獨立性

        輸出觀測值 (oi) 的概率僅取決于產生觀測值的狀態(tài),而不取決于任何其他狀態(tài)或任何其他觀測值。它表示如下:

3.2.2 輸出獨立性

        前向算法

        讓我們有一個簡單的HMM,我們有兩個隱藏的狀態(tài),它們代表一個城鎮(zhèn)的天氣,我們也知道一個孩子,他可以根據(jù)天氣攜帶兩樣東西中的任何一個,一頂帽子和一把雨傘。孩子的物品與天氣之間的關系由橙色和藍色箭頭顯示。黑色箭頭表示狀態(tài)的過渡。

圖片來源:作者

假設我們知道以下項目序列

一個序列

我們使用前向算法來查找觀察到序列的概率,給定HMM的參數(shù)是已知的,即轉移矩陣,發(fā)射矩陣和平穩(wěn)分布(π)。

具有潛在隱藏狀態(tài)的序列

        我們找到了所有可能的隱藏狀態(tài),這些狀態(tài)可能導致我們進入這個序列。我們找到每個序列的累積概率。我們發(fā)現(xiàn)總共有 8 個這樣的序列。現(xiàn)在計算每個序列的概率將是一項繁瑣的任務。直接計算聯(lián)合概率需要對所有可能的狀態(tài)序列進行邊緣化,其數(shù)量隨著序列長度的增加呈指數(shù)增長。相反,前向算法利用隱馬爾可夫模型的條件獨立規(guī)則以遞歸方式執(zhí)行計算。

序列的概率

序列的概率是隱藏狀態(tài)的所有可能序列的總和,可以表示為上述。

遞歸地表示如下,其中 t 是序列的長度,s 表示隱藏狀態(tài)。

概率的遞歸表達式

例如,如果 t=1,

現(xiàn)在,為了得到最終答案,我們找到每個隱藏狀態(tài)的α t并將其相加。它表示如下:

前向算法的最終表達式

在前向算法中,我們使用當前時間步的計算概率來推導出下一個時間步的概率。因此,它在計算上更有效。

前向算法主要用于需要我們在知道觀察序列時確定處于特定狀態(tài)的概率的應用程序。我們首先計算為上一個觀測值計算的狀態(tài)的概率,并將其用于當前觀測值,然后使用轉移概率表將其擴展到下一步。該方法緩存所有中間狀態(tài)概率,因此僅計算一次。這有助于我們計算固定狀態(tài)路徑。該過程也稱為后驗解碼。

3.3 逆向算法

        后向算法是正向算法的時間反轉版本。在逆向算法中,我們需要找到機器在時間步 t 處處于隱藏狀態(tài)并生成序列剩余部分的概率。在數(shù)學上,它表示為:

3.4 正向-后向算法

        正向-后向算法是一種推理算法,用于計算所有隱藏狀態(tài)變量(分布)。此推理任務通常稱為平滑。該算法利用動態(tài)規(guī)劃原理,高效計算兩次獲得后驗邊際分布所需的值。第一遍在時間上前進,而第二遍在時間上倒退;因此得名正向-后向算法。它是上面解釋的正向和后向算法的組合。該算法計算給定 HMM 的觀察序列的概率。該概率可用于對識別應用中的觀察序列進行分類。

四、維特比算法

        對于包含隱藏變量的 HMM,確定哪個變量序列是某些觀察序列最有可能的基礎源的任務稱為解碼任務。解碼器的任務是在有經過訓練的模型和一些觀察到的數(shù)據(jù)時找到最佳隱藏序列。更正式地說,給定作為輸入 a 作為 A 和 B 和一個觀察序列 O = o₁, o₂, ..., ot,找到最可能的狀態(tài)序列 S = s₁, s₂, . . . .圣。

        我們當然可以使用前向算法來找到所有可能的序列,并在最大可能性上選擇最好的序列,但這無法做到,因為存在指數(shù)級數(shù)量的狀態(tài)序列。

        與前向算法一樣,它估計 vt(j) 在看到第一個 t 觀測值并通過最可能的狀態(tài)序列 s₁、s₂、. .圣。每個單元格 vt( j) 的值是遞歸計算的,采用可能將我們引向該單元格的最可能路徑。形式上,每個單元格表示以下概率

        我們可以通過一個例子更好地理解這一點,

五、HMM 模型

        假設我們有一個 HMM 模型,如圖所示。我們總是從太陽(x),云(y)開始,以雪(z)結束。現(xiàn)在,您已經觀察了前向算法問題中的序列。生成此路徑的最可能的序列是什么?

        選項包括:

手動計算

在這種情況下,粗體路徑是維特比路徑。當您從上一個狀態(tài)返回時,您可以看到這一點:0.3*0.4*0.136 > 0.7*0.4*0.024

同樣,0.4*0.5*0.4 > 0.7*0.4*0.2

因此,最可能的序列是 xxyz。

請注意,可以有多個可能的最佳序列。

由于每個狀態(tài)僅取決于之前的狀態(tài),因此您可以逐步獲得最可能的路徑。在每一步中,您都會計算最終進入狀態(tài) x、狀態(tài) y、狀態(tài) z 的可能性。在那之后,你是如何到達那里的并不重要。

六、鮑姆-韋爾奇算法

        該算法為“在什么參數(shù)化下觀察到的序列最有可能?

        鮑姆-韋爾奇算法是期望最大化(EM)算法的一個特例。它利用前向-后向算法來計算特定步驟的統(tǒng)計信息。其目的是調整HMM的參數(shù),即狀態(tài)轉移矩陣,發(fā)射矩陣和初始狀態(tài)分布。

  • 從過渡和發(fā)射矩陣的隨機初始估計開始。
  • 計算每個躍遷/發(fā)射的使用頻率的預期。我們將估計潛在變量 [ ξ, γ ]
  • 根據(jù)這些估計值重新計算躍遷和發(fā)射矩陣的概率。
  • 重復直到收斂

潛在變量γ的表達式

γ是給定觀察到的序列 Y 和參數(shù) theta 時處于狀態(tài) i 的概率

潛在變量 ξ 的表達式

ξ 是給定觀察到的序列 Y 和參數(shù) theta 時處于狀態(tài) i,j 的概率

參數(shù) (A, B) 更新如下

更新 A 或轉換矩陣

更新 B 或發(fā)射矩陣

 

七、HMM的優(yōu)勢

  • NLP中使用的HMM標記器訓練起來非常簡單(只需要從訓練語料庫中編譯計數(shù))。
  • 性能相對較好(命名實體的性能超過 90%)。
  • 它消除了標簽偏差問題
  • 由于每個 HMM 僅使用正數(shù)據(jù),因此它們可以很好地擴展;因為可以在不影響學習的 HMM 的情況下添加新單詞。
  • 我們可以初始化模型,使其接近被認為是正確的。

八、HMM的缺點

  • 為了定義觀察和標簽序列的聯(lián)合概率,HMM需要枚舉所有可能的觀察序列。
  • 表示多個重疊要素和長期依賴關系是不切實際的。
  • 要評估的參數(shù)數(shù)量巨大。因此,它需要一個大型數(shù)據(jù)集進行訓練。
  • HMM,訓練涉及最大化屬于類的示例的觀察到的概率。但它并沒有最小化觀察其他類實例的概率,因為它只使用正數(shù)據(jù)。
  • 它采用了馬爾可夫假設,該假設不能很好地映射到許多現(xiàn)實世界的域


熱門文章
  • 用Fiddler實現(xiàn)某干教網App學習記錄...
  • 病毒分析小白嘗鮮-GANDCRAB勒索家族...
  • 隱馬爾可夫模型及其算法
  • 華碩 GTX1050Ti Expedition 和 STR...
  • 顯卡維修經驗分享,RTX3080,描述為...
  • 藍天主板改集顯維修
  • 通用主板常用插槽量測點
  • GA-B150M-D2VX-SI開機掉電反復重啟...
  • 紅米K30 Pro開機重啟怎么維修
  • 電腦休眠后無法喚醒怎么辦?原來還...
  • 天逸510Pro拆機箱換固態(tài)硬盤圖解
  • 電腦重裝后進不了系統(tǒng)的三種解決方...
  • 錦州廣廈電腦上門維修

    報修電話:13840665804  QQ:174984393 (聯(lián)系人:毛先生)   
    E-Mail:174984393@qq.com
    維修中心地址:錦州廣廈電腦城
    ICP備案/許可證號:遼ICP備2023002984號-1
    上門服務區(qū)域: 遼寧錦州市區(qū)
    主要業(yè)務: 修電腦,電腦修理,電腦維護,上門維修電腦,黑屏藍屏死機故障排除,無線上網設置,IT服務外包,局域網組建,ADSL共享上網,路由器設置,數(shù)據(jù)恢復,密碼破解,光盤刻錄制作等服務

    技術支持:微軟等
    主站蜘蛛池模板: 永久免费av无码网站yy| 亚洲欧洲精品无码AV| 亚洲heyzo专区无码综合| 无码囯产精品一区二区免费| 麻豆aⅴ精品无码一区二区| 内射人妻无码色AV天堂| 国产成人无码AV一区二区在线观看 | 亚洲国产成人精品无码区在线秒播| 久热中文字幕无码视频| aⅴ一区二区三区无卡无码| 亚洲AV无码一区二区大桥未久| 无码人妻精品一区二| 久久精品中文无码资源站| 一本大道无码日韩精品影视| 中文字幕亚洲精品无码| 夜夜添无码一区二区三区| 免费无码又爽又刺激高潮| 亚洲av无码专区在线| 色综合久久无码中文字幕| 亚洲精品无码久久久久sm| 无码熟熟妇丰满人妻啪啪软件| 亚洲AV无码国产精品色| 亚洲av无码国产精品色午夜字幕| 精品乱码一区内射人妻无码| 亚洲AV综合色区无码二区偷拍| 亚洲AV中文无码字幕色三 | 日韩精品无码永久免费网站| 中文字幕无码视频手机免费看| 无码人妻精品一区二区在线视频| 久久久久成人精品无码| 人妻无码中文字幕| 免费a级毛片无码av| 久久久久久久久免费看无码| 亚洲av无码无线在线观看| 亚洲heyzo专区无码综合| 亚州AV综合色区无码一区| 精品少妇人妻AV无码专区不卡 | 亚洲精品无码久久久久牙蜜区| 精品日韩亚洲AV无码| 亚洲va成无码人在线观看| 亚洲一本到无码av中文字幕|