進化樹搜索

算法

目錄

心氣虛,則脈細;肺氣虛,則皮寒;肝氣虛,則氣少;腎氣虛,則泄利前後;脾氣虛,則飲食不入。
醫學百科APP(安卓 | iOS | Windows版)

您的醫學知識庫 + 健康測試工具

https://www.wiki8.cn/app/

1 拼音

jìn huà shù sōu suǒ

2 註解

進化樹搜索

單一的進化樹的數量會隨着分類羣數量的增長而呈指數增長,從而變爲一個天文數字。由於計算能力的限制,現在一般只允許對很小一部分的可能的進化樹進行搜索。具體的數目主要依賴於分類羣的數量、優化標準、參數設定、數據結構、計算機硬件以及計算機軟件

有兩種搜索方法保證可以找到最優化的進化樹:窮舉法和樹枝 跳躍法(BB)。對於一個很大的數據集,這兩種方法都很不實用。對分類羣數量的限制主要取決於數據結構和計算機速度,但是對於超過20個分類羣的數據集,BB方法很少會得到應用。窮舉法要根據優化標準,對每一個可能的進化樹進行評估。BB方法提供一個邏輯方法,以確定那些進化樹值得評估,而另一些進化樹可被簡單屏蔽。因此BB方法通常要比窮舉法快得多。

絕大多數分析方法都使用“啓發式”的搜索。啓發式現搜索出相近的次優化的進化樹家族(“島嶼”),然後從中得到優化解(“山頂”)。不同的算法用不同程度的精確性搜索這些島嶼和山頂。最徹底也是最慢的程序(TBR,tree bisection-reconnection,進化樹對分重接)先把進化樹在每一個內部樹枝處劈開,然後以任意方式將劈開的碎片重新組合起來。最快的算法只是檢查一下相鄰終端的不太重要的重新組合,因此傾向於找到最近的島嶼的山頂。

降低搜索代價的最好方法是對數據集進行剪除。影響優化搜索策略選擇的因素(數據量,數據結構,時間量,硬件,分析目的)太複雜,無法推薦一個簡單可行的處方。因此進行搜索的用戶必須對數據非常熟悉且有明確的目標,瞭解各種各樣的搜索程序及自己硬件設備和軟件能力

除上述當前應用最廣的方法外,還有大量的建立和搜索進化樹的其它方法。這些方法包括Wagner距離方法和親近方法(距離轉化方法);Lake的不變式方法(一個基於特徵符的方法,它選擇的拓撲結構包含一個意義重大的正數以支持顛換);Hadamard結合方法(一個精細的代數方陣方法,對距離數據或者觀察到的特徵符進行修正);裂解方法(這個方法決定在數據中應該支持哪一個基於距離的可選的拓撲結構);四重奏迷惑(Quartet puzzling)方法可以爲ML建樹方法所應用,這個算法相對而言是個較快的進化樹搜索算法。

特別提示:本站內容僅供初步參考,難免存在疏漏、錯誤等情況,請您核實後再引用。對於用藥、診療等醫學專業內容,建議您直接咨詢醫生,以免錯誤用藥或延誤病情,本站內容不構成對您的任何建議、指導。