科技名詞 | 集成學(xué)習(xí) ensemble learning

發(fā)布日期：2023-10-26??來源：全國科學(xué)技術(shù)名詞審定委員會(huì)??瀏覽次數(shù)：1365

核心提示：集成學(xué)習(xí)ensemble learning定義：通過結(jié)合多個(gè)學(xué)習(xí)器來解決問題的一種機(jī)器學(xué)習(xí)范式。其常見形式是利用一個(gè)基學(xué)習(xí)算法從訓(xùn)練集產(chǎn)生多個(gè)基學(xué)習(xí)器，然后通過投票等機(jī)制將基學(xué)習(xí)器進(jìn)行結(jié)合。代表性方法包括Boosting、Bagging等。學(xué)科：計(jì)算機(jī)科學(xué)技術(shù)_人工智能_機(jī)器學(xué)習(xí)相關(guān)名詞：機(jī)器學(xué)習(xí) 決策樹圖像識別圖片來源：視覺中國【延伸閱讀】集成學(xué)習(xí)是一種機(jī)器學(xué)習(xí)方法

集成學(xué)習(xí)

ensemble learning

定義：通過結(jié)合多個(gè)學(xué)習(xí)器來解決問題的一種機(jī)器學(xué)習(xí)范式。其常見形式是利用一個(gè)基學(xué)習(xí)算法從訓(xùn)練集產(chǎn)生多個(gè)基學(xué)習(xí)器，然后通過投票等機(jī)制將基學(xué)習(xí)器進(jìn)行結(jié)合。代表性方法包括Boosting、Bagging等。

學(xué)科：計(jì)算機(jī)科學(xué)技術(shù)_人工智能_機(jī)器學(xué)習(xí)

相關(guān)名詞：機(jī)器學(xué)習(xí) 決策樹圖像識別

圖片來源：視覺中國

【延伸閱讀】

集成學(xué)習(xí)是一種機(jī)器學(xué)習(xí)方法，它通過將多個(gè)基本的學(xué)習(xí)模型（也被稱為基學(xué)習(xí)器）組合成一個(gè)強(qiáng)大的學(xué)習(xí)系統(tǒng)來提高模型的性能。集成學(xué)習(xí)的基本思想可以概括為“多樣性和投票”，即通過構(gòu)建多個(gè)基學(xué)習(xí)器，并讓它們對輸入數(shù)據(jù)進(jìn)行獨(dú)立的預(yù)測，然后通過某種方式將各個(gè)基學(xué)習(xí)器的預(yù)測結(jié)果結(jié)合起來，產(chǎn)生一個(gè)最終的預(yù)測結(jié)果。這樣做的好處是，各個(gè)基學(xué)習(xí)器可以各自在不同的特征子集或者在不同的模型空間進(jìn)行學(xué)習(xí)，從而降低模型的泛化誤差。

集成學(xué)習(xí)的概念可以追溯到20世紀(jì)90年代初期，但真正引起人們關(guān)注是在2000年以后。根據(jù)個(gè)體學(xué)習(xí)器的生成方式，目前的集成學(xué)習(xí)方法大致可分為兩大類：一類是個(gè)體學(xué)習(xí)器間存在強(qiáng)依賴關(guān)系、必須串行生成的序列化方法，如Boosting（自適應(yīng)提升）；另一類是個(gè)體學(xué)習(xí)器間不存在強(qiáng)依賴關(guān)系、可同時(shí)生成的并行化方法，如Bagging（自助投票）和隨機(jī)森林。其中，Boosting是一族可將弱學(xué)習(xí)器提升為強(qiáng)學(xué)習(xí)器的算法，主要是通過對樣本集的操作獲得樣本子集，然后用弱分類算法在樣本子集上訓(xùn)練生成一系列的基分類器；Bagging是一種基于數(shù)據(jù)隨機(jī)重抽樣的集成學(xué)習(xí)方法，它通過從原始數(shù)據(jù)集中有放回地抽取樣本來訓(xùn)練多個(gè)基分類器，并對所有基分類器的預(yù)測結(jié)果進(jìn)行平均或投票來產(chǎn)生最終的預(yù)測結(jié)果；隨機(jī)森林是Bagging的一個(gè)擴(kuò)展變體，它在以決策樹為基學(xué)習(xí)器構(gòu)建Bagging集成的基礎(chǔ)上，進(jìn)一步在決策樹的訓(xùn)練過程中引入了隨機(jī)屬性選擇。

集成學(xué)習(xí)的應(yīng)用非常廣泛，例如圖像識別、文本分類、金融風(fēng)險(xiǎn)評估、生物信息提取、醫(yī)療診斷等。在圖像識別方面，可以用于目標(biāo)檢測、語義分割等任務(wù)；在文本分類方面，可以用于情感分析、垃圾郵件過濾等任務(wù)；在金融風(fēng)險(xiǎn)評估方面，可以用于信用評分、欺詐檢測等任務(wù)；在生物信息學(xué)中，可從海量基因組數(shù)據(jù)中提取有用信息；在醫(yī)療診斷方面，可用來提高疾病診斷的準(zhǔn)確度。

（延伸閱讀作者：西華師范大學(xué)數(shù)學(xué)與信息學(xué)院李斌斌博士）

責(zé)任編輯：張鵬輝

免責(zé)聲明：
本網(wǎng)站部分內(nèi)容來源于合作媒體、企業(yè)機(jī)構(gòu)、網(wǎng)友提供和互聯(lián)網(wǎng)的公開資料等，僅供參考。本網(wǎng)站對站內(nèi)所有資訊的內(nèi)容、觀點(diǎn)保持中立，不對內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。如果有侵權(quán)等問題，請及時(shí)聯(lián)系我們，我們將在收到通知后第一時(shí)間妥善處理該部分內(nèi)容。

• 科技名詞\|仿生設(shè)計(jì) biomimetic design	• 瞄準(zhǔn)更多國際科學(xué)前沿我國大科學(xué)裝置建設(shè)提速
• 動(dòng)物真的能預(yù)測地震？	• 科普\|三問具身智能
• 科技名詞\|糖酵解 glycolysis	• 又一歷史性突破：我國首個(gè)億噸級頁巖油田誕生！
• 氣象的“天機(jī)”是如何被破譯的	• 科技名詞\|神經(jīng)激素 neurohormone
• 科技名詞\|煤化工 coal chemical industry	• 人臉識別技術(shù)應(yīng)用安全管理辦法 security manage

科技名詞\|仿生設(shè)計(jì) bi	瞄準(zhǔn)更多國際科學(xué)前沿
動(dòng)物真的能預(yù)測地震？	科普\|三問具身智能

網(wǎng)站首頁

加工/銷售

企業(yè)管理

網(wǎng)站首頁

加工/銷售

企業(yè)管理

科技名詞 | 集成學(xué)習(xí) ensemble learning

集成學(xué)習(xí)