統計假設檢驗(hypothesis test)為我們進行學習器性能比較提供了重要依據,基于假設檢驗結果我們可推斷出,若在測試集上觀察到學習器A比B好,則A的泛化性能是否在統計意義上優于B,以及這個結論的把握有多大,下面更多關于假設檢驗的介 宅介紹兩種最基本的假設檢驗,然后介紹幾種常用的機器學習性能比較方紹可參見[Wellek, 2010】便于討論,本節默認以錯誤率為性能度量,用E表示.