当前位置: > 论文中心 > 计算机论文 >

中使用MMTD算法来对落入置信区间的概率大小进行评

时间:2015-02-09 10:01 点击:
【 摘 要 】 文中使用MMTD算法来对落入置信区间的概率大小进行评估。文章将MMTD算法在评估假设中进行应用是创新点。 【 关键词 】 样本错误率;MMTD;置信区间 【 Abstract 】 We use the MMTD algorithm to evaluate the probability size confidence interva
  【 摘   要 】 文中使用MMTD算法来对落入置信区间的概率大小进行评估。文章将MMTD算法在评估假设中进行应用是创新点。

  【 关键词 】 样本错误率;MMTD;置信区间

  【 Abstract 】 We use the MMTD algorithm to evaluate the probability size confidence interval. In this paper, the MMTD algorithm in evaluating hypotheses application is the innovation point of this article.

  【 Keywords 】 sample error rate;MMTD;confidence interval

  1    引言

  在机器学习的算法中对假设的精度进行经验评估是机器学习中的基本问题。经验评估算法是机器学习重要算法,假设评估算法能够根据样本的概率得出相应的真实错误率置信区间。在机器学习中的评估假设算法中,主要讨论和分析的是样本错误率的概率与真实错误率之间的有机联系。通过样本错误率的计算如何得出真实错误率置信区间,这是评价假设中关键技术和算法。

  样本错误率与真实错误率是两种不同的概率,这两种概率存在某种必然的联系。真实错误率的置信区间是由样本错误率得出的。因此在这里要对真实错误率值的置信度进行评价,对真实错误率值的置信度如何进行评价已有多种算法。

  置信度有好与坏的区分。然而置信度好与坏,置信度好则真实错误率落入置信区间的概率就大,置信度坏则真实错误率落入置信区间的概率就小,但事物大与小的属性值符合三值逻辑的讨论范围。如果某类实体的属性符合三值逻辑讨论的范围,那么实例的取值符合中介逻辑的取值特性。在这里根据上述理由和讨论将MMTD算法在评估假设中的置信度上进行应用是首先次,这也是本文的创新之处。

  2    样本错误率和真实错误率

  “为解决errors (h)在何种程度上提供了对errord (h)的估计的问题,先考虑h为离散值假设的情况。具体地说,比如我们要基于某离散值假设h在样本s上观察到的样本错误率估计它的真实错误率,其中:

  (1)样本s包含n个样例,它们的抽取按照概率分布,抽取过程是相互独立的,并不依赖于h。

  (2)n≥30。

  (3)假设h在这n样例上犯了r个错误(errors (h)=r/n) ”。

  “举例说明,假如数据样本s包含n=40个样例,并且假设h在这些数据上产生了r=12个错误。这样,样本错误率为errord (h)=12/40=0.30。如果没有更多的信息,对真实错误率errord (h)的最好的估计即为样本错误率0.30。然而我们不能期望这是对真实错误率的完美估计。如果另外收集40个随机抽取的样例s',样本错误率errors' (h)将与原来的errors (h)存在一些差别。这种差别是由s'和s组成上的随机差异所产生的。实际上,如果不断重复这一实验,每次抽取一个包含40样例的样本si,将会发现约95%的实验中计算所得的区间包含真实错误率。因此,我们将此区间称为errord (h)的95%置信区间估计”。

  已知这些条件,统计理论可给出以下断言:

   论文榜(www.zglwb.com),是一个专门从事期刊推广、投稿辅导的网站。
本站提供如何投稿辅导,寻求投稿辅导代理,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。


栏目列表
联系方式
推荐内容
 
QQ在线咨询
投稿辅导热线:
189-6119-6312
微信号咨询:
18961196312