当前位置: > 论文中心 > 计算机论文 >

融合空间信息LDA的视觉对象识别研究(2)

时间:2013-09-13 13:52 点击:
其中,,。将上述不等式带入似然函数中,获得似然函数的一个下界,并且是参数的函数。 给定一个模型的参数和一幅图像,变分推理算法相对于变分参数来优化式(6)。使用梯度下降法迭代优化一个参数时,其它参数都保
 
  其中,,。将上述不等式带入似然函数中,获得似然函数的一个下界,并且是参数的函数。
 
  给定一个模型的参数和一幅图像,变分推理算法相对于变分参数来优化式(6)。使用梯度下降法迭代优化一个参数时,其它参数都保持不变。对于参数,则有其迭代优化公式:
 
  对于参数,通过对公式(3.1)求导得到其迭代优化公式:
 
  其中第一项来自于词汇生成模型的多项式分布,第二项既考虑了独立特征函数,也考虑了相关性特征函数,在第二项中,特征函数就融合了图像二维空间相邻区域间的相互依赖关系。
 
  对于参数,使用梯度下降法,则对于参数的梯度分别为:
 
  首先设
 
  信念传递算法可以有效计算dedao和,在优化时并没有解析式解,所以可选用梯度下降算法优化这两个变分参数。
 
  给出图像集合,通过最大化图像的似然函数来实现参数估计,并使用最大期望算法通过对公式(3.1)中所有图像求和来最大化似然函数的下界。
 
  在E步中,本文对变分参数最大化似然函数下界,完成对每篇文档的变分推理。在M步中,本文对模型参数最大化似然函数下界。E步和M步重复进行,直到收敛为止。
 
  下面给出M步中,模型参数估计的公式。
 
  对于模型参数,是高斯分布的均值向量,使用E步中得到的变分参数获得该均值向量,计算公式为:
 
  其中,表示训练模型中文档的总数。
 
  对于模型参数,是高斯分布的协方差矩阵,能够反映主题间共现关系概率。对每一文档,首先计算一次中间变量cov_s,其计算公式为:
 
  最后得到矩阵的每个元素:
 
  其中:
 
  对于模型参数,是一个K*N的矩阵,表示给定主题下词汇的分布概率,即,其计算公式为:
 
  其中,式中的指对每一行求和,使得该行的元素和相加为1。
 
  3实验
 
  本文使用VOC(2007)图像数据库的训练集合和测试集合,分别进行模型的训练和测试。该图像库共有20个类别的图像。使用融合空间信息的LDA模型训练得到该模型的参数,这里设置主题数为100,并且对4952幅进行测试,得到每幅图像的主题分布矩阵,该矩阵作为SVM输入参数,使用SVM分类器对不同类别的图像进行分类。在使用SVM分类器进行分类时,将当前需要识别的图像设置为正例,将其他所有类别的图像设置为反例,形成多个2分类问题。本文采用precision、recall和accuracy这三个量化标准评价图像识别率的好坏:
 
  最后通过precision和recall得到Aero-plane,Bottle,Bus,Cat这四类图像的AP曲线,并且与LDA模型与SVM分类器得到的识别率的AP曲线进行比较,对比结果如图4、图5、图6、图7所示。可以看出,本模型相比LDA模型,AP曲线较稳定,没有出现LDA模型AP曲线的不稳定性情况。
 
  4讨论
 
  通过将二维图像空间信息融合进LDA模型,构建条件随机场LDA模型,使得每次视觉词汇主题的产生不再条件独立,而与其相邻区域视觉词汇的主题存在一定的依赖关系,这更加符合图像特性,并且文档所对应的主题的产生不再来自于狄利克雷分布,而是高斯分布,那么高斯分布的协方差矩阵就可以反映主题间的共现关系,即一个主题的出现也表现了其他主题出现的概率,可用于场景识别的应用。融合空间信息的LDA模型,可以提高图像视觉词汇主题分配的准确率,从而达到提高视觉对象识别率的目的。
 
  参考文献:
 
     [1]BOSCHA,ZISSERMANA,MUNOZX.Sceneclassificationusingahybridgenerative/discriminativeapproach[J].IEEETransactionsonPatternAnalysisandMachineIntelligence.PatternAnalysisandMachineIntelligence,2008,30(4):712-727.
 
  [2]VIJAYANARASIMHANS,GRAUMANK.Keywordstovisualcategories:Multiple-instancelearningforweaklysupervisedobjectcategorization[C]//IEEEConferenceonComputerVisionandPatternRecognition,2008.6:1-8.
 
  [3]CANINIKR,SHASHKOVMM,GRIFFITHSTL.ModelingtransferlearninginhumancategorizationwiththehierarchicalDirichletprocess[C]//Proceedingsofthe27thInternationalConferenceonMachineLearning,2010-06.
 
  [4]BERGAMOA,TORRESANIL.Exploitingweakly-labeledWebimagestoimproveobjectclassification:adomainadaptationapproach[C]//NeuralInformationProcessingSystems,2010.
 
  [5]LOWEDG.?Distinctiveimagefeaturesfromscale-invariantkeypoints[J].?InternationalJournalofComputerVision,?200460(2):91-110.
 
  [6]JURIEF,TRIGGSB.Creatingefficientcodebooksforvisualrecognition[C]//ProceedingsoftheIEEEInternationalConferenceonComputerVision,2005,10(1):604-610.
 
  [7]STEYVERSM,GRIFFITHST.Probabilistictopicmodels[M].HandbookofLatentSemanticAnalysis,2007.?
 
  [8]BLEIDM,NGAY,JORDANMI.LatentDirichletallocation[J].JournalofMachineLearningResearch3,2003:993–1022.
 
  [9]李志欣,施智平,刘曦,史忠植.建模连续视觉特征的图像语义标注方法[J].计算机辅助设计与图形学学报,2010,22(8):1412-1420.
 
  [10]吴飞,韩亚洪,庄越挺,邵健.图像-文本相关性挖掘的Web图像聚类方法[J].软件学报,2010,21(7):1561-1575.
 
  [11]FERGUSR,LFeifeiPERONAP,etal.LearningobjectcategoriesfromGoogleimagesearch[C]//ICCV2005.TenthIEEEinternationalconference,2005,2:1816-1823.
 
  [12]ZHAOBin,LIFeifei,XINGEP.Imagesegmentationwithtopicrandomfield[C]//EuropeanConferenceonComputerVision,2010,6315:785-798.
 
  [13]VERBEEKJ,TRIGGSB.RegionclassificationwithMarkovfieldaspectmodels[C]//ComputerVisionandPatternRecognition,2007:1-8.
 
  [14]CAOLiangliang,LIFeifei.Spatiallycoherentlatenttopicmodelforconcurrentsegmentationandclassificationofobjectandscenes[C]//PatternAnalysisandMachineIntelligence,IEEETransaction,2010,32(9):1627-1645.
 
  [15]LAFFERTYJ,MCCALLUMA,PEREIRAF.Conditionalrandomfields:probabilisticmodelsforsegmentingandlabelingsequencedata[C]//ICML,2001.
 
  [16]WAINWRIGHTM,JORDANM.Avariationalprincipleforgraphicalmodels[C]//NewDirectionsinStatisticalSignalProcessing,MITPress,2005.
 
  [17]BLEID.LAFFERTYJ.Correlatedtopicmodels[C]//NIPS,2006.

   论文榜(www.zglwb.com),是一个专门从事期刊推广、投稿辅导的网站。
本站提供如何投稿辅导,寻求投稿辅导代理,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。


栏目列表
联系方式
推荐内容
 
QQ在线咨询
投稿辅导热线:
189-6119-6312
微信号咨询:
18961196312