博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Learning to Compare: Relation Network for Few-Shot Learning论文笔记
阅读量:4146 次
发布时间:2019-05-25

本文共 1415 字,大约阅读时间需要 4 分钟。

前言

在语音问答系统领域,很多时候,每一个类所拥有的训练数据量是很少的,采用传统的分类器进行训练,很可能出现overfitting,为了应对这种问题,最近要研究一下小样本学习。

关于小样本学习的基本概念,可以参看https://www.chainnews.com/articles/650132977783.htm,该综述中还提到了每种类型算法中的典型算法。

论文评价

论文链接:

这篇论文结构简单,没有很多技巧,但是效果好,理论清晰,是一篇很赞的文章,很喜欢这类文章。

few-shot 算法

  • few-shot: 通过对比图像与图像之间的特征来实现识别;
  • zero-shot:通过对比对图像的描述和图像来实现识别;
  • 该论文框架也可适用于zero-shot, 本节主要针对few-shot讲解

该论文采用一个深度网络,该网络包含两个模块:embedding module和relation module。

embedding module 负责将support set中的图像和batch中的图像进行编码(其实就是提取各自的特征),relation module的任务是以这两个特征为输入,判断两个图像的匹配得分,1表示是同一个类,0表示为不同类。
算法整体结构:
在这里插入图片描述
上图中 f ψ f_{\psi} fψ代表embedding module, g ϕ g_{\phi} gϕ代表relation module, 训练时 C-way k-shot中, 每个类中的1张query image(如上图中穿最下方穿红衣服的狗狗)通过embedding module得到其feature,该类support set中的k个images 都通过embedding module 得到k个features,将该k个features的对应元素求和得到该类的feature,将该类的feature和query image的feature进行concatenate送到relation module,relation module得到一个得分,利用MSE作为目标函数,上述过程用公式表示如下:
r i , j = g ϕ ( C ( f ψ ( x i ) , f ψ ( x j ) ) ) r_{i,j}=g_{\phi}(C(f_{\psi}(x_i),f_{\psi}(x_j))) ri,j=gϕ(C(fψ(xi),fψ(xj)))
其中, C C C代表concatenation, r i , j r_{i,j} ri,j代表得分。
目标函数为:
a r g m i n ψ , ϕ ∑ i i = m ∑ j j = n ( r i , j − 1 ( y i = = y j ) ) argmin_{\psi,\phi}\sum_{i}^{i=m}\sum_{j}^{j=n}(r_{i,j}-1(y_i==y_j)) argminψ,ϕii=mjj=n(ri,j1(yi==yj))
其中, y j y_j yj代表query image的类别标签, y i y_i yi代表support set中第i类的标签。

具体的网络结构如下图所示:

在这里插入图片描述

zero-shot

在这里插入图片描述

DNN用作处理image的embedding module, 可采用imageNet上训练好的InCeption v2或者ResNet101,左侧输入语义向量。

转载地址:http://zwnti.baihongyu.com/

你可能感兴趣的文章
为什么说程序员是“培训班出来的”就是鄙视呢?
查看>>
码农吐糟同事:写代码低调点不行么?空格回车键与你有仇吗?
查看>>
阿里p8程序员四年提交6000次代码的确有功,但一次错误让人唏嘘!
查看>>
一道技术问题引起的遐想,最后得出结论技术的本质是多么的朴实!
查看>>
985硕士:非科班自学编程感觉还不如培训班出来的,硕士白读了?
查看>>
你准备写代码到多少岁?程序员们是这么回答的!
查看>>
码农:和产品对一天需求,产品经理的需求是对完了,可我代码呢?
查看>>
程序员过年回家该怎么给亲戚朋友解释自己的职业?
查看>>
技术架构师的日常工作是什么?网友:搭框架,写公共方法?
查看>>
第四章 微信飞机大战
查看>>
九度:题目1008:最短路径问题
查看>>
九度Online Judge
查看>>
九度:题目1027:欧拉回路
查看>>
九度:题目1012:畅通工程
查看>>
九度:题目1017:还是畅通工程
查看>>
九度:题目1034:寻找大富翁
查看>>
第六章 背包问题——01背包
查看>>
51nod 分类
查看>>
1136 . 欧拉函数
查看>>
面试题:强制类型转换
查看>>