2014
DOI: 10.1109/tnnls.2013.2293178
|View full text |Cite
|
Sign up to set email alerts
|

Learning and Representing Object Shape Through an Array of Orientation Columns

Abstract: Recognizing an object from its background is always a very challenging task for pattern recognition, especially when the size, pose, or illumination of the object or the background are changing. The most essential method of handling this classical problem is to learn and define the structure of an object using its topological or geometrical features and components. To create a data structure that can describe the spatial relationships of object components formally and join knowledge learning and applying in a … Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
3
1
1

Citation Types

0
2
0
3

Year Published

2015
2015
2024
2024

Publication Types

Select...
8

Relationship

2
6

Authors

Journals

citations
Cited by 14 publications
(5 citation statements)
references
References 68 publications
0
2
0
3
Order By: Relevance
“…在计算机视觉领域, 现有的深度神经网络具有计 算量大、占用内存多、可解释性差等缺点,压缩模型 大小和减少网络深度是目前的解决途径之一 [1] 。有研 究者借助生理视觉原理, 对目标图像预先进行特征抽 取和表示,显著减少了深层网络的规模,降低了数据 的维度 [2] 。因此采用高效的特征表示方法是实现紧致 化视觉的重要途径之一。由于在变化的环境或姿态 下,图像的几何特征是恒定的,提取并利用图像稳定 的形状特征对提高视觉任务的鲁棒性有帮助。 现 有 的 特 征 提 取 方 法 如 形 状 上 下 文 (Shape Context, SC) [3] , 三 角 形 区 域 表 示 (Triangle-area representation, TAR) [4] ,距离集(Distance Sets) [5] ,傅里 叶描述子(Fourier Descriptor, FD) [6] ,Hu 矩 [7] ,Zernike 矩 [8] 等,均使用轮廓点的分布关系表征形状,后续如 内 距 离 形 状 上 下 文 (Inner-distance Shape Context, IDSC) [9] 和高度函数(Height Function, HF) [10] 等算法在 SC 的基础上作了改进,但都需要匹配像素点对,这 将增加计算代价。认知学研究发现,人脑的识别过程 更关注形状的方位、曲率等中高级特征 [11] ,将形状的 中高级特征映射成二值编码, 用编码的距离度量相似 度,会使形状的匹配更加高效,且可解释性强。 基于中高级特征编码的形状描述子如词袋(Bag of Words, BoW) [12] ,曲率尺度空间(Curvature Scale Space, CSS) [13] ,以及编码角度 [14] 和轮廓段特征 [15] , 几何表示更加明确,具有更好的可解释性。但是上述 方法在学习能力、计算时间、空间能耗上仍不能与人 视觉系统的优异识别性能相比, 并且特征反映的目标 形状与人的直观感受不完全一致, 编码特征的描述子 也无法迁移到仿生视觉的不同几何特征空间中。 超柱模型 [16] 借鉴视觉神经系统的优异性能,模 拟哺乳动物初级视皮层对朝向信息的选择性反应机 制来提取和表示图像中的线性或近似线性特征, 提高 了图像匹配的效率。 但受限于缺少有效的多特征融合 方法,现有超柱模型均未考虑朝向的强度和尺度信 息,故而无法表示丰富的轮廓信息。 本文基于超柱模型及其代表性算法线条上下文 (Line Context, LC) [16,17]…”
Section: 引言unclassified
See 2 more Smart Citations
“…在计算机视觉领域, 现有的深度神经网络具有计 算量大、占用内存多、可解释性差等缺点,压缩模型 大小和减少网络深度是目前的解决途径之一 [1] 。有研 究者借助生理视觉原理, 对目标图像预先进行特征抽 取和表示,显著减少了深层网络的规模,降低了数据 的维度 [2] 。因此采用高效的特征表示方法是实现紧致 化视觉的重要途径之一。由于在变化的环境或姿态 下,图像的几何特征是恒定的,提取并利用图像稳定 的形状特征对提高视觉任务的鲁棒性有帮助。 现 有 的 特 征 提 取 方 法 如 形 状 上 下 文 (Shape Context, SC) [3] , 三 角 形 区 域 表 示 (Triangle-area representation, TAR) [4] ,距离集(Distance Sets) [5] ,傅里 叶描述子(Fourier Descriptor, FD) [6] ,Hu 矩 [7] ,Zernike 矩 [8] 等,均使用轮廓点的分布关系表征形状,后续如 内 距 离 形 状 上 下 文 (Inner-distance Shape Context, IDSC) [9] 和高度函数(Height Function, HF) [10] 等算法在 SC 的基础上作了改进,但都需要匹配像素点对,这 将增加计算代价。认知学研究发现,人脑的识别过程 更关注形状的方位、曲率等中高级特征 [11] ,将形状的 中高级特征映射成二值编码, 用编码的距离度量相似 度,会使形状的匹配更加高效,且可解释性强。 基于中高级特征编码的形状描述子如词袋(Bag of Words, BoW) [12] ,曲率尺度空间(Curvature Scale Space, CSS) [13] ,以及编码角度 [14] 和轮廓段特征 [15] , 几何表示更加明确,具有更好的可解释性。但是上述 方法在学习能力、计算时间、空间能耗上仍不能与人 视觉系统的优异识别性能相比, 并且特征反映的目标 形状与人的直观感受不完全一致, 编码特征的描述子 也无法迁移到仿生视觉的不同几何特征空间中。 超柱模型 [16] 借鉴视觉神经系统的优异性能,模 拟哺乳动物初级视皮层对朝向信息的选择性反应机 制来提取和表示图像中的线性或近似线性特征, 提高 了图像匹配的效率。 但受限于缺少有效的多特征融合 方法,现有超柱模型均未考虑朝向的强度和尺度信 息,故而无法表示丰富的轮廓信息。 本文基于超柱模型及其代表性算法线条上下文 (Line Context, LC) [16,17]…”
Section: 引言unclassified
“…发现在视觉空间中央10  内的位置刺激会引发一个几 乎恒定大小的宽神经活动带 [18] , 因此本文使用的朝向 间隔与超柱模型 [16] 保持一致,设置 n=19;由于人类 大脑皮层中"兴奋型-抑制型"突触的比例大约为 9:1, 表 1 各个线段代表的不同信息 Table 1 The parameter value of the segments in Fig. 1 1…”
Section: 引言unclassified
See 1 more Smart Citation
“…This array processes the image in a compound receptive field of all columns. The arrangement of receptive fields were introduced in [ 35 ].…”
Section: A Bio-inspired Line Detection Architecturementioning
confidence: 99%
“…For example, Salamat et al proposed a brain-like unsupervised clustering method based on hyperdimensional computing, which maps low-dimensional data to high-dimensional data for processing clusters [ 6 ]. Wei et al proposed computational models that simulate the structure of functional columns of the visual cortex and nonclassical receptive fields [ 7 , 8 , 9 , 10 ]. These studies show how to design computational models from a neuromorphic perspective with the potential of in-memory computing.…”
Section: Introductionmentioning
confidence: 99%