基于颜色特征的图像检索技术研究毕业设计(编辑修改稿)内容摘要:
在纯色中包含的白色光的成份。 例如同样是红色,也会因颜色浓度不同而分为深红色、粉红色和浅红色。 饱和度 S 也用百分比来度量,从浓度最小的 O%到浓度完全饱和的100%。 色调 H 和饱和度 S 分量合起来定义了颜色的 色度 (Chromatieity)特性。 HSV颜色模型用 Munsell三维空间坐标系统表示,其示意图如图 3 所示。 图 3 HSV 颜色模型 Munsen颜色空间具有以下己经被人的眼睛所证实的特点 : (1)坐标之间的心理感知独立性 (PereeptualIndependenee),即人可以独立感知各颜色分量的变化。 (2)线性伸缩性 (LinearSealability),人眼可感知的颜色差异与 HSV 颜色分量的相应值上的欧几里德距离 (EuelideanDIStanee)是成比例的。 因为 HSV 颜色空间根据色调 H 的值来区分 不同的颜色,因此在 HSV 的三个分量中, H 分量是尤为重要的,它可以很好地模拟人类对颜色的识别和记忆过程。 CMY 颜色空间 以红、绿、蓝的补色青( Cyan)、品红( Magenta)、黄( Yellow)为原色构成的 CMY 颜色模型,常用于从白光中滤去某种颜色,又被称为减性原色系统。 CMY颜色模型对应的直角坐标系的子空间与 RGB颜色模型所对应的子空间几乎完全相同。 差别仅在于前者的原点为白,而后者的原点为黑。 前者是定义在白色中减去某种颜色来定义的一种颜色,而后者通过从黑色中加入颜色来定义一种颜色。 CMY 模 型以打印在纸张上油墨的光线吸收特性为基础,当白光照射到半透明油墨上时,部分光谱被吸收,部分被反射回眼睛。 理论上,青( Cyan)、品红( Magenta)和黄( Yellow)色素能够合成吸收所有的颜色并产生黑色。 因为所有打印油墨都会包含一些杂志,这三种油墨实际上产生一种土灰色,必须与黑色油墨混合才能产生真正的黑色。 将这些油墨混合产生颜色称为四色印刷。 减色( CMY)和加色( RGB)是互补色,每对减色产生一种加色,反之亦然。 如图 4 所示。 图 4 CMY 颜色模型 认知科学及视觉心理学证明,人类不能像计算机显示器那样只 使用 RGB成分感知颜色,因此,选择一个适合于人类视觉特征的颜色空间可以改善检索效果。 由于在进行基于内容的图像检索时,查询要求往往是按照用户的主观视觉感受而发出的,因此在进行图像之间颜色差异的比较时, CBIR 系统一般采用具有视觉一致性的颜色空间。 所谓视觉一致性,是指对两种不同的颜色,它们在颜色空间中坐标的距离与它们在观察者的颜色感知空间中的距离是大致相同的。 HSV 空间具有这样的特性 [9]。 因此本系统选用 HSV 颜色模型。 3 颜色特征的表达 颜色直方图 (1)颜色直方图的定义 颜色直方图 [9]是颜色信息 的函数,其核心思想是在一定的颜色空间中对图像各种颜色出现的频数进行统计, 颜色直方图描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置 ,即图像的对象或物体。 它的优点就在于它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。 颜色直方图可以基于不同的颜色空间和坐标系,最常用的是 RGB 颜色空间,因为大部分的数字图像都是用 RGB颜色空间表达的。 基于 RGB颜色空间表示时,彩色图像的直方图可以用 R、 G、 B三个单 色的直方图或联合分布直方图来表示。 用三个单色直方图表示时,各个直方图表示的是图像在这种颜色分量的统计分布,总共有三个不同的概率分布。 而彩色图像用一个 RGB颜色直方图表示时,其统计的是不同颜色出现的频数,以色彩作为横坐标,纵坐标为色彩出现的频数。 在 RGB 颜色空间中,颜色直方图可以看成是一个离散函数,即 H(k)?nk, (k?0,1,...,L?1) n 其中, k 表示图像的特征取值, L表示特征可取值的个数,凡表示图像中具体征值为 k 的像素个数, n表示图像像素的总个数。 (2)颜色直方图的特性 旋转不变性和缩放 不变性:颜色直方图是表示图像中颜色分布的一种方法,它的横轴表示颜色等级,纵轴表示在某一个颜色等级上具有该颜色的像素在整幅图像中所占的比例,直方图颜色空间中的每一个刻度表示了颜色空间中的一种颜色,因此,颜色直方图具有与身俱来的旋转不变性和缩放不变性,如图 5 所示。 位置无关性:直方图描述了每个灰度级的像素的个数,但不能为这些像素在图像中的位置提供任何线索。 当一幅图像被压缩为直方图后,所有的空间信息将全部丢失,因此,任一特定的图像具有唯一的直方图,但并非一一对应,而是一对多,不同的图像有可能具有相同的直方图特征。 叠加性:如果一幅图像由两个不连接的区域组成,并且每个区域的直方图己知,则整幅图像的直方图是该两个区域的直方图之和。 该结论可推广到任何数目的不连接区域的情形。 直方图是总体灰度概念,从直方图中可以看出图像整体的性质:如图像的明暗程度、图像的亮度等。 再如图像的灰度动态范围太小会使许多细节分辨不清楚,而灰度级分布均匀,则会给人以清晰、明快的感觉。 图 5 颜色直方图的旋转不变性和缩放不变性 累加直方图 [10] 当图像中的特征并不能取遍所有可取值时,统计直方图中会出现一些零值。 这些零值的出现会对计算直方图的 相交带来很大影响,从而使得算出的匹配值并不能正确的反映两图间的颜色差别。 累加直方图是以颜色作为横坐标,从坐标原点到该颜色的所有颜色的像素出现的频数为纵坐标绘出的图形。 这样图像的累加直方图向量 H 可以定义为: ?C1],C2],.........,Ck],.........,Cn]0?Ck]?1 ? Ck]表示 C1~Ck 种颜色的像素的累加频数: Ck]? Ci?Ck?h[C] i 我们已经计算出图像的一般直方图,可以方便地计算图像累加直方图。 这样,最后得到的累加直方图特征向量为: L?l[0],l[1],...........,l[k],...........,l[35] 4 图像特征的相似性匹配; 相似度匹配方法 [11];图像检索的效果很大程度上取决于匹配算法的优劣;设 D 为距离函数, x、 y、 z为三个特征向量,则所有;(1)D(x, y)=D(y, x)=0(自相似性 ); (2)D(x, y)?D(x, x)?0(最小性 ); (3)D(x, y)=D(y,x)(对称性 ); (4)D(x, y)+D(y, z)?D(x, z)(;图像的相似度度量, 4 图像特征的相似性匹配 相似度匹配方法 [11] 图像检索的效果很 大程度上取决于匹配算法的优劣。 基于文本的检索方法中 使用的是文本的精确匹配,而基于内容的图像检索则通过计算查询和候选图像之 间的视觉特征的相似度来完成。 以一定的计量或测量方法来判断图像内容是否相 关。 图像特征提取大多数可以表示为向量形式,因此常用的图像比较方法都是基 于向量空间 模型 ,即将图像特征 看作向量空间中的两个点,通过比较两个点之间 的距离来衡量其相似度。 按照距离公理,在定义距离测度时要满足距离公理的四 个条件 :自相似性、最小性、对称性、及三角不等性。 设 D 为距离函数, x、 y、 z 为三个特征向量,则所有的距离函数都满足的条件表示为: (1)D ( x, y ) = D ( y, x ) = 0(自相似性 ) (2)D ( x, y )?D ( x, x )?0(最小性 ) (3)D ( x, y ) = D ( y, x)(对称性 ) (4)D ( x, y ) + D ( y, z )?D ( x, z )(三 角不等性 ) 图像的相似度度量,既是图像检索技术中的一个关键问题,也是其中的一个难点。 常见的方法有:直方图相交法、直方图欧氏距离、直方图余弦距离、二值集hammimg距离、直方图二次距离度量、二值集二次距离、直方图 Mahalanobis距离。 以下只简要介绍系统中常用的直方图的交、直方图欧氏距离两种距离度量方法。 直方图的交集的方法 直方图的交集算法,根据颜色索引检索出查询图像的颜色直方图,将其与图像库中的每一图像的直方图取交集,根据交集的值来选出最佳匹配图像。 直方图交集的公式如下: D(Ha,Hb)=i,j,k?min{Ha(i,j,k),Hb(i,j,k)} i,j,kN?Hb(i,j,k)N D(Ha,Hb)为其中 Ha 为查询图像直方图, Hb 为图像库中的任一图像直方图, 两图像的匹配值。 D(Ha,Hb)?(0,1),它的值越接近 1,则两图像越相似。 直方图交集方法能对两幅图像进行详细的比较,然而对于许多合成的图像,如商标等,它们有大量的一致颜色,三维直方图只有几个域的值很高,而其它许多域的颜色信息变化有限。 因而,对于这样的图像进行过细的比较是不必要的。 又由于在扫描图像时容易产生一些噪音,所以这种过细 的比较容易产生错误的结果。 欧式距离法 我们可以利用欧基里德距离公式( Euclidean Distance)来计算距离。 对于两个 N维直方图 x,y,两者的欧氏距离可以表示如下: d2(x,y)?(x1?y1)2?(x2?y2)2?...?(xn?yn)2?(x?y)T(x?y) 此距离公式虽然简单,但是与特定的颜色分布无关,有一种方法可以引入相关权值 A,这里 A 是一个 N?N 维矩阵,此时距离公式可以表述如下: d2(x,y)?(x?y)TA(x?y) 为了简化计算,将直方图 x,y规范化使其满足: 0?xi,yi?1 且 ?xi??yi?1 ii 矩阵 A?[aij],,权 aij 表示颜色 i 与颜色 j 之间的相似度。 若取 z=xy,则有 ?z ii 取定了距离公式后,我们需要确定 A 的取值, ?0,?1?zi?1,d2?zTAz, 且要保证此矩阵 A 能够使 d2?0,我们用 dij 表示颜色 i与颜色 j 在 RGB 颜色空间的距离。 取 aij?(1?dij/dmax),其中, dmax?maxij(dij)。 有 d2?zTAz??zizj(1?dij/dmax)??zizj?(?zizjdij)/dmax ijijij 因为 ?zi?0,则 d2?(?1/dmax), ?zi?0,H?[dij]. ii 5 图像检索算法实现 程序开发运行环境 Matlab 是集数值计算、符号运算及图形处理等强大功能于一体的科学计算语言作为强大的科学计算平台,它几乎能够满足所有的计算需求 ,它具有如下的优势与特点 : 友好的工作平台和编程环境;简单易用的程序语言;强大的科学计算及数据处理能力;出色的图形处理功能。 程序检索逻辑 我们可以从图 6 中抽象出三个层次或者功能模块: (1)颜色空间内特征提取 对图像数据进行特征提取,可以选择任何一种能够达 到检索要求的颜色空间和特征表达方式。 (2)图像匹配(相似度计算) 在选取了特征之后,需要选择或寻找适当的判别准则,从而判断出待识别的图像的特征与数据。基于颜色特征的图像检索技术研究毕业设计(编辑修改稿)
相关推荐
亩增收 3000 余 元, 单位面积经济效益 提高 75% ②推广果园 :***镇、 ***镇苹果高光效树形大树改造 推广 基地 面积 5000 亩 ,每亩果园 经济效益增加 3000 元,推广基地 经济效益 将 增加 1500 万元。 ( 3)技术、质量指标 ①亩枝果量和产 量:成形后亩总枝量 55000- 65000 个,结果量120xx- 13500 个,单果重量 240 克以上,亩产达到
声能 密 度 声能密度是指在传播媒质中,媒质单位体积内所包含的声能。 在平面波声场中,声能密度可表示为 : 22rmsPD c ()式中 rmsP —— 有效声压; —— 空气 度; c —— 空气中声波传播速度,即声速; 毕业设计说明书 第 8 页 共 38 页 (4) 声学量的级 在声学中,直接使用声压、声强和声功率是极不方便的,为此,引入了 “ 级” 的概念,来表示声音的强弱。
(Microsoft Foundation Classes), 用于在 C++环境下编写应用程序的一个框架和引擎。 该类库提供一组通用的可重用的类库供开发人员使用。 大部分类均从 CObject 直接或间接派生,只有少部分类例外。 MFC 类库作为 C++与 Windows 的接口,建立在 Win32 应用程序编程接口 API 之上,封装了大多数的 API 函数,主要是 API
的传输与交换。 在标有关键的元数据属性之后,不同机构、公司、学校间的学习对象资源可以互通有无,或进行相关兼容性的修改。 前文提到的LTSC学习对象元数据工作小组就致力于建立学习对象元数据的标准规范,以实现不同机构间学习对象资源的共享。 截止2001年4月,并仍在修改讨论之中。 我国现代远程教育标准研究项目(DLTS—Distance Learning Technology
种器件获得,那就是角速度传感器 陀螺仪。 角速度传感器 陀螺仪 陀螺仪可以用来测量物体的旋转角速度。 选用 EN03 系列的加速度传感器。 它利用了旋转坐标系中的物体 会受到克里利奥力的原理,在器件中利用压电陶瓷做成振动单元。 当旋转器件时会改变振动频率从而反映出物体旋转的角速度。 安徽理工大学毕业设计 13 在车模上安装陀螺仪,可以测量车模倾斜的角速度,将角速度信号进行积分便可以得到车模的倾角
净现金流的水平和稳定性。 尤其是顾客满意度 (以 ACSI 测量 )与股票的市场价值显著相关。 此外,满意度评价结果可以作为制定战略计划的依据;可以从中找出顾客最关注的地方加以改进,找出价值客户加以管理;用满意度的评分进行市场细分、业务流程再造等。 图 1 以 顾客满意度 为中心的关系链 品牌形象感知 价值 顾客满意度 服务质量感知 产品质量感知 价格感知 认知忠诚 情感忠诚 顾客保留率 6