基于百度EasyDL定制化图像识别平台的海洋鱼类识别方法
本文作者:范伟亚
【目的基于】鱼类识别对渔业资源的开发利用有着重要的意义。针对海底环境恶劣、百度别平拍摄环境亮度低、定制场景模糊的化图海洋实际情况导致海底观测视频品质差,视频中的像识鱼类识别难的问题以及现有鱼类识别方法存在的鱼类标注数据集过少导致训练的深度模型准确度不高的问题。
【方法】本文提出了一种基于百度EasyDL定制化图像识别平台的鱼类海底鱼类识别方法。首先使用伽马校正法和暗通道先验算法对图片数据进行预处理,识别提高图片亮度和清晰度,基于接着利用百度EasyDL定制化图像识别平台构建初鱼类识别模型,百度别平再使用数据增强等方法对模型进行调优,定制提高模型识别能力。化图海洋
【结果】实验结果表明,像识与其他识别方法相比,鱼类该方法可以有效提高鱼类识别的识别准确率。
1 引言
鱼类不但有一定的基于食用价值,而且还有很高的药用价值,所以世界各国对鱼类资源的开发和利用都非常重视,在对鱼类资源开发过程中,必须对鱼类进行识别,了解其分布情况,但鱼的种类繁多,形状大小相似,识别起来较为困难。因此研究鱼类识别的方法,对我国渔业资源的开发利用具有重要的学术价值和经济价值,对于鱼类的分布情况,传统的研究方法以出海捕捞为主,使用延绳钓探捕、拖网探捕等常用捕捞技术。这种传统调研方式固然有效,但是对于相关科研人员来说,由于调研过程周期长,耗费资源太多,而且结果存在一定的延迟性,大大影响研究人员研究成果的质量。还有基于声呐系统的方法,对鱼体回波信号进行处理分析,从声学信号中提取适于分类的特征进行识别,但是由于声呐系统会对鱼类造成一定的伤害,所以也不能频繁实施,针对上述问题,国家于“十二五”期间提出将全面推动国家海底观测平台的建设,其中就包括通过部署水下摄像器材来实时监控关键海洋生物的重要务,这样就可以通过分析观测视频来代替出海调研,而且保证了获得数据的实时性,能够极大地提高科研人员的研究效率。
传统的机器学习方法用于鱼类识别的实现过程为:获取鱼图像、提取特征、构建分类器,将特征向量输入分类器以实现种类识别。如:Phenoix等人[1]采用贝叶斯和高斯核混合模型对鱼类特征进行分层分类的方法来实现鱼的分类识别;杜伟东等人[2]提出了一种提取多方位声散射数据的小波包系数奇异值、时域质心及离散余弦变换系数特征,并进行特征融合,最后用支持向量机分类的鱼识别方法;虽然这些方法都可以实现鱼类识别,但是这些方法这类方法已不适用于当前的视频或图片数据,并且方法严重依赖于人工选择特征,而人工选择特征往往只能选择表层特征,很难挖掘出有鉴别力的特征。
和传统机器学习方法相比,近年来崛起的深度学习方法以数据为驱动,能够从大量数据中通过卷积等操作自动学习特征表示,很好的解决了人工选择特征的问题。Abdelouahid等人[3]和顾郑平等人[4]都提出了采用深度网络模型进行鱼类识别的方法,虽然这些方法在识别性能上都取得了引人瞩目的效果,但是依然存在以下问题:模型识别性能的提高需要大量的鱼类标注数据集用于学习训练,而标注数据工作费时且昂贵,故在实际应用中难以满足。
为此,针对以问题,本文提出了一种基于百度EasyDL定制化图像识别平台的海底鱼类识别方法。利用百度EasyDL定制化图像识别平台解决目标数据集训练数据过小和数据分布差异问题,而且通过引入伽马校正法和暗通道先验算法对数据进行预处理,使数据特征具有更好的辨别能力,同时使用数据增强方法对模型进行调优,使得训练得到的模型的泛化性更强。
2 相关工作
2.1 海洋鱼类识别系统
图 1 海底观测平台
海底观测平台的系统结构如图1所示,位于海面以下的水下接驳器统一接收来自各个传感器的采集数据,包括水下摄像器材采集的视频数据,然后将数据传输至位于陆地上的岸基站。岸基站接收并缓存所有来自海底的数据,按约定的协议和规则转发给大数据中心。大数据中心由多个子系统构成,负责对不同类型数据的转化、存储、处理、分析,其中包括本文将要研究的海洋鱼类识别系统,负责对海底观测视频的处理分析。本文采用开源计算机视觉工具软件OpenCV来读取视频数据,将视频分解为图片帧,同时使用背景差分算法过滤无用帧后,针对每一帧进行预处理和识别分析。
2.2 数据预处理
由于海底图像对各种噪声和干扰是比较敏感的,在不同光照条件下,悬浮物等都对最终成像和识别有很大的影响。而且从图像的形成过程考虑,图像采集是将一个三维目标映射成为一幅二维图像,不可避免会有信息的丢失,所以本质上图像就具有一种模糊性。另一方面由于海水的能见度低, 透明度只有空气的千分之一,使得采集到的图像信噪比较低、纹理模糊。再次由于海洋中各种悬浮物的存在, 也会对光波(也就是电磁波)产生散射和吸收作用 ,导致采集到的海底图像产生严重的灰白效应。再加上海流的影响以及摄像机镜头的抖动等因素, 造成图像部分失真现象等因素都会影响最终识别的效果。
下面是几幅比较典型的海底鱼类图像,我们可以看到,采集的图像的对比度都较低,图像较为模糊:
图1 海底鱼类图像图
因此,本文先使用提高亮度、提高清晰度对数据进行预处理的方法,尽可能消除亮度低和模糊带来的影响。对于提高亮度的方法,本文选择伽马校正法[5],使用指数函数调整每个灰度单元,计算公式如下:
(1)
亮度的变化由参数γ来控制:当γ<1时,pi,j[k]的值会变小,亮度会提高。反之,则pi,j[k]的值会变大,亮度会降低。
对于提高清晰度的方法,通过参考基于暗通道先验算法去雾的研究[6]。该研究认为雾天拍摄图片的模糊是由空气中的杂质对光的散射造成的。而海底拍摄图片的模糊也恰好是由水中的杂质对光的散射造成的,于是可以将其适用于海底拍摄图片,所以在该研究的基础上,针对海底环境的特点作了改进,对每个灰度单元进行优化,计算公式如下:
(2)
综合上述提高亮度和清晰度的过程,预处理的步骤如下:
图3所示展示预处理方法对图片品质的提升效果:
a原始图 b预处理后图片
图2 预处理效果对比图
从图3中可以看出,本文提出的预处理方法可以比较有效地提高图片的亮度以及清晰度。但是面对品质极差的图片,预处理方法也显露出了局限性,无法将其品质提高到鱼类各项关键特征都清晰的程度。
2.3 模型构建及训练
本文以台湾电力公司、台湾海洋研究所和垦丁国家公园在2010年10月1日至2013年9月30日期间,在台湾南湾海峡、兰屿岛和胡比湖的水下观景台收集的鱼类图像数据集合--Fish4Knowledge(F4K)数据集[7]作为实验数据。该数据集包括23类鱼种,共27370张鱼的图像,数据集如图4所示。
图3 Fish4Knowledge(F4K)数据集
将实验数据上传至百度EasyDL数据中心,如图4所示,采用百度EasyDL定制化图像识别平台构建鱼类图像识别模型,由于鱼类形状大小相似,品种差异小,可辨识性较小,故选择AutoDL Transfer算法进行模型训练,AutoDL Transfer模型是百度研发的AutoDL技术之一,结合模型网络结构搜索、迁移学习技术、并针对用户数据进行自动优化的模型,与通用算法相比,虽然训练时间较长,但更适用于细分类场景。如图5所示。
图4 数据上传
图5 模型构建
2.3 预处理有效性实验
为了证明本文所提预处理方法的有效性,本文在F4K数据集上做了原始的数据和基于预处理的方法的数据模型性能对比实验,实验在参数相同的条件下,使用百度EasyDL定制化图像识别平台对数据进行训练,评估对比结果如表1所示:
表2性能对比
表1的结果显示,在鱼类识别上本文所提的预处理方法比使用原始数据有更好的识别性能,准确率及召回率等各项指标都要远远好于使用原始数据训练的模型。
2.4 模型进一步调优
为了更好的提高模型识别的准确率,本文采用数据增强的方法对数据进行扩充,增加数据的规模,提高模型的泛化性能。以前,若想对训练数据进行数据增强的操作,需要手动调整图片来对模型训练样本进行扩展,例如旋转、移动、缩放、翻转图片等方式,过程如图6所示。
图6 数据增强处理
如今,EasyDL的图像分类模型训练中,可以通过平台提供的调参功能来自动执行上述增强操作,优化数据丰富度,开发者再也不用手工重复处理原始数据啦!
表3 数据增强后数据集大小
表4 数据增强后性能对比
2.5 模型对比实验
为了进一步证明本文模型的优势,将本文模型与其他模型,包括目前流行的深度网络模型VGGnet16、VGGnet19以及文献[3]中的PreCNN-SVM鱼类识别方法和文献[4]中Alex-FT-SVM鱼类识别方法,在F4K数据集上进行性能评估和比较,实验对比结果如表2所示。
表5不同方法的鱼类识别性能比较
表2的各种方法对比结果来看,本文的方法相对于其他方法识别准确率有较大提升,获得了99.6%的鱼类识别精度。本方法充分利用百度EasyDL定制化图像识别平台优势,可以很好地解决鱼类识别任务训练数据不足的问题,同时通过引入伽马校正法和暗通道先验算法对数据进行预处理,使数据特征具有更好的辨别能力,使用数据增强方法对模型进行调优,进一步提高了模型识别的准确率。
3 结束语
海底观测环境亮度低、场景模糊,导致采集的视频品质差,直接识别视频中的海洋鱼类效果不好。本文提出了预处理方法提高图片品质、百度EasyDL定制化图像识别等方法,实现对较差品质图片的准确识别。针对亮度低和场景模糊的问题,在预处理时首先使用伽马校正法提高了图片的亮度,然后参考基于暗通道先验算法的去雾研究针对海底环境的特点作了改进,提高了图片的清晰度。由于目前还没有大量标记数据,本文使用百度EasyDL定制化图像识别及AutoDL Transfer算法,解决了训练数据少导致模型效果差的问题。从实验结果可以看出,本文所提方法可以以高达99.6%的准确率识别海底鱼类的图片,验证了方法的有效性。然而,本文的方法还存在不足,其中的关键在于海底环境的特殊性,提高图片品质的预处理方法还没有完全结合海底环境的特点,提高图片品质的能力有限。下一步的研究工作将是深入分析、挖掘海底环境的特点,提出针对性更强的、更有效的预处理方法。
参考文献:
[1]Huang, Phoenix X., Bastiaan J. Boom, and Robert B. Fisher. "Hierarchical classification with reject option for live fish recognition." Machine Vision and Applications 2015,26(1): 89-102.
[2]杜伟东, 李海森, 魏玉阔, 等. 基于 SVM 的多方位声散射数据协作融合鱼分类与识别[J]. 农业机械学报, 2015,61(3):39-43.
[3]Tamou A B, Benzinou A, Nasreddine K, et al. Underwater Live Fish Recognition by Deep Learning[C]//International Conference on Image and Signal Processing. Springer, Cham, 2018,171(6): 275-283.
[4]顾郑平,朱敏.基于深度学习的鱼类分类算法研究[J].计算机应用与软件,2018,35(1):200-205.
[5]蒋明敏.基于FPGA的LCD伽马校正研究[D].南京,南京林业大学,2016:25-27.(JIANG M M.Research on LCD Gamma Correction Based on FPGA[D].Nanjing,NanjingForestryUniversity,2016:25-28.)
[6]HE K, SUN J, TANG X. Single image haze removal using dark channel prior[J]. IEEE transactions on pattern analysis and machine intelligence, 2011, 33(12): 2341-2353.
[7]B J, Huang P X, He J, etal. Supporting ground-truth annotation of image datasets using clustering[C]//ICPR. 2012,21(1): 1542-1545.
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
19
-
浏览
788
-
获赞
1
热门推荐
-
“铁拳”行动|侵犯注册商标专用权、经营未经检验检疫的肉类产品 广西公布“铁拳”行动典型案例
中国消费者报南宁讯记者顾艳伟)10月15日,广西市场监管局召开2021广西民生领域案件查办“铁拳”行动大案要案专题新闻发布会,广西市场监管局党组成员、副局长刘军通报了广西市场监莫雷托:想引进尼科巴萨必须出售球员,资金情况允许他们会尝试
7月5日讯据记者莫雷托报道,如果资金情况允许,巴萨会追求尼科-威廉姆斯。莫雷托在专栏中这样写道:“一名中场球员仍是巴萨的首要任务,他们仍在评估转会市场情况,看看什么是最佳选择。之前我们已经报道了,弗里华伦天奴与盟可睐 2018 秋冬羽绒服联乘系列发售
潮牌汇 / 潮流资讯 / 华伦天奴与盟可睐 2018 秋冬羽绒服联乘系列发售2018年08月25日浏览:3849 早前,两大奢侈品牌 Valentino 与 Moncl荷媒:利物浦尝试签下维弗尔,但布莱顿已与费耶诺德达成协议
7月5日讯 据荷兰媒体《电讯报》透露,利物浦也想签下维弗尔,但布莱顿已与费耶诺德达成口头协议。媒体指出,费耶诺德24岁中场维弗尔吸引了多家俱乐部的关注,利物浦和斯洛特希望签下这位防守型中场,他们已经积陕西省延安市质检院扎实做好延能化特种设备检验工作
中国消费者报西安讯袁江 翟亚维记者徐文智)近日,陕西省延安市质检院圆满完成陕西延长石油延安能源化工有限责任公司以下简称延能化)特种设备检验工作任务。延安市质检院60多名检验人员前后历时80余天,超量完UNDERCOVER x Nike React Element 87联名鞋款,四色齐曝!
潮牌汇 / 潮流资讯 / UNDERCOVER x Nike React Element 87联名鞋款,四色齐曝!2018年08月30日浏览:4112 昨日,我们刚为大2024艺术品投资前景解析,艺术品投资潜力无限 收藏资讯
艺术品,它们不仅仅是物质的体现,更是一个民族历史的见证和文化的传承。这些作品蕴含了无数代人的智慧和心血,反映了一个民族的精神面貌和审美追求。它们是全民族的宝贵财富,也是全世界共享的文化遗产。随着经济的《黑神话》PC最高与最低画质对比视频 来看看差距
《黑神话:悟空》采用虚幻5引擎打造,游戏画面非常出色。近日油管主ElAnalistaDeBits分享视频,展示了《黑神话》PC版最高与最低画质的对比,一起来看看有多大差距。对比视频:从视频中可以看到Pswisswin官方旗舰店双肩包(swisswin是什么品牌)
swisswin官方旗舰店双肩包(swisswin是什么品牌)来源:时尚服装网阅读:1870SWISSWIN瑞士十字双肩包怎么样,质量好不好吗自然是一流的水准。swissgear原本是威戈一个产品系列我院承办国家级继教项目“静脉药物配置质量与安全管理培训会议”
7月2-5日,由我院承办、四川省预防医学会静脉配制专委会主办的国家级继续医学教育项目“静脉药物配制质量与安全管理培训会议” 在成都峨眉雪芽大酒店召开,全国共两百多名药学和护理专家参会。四川省预防医学会余承东五十而知天命
对于华为消费者业务 CEO 余承东来说,2019 年 8 月 9 日无疑是一个极为特别的日子。这一天,出生于 1969 年的余承东迎来了他的 50 岁生日。同时,这一天也恰逢 2019 华为开发者大会adidas 三叶草与 United Arrows & Sons 发布全新联乘企划
潮牌汇 / 潮流资讯 / adidas 三叶草与 United Arrows & Sons 发布全新联乘企划2018年08月24日浏览:3368 追忆至上世纪,三年合同,年薪1500万欧,穆帅新下家曝光,新土豪或崛起争冠
被罗马队解雇之后,穆帅的下一站在哪儿引起了球迷和媒体的广泛关注。从罗马下课后,穆帅果断拒绝了来自沙特球队的报价,这说明穆帅认为他目前依然有能力在欧洲俱乐部找到新工作,没有必要为了钱而去沙特联赛淘金。据爆料称英伟达RTX 50系显卡功耗普涨 旗舰型号增加更多
爆料显示下一代Blackwell游戏显卡的功耗会增加,而且功耗的增加在新产品系列中的更高规格产品中会更加明显。此前实际上已经有一些关于RTX 50系列显卡功耗的爆料,显示该系列游戏显卡有可能将延续性能2024艺术品投资前景解析,艺术品投资潜力无限 收藏资讯
艺术品,它们不仅仅是物质的体现,更是一个民族历史的见证和文化的传承。这些作品蕴含了无数代人的智慧和心血,反映了一个民族的精神面貌和审美追求。它们是全民族的宝贵财富,也是全世界共享的文化遗产。随着经济的