现在的位置:主页 > 期刊导读 >

基于支持向量机的钢板缺陷分类问题的研究

来源:物联网技术 【在线投稿】 栏目:期刊导读 时间:2020-05-21 10:29

【作者】:网站采编

【关键词】:

【摘要】0 引 言 我国钢材制造产业迅猛发展,但钢板表面质量检测技术发展仍然缓慢,国内只有部分钢材生产商掌握了钢板表面质量检测技术,其余生产企业主要依赖于人工检测。在现实工业生

0 引 言

我国钢材制造产业迅猛发展,但钢板表面质量检测技术发展仍然缓慢,国内只有部分钢材生产商掌握了钢板表面质量检测技术,其余生产企业主要依赖于人工检测。在现实工业生产过程中,钢板表面可能会出现各种类型的缺陷,例如结疤、Z_划痕、K_划痕、污渍、裂纹等。受噪声、光照、钢板数量等因素影响,在后期图像处理过程中对采集的缺陷图像进行处理面临着很大的困难。基于已有的分类算法理论基础和实际工业生产环境,我们对缺陷检测和识别进行了深入研究,分析如何提高钢板表面缺陷检测准确度和识别精度,以提高产品质量、降低制造成本。钢板表面缺陷检测流程如图1所示。

图1 检测流程

1 数据预处理

钢板缺陷分类的数据源提供了1 941个数据,每个数据有34种信息字段。前27个字段描述了钢板故障相关信息因子,后7个信息字段描述了包括七种可能的缺陷类型,分别为结疤、Z_划痕、K_划痕、污渍、裂纹、压痕、其他缺陷。输入向量由27个指标组成,其中包括X最小值、X最大值、Y最小值、Y最大值、像素_区域等指标,这些指标近似描述缺陷的几何形状及其轮廓。所有的数据集存储在faults.csv中,为方便分类,我们需要对数据进行预处理,先将1 941个数据划分为两部分,即前1 000个数据作为训练集,后941个数据作为测试集。再将原有csv文件划分为两个子文件input.csv和label.csv,用于表示算法的输入、输出。label.csv的7列为虚拟变量,即如果板故障归类为“Stains”,则该列中将有一个1,其他列中将有0。缺陷钢板的部分数据信息描述见表1所列。

表1 缺陷钢板的部分数据信息描述

数 据 描 述 数 据 描 述X_Minimum X最小值 Edges_Y_Index 边y X_Maximum X最大值 Outside_Global_Index 外部全局Y_Minimum Y最小值 LogOfAreas 区域日志Y_Maximum Y最大值 Log_X_Index日志x X_Perimeter X周界 Log_Y_Index日志y Y_Perimeter Y周界 Orientation_Index 方向

高维特征量作为训练样本进行识别分类时,存在很多问题。维数太高使得计算过程复杂,会耗费大量时间,因此需要在计算时间和信息量间进行适度衡量,其一,希望通过降维的方式来节省计算量和时间;其二,希望降维后的特征量尽可能多得保持原来的信息。本文采用主成分分析法对特征向量降维。主成分分析法是实现特征降维的有效方法,本文首先对提取的特征值进行归一化处理,再通过PCA对缺陷特征进行降维,实现有效特征的选择。对上述七种缺陷提取特征,将27维特征向量降至11维。降维后钢板表面的缺陷分类准确率较之前提升2%。

(1)训练集共有M个样本,每个样本大小为m×n,对应的训练样本矩阵如下:

对矩阵进行向量化处理,式中,ai是指将第i个图像数据矩阵变成m×n维的列向量。

(2)计算M个样本的平均值:

然而,降低SHR是一个复杂的过程。乙苯经脱氢制苯乙烯是一个吸热平衡反应,产物中的摩尔数上升。因此,高温、低压、高蒸汽比的反应环境更有利于反应的正向进行。蒸汽不仅有助于推移平衡点向产物方向移动,而且还能防止过度焦化和催化剂的过度还原。如果SHR较低,则相应地导致转化率降低。让超低SHR得以实现且创造价值的唯一方法便是创新流程技术并使用高活性和高选择性兼得的催化剂。

(3)计算第i个样本与均值的差值:

当车辆处于运行状态时,在线缆的固定点附近,线缆会受到因车辆运动而造成的额外拉应力和压应力。这两种应力的大小和方向随着车辆的运动而时刻变化。因此,线缆固定点附近的线缆也会因此而发生形变,这对线缆的疲劳寿命影响很大。

(4)构建样本的协方差矩阵:

式中,A=[c1, c2, ..., cM]是差值矩阵。

宝马集团携豪华阵容亮相2018广州车展:全新BMW X5以王者之姿完成亚洲首发并宣布预售;创新BMW i8敞篷跑车开始接受订单,第七款宝马集团新能源产品将于明年正式进入中国;新BMW 1系三厢M运动版实现中国首发,首次将BMW M运动套装引入国产紧凑级车型当中;BMW摩托车旗下的全新BMW F 750 GS在中国首发并启动预售。

(5)求样本协方差矩阵的特征值和特征向量,构造特征空间。

上述法律人士同时表示,在司法实践中,罚金刑经常会遇到执行难问题,为了解决这一问题,有不少法院会以从轻处罚作为交换条件,促使被告人在正式宣判之前先缴纳罚金,从而解决“判了白判”的问题。所以,开庭前催罚金也就成了不少法院(尤其是基层法院)的普遍做法。

2 分类原理

2.1 支持向量机SVM分类原理

训练集如下:

式 中:xi∈ Rnyi∈ {-1,+1},i=1,2,…,Nxi为 第i个特征向量;yixi对应的标签;(xiyi)称为训练集T中的第i个样本点。

训练的最终目的是在特征空间划分出一个超平面,线性可分SVM利用间隔最大化距离求最优分离超平面。线性可分SVM学习得到的分离超平面为:

钢板缺陷的SVM分类模型的建立步骤:

SVM通过寻找支持向量使数据集间隔最大化,从而找到最优分割超平面。对于非线性可分样本,需要引入核函数。核函数能够将低维空间中的样本数据映射到高维空间,使得样本线性可分,其计算公式如下:

式中:φ表示从输入空间到高维空间的非线性特征映射过程。加入约束条件后,寻找最优分割超平面的过程可以看作是一个凸二次规划问题求解的过程。通过求解该问题,得到最优分类函数,其表达式如下:

式中,是只由支持向量确定的参数,能够用来调控最优分类平面。

2.2 基于Keras的神经网络分类原理

卷积神经网络属于前馈神经网络,本文是通过构建多个卷积层、汇聚层和全连接层交叉而成的一个网络,基于反向传播算法对划分出的训练集进行训练[1]。如果仅全连接前馈神经网络训练样本,则会导致参数太多、陷入局部最优。加入卷积神经网络后,通过局部连接、权重共享和等变表示,对神经网络进行二次优化。新加入的神经网络具有新特点:在超平面上平移、缩放和旋转不变性。基于Keras的神经网络模型采用序列模型和通用模型。序列模型各层之间是依次顺序的线性关系,在第k层和第k+1层之间可以加入各种元素来构造神经网络,这些元素可以通过一个列表来制定,然后作为参数传递给序列模型以生成相应模型。通用模型通过函数化的应用接口来定义模型,在定义模型时,从输入的多维矩阵开始,之后定义各层及其要素,最后定义输出层。输出层的值域对应钢板缺陷的类型[2]

3 实验结果与分析

3.1 基于支持向量机的钢板表面缺陷分类算法

3.1.1 钢板缺陷的SVM分类模型的建立

粉彩没骨花鸟画在改革开放之后,在持续传承传统的审美表现的基础之上,全新的、现代的审美表现上越来越受到艺术家的重视。在他们的创作当中,在全民注重创新的大背景之下,这种创新与变革的趋势愈演愈烈,从而使得当代粉彩没骨花鸟画的创作者们都绞尽脑汁创造新颖的绘画方式。

式中:xi为第i个输入向量,即样本集合中的向量;wxi对应的权值向量;偏置量为b,即超平面相对原点的偏移。得到的分类决策函数为:

(2)选择适当的核函数,通过参数寻优来构造支持向量机模型,常用的核函数形式主要包括线性核函数、多项式核函数、径向基型核函数和Sigmoid核函数。

在HFSS中根据优化好的单腔搭建双腔模型,在本征模式(Eigenmode)下采用双模匹配法来进行级间耦合、交叉耦合与端口耦合仿真,其文献[5]中讲述了耦合系数的提取方法。级间耦合仿真模型如图3所示,初始窗口W设为10 mm,设置耦合筋高度为变量h_cou,参考在CoupleFil中得到表2的耦合系数数据,仿真得到相应耦合筋的初始高度。同样在双腔之间采用添加飞杆的方式来实现容性的交叉耦合[6],最终仿真得到飞杆盘R_f的初始值为3.6 mm。

(1)对所给数据集进行划分,将其划分成训练样本集和测试样本集;

(3)基于步骤(1),搭建整体检测网络,并设置该网络对应的超参数,包括卷积神经网络[5]的层数、卷积核大小、卷积滑动步长、池化方式和激活函数类型;

在支持向量机分类问题中[3],采用Kaggle中提供的缺陷钢板数据集,钢板数据集共有1 941个数据,共分为7类,每个数据包含27个属性。在本题中,将所有数据分为7类,根据LibSVM和SMO解决缺陷钢板的多分类问题。支持向量机有2个重要参数,c-惩罚系数和kernel-径向基函数,默认c的参数为1.0,默认的kernel参数为Rbf。对2个参数进行调参,观察不同核函数和惩罚系数对分类性能的影响。分类结果见表2所列。

中华人民共和国宪法是国家的根本大法,是治国理政的总章程,具有最高的法律效力,宪法第五条规定实行依法治国,建设社会主义法治国家,公民的一切活动是有法可依的。宪法规定公民的六项基本权利中的公民的人身自由权利、批评建议权利、文化教育权利等,并没有规定读者权利,但这一权利具体分解到公民基本权利中加以确认,读者权利是公民的一项基本权利,读者获取文献信息的权利是不可或缺的,图书馆应该给予最大限度的尊重和保护,第四十六条规定中华人民共和国公民有受教育的权利和义务。

自2006年以来,中国旅游者的不文明行为因高层的重视而得到广泛的关注,但是至今,每到旅游旺季,旅游者的各类不文明行为就会见诸报端,比如乱扔垃圾导致景区被污染,站在历史人物的雕像身上拍照之类,这些典型的不文明行为常被人们指责为“中国人素质太低”,似乎对于景区而言,并不能实现有很效的管理,但根据本课题组的研究,景区在塑造和引导旅游者的文明行为方面,可以发挥切实的作用。并且只有旅游业的所有相关主体共同努力,才能够实现中国旅游者整体文明程度的提升,景区理应发挥其应有的作用。

表2 支持向量机SVM分类错误率

惩罚系数c 0.4 0.6 1 Rbf 0.190 3 0.189 6 0.190 1 Poly 0.170 2 0.169 2 0.178 9 Liner 0.189 4 0.190 0 0.190 1 Sigmoid 0.191 1 0.190 7 0.190 4 kernel函数

c=0.6,kernal=Poly时,SVM的分类误差最小,errorrate=16.92%。对于不同核函数的分类方法而言,采用Poly核函数的错误率最低,且其明显优于其他三种核函数,所以在缺陷钢板分类问题中,采用Poly核函数c=0.6的惩罚系数时,分类效果最好[4]

3.2 基于Keras的神经网络

(6)设置缺陷检测网络的训练超参数,包括优化方法、学习率、迭代次数、权重初始化策略、权重衰减参数、动量系数和数据增强方法;

在传统的小学语文课堂教学中,语文教师用来教学的全部资源主要是教材和教参。而教材因为篇幅的限制,内容非常少,学生能够习得的内容也十分有限。而信息化教学就可以改善这一现状。信息技术具有交互性、虚拟性的特点,可以实现资源共享。教师可以利用信息技术在课堂上引进很多教材上没有的内容,以此拓宽学生的视野和思维,提升学生学习效率和学习质量,促进学生全面发展[2]。

再者,鹅鼻“此山险绝”,绝少有人涉足(罕有至者),姚令威也是靠一位采药人的带领才到了这里。在离秦始皇树碑一千年之后仍是这样的一处寂静的高山荒岭,可以想象在秦朝时这里还该有多少荒蛮冷寂!秦始皇为什么要在会稽树碑?就是为了宣扬秦的威德,整顿越地风气,它实际上是一幅恩威并重的布告,一件震慑越人的武器。布告要使人处处看在眼里,时时悬在心里,才能产生慑服人心的作用。不把它放在离县城很近、人气聚集的禹庙、禹墓旁,而放到了人迹罕至的鹅鼻山,难道秦二世的脑子出了问题?!姚令威真是憨直得可以。

基于Keras的神经网络钢板表面缺陷分类算法步骤如下:

(1)选取适当的基准网络,然后使用faulty-steel-plates数据集对该网络进行预训练;

(2)对所给数据集进行划分,建立用于训练的专用缺陷检测数据集;

3.1.2 钢板缺陷的SVM分类模型实验结果分析

(4)搭建多级特征融合网络,并将其与整体检测网络合并,得到缺陷检测网络;

子空间跟踪技术递归地对每个样本进行干扰子空间估计,有效的避免了协方差矩阵Rxx的计算[14]。W.Utschick.给出了紧缩投影近似子空间跟踪(PASTd)算法[15]。PASTd算法首先对最主要的特征矢量进行估计,并将接收数据在该矢量方向上的投影从数据中移除。从而使次要的特征矢量成为最主要的特征矢量,并且仍旧可以从中提取出来[16]。重复进行上述过程,所有的期望矢量元素都可依次提取。PASTd算法过程如下所示。首先合理选择初始值e(0)。

(5)构建缺陷检测网络的损失函数;

3.2.1 基于Keras的神经网络钢板表面缺陷分类算法

(7)对训练集进行训练,使基准网络、多级特征融合网络和RPN共享卷积层和计算量[6]

(8)使用训练完成的缺陷检测网络执行钢板表面缺陷检测任务,得出缺陷类别。

神经网络简化图如图2所示。

老傣文文献的内容非常广泛,按总体涉及的学科角度,大略可分为哲学历史类(如《论傣族诗歌》《加都沙罗》等)、法律法规类(如《芒莱法典》《领主法律大典》等)、佛教经典类(如《三藏经》《尼滩龙》等)、文学艺术类(如《布桑改和雅桑改》《厘奉》等)、语言文字类(如《波腊纳坦》《木腊沙刹钠革》等)、天文历法类(如《巴嘎等》《呼啦》等)、医药医理类(如《档哈雅》等)、政治经济类(如《泐史》等)、农田水利类(如《宣慰田、头人田及收租清册》等)。

图2 神经网络简化图

神经网络[7]由多个卷积层和多个全连接层组成。首先由3个卷积层把来自输入层的数据逐步进行特征抽象,再进入2个全连接层进行特征关系和权重值计算,最后将结果输出到输出层。在卷积层中,使用tanh作为每层的激活函数,高斯核设置为3,初始输入维度为27。在全连接层中,使用dense类来定义完全连接的层,将层中的神经元数量指定为第一个参数,并使用tanh和Sigmoid分别作为这两层的激活函数,第一个全连接隐藏层有200个神经元,第二个全连接隐藏层有7个神经元,对应缺陷钢板的7种类别。导入Keras的相关模块,基于Keras构造上述模型,模型完整结构见表3所列。

表3 基于Keras的神经网络结构

l atten_1 (Flatten)(None,1620)0 dense_1 (Dense)(None,100)162100 dense_2 (Dense)(None,7)707 Total params:162,927 Trainable params:162,927 Non-trainable params:0 Layer (type)Output ShapeParam #conv1d_1 (Conv1D)(None,27,60)120 f

3.2.2 基于Keras的神经网络钢板表面缺陷分类实验结果分析

实验环境为Windows 10系统,编程语言为Python,神经网络学习框架为Keras框架,将上文提出的faulty-steelplates数据训练集进行特征提取与训练,Batch Size=32,Epochs=100,经过100步迭代,模型在训练集上所能达到的准确率稳定在92.2%左右,模型在测试集上所能达到的最高准确度为91.5%。基于Keras的神经网络钢板表面缺陷分类实验结果如图3所示。

图3 基于Keras的神经网络钢板表面缺陷分类实验结果

4 结 语

本文针对缺陷钢板分类问题提出了基于Keras的神经网络算法和支持向量机算法[8]的分类模型,首先采用主成分分析法[9]对这27维缺陷特征向量进行降维处理,将降维后的数据进行分类,分类结果对比训练集和测试集的准确率,表明基于Keras的神经网络算法优于SVM方法,保证了分类模型具有较小的损失,尽可能多地提高模型训练的精确度。因此,Keras神经网络[10]比SVM更适合缺陷钢板分类问题的研究,是一种具有较高使用价值的样本分类方法。

参考文献

[1]杨钟瑾,史忠科.神经网络结构优化方法[J].计算机工程与应用,2004(25):52-54.

[2]赵元庆,吴华.多尺度特征和神经网络相融合的手写体数字识别[J].计算机科学,2013,40(8):316-318.

[3]方向,陈思佳,贾颖.基于概率测度支持向量机的静态手写数字识别方法[J].微电子学与计算机,2015(4):107-110.

[4]李佳,刘振宇.SVM与BP神经网络在石煤提钒行业清洁生产评价中的对比研究[J].中南民族大学学报(自然科学版),2018(4):18-21.

[5]李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515.

[6]刘长征,相文波.基于改进卷积神经网络的肺炎影像判别[J].计算机测量与控制,2017,25(4):185-188.

[7]吕耀坤.基于卷积神经网络的实景交通标志识别[J].物联网技术,2017,7(1):29-30.

[8]郭显娥,武伟,刘春贵.多类SVM分类算法的研究[J].山西大同大学学报(自然科学版),2010,26(3):6-8.

[9]徐宁,刘权,孟坤.基于主成分分析法的空气质量评估及污染扩散研究[J].科学中国人,2017(z2):47.

[10]马湧,王晓鹏,马莎莎.基于Keras深度学习框架下BP神经网络的热轧带钢力学性能预测[J].人工智能技术,2019,43(2):6-10.

中图分类号:TP391

文献标识码:A

文章编号:2095-1302(2020)04-0033-03

DOI:10.16667/j.issn.2095-1302.2020.04.009

收稿日期:2019-11-05

修回日期:2019-12-03

基金项目:国家重点研发计划(2016YFB0700504);西安市科技计划项目(201805042YD20CG26(3))

作者简介:

丛 成(1986—),男,黑龙江双鸭山人,本科,高级工程师,主要研究方向为石油钻井工具设计。

吕 哲(1996—),女,陕西西安人,硕士研究生,主要研究方向为计算机应用。

高 翔(1974—),男,陕西西安人,博士,副教授,主要研究方向为计算机应用。

王 敏(1975—),女,陕西西安人,博士,副教授,主要研究方向为计算机应用。

文章来源:《物联网技术》 网址: http://www.wlwjszz.cn/qikandaodu/2020/0521/343.html

上一篇:基于物联网技术智慧化油田数据采集教学装置的
下一篇:基于物联网的发货保障系统设计