首页>雅虎娱乐资讯

CTO专栏|INDASS数据分析

2017-07-08 10:37

INDASS 是智物联Mixlinker体系中的工业物联网数据分析服务系统(Industrial Data Analysis Service System),是智物联Mixlinker提供的工业物联网数据分析服务。
我们知道,智物联Mixlinker工业设备物联网的三大基础部分内容,分别是:
第一部分:工业设备数据采集、数据组织、数据发送到云平台——APRUS工业设备物联网适配器(Advanced Programmable Remote Utility Server)和APICO高级可编程工业物联网控制器(Advanced Programmable Internet & Industrial Controller);
第二部分:云平台数据接收、再组织、存储、快速检索,以及进行分发和交换
——GARDS通用异步远程数据服务(Generic Asynchronous Remote Data Service);
第三部分:数据的展现和相关信息的管理——FIDIS柔性信息与数据集成服务系统(Flexible Information & Data Integrated Service)。
 
这三部分是智物联Mixlinker工业设备物联网最基础的工作,他们都是围绕工业设备数据这个核心进行一系列相关工作的。
 
 
工业物联网数据分析
 
简称数据分析,是对工业设备数据更加深入的应用,其目的就是通过对这些数据深入计算和分析,找出数据的变化规律,从而分析出设备运行的规律。
 
数据分析包括两方面内容,分别是:小数据分析和大数据分析。
 
 
小数据分析
就是通过对最近一段时期(如几个小时、一天)之内各单台设备运行数据的分析,对单台设备当前的运行状态做出客观评估,并对单台设备在未来一段时间的运行情况进行预测,这就是INDASS。
 
大数据分析
就是根据一个(或多个)确定的分析命题,并基于同类或不同类多台设备(或设备群)所采集的,在相当长时间(如三个月、半年、甚至一年)的数据进行分析,达成(或接近)命题所要求分析结果。
 
要做大数据分析,我们需要做三件事:
第一:建立大数据分析的命题,并评估命题的可行性,命题就是我们想要知道的问题和答案。
比如,我们可以提出这样的命题:
 
“我们生产的柴油发动机的不同型号或者系列的一致性有没有差别?有什么差别?”
 
或者是这样的命题:
 
“我们生产的柴油发动机,在东北、西北、华中、华南等不同地域条件下,运行能耗有没有差别?有什么差别?有多大差别?是什么原因导致的这些差别?”
 
 或者是这样的命题:
 
“我们的柴油发动机,在不同的工况条件下,如内陆油田钻井平台、海洋钻井平台,发生故障的频率、故障的原因、故障的类型,有没有不同?有什么不同?是什么原因导致的不同?”
 
无论是什么命题,都需要对命题的可行性做出评估,因为并不是所有的命题都一定能分析出一个客观可信的结论。比如这样的命题:“我们的柴油发动机产品销售到某地,对该地的文教事业有什么影响”。这个命题,很显然我们是无法从柴油发动机的运行数据中找到答案。
 
第二:根据命题设计数学模型,然后基于刚才说的大数据,进行一系列的计算和分析。
 
这里说的是两个东西,一个是建立数学模型,另一个是计算和分析。怎么去建立数学模型呢?我们先忽略“数学”这两字,就说“模型”。如果我们用通俗的话来解释,那么模型可以简单理解成一个“模子”,就像我们做月饼需要 “模子”一样,把月饼的内容(皮儿和馅儿)放到模子里面再拿出来,就是月饼的模样。
 
我们用刚才说到的一个命题来举例子:“我们生产的柴油发动机,在东北、西北、华中、华南等不同地域条件下,运行能耗有没有差别?有什么差别?有多大差别?是什么原因导致的这些差别?”
这个命题的模子是这样的:
这个模子的意思是,我们把大数据按六个区域的数据进行过滤和区分,然后把每个区域的相关数据,也就是能耗以及跟能耗有关的数据特征进行计算和提取;然后我们再把提取出来的能耗特征进行比较分析。这个比较分析并不是盲目的,是需要按我们确定好的议题来:
 
(1)差别存在的比例有多少、从而判断差别是不是具有普遍性;
 
(2)差别现象是什么、差别表现在哪里;
 
(3)把差别量化,要分析出究竟不同的现象对应有什么差别程度;
 
(4)对应的差别现象、对应的差别程度,相对应的原因都是什么。
第三:就是刚才我们说的分析结果,输出报告。大数据分析给这个报告提供了明确的论点;大数据就是这个论点的论据;大数据分析就是这个论点的论证。
 
前面我们对“小数据分析”做了定义。
小数据分析,在设备物联网中非常重要,也非常实用。小数据分析与大数据分析不同,小数据分析的内容(也可以叫命题)是确定的,分析结果是需要迅速输出的(不像大数据分析,可以花两个月计算,三个月写报告。
 
准确来说,INDASS是一个“计算和分析”的服务或者工具。首先,INDASS可以提供一系列的基础计算服务,比如,积分计算、方差/协方差计算、方差/协方差矩阵计算、非线性方程计算、函数拟合计算,等等。这些计算实际上也是需要消耗大量计算资源的,也有一定的难度,因此,是不适合放在应用层面去计算。
 
其次,INDASS可以提供特定的分析任务,包括:设备运行指数计算、设备运行参数预测、设备数据稳定性计算。
 
设备运行指数
 
假如设备有180个参数,或者更多,这就带来很多问题,计算量非常大,即便我们能找到计算方法,也没法去计算。所以,我们只能一切从简,这就是指数。
 
设备运行指数计算
 
就是根据设备的全部(或部分)关键参数,通过一个算法,计算出一个单一数值,来表示这个设备当前的运行状况。一个设备可能有一百多两百个参数,这些参数之间的关联非常复杂,某些参数的变化,可能直接或间接导致其他一些参数的变化,某些参数的变化,可能会导致设备出现问题。指数就是我们用一个简单的方法,对复杂的设备系统进行“定位”。这就好比我们用“成绩”来说明一个学生的学习好坏;而用“智商”来衡量一个人有多聪明。
 
指数当前的水平,以及指数的变化,实际上从另一个侧面,反应了设备运行状态的变化。比如,某学生的这学期的学习成绩80分,只能说明该学生读书一般般。如果几个学期该生的成绩都是80左右,说明该生学习成绩还算稳定;但是,我们如果知道,该学生上学期的成绩是50分,那么,我们就知道,这个学生是在进步,应该鼓励表扬;相反,如果该学生上学期的成绩是95分,那么,该生肯定是退步了,需要找找退步的原因,是不是早恋了。
 
设备运行参数预测
 
INDASS提供的设备运行参数预测,准确来说,是“设备连续运行主要参数预测”。预测是一个比较复杂的事情,怎么去保证预测的准确性是个大问题。为了解决这个问题,我们根据预测的准确性,把预测分成不同的区间:10分钟、30分钟、1小时、3小时、6小时和24小时。这是因为在这个预测期间里面,预测的可信度基本一致。
 
INDASS的预测是非常有用的。比如,某个参数在30分钟区间的预测值超过了该参数的安全阈值,那么,就相当于我们为设备赢得了30分钟处理问题的时间,至少赢得了人员疏散撤离的时间。
 
需要说明的是,INDASS只是单纯的参数预测,而无法提供这些参数的变化,到底是不是正常,是不是会出现或者引发别的问题。
 
稳定性计算
 
INDASS提供的稳定性计算,实际上是设备主要参数的稳定性,也就是这些数据的离散程度计算。比如,柴油发动机的动力负载,如果一直保持在某个数值左右,变化幅度不大,那么就说明这个参数是稳定的;相反,如果这个数值忽高忽低,那么就是这个参数不稳定,变化无常。
 
但是,这些都是参数的离散程度,并不能说明整个设备的稳定性状况。
 
我们先确定一个假设:
如果一个设备有180个参数,每个参数的数据变化的幅度都很小,也就是说每个数据都很稳定。那么,这个设备运行一定是稳定的;反之,如果一个设备运行不稳定,那么,这些参数中,至少其中有一个(或者多个)数据是不稳定的。
这是一个重要的逻辑推理: 若A则B  那么 非B则非A。
 
然而,一台设备的运行参数之间是关联的,有时一个参数变化,而另一个参数也在同时变化的时候,并不能说明这个设备不稳定;或者说,当两个或者多个参数同时小幅度变化时,也有可能导致设备的不稳定。
 
刚才说了,尽管我们计算出来指数、趋势和稳定性,其实并不能说明这个计算结果代表了设备运行是什么状况,也不能说明设备这样下去会是什么结果。原因就是这些数据之间的关联关系非常复杂;这些数据以及数据的变化,对整个设备系统的影响面会是多大,也非常复杂。
 
这就是我们为什么需要引入智物联Mixlinker人工智能机器人服务系统 MAIRS(Mixlinker Artificial Intelligence Service)去做深度学习,并获得新的分析结果。
 
关于MAIRS的详细介绍以及原理和应用,请戳此《CTO专栏| MAIRS人工智能服务》
 
智物联将定期发布技术干货(由智物联CTO提供技术分享),关注“智物联网络”微信公众号,点击公众号对话框左下角“智物联”-“CTO专栏”,可获取最新干货。
咨询智子小助手:zhiwulian01(微信)

如有疑问或想了解更多,请咨询:0755-23740592

关注我们

  • 智物联APP 扫码下载
  • 微信公众号 扫码关注微信

深圳市智物联网络有限公司 版权所有 Copyright (c)2017 粤ICP备14064171号