/ *从滑块中删除Meta的评论* /

用时间关联规则解决现实生活中的问题

经过|5月20日,2020年

研究人员讨论了如何从数据库中提取有价值的信息,以帮助紧急情况下的决策,如当前的大流行。

从不同领域收集的数据量导致了这样一种情况:从大型数据集中提取感兴趣的知识对于行业、安全、医疗保健和经济应用程序来说是一项非常有吸引力和挑战性的任务。

然而,在现实生活中,数据会随着时间变化或代表不同的时间情况,而这些时间信息通常包含在收集的数据中。如果没有适当地考虑这些时间成分,所提取的知识可能就没有用处,因为没有办法知道它在当前或未来的某个时刻是否适用。

有用的知识如“在收到7天的放射治疗后,癌症患者患有恶心和缺钙,”可以从癌症患者的数据库中提取,以帮助医疗保健提供者做出决定。此外,由于其与特定时间段或特殊事件或诸如体育比赛,飓风,或者当前目睹的特殊事件或紧急情况,或者我们目前目睹的特殊事件或紧急情况,这一知识可能被忽略了这一知识,这是一个大流行,需要为医院提供更高的个人防护设备供应个人。

关联发现是从大型数据库中提取知识最常用的数据挖掘技术之一。关联规则允许识别数据库中元素或值之间的依赖关系,并被定义为类型a→B的隐含表达式(事实a和B之间没有交集)。

例如,可以从医院的设备储存库中提取规则掩码→手套,表明大多数佩戴面具的医务人员也戴手套。这条规则可以帮助医院管理人员计划设备订单,但它没有传达每次时期需求的信息。在过去的几年中,已经在文献中提出了许多方法,用于从数据库中挖掘时间关联规则(TAR),这明确地考虑了时间信息。

在最近发表于电线数据挖掘和知识发现,格拉纳达大学和西班牙哈伊恩大学的研究人员审查了TARS领域的当前状态,以帮助学生和研究人员更容易定位与之相关的文章颞型问题他们正试图解决。

他们的研究证明了tar的巨大能力,可以成功地应用于广泛的现实问题。这是“工业、安全、医药和医疗保健领域的情况,医药和医疗保健领域的许多应用建议尤其值得注意,”作者解释说。

几种免费和开源软件工具可用于对不同问题应用于不同的问题,但很少有研究人员共享与其提案相关的源代码。出于这个原因,作者建议研究人员“分享他们提案的源代码,因为这将对更好的算法和适用于新科目和行业的适用性来产生非常积极的影响。”

作者探索了考虑时间信息的不同方法,如开发解决时间大数据问题的新方案(如物联网),利用MapReduce范式,深度学习,雾计算,而其他维度在知识抽取过程中(如空间)获得更完整、更准确的信息。对最大化/最小化某些单位利润的高效用tar的提取决定了其相关性——例如,用于医疗的药品的价格。

“这导致了一组潜在的增强技术的发展,因为焦油的发现允许我们获得具有更大预测和描述力的模型,提供额外的感兴趣,”作者结束。

Alberto Segura-Delgado,MaríaJoséGacto,RafaelAlcalá和JesúsAlcalá-Fdez的文章

note: Alberto Segura-Delgado等人。时间关联规则挖掘:将时间变量视为一个积分或隐含成分的概述,《连线数据挖掘与知识发现》(2020)。DOI: 10.1002 / widm.1367