The Wayback Machine - https://web.archive.org/web/20221025114447/https://baike.sogou.com/kexue/d10718.htm

数据融合

编辑
来自两个来源(维度#1 & #2)的数据融合产生的分类器要优于仅基于维度#1或维度#2的任何分类器

数据融合是集成多个数据源以产生比任何单个数据源提供的信息更一致、更准确和更有用的信息的过程。[1]

根据融合的处理阶段,数据融合过程通常分为低、中或高三类。[2] 低级数据融合结合了几个原始数据来源,以产生新的原始数据。期望融合数据比原始输入信息更丰富、更综合。

例如,传感器融合也称为(多传感器)数据融合,是信息融合的一个子集。

人类是数据融合的一个主要例子。作为人类,我们严重依赖我们的感官,如视觉、嗅觉、味觉、听觉和身体运动。所有这些感觉的结合每天都在帮助我们完成日常生活中的大部分任务。这本身就是数据融合的一个主要例子。我们依靠嗅觉、味觉和触觉的融合来确保食物的可食用性。同样,我们依靠视觉、听觉和控制身体的运动能力来行走、驾驶和完成生活中的大部分任务。在所有这些情况下,大脑执行融合处理,并控制我们下一步需要做什么。我们的大脑依赖于上述感官所收集数据的融合。 [3]

1 地理空间应用编辑

在地理空间(GIS)领域,数据融合通常与数据集成同义。在这些应用中,通常需要将不同的数据集组合成一个统一的(融合的)数据集,该融合数据集包含来自输入数据集的所有数据点和时间点。融合数据集不同于简单的组合超集,因为融合数据集中的点可能包含原始数据集中没有包含的属性和元数据。

这一过程的一个简化示例如下所示,其中数据集α与数据集β融合,形成融合数据集δ。集合α中的数据点具有空间坐标X和Y以及属性A1和A2。集合β中的数据点具有空间坐标X和Y以及属性B1和B2。融合的数据集包含所有的点和属性。

输入数据集α 输入数据集β 融合数据集δ
X Y A1 A2
α1 10 10 M N
α2 10 30 M N
α3 30 10 M N
α4 30 30 M N
X Y B1 B2
β1 20 20 Q R
β2 20 40 Q R
β3 40 20 Q R
β4 40 40 Q R
X Y A1 A2 B1 B2
δ1 10 10 M N Q? R?
δ2 10 30 M N Q? R?
δ3 30 10 M N Q? R?
δ4 30 30 M N Q? R?
δ5 20 20 M? N? Q R
δ6 20 40 M? N? Q R
δ7 40 20 M? N? Q R
δ8 40 40 M? N? Q R

在这个简单的例子中,所有的属性在整个分析域中都是一致的,属性可以简单地分配。如将M?、N?、Q?、R?分配为M、N、Q、R。在实际应用中,属性是不一致的,通常需要某种类型的插值来为融合集中的数据点正确分配属性。

在一个复杂得多的应用中,海洋动物研究人员使用数据融合将动物跟踪数据与测深、气象、海洋表面温度(SST)和动物栖息地数据相结合,以探查和了解栖息地利用和动物对外部力量(如天气或水温)的反应。这些数据集显示了不同的空间网格和采样率,因此简单的组合可能会产生错误的假设,并污染分析结果。但是通过使用数据融合,所有的数据和属性都被整合到一个视图中,并在这个视图中创建一个更完整的环境图像。这使科学家能够确定关键的时间和地点,并对环境和动物行为之间相互作用形成新的见解。

在右图中,塔斯马尼亚海岸的岩石龙虾作为了研究对象。塔斯马尼亚大学的休·彼得森博士使用数据融合软件将南部龙虾跟踪数据(白天和晚上分别用黄色和黑色进行颜色编码)与水深和栖息地数据融合,创建了独特的4D龙虾行为图片。

2 数据集成编辑

在地理空间领域之外的应用中,数据集成和数据融合这两个术语的用法有所不同。例如,在商业智能等领域,数据集成被用来描述数据的组合,而数据融合是包含减少或替换的集成。数据集成可以被视为集合组合,其中较大的集合被保留,而融合是一种提高置信度的集合缩减技术。

3 JDL/DFIG模型编辑

20世纪80年代中期,联合主管实验室(Joint Directors of Laboratories)组建了数据融合子板(Data Fusion Subpanel,后来被称为数据融合小组)。随着万维网的出现,数据融合包含了数据、传感器和信息融合。JDL/DFIG 引入了一种数据融合模型,以将不同的过程分开。目前,数据融合信息组(DFIG)模型的六个级别是:

级别0:源预处理/主题评估

级别1:对象评估

级别2:形势评估

第3级:影响评估(或威胁改进)

第4级:流程细化

第5级:用户提炼(或认知提炼)

尽管JDL模型(1-4级)至今仍在使用,但它经常受到批评,因为它暗示这些级别必然是有序发生的,也因为它没有充分体现人在回路中的潜力。DFIG应模型(0-5级)探索了态势感知、用户细化和任务管理的含义。[4] 尽管存在这些缺点,JDL/DFIG模型对于可视化数据融合过程、促进讨论和共同理解非常有用,[5] 并且对于系统级的信息融合设计非常重要。[4]

3.1 应用领域

  • 地理空间信息系统
  • 土壤制图
  • 商业智能
  • 海洋学
  • 发现科学
  • 业务绩效管理
  • 智能运输系统
  • 顾客积分卡
  • 化学信息学
    • 定量构效关系
  • 生物信息学
  • 情报机构
  • 无线传感器网络
  • 生物测定学

4 多种交通传感模式编辑

来自不同传感技术的数据可以以智能的方式组合,以准确地确定交通状态。基于路边收集的声音、图像和传感器数据的数据融合方法,结合了不同的单个方法的优点。[6]

5 决策融合编辑

在许多情况下,地理上分散的传感器受到严重的能量和带宽限制。因此,某一现象的原始数据通常被整合为来自每个传感器的几个比特。当推断二元事件(即,H0或H1或)时,在极端情况下,只有二元决策信息从传感器发送到决策融合中心(DFC)并进行融合,以获得改进的分类性能。[7][8][9]

6 增强情景感知编辑

利用包括运动传感器、环境传感器、位置传感器在内的大量内置传感器,现代移动设备通常允许移动应用程序访问大量传感数据,这些传感数据可以被用来增强情景感知。使用信号处理和数据融合技术(如特征生成、可行性研究和主成分分析(PCA))来分析这些感知数据,将大大提高对设备运动和情景状态分类的正确率。[10]

参考文献

  • [1]

    ^Haghighat, Mohammad; Abdel-Mottaleb, Mohamed; Alhalabi, Wadee (2016). "Discriminant Correlation Analysis: Real-Time Feature Level Fusion for Multimodal Biometric Recognition". IEEE Transactions on Information Forensics and Security. 11 (9): 1984–1996. doi:10.1109/TIFS.2016.2569061..

  • [2]

    ^Klein, Lawrence A. (2004). Sensor and data fusion: A tool for information assessment and decision making. SPIE Press. p. 51. ISBN 978-0-8194-5435-5..

  • [3]

    ^"Penn State WebAccess Secure Login". ieeexplore-ieee-org.ezaccess.libraries.psu.edu (in 英语). Retrieved 2018-06-27..

  • [4]

    ^Blasch, Erik P.; Bossé, Éloi; Lambert, Dale A. (2012). High-Level Information Fusion Management and System Design. Norwood, MA: Artech House Publishers. ISBN 978-1-6080-7151-7..

  • [5]

    ^Liggins, Martin E.; Hall, David L.; Llinas, James (2008). Multisensor Data Fusion, Second Edition: Theory and Practice (Multisensor Data Fusion). CRC. ISBN 978-1-4200-5308-1..

  • [6]

    ^Joshi, V., Rajamani, N., Takayuki, K., Prathapaneni, Subramaniam, L. V., (2013). Information Fusion Based Learning for Frugal Traffic State Sensing. Proceedings of the Twenty-Third International Joint Conference on Artificial Intelligence.CS1 maint: Multiple names: authors list (link).

  • [7]

    ^Ciuonzo, D.; Papa, G.; Romano, G.; Salvo Rossi, P.; Willett, P. (2013-09-01). "One-Bit Decentralized Detection With a Rao Test for Multisensor Fusion". IEEE Signal Processing Letters. 20 (9): 861–864. arXiv:1306.6141. Bibcode:2013ISPL...20..861C. doi:10.1109/LSP.2013.2271847. ISSN 1070-9908..

  • [8]

    ^Ciuonzo, D.; Salvo Rossi, P. (2014-02-01). "Decision Fusion With Unknown Sensor Detection Probability". IEEE Signal Processing Letters. 21 (2): 208–212. arXiv:1312.2227. Bibcode:2014ISPL...21..208C. doi:10.1109/LSP.2013.2295054. ISSN 1070-9908..

  • [9]

    ^Ciuonzo, D.; De Maio, A.; Salvo Rossi, P. (2015-09-01). "A Systematic Framework for Composite Hypothesis Testing of Independent Bernoulli Trials". IEEE Signal Processing Letters. 22 (9): 1249–1253. Bibcode:2015ISPL...22.1249C. doi:10.1109/LSP.2015.2395811. ISSN 1070-9908..

  • [10]

    ^Guiry, John J.; van de Ven, Pepijn; Nelson, John (2014-03-21). "Multi-Sensor Fusion for Enhanced Contextual Awareness of Everyday Activities with Ubiquitous Devices". Sensors (in 英语). 14 (3): 5687–5701. doi:10.3390/s140305687. PMC 4004015. PMID 24662406..

阅读 74
版本记录
  • 暂无