The Wayback Machine - https://web.archive.org/web/20221029033315/https://baike.sogou.com/kexue/d11226.htm

AIDC

编辑

自动识别和数据提取(Automatic Identification and Data Capture 简称:AIDC)是指在没有人为参与的环境下,应用软件可以自动识别对象,并将对象录入计算机系统中,从中收集数据信息。自动识别和数据提取应用到的技术,包括QR码、条形码、调频频率识别(Radio Frequency Identification,简称DFID),生物识别(刷脸系统等)词条智能芯片和声音识别等。自动识别和数据提取也可称为“自动识别”、“自动数据”。自动识别的数据一般源于外部数据获取,尤其是图像音频视频分析所获得的数据。为了更好的数据提取,一般会用数据转换器将实际图片或音频转变成为数字文件,然后对这些数字文件会有两种处理方法:第一种,将数字文件存储在一个系统待用,然后用计算机做分析;第二种,将这些文件与数据库中的数据做对比,确认信息后授权进入另一安全系统做深入分析。

对于生物计量安全系统说,数据提取就是只获取和确认生物信息,例如指纹掌纹面部信息或声音信息。调频频率识别是一种1980年代产生的自动识别和数据提取技术。这种技术是自动数据收集识别和分析系统的基础。调频频率识别因其可以追踪动态对象而被广泛应用。它可用于车辆识别(Automated Vehicle Identification,简称AVI),生物识别等。这些无线的自动识别和数据提取技术,可以在没法使用条形码的情况下使用。

1 概述编辑

几乎所有的自动识别技术都有三个基本模块,这也类似于自动识别和数据提取的几个关键处理步骤:

  1. 数据编码器。编码是一组信号或标志,其背后的含义其实就是一串阿拉伯数字。当数据被编码后,所有的字节被转化成为机器语言,这些信息会被录入在一个标签或商标上。
  2. 扫描器或读码器。这个设备可以读取被编译的数据,然后将数据转化为对应的格式,一般来说是电子模拟信号。
  3. 数据解码器。这个步骤是将电信号转化为数码数据,再转化为数字字节。

2 从纸质文件中提取数据编辑

最适应的数据提取方法是从纸质文件中提取数据然后存储在数据库中。根据数据类型的不同有几种基本的数据提取技术:

  1. OCR(Optical Character Recognition)--光性文字的识别,即将图片中的文字或者手写的文字,用机器转换机器可以识别的文字。
  2. ICR(Intelligent Character Recognition)--智能文字识别,是一种高级的光性文字识别,可以识别出手写字体尤其是比较难以辨认的字体字形。
  3. OMR(Optical Mark Recognition)--标志识别, 这种方法可以读取人们在纸上做的标记,像是对勾等,一般是用在调查问卷、选择题答题卡的读取上。
  4. BCR(Bar Code Recognition)--条形码识别
  5. DLR(Document Layer Recognition)--文档层识别

这些基本方法可以从纸质文件中提取数据信息,然后再在商务信息分析系统中做下一步分析。

支持数据提取的文件可以分为三种:结构化文件、非结构化文件以及半结构化文件。

  • 结构化文件:指搜游文件都有固定的格式和样式(问卷、测试、保险单和退税单等),这种文件是最容易提取数据的,因为所有的数据字段都在文件的同一个地方。
  • 半结构化文件:指大体结构相同,但是排列方式根据项目多少或者其他参数的不同有所不同。这种文件中提取数据比较困难,但是还是可以提取出一些的。
  • 非结构化文件:文件内容会有结构上和样式上的灵活变化,例如信件,合同和文章等。

3 未来的发展趋势编辑

如果所有的易拉罐,书,鞋子和一部分汽车上都有微型识别器我们的日常生活将会发生翻天覆地的变化。供需不平衡而导致的浪费将不复存在,因为我们会很清楚的知道到底应该生产多少东西。偷盗现象也成为过去,因为我们可以随时追踪物品的所在地点。特殊物品以及贵重,例如药品、修理零件,和电子零件的假冒伪劣现象也会减少或消除,因为厂家或者供应链会全程追踪他们的产品。生产的浪费也会减少,因为环境传感器,会在不易存储的产品暴露在极端环境中时,向供应商或消费者发出警告。而供应链也会变得更有效率,因为厂家只会往有需求的地方发相应数量的产品。同时,零售价和成本价也会随之降低。1999年已经建立了全球自动识别商标协会,超过100家的大型企业和SAP、Alien等公司的技术部门展开合作,同时顶尖大学也加入了研发的团队。现在这项技术正在全球化的推广中。


[1][2][3][4][5][6]

  1. "Automatic Identification and Data Capture Market-Global Forecast 2023".
  2. "what is optical character recognation?".
  3. Margaret Rouse. "Barcode". TechTarget.
  4. "Optical recognition and data-capture".
  5. Waldner, Jean-Baptiste (2008). Nanocomputers and Swarm Intelligence. ISTE John Wiley&Sons. pp. pp.205–214. ISBN 1-84704-002-0.CS1 maint: Extra text (link)
  6. "Auto-ID Center: the new network" (PDF).

参考文献

  • [1]

    ^"Automatic Identification and Data Capture Market-Global Forecast 2023"..

  • [2]

    ^"what is optical character recognation?"..

  • [3]

    ^Margaret Rouse. "Barcode". TechTarget..

  • [4]

    ^"Optical recognition and data-capture"..

  • [5]

    ^Waldner, Jean-Baptiste (2008). Nanocomputers and Swarm Intelligence. ISTE John Wiley&Sons. pp. pp.205–214. ISBN 1-84704-002-0.CS1 maint: Extra text (link).

  • [6]

    ^"Auto-ID Center: the new network" (PDF)..

阅读 315
版本记录
  • 暂无