公务员期刊网 论文中心 正文

电子文件管理下物联网数据管理浅析

电子文件管理下物联网数据管理浅析

摘要:通过介绍国外管理物联网数据的经验,得出物联网数据管理要根据物联网数据的属性和特点,依照GARP准则,拓宽NOARK标准,在电子文件管理系统中收集和管理物联网数据。基于这些管理准则,提出我国物联网数据管理要从物联网数据开放、元数据建模、数据保护几方面入手,提高物联网数据质量,实现物联网数据价值。

关键词:电子文件;物联网数据;数据管理;元数据;可信性

挪威的托马斯·索德林等学者应用GARP准则和NOARK标准,从宏观和微观相结合的角度,按照公开的和涉及隐私非公开的两种分类方式,分析芝加哥开放数据门户的水资源管理系统和挪威海关管理的用于识别车辆的ANPR系统的数据管理,从这两个案例分析中得出物联网数据的管理方法,他们建议在灵活的电子文件保存系统中收集和管理物联网数据,从而更好地实现信息治理。

1物联网数据的属性及其与文件的关系

物联网数据要按照生成、利用、保管的流程来统一管理,对数据的管理贯穿其整个生命周期。物联网数据也像文件一样可以被移交、分类、保存。而一些档案馆的电子文件最早都是来自部分数据库的数据集。数据集以两种方式分类编目,一种是作为数据,一种是作为电子文件。因此挪威的学者认为可将物联网数据看作文件来对待和管理,在一个灵活的电子文件保存系统中收集和管理,可以实现更好的信息治理。希望使用标准方法来避免潜在的供应商锁定情况,并确保互操作性。由此可见,做好电子文件管理是完成物联网数据管理的前提条件。

2国外电子文件管理的准则在物联网数据管理中的体现

国外有影响力的电子文件管理规范有GARP和挪威的NOARK。GARP(GenerallyAcceptedRecordkeepingPrinciples),就是通用的电子文件管理准则,主要包含八条内容:可问责、透明度、完整性、保护性、合法性、可用性、保管和处置。这些准则构成了一个广泛使用的全球标准,确定了记录管理、记录和信息管理(RIM)以及信息管理程序的关键特征和良好实践的高层框架。该原则以实践经验为基础,基于对法律原则和信息论的广泛思考和分析。它们的目的是为组织提供管理信息的行为标准和判断行为的准则。[1]NOARK准则包含了电子文件保管标准,从电子文件创建到最后的处置都有体现。在2019年,它的标准进一步明确了应用程序编程接口,NOARK也是保存标准,它是XML表的具体表现。NOARK以全宗为目标,在某种程度上,NOARK标准可以被看作是关于收集和全宗的正确阐释。NOARK标准还提出一个元数据模型来管理中央元数据以及电子文件。

2.1问责制Accountibility。指高级行政人员应负责将信息管理工作交给适当的个人。在芝加哥的行政命令中,设立了向首席信息官报告的首席数据官。芝加哥的开放数据门户是根据市长的行政命令建立的,问责制要求高层管理人员对政策的实施效果进行监督。托马斯·索德林认为将物联网数据当作电子文件对待,并在电子文件管理系统中管理这些数据,这样的做法会让公共机构更符合问责原则。当描述处理物联网数据时,作为信息管理者要特别关注物联网数据的隐私问题。而开放数据访问也应该遵循可问责原则。

2.2透明度Transparency。一个组织的业务过程和活动,包括其信息治理计划,应以公开的和可验证的方式进行记录,该文件应提供给所有人员和适当的相关方。透明度原则要求过程是公开的和可验证的,涉密和不涉密的案例都体现了数据的透明度,而透明度原则不应该泄露组织机构职能的秘密。芝加哥开放数据门户符合透明度原则,在开放门户内,向任一访问者提供关于数据的描述。挪威海关有限的ANPR系统信息,也是为了避免泄露太多操作信息。

2.3完整性Integrity。建立信息治理方案,使组织产生或管理的信息资产具有真实性和可信性的合理保证。设备的质量和位置,数据收集的多端点和物联网设备供应商的多样性和产品的不兼容性,都会影响数据的收集质量。因此在物联网数据管理过程中需要形成一种可信机制。NOARK标准从遵循保护原则和开放性两方面确保完整性原则,这一标准也支持其它完整性机制,比如校验数据可以集中覆盖上传的文档,来源于物联网的数据转换成文档的可以被这样的固定信息覆盖。

2.4保护性准则Protection。保护性准则指应制定信息治理方案,以确保对私有的、机密的、特权的、秘密的、对业务连续性至关重要的或其他需要保护的信息资产有适当程度的保护。物联网中数据的保护性原则包含两方面内容,一方面指保护物联网设备的安全,另一方面指网络传输的数据隐私保护。在NOARK标准中,保护性准则体现在电子文件管理系统中关于用户、组织和职责的明确详细的要求和规定以及合理的访问控制机制。物联网数据的保护性方面,利用最终的API可以保证物联网设备在间隔时间内向文件保存系统推送定义好的一组信息。学者们认为挪威海关总署汽车管理案例是在汽车管理系统中出现的问题,没有体现保护性准则。在这个案例中没有明确规定访问数据的主体,缺少数据安全的文档。

2.5可用性Availability。可用性准则是指组织应维护其信息资产,以确保其及时、有效和准确地检索。物联网数据的可用性有即时和可用两方面涵义。数据检索是捕获物联网数据的重要意义所在,开放数据门户和NOARK-API一样体现了数据检索标准。在数据收集方面,物联网数据具有即时性;在数据检索方面,检索界面应该易于使用,并适用于元数据的描述。查询规范协议是可调整的,在有界区域内检索。可用性原则还需要物联网电子文件管理系统应用现代的REST-BASEDAPI方法,系统将需要通过及时检索文件来处理大量数据,支持快速解决各种领域物联网数据的弹性方法来搜索。

2.6合法合规性Compliance。信息治理计划的构建应符合适用法律、其他有约束力的权威和组织的政策。ANPR-data案例表明挪威海关总署在信息收集方面侵犯了个人隐私,超出了相关的法律规定范围。虽然立法会滞后于技术更新,但是收集物联网数据的公共机构必须遵守法律和规定。

2.7保管Retention。保管准则是指组织应考虑其法律、法规、财政、运营和历史要求,在适当时间内维护其信息资产。物联网关于数据保存没有明确要求,保管性是个宽泛的专题,但对于维护公民个人合法权益是必不可少的。保管期限保证电子文件根据不同的职责内容保存足够的时间。保管期限也覆盖了保存的各方面,在电子文件生命周期中也适用。芝加哥的开放门户提供了电子文件保存的易保存格式,甚至允许利用者下载全部的数据集,包括一些附加的元数据。车辆识别案例看起来是多数电子文件在短时间保存后删除,需要被保存的是可能受关注的车牌,它应该被控制。在某些特定阶段,这样的电子文件出于长期保存的原因应考虑迁移的问题。NOARK标准还定义了与XSD表相关的元数据保存模型,描述是可扩展的,可以覆盖这里提到的案例。

2.8处置Disposition。处置原则,组织应根据适用法律和组织政策,对不再需要维护的信息资产提供安全和适当的处置。处置功能是电子文件保存系统必须支持的基本功能。物联网数据的保存和删除要求有待进一步明确。欧洲通过GDPR立法加强关于个人信息的定位、检索和删除的要求。在挪威的汽车管理系统案例中,体现了对数据的保存和删除的需要。挪威海关没有按照法律法规要求处置数据,存在侵犯隐私的问题,因此被挪威数据保护局给予罚款的处罚。文件保管是依据它的价值而定,但物联网数据的价值是潜在的,有时是以长期价值的形式存在,因此物联网数据的保存有时采用实时保存方法。根据标准化的方法,处置是自动和电子文件相关,保证数据在特定的时间删除。如果有特殊延长保存电子文件期限的要求,那么会有个别文件的特定迁移规则。随着物联网数据的增长,需要处置功能的要求更加明确。因为有些数据的价值比较小,比如个人的文件,或者另一些数据没有历史价值。实时性的数据可能会被删除,受隐私法保护的数据要求被自动处置,组织的问责制和透明机制不能保证数据处理的合法性和合规性。信息安全是体现保护性和完整性原则的要求。对于涉密数据要协调处理数据收集和隐私权保护之间的关系。随着信息共享的扩大,应该有保留或者删除数据的要求,以保证在合适的时间自动处理数据。建立在物联网门户基础上的合理的电子文件保管原则来处理物联网数据的快速增长,这也许会帮助政府机构找到最好的管理物联网数据的方法,研究出超越电子文件保管标准的方法,帮助避免供应商锁定和供应商竞争。

3面向物联网数据,拓展NOARK的电子文件保管标准

物联网数据的异构性和难以捉摸性导致无法找出一种普遍的标准化方法来管理,但是研究建立在标准基础上的方法来管理物联网数据是有价值的。因为标准化可以提高互操作性、可以避免潜在的供应商锁定问题。将物联网数据管理方法建立在保存电子文件的标准上是可行的,应用弹性的API可以处理高难度的数据异构性,这样的数据处理标准包括弹性和可扩展的元数据模型;可扩展的元数据保存模型;捕获和检索物联网数据的标准化搜索协议;支持保存和处置功能。NOARK标准在API描述方面符合以上要求,即使这里的元数据标准是弹性的,但是在不打破一致性的前提下,标准的拓展程度还是受限的。[2]这里数据模型的拓展要注意是否涉密的物联网数据。对于涉密的物联网数据,或特殊数据保存要扩展文件实体,这个包括定位、时间戳等特性,将相关捕获的图片与相应的文档元数据一起保存。建立NOARK的弹性API模型,捕获和检索物联网数据,有两种记录方法,文档法和文件法。iso15489标准中电子文件和文档的区别描述是,文档是结构化和非结构化信息,所有的电子文件都是文档,但不是全部的文档记录。文档可以编辑,直到文档成为电子文件。而NOARK中文档是关于格式描述和附加的元数据。文档法可以设为适合档案保存的格式,文件法要为保存和迁移数据作准备;通过拓展元数据模型,使之更易检索,实体扩展和添加属性帮助物联网数据在类和文件的基础上聚合记录。在芝加哥水管理系统方面,运用拓展NOARK标准的方法,文件法适用拓展实体并添加相关属性,将记录的水质价值作为文件。文档法和文件法都将水质读数记录放在电子文件保存结构中,为了保存的目的而迁移数据也很重要,文件法还提高了数据的易检索性。在ANPR案例中,NOARK的元数据模型拓展意味着处置规则可以自动和电子文件关联,确保在合适的时间删除文件。合理的访问控制机制可以减少挪威数据保护局对其的批判,因为信息的安全是保护性和完整性原则的基本要求。

4物联网数据管理带来的启示

4.1建立一体化物联网数据开放共享体系,实现物联网数据的集中管理。物联网数据可能代表存在于电子文件管理系统中一种新类型的数据和文件,物联网数据更具有可变的特性和要求,这容易导致潜在的大量实时数据和非实时数据。因而会带来数据交换的不连续。如果这种数据数量增加,会阻碍数据的检索,影响可用性和检索性原则。实现物联网数据开放,还离不开标准化的数据原则和数据管理流程,这需要建立起真正统一的物联网数据生成、使用、反馈、评价标准,进一步提高物联网的数据质量,消除因数据标准缺失产生的无效数据和虚假数据,克服数据价值化的障碍。

4.2加强元数据管理,实现物联网数据管理的标准化。建立元数据模型是实现物联网数据的自动收集和管理的一种有效方法。通过数据建模,根据业务上下文和解决方案上下文,建立一个合适的元数据标准。在数据流程设计方面,根据业务类型或条件设计业务规则,建立元数据模型要遵循元数据的灵活性、可扩展性、可检索性导向,提高收集的物联网数据标准化程度。分开保存元数据和物联网数据,实现内容检索和数据价值挖掘。由于物联网数据量巨大,而元数据相对数量较小,可以将元数据单独保存,方便对物联网数据的检索。

4.3建立安全机制,保护数据隐私和信息安全。物联网数据安全指的是遵循数据机密性(Confidentiality)、完整性(Integrity)和可用性(Availability)3个原则(即CIA原则),以保证物联网的数据安全。在设计阶段,要充分考虑隐私、数据保护和信息安全统一的要求。根据这些要求,制定相应的策略管理,包括数据收集策略、数据存储策略和数据安全策略等。数据安全策略可以从法律层面和技术层面两方面来实施。法律层面,具有约束力的法律和高水平的数据保护法结合,可以实现物联网技术的保护性和可信性的选择。数据保护立法应具有一致性和专业性,要考虑国际上的协调性。国际上已有欧盟的《通用数据保护条例》(GDPR),我们的数据立法可以考虑纳入这些默认的数据保护条款。新一轮的网络安全立法要补充数据隐私的协议,隔离物联网设备,监控数据记录。隐私保护除了考虑不泄露信息,还要考虑数据应用。技术层面可以应用加密技术和区块链技术,制定适当的隐私策略。根据灵敏度对数据分类,依据个人识别信息、敏感信息、安全信息和公开信息等分类管理。然后要考虑到物联网的多个系统,多个登录点,分布式方法,互操作的方式,结合具体的安全策略,建立访问控制模型,对数据的访问和操作进行控制。明确定义获取数据的主体权限,从主体、客体和控制策略这些要素着手,通过身份认证、授权、文件保护和审计等主要功能,实现访问控制,应用数据加密等技术确保数据隐私,基于数据的粒度访问每部分数据,保证系统资源的合法性、完整性和时效性。

4.4发展监管制度,实行第三方监管,保证物联网数据的可信性。法律不能涵盖所有数据安全问题,欧洲的《一般数据保护条例》和美国的《2015年网络安全法案》,都在努力利用监管的方式来平衡技术创新与数据主体利益的保护关系。美国的联邦贸易委员会依据《联邦贸易委员会法案》的规定,对没有采取充分措施保护消费者数据的组织加以惩罚。法律赋予第三方机构以相应的权力确保物联网设备供应商的行为符合公平和公正的要求。我国的《数据安全法(草案)》和《个人信息保护法》,都体现了寻求发展和安全的平衡,不同利益主体之间的平衡,各国家、各地区、各部门要主动担负不同的监管职责。

作者:黄睿 单庆元 单位:大连工业大学档案馆