公务员期刊网 精选范文 地理信息概述范文

地理信息概述精选(九篇)

地理信息概述

第1篇:地理信息概述范文

[关键词]数字图书馆 语义模型 信息抽取 本体

[分类号]G250.76

1 引言

语义是指“数据(符号)”所指代的概念的含义以及这些含义之间的关系,是对数据的抽象或者更高层次的逻辑表示。语义通过两种途径产生:①人类赋予;②通过计算模型产生。通过第二种方式产生的语义可以被计算机理解和处理,可以被获取、传递、共享。根据实体资源(如文本和图像)来产生语义或挖掘出信息所蕴含的隐性语义是一个挑战性的任务。基于统计的聚类分析、共词分析、信息抽取和挖掘技术可以帮助实现语义的自动抽取。实现的关键在于建立一个语义模型,该模型既适用于显式语义,又适用于通过显式语义挖掘推导出隐含语义。语义模型是通过模型作为媒介来实现数据语义关系形式化描述的一种方式。基于本体的语义模型是通过以本体为核心的模型作为媒介,实现数字资源语义关系形式化描述的一种方式。本文基于本体构建了语义模型,并基于该语义模型探讨数字图书馆知识组织过程中信息抽取策略。

2 信息抽取与本体

信息抽取是从分布的、异构的文本中提取出特定的事实信息,将其中隐含的语义提取出来并以更为结构化、更为清晰的形式表示,为用户使用提供便利。信息抽取与语义标注总是融合在一起、互相支持的;信息抽取需要在语义标注的基础上进行,语义标注的内容是经过信息抽取提取出来的。因此,目前对于信息抽取研究离不开对抽取对象的语义分析和描述。语义分析与描述技术的研究热点是本体技术。

本体是对面向计算机语言的、已被组织的知识的描述,而信息抽取是面向自然语言,分析文档表达的事实和从这些文档中提取相关信息片段。信息抽取和本体是相辅相成的:作为抽取相关信息的理解程序,本体被用于信息抽取,是信息抽取的语义知识依据;信息抽取可以丰富本体,因为信息抽取出来的文档可以作为设计和丰富本体的知识资源。

这两方面的任务被结合在循环中(见图1)。本体可以有效地、准确地、解释信息抽取出来的数据,而信息抽取从文档提取出来的新知识可以整合进入本体从而丰富本体。

2.1本体对信息抽取的支持

在抽取过程中,本体知识对文档的语义解释具有重要作用。

本体对领域概念以及概念的多种形式进行了规范性说明,因此在信息抽取中可以用来进行字符串的语义分析,进而进行概念识别;在信息抽取过程中,需要领域本体对文档中实体名称进行识别与分类。本体中的类可以对信息抽取文档进行概念识别、语义标注和概念规范。

本体的概念层次结构。传统信息抽取的重点是使用同义词集而不是层次关系。例如,在wordNet中,同义词集可以用于语义标注和消歧,但上下类关系还需要本体参与。本体中包含的语义类型或语义的层次关系,有助于通过抽取内容进行推理和忠实释义。

更先进的信息抽取系统也需要利用领域本体的概念节点、概念节点的属性和相互关系予以描述。本体中的概念与属性值能够清楚地描述信息抽取对象的本质。对于文档中抽取对象的分析既能提高自然语言处理,又能指导概念框架的实体构成,而相应的规则即是基于短语模型,更多是基于语义分析的。

领域概念模型。领域概念模型本身用于推理,它能合并不同表现形式的同一概念,并且能够揭示出隐含的语义。

2.2信息抽取对本体的丰富

本体构建一直是公认的语义进程中的瓶颈,而信息抽取有助于本体构建。已经提出各种方法用于语料库的建设以利于本体构建,如基于规则的信息抽取即是对本体构建方法的补充。基于推理规则抽取出基本数据,通过已有本体对该数据进行概念及概念关系分析,在此基础上将数据中新的概念或概念间的新关系整合到本体。

实体命名抽取:实体命名通过在本体中以实例的形式表示。从这个角度看,需要自动地不断地为本体增添一些热门领域的实体名称。而信息抽取被广泛应用于识别和分类文档、网页、数据库等中的实体。

关系抽取:在结构化本体中,概念与概念之间存在着语义关联。目前从文档中获取本体关系的方法主要有三种:基于共词分析方法、基于知识库方法和基于信息抽取模式方法。信息提取模式方法提升了前两种方式:第一种方法需要对基本关系类型进行解释,而信息抽取中的规则就是特色化关系;第二种方法原有的知识可以帮助设计一个提取规则。

信息抽取通过本体进行基于领域的语义分析,提升信息的语义性,为智能检索打下基础;本体通过信息抽取不断学习,不断演化,解决本体构建的瓶颈问题。鉴于此,本文基于本体构建数字图书馆知识组织语义互联的语义模型,利用语义模型探讨语义互联实现过程中各个重要环节的策略,进而最终完成数字图书馆知识组织的语义互联。

3 数字图书馆互联的语义模型

语义模型是对内容语义、语义类型及语义关系进行描述和组织的机制,它试图在用户的信息需求和信息资源之间搭建一座桥梁,将两者灵活而有机地结合起来,从语义的角度来解析信息资源,进而从互理解的角度来提升用户检索的准确度和召回率,更好地满足用户的信息需求。语义模型是影响数字图书馆知识组织语义互联的核心要素。本文构建了以元数据、领域本体、桥本体和本体解析体系为组成要素的语义模型,利用语义模型实现数字图书馆知识组织过程中的数字资源、用户需求表达的语义解析,完成数字图书馆用户交互层、内容管理与功能层、内容层之间的语义映射。其中,元数据进行资源的标准化描述,领域本体进行概念以及概念之间关系的语义标注,桥本体用于资源之间语义聚合,本体解析主要解决本体的具体效用发挥的方式,如图2所示:

3.1元数据

元数据是数字图书馆用来解决语义互联的重要基础工具。数字图书馆由资源构成,而资源是可以被标识的。元数据提供了对资源各种属性的描述。元数据通过定义数字图书馆中资源的信息结构以及定义由数字对象构成的资源库的组织结构,决定着数字图书馆知识组织和知识服务方式。元数据发展比较成熟,已经形成完整规范的元数据体系,包括元数据格式、元数据标准、元数据方案、元数据应用纲要、元数据注册系统等等,这些为数字图书馆知识组织语义互联打下了基础。

3.2领域本体

领域本体是知识组织体系中重要组成部分,其目标是捕获相关领域的知识。领域本体是对领域内共享概念模型的明确的形式化的规范说明;概念以及概念之间的关系是经过精确定义的,提供了对领域知识的共同理解与描述,能够为计算机所使用并可用数学方

式表达。在领域本体技术驱动下,信息资源以全新方式进行组织,组织原理发生如下改变:①从用户可理解到机器可理解;②从信息描述到知识表现;③从语义隐含到语义揭示;④从“以概念为中心”到“以概念一关系为中心”;⑤从信息表示到智能推理。这些变化要求知识组织理论、形式、方法、技术、体系以及知识组织过程都要随之改变,实现对资源从语法层面向语义层面深入,最后直至语用层面的组织,在获取、表示、加工、存储、重组、提供、共享、利用、控制等知识组织过程中,充分体现语义性,在数字图书馆系统的各层之间,在用户、资源、服务之间,形成语义互理解和互操作。

3.3桥本体

桥本体是一种特殊的本体,完成不同领域本体概念之间关系的映射,进而实现本体整合,形成领域内的共享本体。桥本体记作Obridg。,可以用一个六元组表示:

Obridge={cb,Acb,Rb,Arb,hb,xb}(1)

其中,cb表示桥本体概念的集合,Acb表示桥本体概念所对应的属性集的集合,Rb表示桥本体之间关系的集合;Arb是桥本体之间关系所对应的属性集的集合,Hb代表了概念的层次结构,xb是一系列公理集合。

在概念上,桥本体具有四层树形结构(见图3):第一层是最普遍的概念,标记为T;第二层具有概念桥和关系桥两个概念,它们分别表示了两种不同的桥关系;第三层由10种不同类型的子类桥组成;第四层是一系列动态创建概念的集合,它们的属性描述了不同本体之间关系的信息。其中上面三层是固定的,称之为静态层,第四层的概念是根据已知的多本体动态产生的,为动态层。

3.4本体解析体系

数据存储模式的选择直接影响使用的效率。本体是系统多层之间语义联系的纽带,因此本体、桥本体的存储方式影响数字图书馆知识组织和知识服务的质量。本文选用的本体描述语言为W3C推荐的OWL,将其存储到关系数据库。关系数据库存储本体既有缺点,对本体含有的丰富语义缺乏精准的表现,又有无可比拟的优点。已有文献对本体到关系数据库模式映射进行了详尽的阐述,在此仅谈及桥本体的解析。

根据桥本体的概念结构和关系数据库的形式化定义,下面给出它到关系数据库模式的映射规则。

以桥本体建立数据库,取名为database-brid―geO。

桥本体中的十个桥关系分别为桥本体的子类,分别以这十个桥关系建立十张表,表名为table―Bcequal、table_BCdifferent、table_BCisa、table_Bcinstan―ceof、table BCoverlap、table BChasa、table_Beopposed、ta-ble_BCconnect、table_BRsubsume和table_Brinverse。

将桥本体的属性映射为各个表的属性,属性类型为字符型;各表属性个数并不相同,主要包括三类:一类表示具有该种桥关系的两个领域本体的名称;一类表示具有该种桥关系的领域本体的类名称;一类属性代表该类所对应表的地址。

属性值分别取值为领域本体名、领域本体中类名和类对应的表名。

不同领域本体概念之间的关系构成表中的记录。

表中的主键为复合主键,由不同领域本体名称和不同概念名称组合而成。

4 基于语义模型的信息抽取策略

抽取对象是异质的、异构的、多语种的、半结构化甚至是非结构化的,并且可能存在着语义模糊、语义缺失,因此对抽取对象实体命名识别、实体间关系的识别变得更加困难,需要多种技术协作完成。语义模型能有效协助信息抽取:利用元数据对数字信息资源和用户信息资源进行规范化描述,利用领域本体集和桥本体实现数字资源和用户信息资源语义关系形式化描述,而语义模型中本体解析体系为信息抽取为利用本体提供了途径。因此,利用语义模型可以有效地进行实体命名识别和信息抽取规则制定。基于规则进行信息抽取能有效过滤掉噪声,增加新的结构信息。大体过程如图4所示:

4.1数据采集和数据清洗

通过各种数据采集工具对数据库、文档和网页进行数据采集。数据库中的数据是结构化的,采集相对简易;而文档和网页结构各异,先将它们抓取入系统;数据清洗目的是对有信息价值的各种数据通过处理产生纯文档。首先对抓取的原始数据进行结构分析,去除噪声,分析数据是表结构、文档结构还是网页结构,网页结构是内容型网页还是表单型网页,并对各种结构进行识别剥离;然后进行内容分析,例如网页中的广告、图像、版权信息等等;最后对用户关心的信息内容进行提取,产生待处理的纯文档,如图5所示:

4.2文档预处理

文档预处理的任务是自然语言处理,将文档处理切分为待处理的词汇和信息单元。首先将待处理的纯文档进行词语切分和词性标注,取出分词结果中的名词和动词;然后按标点符号进行短句分割,作为信息单元,并以此作为信息抽取的粒度;最后对短句进行语法词法分析,并实施初次筛选,保留其中至少包含两个名词和一个动词的信息单元。该过程需要相关领域知识的术语表、词汇表、主题词表等,对分词系统中的词表进行二次加工。语义模型中的领域本体可以提供规范化的概念及概念中所涉及术语的多种形式,可以对词表进行丰富和规范,如图6所示:

4.3规则生成

信息抽取规则的生成利用了本文构建的语义模型。语义模型中的领域本体描述了概念、属性、实例以及本体内部概念与概念之间的关系,桥本体描述跨本体的概念之间的多种关系。领域本体和桥本体用OWL描述,将OWL本体映射到关系数据库,形成语义模型数据库;数据库中含有若干个表,通过表、表的属性、表的主键与外键以及属性之间的约束对本体进行解析。信息规则在此基础上生成:首先从语义模型数据库抽取类、抽取属性、抽取实例、抽取关系,对于桥本体还需要抽取表名;然后通过其解析出的本体中描述的概念、关系、层次结构等来生成三元组,再将此三元组作为信息抽取的规则存入规则库。如图7所示:

4.4实体抽取

信息抽取主要是对信息单元进行解析后,对信息单元中的名词基于语义模型中的概念和实例进行实体命名识别,充分利用本体对概念规范描述的优势,提高实体命名识别的准确性;再对信息单元重新规范,形成具有主、谓、宾三元关系的分析树。将该分析树与抽取规则三元组进行匹配,如果匹配成功则将该三元关系存入数据库中,完成信息抽取;如果匹配不成功,对该三元关系的概念与语义模型进行语义相似度计算,根据计算结果,形成本体中的新概念或新关系,添加到语义模型中,完成本体学习,丰富领域本体,如图8所示:

基于语义模型的信息抽取有如下好处:①语义模型的引入既保证了结构的一致性,又保证了数据的一致性,使不同来源的数据都能以统一的标准进行描述和呈现,方便了信息的继承与交换,提高了信息抽取的准确率及召回率;②驱使整个信息抽取过程都直接来自于语义模型,这为利用各种各样的本体数据呈现了一条非常自然的路径;③基于语义模型的系统可以促进本体进化,丰富领域本体。

第2篇:地理信息概述范文

关键词:本体 信息检索 搜索引擎

中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2013)07-0043-01

1 引言

随着信息技术发展与应用的不断深入,网络已经成为世界范围的信息源。与之相伴的是信息检索问题,怎样实现在海量网络信息中获取符合用户需求的信息,是信息检索界亟待解决的课题。本文以图书信息的查询为例,从而极大地提升图书查询的准确性和效率,使图书馆能够为用户提供更高品质的服务打下基础,本文的成果具有比较好的理论价值与实践意义。

2 本体技术概述

本体是以系统化的方法来描述客观世界的事物,从而能够实现事物中所包含元素的集成和重用,从而将信息抽象为知识。在对事物的描述中,本体将所有的事物分解为不同的概念,并准确地定义概念之间的逻辑联系。当前,作为一种信息技术的实现方法,本体论在计算机领域中具有比较重要的价值与意义,正在一些领域有着比较广泛应用,包括语义网络的实现、智能搜索的设计、异构数据的整合、以及GIS系统和图书馆的数字化等。在这其中,语义网络的研究和应用是一个热点。

3 基于本体的信息检索设计与实现

3.1 系统框架设计

结合目前应用比较广泛的B/S的结构体系,本研究所涉及的信息检索结构分为三个层次,下面分别进行阐述:(1)应用层的设计。在基于本体的检索系统中,应用层的功能是处理用户需求,实现用户和系统的交互。在应用层中,通过用户界面的表单来处理用户所输入或者选择的查询请求,对请求的格式进行初步处理之后传输至逻辑层进行进一步的处理,并将由逻辑层传输到本层的检索处理结果向用户显示。(2)逻辑层的设计。逻辑层是检索系统对查询和检索结果进行处理的核心部分,主要功能有:用户查询的生成、用户查询条件的表达、用户查询的执行。逻辑层的设计成股份考虑到了检索内容的本体模型与查询处理之间的匹配。(3)数据层的设计。数据层的功能是对系统的数据进行存储,针对本文所研究的图书信息而言,将会为所有的图书数据构建一个基于本体的数据库,本研究选择的是sql server数据库。在数据库中,结合本体库知识对所存储的信息以及信息之间的联系进行标注,从而使图书信息能够以本体的规范进行存储,以便查询。

3.2 检索方法的设计

当前,无论是基于哪一种搜索引擎,具体的检索结果往往难以保证足够的查全率和查准率。其核心原因在于:首先对没能准确地表达用户的查询需求,导致信息系统难以精确地把握查询需求;其次是系统是以机械匹配的方式来处理用户所输入的检索关键词,因此没能对所查询的语句进行必要的扩展。所以本研究所涉及的基于本体的检索方式的设计基本思路为:(1)基于本体对于事物的描述,首先对用户所输入的查询条件进行整理和优化,把其查询条件进行转换,使之能够体现为本体的概念以及本体元素之间的联系。(2)结合本体的信息处理模式,对转换之后的查询条件进行概念上的扩展,最终形成符合本体属性和特点的查询式,开始查找,并得到结果。

3.2.1 基于本体的检索优化方案设计

此处将用户查询条件所属的原始概念空间定义为{C,R},在该空间中,C的涵义是查询条件所包含的全部概念项,R的涵义是全部概念项之间所拥有的逻辑关系。在本体的设计理念下,本研究把检索优化的步骤定义为(1)把概念项空间C里用户的查询概念进行转化,使之成为本体类型的概念,从而构建基于本体的概念;(2)结合查询概念之间的逻辑关系R,对查询条件进行逻辑转换,从而构建符合本体模式的优化概念空间。

在(1)中,首先设概念项空间C里所包含的概念项是(C1,C2,C3,C4,C5……),针对里面的所有概念项,在已经构建的本体知识库里搜索与这些概念项匹配的概念,所有的同义词以及词性变换均能够生成新的记录,以(Ci,Oi)表示。记录中,Ci的涵义是概念项(C1,C2,C3,C4,C5……)中的一个元素,Oi则表示图书信息本体里和Ci匹配的概念,可知在这样的模式之下,每一个概念项均可能有多个与之匹配的概念,而所有的匹配概念最终形成新的概念集O。当前概念相的匹配完成之后,则进行针对查询条件的逻辑转换,最终通过一套逻辑转换规则形成新的逻辑关系。

3.2.2 检索的语义扩展

在对用户的查询条件进行本体话处理之后,有可能会出现无法找到与之匹配的概念的情况,这时候需要对检索进行语义的扩展。扩展的目的是从一个概念延伸到其他概念,以及从一个属性眼神至其他的属性,从而实现查询的准确率。语义扩展包含三个方面,分别是同义词的扩展、子概念的扩展以及父概念的扩展。下面进行详细的阐述:(1)同义词的概念扩展。在中文的表述中,同义词的普遍存在的。相同的检索条件可能有多种不同表述方法,此时需要以同义词的扩展来达到检索的准确率。在本体库的构建中,将属于同一概念的所有表达方式进行标记,当收到用户的检索请求以,系统执行“或”运算,得到所有的同义词并集,提高查全率。(2)子概念的扩展。通过以更加贴近用户查询条件的子概念看来表达检索,从而将检索结果定位在更加精确的领域。举例来讲,用户搜索图书信息时,如果输入“通信介质”作为查询条件,未能看到满足要求的检索结果,此时根据本体知识的架构,通讯介质又可以包含以下的子概念:如光纤、同轴电缆、微波等,通过子概念的扩展,实现信息检索的查准率。(3)父概念的扩展。与子概念相反,父概念的扩展指的是将查询条件的上层概念来替换用户所输入的查询条件,从而实现结果的扩展。举例来讲,如果输入“工作站”作为查询条件,未能看到满足要求的检索结果,此时根据本体知识的架构,工作站的父概念包括网络硬件、局域网节点等,从而达到更好的查准率。

4 结语

本文结合当前信息检索所存在的不足之处,以图书馆信息检索为例,引入本体技术来构建数据检测和索引优化的科学方法,通过构建图书信息的本体属性架构,实现了复杂语义信息的表达和识别,从而在很大程度上提升了图书馆信息查询的效率。

参考文献

第3篇:地理信息概述范文

关键词:领域本体,个性化信息检索,构建本体

 

1.个性化信息检索的内涵和相关技术

个性化信息检索是指根据用户的兴趣和特点进行检索,得到能够满足用户个性需求的信息,是一种能培养个性化趋势的检索方法,高效率地为用户提供检索服务,返回与用户需求相关的检索结果。个性化信息检索的检索条目既可以是内容检索,也可以根据其它事件的关系检索。个性化信息检索以用户检索行为为中心,与用户查询经历有关。个性化信息检索的相关技术包括用户建模技术、智能Agent技术、个性化推荐技术、数据挖掘技术等。

2.基于领域本体的个性化信息检索

2.1本体描述语言

目前,出现了基于人工智能的本体描述语言和基于Web的本体描述语言等本体描述语言。其中OWL是基于Web的本体描述语言,是目前W3C开发的一种语言,它能够取得表达力和推理复杂度之间的平衡,不仅能够使表达Web上信息的需求得到满足,而且能够使得推理复杂度得到控制,对于应用的开发提供了便利条件。

2.2构建本体的原则和步骤

建立本体时,应按以下的原则来进行指导。

2.2.1明确客观:即对于建立本体时定义的术语,本体用自然语言给出的语义定义,能够明确有效地表述独立于计算机环境的概念知识的内容,并且客观地和形式化地定义概念名称,是明确客观的,能够尽可能地使用标准术语来准确地表达概念项的内涵。

2.2.2完整性:即本体必须给出完整的定义,使得所描述术语的含义能够完全表达出来。

2.2.3一致性:也就是说,由建立本体时定义的术语得出的推论必须和术语本身的含义是一致的。建立本体时定义的公理以及用自然语言进行说明的文档都具有一致性,本体要支持与其定义相一致的推理。

2.2.4最大单调可扩展:即不需要修改本体已有的内容,就可以向本体中添加通用或专用的术语。在建立本体论时,要考虑到将来可能的扩展,以便进一步的补充和专门化说明本体论。必须使本体为了满足特殊的需求,支持在不需要修改现有的定义的前提下,便能够根据已有的概念定义新的术语。

2.2.5最小承诺:某个知识系统承诺了某个本体是指该知识系统使用知识的行为与本体中的定义相一致。最小承诺是在支持知识共享活动要求的基础上,在本体设计时尽量减少本体承诺。本体承诺只要能够满足特定的知识共享需求即可,要求本体承诺最小。对本体进行承诺的知识系统能够根据实际情况和需求信息不受限制地对本体进行专门化和实例化。构建本体的步骤包括:明确构建的目的、确定所构建本体覆盖的领域和范围、建立本体、检查和评估、提交本体和反馈。

2.3基于领域本体的个性化信息检索的基本原理

领域本体把现实世界中的某个应用领域抽象成一组概念及概念间的关系。在传统信息检索技术中融入本体,既能够发挥概念信息检索的优势,又可以克服概念信息检索的局限性,即它不能对概念关系进行处理。由于本体能够对概念关系进行处理,并通过概念之间的关系来表达概念语义,所以检索的查全率和查准率会得到提高。科技论文。基于本体的个性化信息检索对需求集合和信息集合进行了匹配与选择,并在其中加入了本体的元素。可以用如下步骤进行阐释基于本体的个性化信息检索的基本原理:

2.3.1在领域专家的指导下,使用OntoEdit等工具软件手工创建用于检索的领域本体实体。

2.3.2根据已建立的本体,对信息源中的数据进行收集,并把收集得到的信息源中的数据参照特定的格式存储起来,存放在元数据库中。科技论文。根据已建立的领域本体实体,对各种信息资源如Web网页等进行本体元数据标注。利用OWL语言等本体描述语言,对信息资源进行语义层面的表示和描述,并将处理好的信息资源参照特定的格式存放在元数据库中。

2.3.3查询转换器根据用户的检索输入,对用户检索界面获取的查询请求,参照本体将查询请求转换成规定的格式,并且在本体的帮助下,在元数据库中选择匹配出符合条件的数据集合,然后显示给用户检索的结果。

2.3.4进行定制处理检索的结果,并将处理后的结果返回给用户。

2.4基于领域本体的个性化信息检索模型的个性化管理功能模块分析

个性化管理功能模块、个性需求处理功能模块、查询功能模块、信息预处理功能模块是基于领域本体的个性化信息检索模型的组成部分,这些功能模块互相协作,共同完成个性化信息检索。接下来,我们对个性化管理功能模块进行分析,其他功能模块不再赘述。进行基于领域本体的个性化信息检索的最终目标是全面准确地获取用户的个性化需求信息,个性化管理模块主要负责对用户个性化信息需求的收集和管理。科技论文。通过用户模型的建立,个性化管理模块管理用户的个人信息、兴趣及历史查询记录等。在用户提出检索请求之后,系统结合考虑用户的背景信息,这样,就能够有效地解决不同用户对于相同提问信息的不同深度和广度的要求,进而使得获取用户的个性化需求信息变得更加有效。

主要有三种方法结合起来构建用户模型,用来获取用户个性化信息需求:

2.4.1用户主动填写其个人信息需求,即通过用户主动提供的方式获得;

2.4.2通过监视用户自身的信息检索与浏览过程来获得,即通过系统被动学习的方式获得;

2.4.3通过从服务器端挖掘获得,即从服务器中分析获取。

3. 结束语

本文对个性化信息检索相关技术和基于领域本体的相关理论进行了研究,并构建了一个能够实现用户个性化信息需求的快速准确检索的基于领域本体的个性化信息检索系统。基于领域本体的个性化信息检索的研究,在理论方面还有很多问题有待于解决,具有广阔的发展前景,将成为研究重点。

参考文献

[1]孔田野, 李万龙, 张海鸥. 基于药品本体的信息检索系统研究[J]. 河北科技大学学报, 2008,(03).

[2]新新人类. 令人爱不释手的个性化水杯[J]. 网络科技时代, 2004,(01).

[3]尹红丽. 基于本体的个性化信息检索技术研究[J]. 山东轻工业学院学报:自然科学版, 2008,(02).

[4]张秀兰, 蒋玲. 基于本体的个性化检索智能Agent模型探析[J]. 现代情报, 2006,(09).

第4篇:地理信息概述范文

国际会计准则委员会(IASC)成立于1973年,其目标是制定和国际会计准则,促进各国会计实务在国际上的趋同。1989年4月,IASC委员会批准了一份名为《财务报表编报框架》的文件,并于同年7月。该概念框架在指导国际准则的制定及评价现有准则方面发挥了重要作用。IASC于2001年重组成立了新国际会计准则理事会IASB。IASB运作以来,就一直致力于更新概念框架及制定全球性的会计准则的过程中,并于2010年9月完成了《财务报告概念框架》(The Conceptual Framework for Financial Reporting简称“概念框架”)的第一阶段结果,与此同时1989年发表的《财务报表编报框架》的相关章节将被取代,当该概念框架项目被全部完成时,理事会将拥有一份全面、综合且单一的被称作《财务报告概念框架》的文件。

财务会计概念框架,是一系列由财务报告的目标和受目标决定的其他基本概念所组成的一套理论体系。目的在于指导财务报告的宗旨并为财务报告的报告主体、信息质量特征、报表要素、确认、计量、列报及披露提供基本的概念与原则。IASB发表的2010年财务报告概念框架包括了四章节的内容,第1章:通用目的财务报告的目标(The objective of general purpose financial reporting);第2章:报告主体(The reporting entity);第3章:有用财务信息的质量特征(Qualitative characteristics of useful financial information);第4章:1989年概念框架的剩余内容(The Framework (1989):the remaining text)。IASB已完成的概念框架项目第一阶段的成果包括第1章和第3章的内容,同时取代1989年财务报表编报框架的相关内容。第2章报告主体还有待于补充完善,而第四章的内容与1989年发表的财务报表编报框架的相关内容完全相同。因此,本文仅就《财务报告概念框架》中的第1、3章与《财务报表编报框架》中的相关部分做一个比较评述,下面将具体地加以研究。

二、通用财务报告的目标

(一)《财务报表编报框架》关于财务报表的目标

1989年财务报表编报框架中关于财务报表的目标是提供有助于各种类型的使用者进行决策是所需要的关于企业财务状况、经营业绩和财务状况变动的信息,使他们更好地评估企业偿付债务,制造现金和现金等价物的能力及其形成的时间和可确定的程度。同时财务报表还应反映企业管理层对交付给它的资源的经营成果和受托责任。由财务报表的目标可以看出,该目标在强调决策有用性的同时,也显示出管理层受托管理资源的经管责任。

(二)《财务报告概念框架》关于通用财务报告的目标

2010年财务报告概念框架中关于通用财务报告的目标是提供关于报告主体的财务信息,以便有助于对现在和潜在的投资者、贷款人和其他债权人做出向主体提供资源的决策。这些决策包括购买、出售或持有主体的权益和债权工具,及向主体提供贷款的金额和信贷形式。同时通用目的的财务报告也需要提供关于主体的资源及主体管理层、董事会对交付给他的资源的经营成果和受托责任,从而有助于现在或潜在的投资者、贷款人和其他债权人评价主体未来净现金流入的前景。由此可以看出,评价治理当局履行经管责任要求的信息通常也是资源配置决策需要的信息,因此,决策有用性包括了受托责任观,这样就没有必要专门将受托责任作为财务告的目标。

(三)两者的比较

关于财务报告的目标,编报框架和概念框架都强调了对使用者决策有用的目标,同时兼顾了经管者的受托责任,评价受托责任是为了进行经济决策,即“受托责任隶属于决策有用性”。这是两者的相同之处。但概念框架第1章“通用财务报告的目标”与编报框架中“财务报表的目标”相比还有以下特点:

1.内容更加具体,逻辑更加严密,结构更加合理。IASB的财务报告概念框架明确地将内容分为四个章节,改变了编报框架中“一盘散沙”的局面,使得层次更加清晰,更易于理解。在“介绍(Introduction)”部分简化了概念框架的“范围(Scope)”,删除了“用户及其信息需求(Users and their information needs)”部分。在概念框架第1章中内容也做了较大的调整,分为“介绍”、“通用财务报告的目标、有用性及限制”与“关于报告主体经济资源、要求权及资源和要求权变动的信息(Information about a reporting entity’s economic resources,claims,and changes in resources and claims)”三个部分进行描述,将编报框架中的“财务状况、业绩及财务状况变动(Financial position,performance and changes in financial position)”部分包含在了“关于报告主体经济资源、要求权及资源和要求权变动的信息”,删除了“附注及补充计划(Notes and supplementary schedules)”,从而使内容更加明确、具体,结构也更加合理。

2.以“财务报告目标”取代传统的“财务报表目标”。IASB的财务报告概念框架中关于目标在范围上的“重点”开始针对财务报告,而非编报框架中的财务报表。这是由于财务报表是财务报告的核心内容,但财务报告还包括财务报表以外的其他财务报告,而其他财务报告也可以提供预测信息。因此,这种概念上的拓宽可以有助于改进会计实务,更好的满足使用者的信息需求。

3.明确了通用财务报告目标的定位。概念框架的目标1(OB1)明确了“通用目的财务报告的目标形成了概念框架的基础。概念框架的其他方面―报告主体概念、有用财务信息的质量特征及约束条件、财务报表的要素、确认、计量、呈报及披露―逻辑地来自目标”。通过明确而准确地对“通用财务报告目标”的性质与作用进行了定位,至少使人们明确了目标具有两大重要作用:一是规定财务报告的目的与宗旨,为编报财务报告指引方向;二是所有其他基本概念,都产生于目标的要求并共同为实现目标服务(葛家澍,2010)。

4.将通用财务报告的目标集中于投资人和债权人的需要。财务报告目标的核心是为使用者提供决策有用的信息。IASB在财务报告目标中明确指出,现在和潜在的投资者,贷款人和其他债权人是通用目的财务报告直接指向的主要使用者。虽然报告主体的管理者及其他参与方也需要企业的财务信息,但通用财务报告信息并不主要针对他们。尽管通用财务报告主要针对投资者和债权人的需求,但通用财务报告不可能为这些群体提供其所需要的所有信息,仅是针对他们投资信贷决策的共同需要,为满足使用者各方面信息的需求,这些信息使用者也需要其他方面的相关信息。

5.更具体地阐述了决策有用目标的内涵。该概念框架具体落实在通用财务报告所能提供的,直接或间接与评估主体未来现金流量前景密切关联的各种信息之上,包括经济资源和它的要求权,及基于交易、事项情况引起资源和要求权变动所能提供的有用信息。并对经济资源和要求权的变动信息先分为由财务业绩引起和与财务业绩无关两类。由财务业绩引起的变动又区分为基于权责发生制会计(accrual accounting)所形成的财务业绩和基于过去现金流量(past cash flows)形成的财务业绩。所有这些变动应提供的信息,像如何预测主体预期现金流量的金额、时间安排与不确定性以及怎样评估主体产生未来现金净流入的能力等都是使用者所普遍关心的,因为他们各自经济利益均与主体未来的有利现金净流量密切相关。因此该概念框架在描述通用财务报告目标时更加严谨、具体,使得财务报告能提供对决策最有用的信息。

三、有用财务信息的质量特征

(一)《财务报表编报框架》对财务报表质量特征的描述

在1989年的财务报表编报框架中,质量特征被定义为“是使财务报表提供的信息对使用者有用的那些性质。四项主要的质量特征是可理解性(Understandability)、相关性(Relevance)、可靠性(Reliability)和可比性(Comparability)”。

1.可理解性。财务报表所提供的信息的一项基本的质量特征是便于使用者理解。它假定用户对企业的经济活动具有合理程度的知识,而且自身又愿意用适当的精力去研究会计信息。可理解性决定着会计信息的利用程度,但对于具体的信息使用者而言其效用的大小则还取决于使用者对会计信息的运用能力。

2.相关性。是指有用的财务信息必须与使用者的决策需要相关。当信息可以帮助用户评价过去、现在或未来的事项,或通过确证或纠正使用者过去的评价,从而能够影响用户做出的经济决策时,信息就是相关的。在该编报框架中相关性不仅包括了预测价值(predictive value)、证实价值(confirmatory value)还包括重要性(Materiality),如果由于信息在财务报表上的省略式差错,以致影响使用者做出有关的正确的经济决策时,该信息就是重要的。

3.可靠性。当提供的信息没有重要差错或偏见,能如实反映其所反映、理当反映的情况,可供使用者决策做依据,则该项信息就是可靠的。可靠性的内容包括如实反映(Faithful representation)、实质重于形式(Substance over form)、中立性(Neutrality)、审慎性(Prudence)和完整性(Completeness)。

4.可比性。财务报表信息的使用者为了更好的理解和分析企业的财务状况和业绩的变化趋势,不仅需要比较企业不同时期的财务报表数据,还需要对同一时期不同企业的财务报表数据进行比较。为此,要求财务报表提供的信息必须具有可比性,要求同类交易或事项的计量和列报必须按一致的方法进行。

《财务报表编报框架》在第43至45段提出了对相关和可靠信息的限制性因素,包括及时性(Timeliness)、效益和成本之间的平衡(Balance between benefit and cost)以及质量特征相互之间的平衡(Balance between qualitative characteristics)。该编报框架在质量特征的最后部分特别讨论了“真实与公允观点(True and fair view)”,即“公允表述(fair presentation)”的问题,但却未给出明确定义。

(二)《财务报告概念框架》对有用财务信息质量特征的描述

在《财务报告概念框架》中,有用财务信息的质量特征确定了建立在财务报告基础上,对现在或潜在的投资者、贷款人和其他债权人做出的关于报告主体的决策是最有用的信息的类型。它应用于财务报告及以其他方式提供的财务信息中。有用财务信息的质量特征第4段(QC4)描述了,“如果财务信息是有用的,它必须是相关的并且如实反映其拟所反映的。财务信息的有用性将被加强,如果它是可比的、可验证的、及时的及可理解的”。有用财务信息的质量特征分为基本的质量特征(fundamental qualitative characteristics)和增强的质量特征(enhancing qualitative characteristics)及对有用财务报告的成本约束(the cost constraint on useful financial reporting)。

1.基本质量特征包括相关性和如实反映。如果财务信息能够对用户做出的决策产生影响,则该财务信息就是相关的。相关性要求财务信息具有预测价值及证实价值,而重要性也是一个主体相关性的特定方面。财务信息的预测价值要求其可以被用户用来作为输入信息来预测未来的结果。财务信息的证实价值要求其能提供关于以前评估的反馈情况。重要性是指当遗漏或虚假陈述某信息时,将会影响到使用者依据关于报告主体的财务信息做出的决策。有用的财务信息要求其不仅反映相关的现象,而且也必须如实反映其意欲反映的现象。为了完全的如实反映,描述需要具备三项特征,即它是完整的(complete)、中立的(neutral)且免于错误的(free from error)。完整性要求为使用户理解被描述的现象,该描述应包括所有的必要描述和解释方面的所有信息。中立的描述要求在选择或呈报财务信息时不带任何偏见。免于错误意味着在描述现象时无差错或遗漏,并且用来产生报告信息的程序也被无误地选择和应用。当然,免于错误并不意味着在所有方面都是精确的,例如估计的存在。

2.增强的质量特征。可比性、可验证性(verifiability)、及时性及可理解性是属于增进的质量特征,其旨在提高相关且如实反映的信息的有用性。增进的质量特征也可以帮助决定在两种方式都均衡的考虑相关性和如实反映的情况下,哪种方式可更好的来描述现象。可比性要求财务信息能与其他主体类似的信息以及同一主体不同时期的信息相比较。可验证性帮助确保信息如实反映了其意欲反映的经济现象。可验证性意味着在特定描述是如实反映的前提下,不同知识背景且独立的观测者能够达成一致的意见,尽管不一定完全一致。及时性意味着可利用的信息对用户来说是及时的,以便能够影响他们的决策。可理解性要求清晰简洁的对信息进行分类、按特征进行描述及列报。

3.有用财务报告的成本约束。成本对财务报告所提供的信息是一个普遍的约束。在报告财务信息时需要考虑成本与效益的约束条件。

(三)两者的比较

1.相似点。《财务报告概念框架》和《财务报表编报框架》所要求的质量特征从整体来说都有严密的体系,其主要内容可以说是大同小异。两个体系都服从财务会计的基本目标,为决策提供有用的信息。

2.差别点。(1)以“有用财务信息的质量特征”取代编报框架中的“财务报表的质量特征”。从而使概念框架中第3章“有用财务信息的质量特征”更加服从于第1章“通用财务报告的目标”。(2)概念框架中有用财务信息质量特征的层次更加明晰。在概念框架中有用财务信息的质量特征被分为基本的质量特征和增强的质量特征,不同于原先的主要质量特征,使得层次更加分明、结构更加严谨,有利于理解不同质量特征之间的关系。(3)概念框架中以“如实反映”取代了主要质量特征中的“可靠性”,并作为基本的质量特征,其包含完整性、中立性和免于错误,这更符合财务信息的特点。因为信息本来就是客观事物的反映,通用财务报告中的财务信息理应如实地反映一个主体客观存在的经济资源,对资源的要求和引起两者实际变动的现实交易、事项与情况,只有如实反映,才有可能通过财务信息确切描绘主体的经济真实(葛家澍,2010)。(4)概念框架中将可比性、可验证性、及时性与可理解性作为增强的质量特征,而编报框架中却将及时性列为制约因素,将可比性与可理解性作为主要质量特征的组成部分,并且不包括可验证性。这些修改目的是为了更贴近通用财务报告的目标,具有更重要的意义。(5)删除了财务报表质量特征中的“真实与公允观点(公允表述)”,增加了“应用基本质量特征”和“应用增进的质量特征”两部分。从而使得标准更为简化、实用并容易被接受。

四、总结及对我国的启示

自国际财务会计准则理事会(IASB)成立以来,就一直致力于财务会计概念框架的研究,经过多年的精心研究论证,终于在2010年完成了《财务报告概念框架》中的“通用财务报告的目标”和“有用财务信息的质量特征”两部分,取代了1989年的《财务报表编报框架》。与此同时,FASB在同年的第8号概念公告也与该概念框架实质上是趋同,甚至是一致的。IASB第一阶段成果的完成,对完善概念框架又更近了一步。但我们应该意识到,概念框架的完善是一个长期而艰巨的任务,它需要集中国际一流的专家、学者及社会各界人士的共同努力,不断研究探讨,因此将会是一个漫长的过程。

第5篇:地理信息概述范文

[关键词] 信息可视化; 知识组织; 知识体系

[中图分类号] G354 [文献标识码] A [文章编号] 1673 - 0194(2013)012- 0081- 02

1 信息可视化产生的背景及含义

对繁杂的抽象信息之间的复杂关系进行探索的努力,促进了信息可视化这一崭新科学领域的出现。用图形图像方式来展示信息特征,可以利用人类视觉系统的特点帮助人们更快速、更深刻地理解信息,并可以便捷地进行信息空间的导航,快速地检索信息。因此,用图形图像方式来展示信息特征,可以利用人类视觉系统的特点帮助人们更快速、更深刻地理解信息,并可以便捷地进行信息空间的导航,快速地检索信息。可视化便是基于这种需求而产生的,并成为当今信息科学领域的发展趋势之一。

所谓信息可视化,是将非物理的抽象数据用可视的形式表示出来,以便分析数据、发现信息的本质规律和制定决策。信息可视化的任务在于搜索、发现信息之间的关系和信息中隐藏的模式,其对象主要是非物理数据及数据之间的关系以及没有集合属性的抽象信息,其核心问题是寻找表示信息的可视化表达,理解信息的知识表示。信息可视化通过对信息的感知将其信息表达化成知识,它实际上是研究人与计算机表示的信息以及两者之间相互影响的技术,表现为人与计算机信息之间的一种可视化界面。

2 信息可视化与知识组织的联系

知识组织的基本概念是“知识”。从可呈现角度来讲, 知识包括隐性知识和显性知识,这里主要指后者。简单说,知识是抽象化、系统化、理论化的信息, 关联是知识的本质属性。所谓知识组织,就是在信息组织的基础上,研究知识的获取、描述、整理、表达、控制、共享等整个知识组织过程的理论与方法,知识组织的精髓在于对知识及知识间的关联进行揭示和组织,知识获取、知识处理、知识表达和知识共享是知识组织研究的重要内容。其基础是知识组织体系。知识组织体系是对资源内容概念及其相互关系进行描述与组织的机制作为对资源内容概念及其相互关系进行描述与组织机制的知识组织体系,即是指实现知识组织的内在方式和途径,它既指知识组织的过程,也指调控知识组织的方法和手段。

知识组织体系是伴随着数字资源的知识组织而出现的一个新的研究课题。从知识组织与信息可视化两者的关系来看,知识组织实现了知识单元的有序化和知识关联的网络化,而信息可视化在人和信息之间架起了一座桥梁。一个完整的知识管理体系应该包括知识收集、知识提炼、知识存储和知识应用4个阶段。知识形态之间的转化,需要一种视觉化模型来表达和呈现。随着知识量的增加,如何呈现知识成了信息利用的瓶颈。因此,把信息可视化的相关方法和技术应用到知识组织中将是必然的选择。

3 信息可视化工具在知识组织领域中的应用

为了有效地表达和利用知识组织,信息可视化的相关工具和方法被应用到知识组织的研究和管理中,这类工具主要有概念图、主题地图可视化、本体可视化等。

3.1 概念图

概念图是康奈尔大学的诺瓦克(J.D.Novak)博士根据奥苏贝尔(David P.Ausubel)的有意义学习理论提出的一种教学技术。它是利用概念以及概念之间的关系表示和组织结构化知识的一种可视化,通常将某一主题的有关概念置于圆圈或方框之中,然后用连线将相关的概念和命题连接,连线上标明两个概念之间的意义关系。概念图支持并实现了有意义学习理论(Meaningful Learning Theory) 和建构主义模式(Constructivism model)。诺瓦克教授提出的概念图构建准则包括以下4个步骤:① 概念选取:列出关于某个主题的所有重要概念; ② 概念分类:分为广度结构和深度结构,广度结构根据概念间关联性强弱将概念划分为不同的分支,深度结构将不同分支中的概念按照概念的宽窄由上至下排列; ③ 定位中心概念,连接概念:首先,获取中心主题概念,作为整个概念图的根节点,然后,从中心节点出发连接每个分支的中心节点, 形成概念图的第二层,并注明连接词,继续上述过程, 直至连接完所有概念; ④ 连接交叉概念:仔细研究概念图中的各个概念, 看它们是否存在交叉关系,若存在, 连接交叉关系, 并注明连接词。概念图的构建过程即是知识创新的过程,利用概念图可以沉淀隐性知识。而概念图的构建过程也是学习的过程,可以将学习中涉及到的资源链接到概念图, 实现知识结构与相关资源的整合。同时,概念图表示的知识结构遵循人类的认知和学习过程, 因此可以利用概念图导航人们检索所需知识,也就是说, 我们还可以利用概念图聚合显性知识。

3.2 主题图

主题图则侧重以可视化方式表示知识概念间的相互联系,通过由主题、关联和呈现3个核心概念组成的主题图数据模型来描述主题、主题间的关联性以及主题与资源实体之间的关系,并联结与其相关的资源。主题图是利用XMT标记语言表达数据模型的,XTM定义了XML用描述和标记主题图的方式,可开放地标记、存储和传输主题图数据。通过主题图可以展现资源的知识结构。主题通过关联相联系,通过呈现指向相应的信息资源。主题地图可视化的目的是帮助用户快速定位相关信息,轻松识别相关结构。因此,主题地图可视化包括两类要求:表现要求(Representation Requirements)和导航要求(Navigation Requirements)。好的表现形式帮助用户定位感兴趣的位置,有效的导航机制帮助用户快速查看所需信息。表现机制不仅给用户提供主题地图的总览,而且提供不同细节层次的多比例缩放机制,用户可以从总体上把握主题地图,同时可以聚焦主题地图的各个层次细节。总览提供了主题地图的主要特征,用户一眼可以发现主题地图的主要特性。用户首先要了解主题地图有哪些概念及总体特征。这些信息应体现在表现机制上以帮助用户区分不同的主题地图。

3.3 本体

本体是近几年学术界研究的热点, 也是目前知识组织的常用方法。本体起源于哲学领域, 其定义为“共享概念模型的形式化说明”。概念模型是针对客观世界中的一些事物进行抽象所建立的模型, 该模型确定了这些事物的相关概念及其关系。而形式化是指所建立的模型是机器可读的。本体通过领域知识的逻辑抽象而构筑起体现概念及关系的概念系统, 是面向领域的通用概念模型,通过构建领域本体可以规范化组织这一领域的共享知识。基于本体的知识整合的主要功能表现:① 本体的构建为实现资源一体化的知识整合奠定基础。基于本体的知识整合可应用于网络资源、异构资源系统及信息门户的资源整合等多种领域, 其基本思路都是一样的, 即是在资源集合的上层构建一个反映资源知识结构的本体概念模型。如果针对不同领域的信息集合建立起相应的领域本体, 在此基础上, 通过不同本体的语义映射实现异构资源和系统之间的语义联系, 即可将各个相对独立的领域本体资源联系成一个立体的知识网络, 人类所拥有的资源就呈现出具有完整结构、规范有序的知识地图。② 本体的构建使得领域知识可以重用和共享。共享是本体的重要特征, 即指本体概念体现的是共同认可的知识。由于本体反映的是相关领域中公认的概念, 所以如果一个组织构建了专业领域本体, 如法学本体、经济学本体等, 其他组织可以共享和复用。基于本体的资源整合能够真正实现领域知识的共知、共识和共享。③ 在本体的支撑下实现基于语义的知识检索。实现知识检索是本体的重要应用之一。本体作为领域知识的语义模型, 其主要功能体现在知识组织和知识检索两方面。知识检索是知识组织的逆过程。实现基于概念语义的知识检索, 必须有赖于知识组织体系的支撑。只有以基于本体的知识组织体系为基础,以领域本体的概念模型作为资源元数据的规范描述标准, 才能真正实现基于语义的知识检索。

主要参考文献

[1] 赵刚,崔军. 信息可视化初探[J]. 晋图学刊,2007(2).

[2] 李纲, 郑重. 信息可视化研究进展[J]. 图书情报知识,2008(7).

[3] 马文峰,杜小勇. 关于知识组织体系的若干问题[J]. 中国图书馆学报,2007(2).

[4] 周宁,张会平,陈勇跃. 信息可视化与知识组织[J]. 现代图书情报技术, 2006(7).

第6篇:地理信息概述范文

长期以来,会计原则这个概念的界定一直不是很清楚。有时,会计原则与会计规则相对,表示总体层面的规范;有时,会计原则又与会计信息质量相混同。“原则”本身是一个抽象的范畴词,其意义广泛,难以定义。《现代汉语词典》中将原则定义为“说话或行事所依据的法则或标准”。借用这一解释,本文将会计原则定义为“会计人员行为应遵守的规范”,体现人的要素。具体来说,典型的会计原则应该包括稳健性、实质重于形式,或许还应该包括重要性、一致性、中立性和充分披露。

1976年,FASB开始财务会计的概念框架。在至今为止的8份概念公告中,FASB始终都没有把会计原则作为一个单独的概念列入概念框架之中。无论是在与IASB联合趋同之前还是之后,与会计原则相关的概念都被混杂于有用财务信息的质量特征之中。

二、 文献综述

关于会计原则和财务报告概念框架之间的冲突与融合,尽管直接的研究较少,但国内外很多学者和机构都曾有过类似的探讨,本文主要就美国和中国的研究进行回顾。

1. 国外研究回顾。

(1)FASB的观点和做法。FASB在1980年和2010年的两份会计信息质量特征概念公告中,均将会计原则在一定程度上融于其中。被包括在信息质量特征中的会计原则包括一致性、中立性和重要性。同时,FASB并不否认这些特征其实是对人的行为的规范。例如,在SFAC NO.8中,FASB指出信息可比性是目的,一致性则是有助于达成可比性的方法;中立性就是不偏不倚地选择或列示财务信息。这表明,FASB认为将原则直接作为信息质量特征嵌入概念框架中未尝不可。

当然,如前所述,这只限于会计原则与信息质量特征恰好能够统一的时候。面对重要性时,FASB就犯了难。SFAC NO.8中仅给出了重要信息的定义,然而重要性的概念范畴不仅在于信息本身,更在于要求会计人员对重要的信息重点考虑,对不重要的信息简化考虑。出于这个原因,FASB在1980年的信息质量特征概念公告中将重要性列为了确认的界限和起点。2010年的新框架相当于忽视了重要性中人的要素,将其列为相关性的一个方面。这种变化和争议也许正是源于重要性作为人的行为原则无法与客观的信息质量特征完美整合。

至于稳健性、实质重于形式、以及后文将要提到的充分披露则没有出现在两个框架之中。有人认为稳健性与中立性矛盾,因而理应被废除,其实不然。二者曾同时出现在IASB原先的概念框架中。可以认为,有充分证据时,会计人员应保持中立;无充分证据时,会计人员应保持稳健。所以,会计原则作为人的要素难以完全整合进入信息质量特征也许是这三个原则没有被放入概念框架的重要原因之一。

(2)美国审计界关于财务报告质量评估问题的讨论。1998年,美国证券交易委员会前主席Levitt发表了名为《高质量会计准则的重要性》的演讲。他以保护投资人利益为目标,提出了诚信、透明、公允、可比和充分披露等质量要求。这同当时FASB由决策有用目标推出的以相关性与可靠性为主要信息质量的概念框架不尽相同。按照Levitt自己的解释,高质量的含义为信息的可比性、透明度和充分披露。葛家澍(2001,2010)认为,透明度应包括信息的可比性、清晰性、中立性、完整性、实质重于形式等几个方面。其中,充分披露、中立性、实质重于形式显然都是人的行为的规范,属于会计原则。

在Levitt的倡议下, 美国审计界展开了财务报告质量评估问题的讨论,其中多次再现了对人的要素的强调。例如,1999年,美国蓝带委员会建议提出,公认审计准则应要求公司外部审计人员与公司审计公司会计原则、基本估计的基金和保守程度做出讨论。美国审计准则委员会也据此修改了第61号审计准则公告,要求审计人员与公司审计委员会应就审计师关于公司财务报告所用会计原则质量的判断进行讨论,而不仅是这些会计原则的可接受性。这些都是审计界对会计稳健性原则的强调。这场讨论可以看作是审计界对FASB概念框架缺乏人的要素的质疑。

其后,从安然事件到金融危机,“高质量”和“透明度”的呼声从未间断,且越来越响亮。显然,业界认为FASB已定义的会计信息质量无法保证信息的质量和透明度。可是FASB在与IASB联合趋同的框架中依然没有把会计原则加入概念框架。原因在于,FASB和IASB认为高质量和透明度的实质就是与概念框架中已定义的质量特征相关的(葛家澍,2010),这些字样只不过是基本信息质量与增进信息质量的不同表述或描绘(葛家澍、陈朝琳,2011)。

2. 国内研究回顾。在我国旧准则时期,纵观各种会计教材,会计原则是与今天的会计信息质量特征、会计假设、会计确认标准和计量基础相混同的。在新准则时期,这些概念界定逐渐变得明晰,但是会计原则与会计信息质量的关系仍不明确。

某些学者在构建我国的财务报告概念框架时,曾尝试着对会计原则与会计信息质量的关系进行处理。陈国辉等(1998)认为会计原则与会计信息质量特征的关系是平行的,互相影响的,二者无法分出层次的高低,应该统一放在概念框架的第一层次。葛家澍(2006)认为实质重于形式应该从属于透明度这一属性特征,其中透明度与现在的“财务信息内容质量”不同,应定义为“财务信息的表述质量”。而透明度是否应该放入概念框架还有待考察,因为它难以定义(葛家澍,2010)。云虹(2009)则将实质重于形式和谨慎性放在了可靠性之下,即仍偏向于将会计原则直接融入会计信息质量特征。

可见,对于如何处理会计原则与信息质量特征的关系,无论是国内学界还是国外学界,都没有达成一致的意见。

三、 在概念框架中加入会计原则的必要性

美国审计界展开的财务报告质量评估讨论说明,FASB的概念公告存在不足之处,其已经定义的会计信息质量无法保证信息的高质量和透明度。这中间究竟缺失了什么?为了探究这个问题,我们需要重新思考概念框架的构建。

要构建概念框架,不妨以目标为起点演绎推理,即考虑“概念框架的概念框架”。

FASB在1976年的《概念框架项目的范围和含义》文件中指出:“概念框架是一种把目标和基本概念相互联系、协调一致的体系。它能导致内在一致的准则并规定财务会计和财务报表的性质、职能和局限性……用会计的基本概念去指引如何选择应予以会计处理的事项,如何计量这些事项,如何把它们汇总传递给利益相关群体”。再结合杜莉(2004)、葛家澍(2003,2005,2006,2008)的研究,概念框架的目标可以总结为以下四点:(1)确定会计信息的使用者和他们对财务信息的要求,让使用者更理解财务报告的目的、内容、性质和局限性;(2)评估现有的会计准则,发展新的会计准则;(3)在缺乏会计准则的条件下,用来解决新的、复杂的会计问题的处理和报告;(4)使会计原则为社会公认、具有权威性。

以上四个目标,分别对应着概念框架的四个目标受众群体,或者说是四个利益相关主体。如果按照利益主体的思路构建概念框架,就会产生如表1的推导。

FASB现行的财务报告概念框架基本已经满足了目标1和目标4的要求,但是还没有完全满足目标2和目标3的要求。

对于目标2,现行的概念框架仅仅规定了准则制定机构应该制定怎样的准则(对信息使用者决策有用的、能生成一定信息质量的、清楚定义要素的、明确确认原则和计量方法的),但是并没有从主体出发说明如何制定这样的准则。也就是说,现行的概念框架仅从客观角度对结果进行了规定,而缺乏主观原则即对过程的规范。这显然会降低概念框架的指导性。

对于目标3,我们可以发现类似的问题。现行的概念框架仅仅规定了会计实务人员应该生产怎样的信息(对信息使用者决策有用的、符合一定信息质量特征的、满足确认条件的、使用一定计量属性的),但是并没有从主体出发说明如何生产这样的信息。这里,我们再次看到了主观原则的缺失。

主观会计原则的缺失不仅会导致相关主体无所适从,而且会造成规则过于零散,无法贯穿成整体的后果。在现行的概念框架中,从会计信息质量到确认原则和计量方法都是细化到报表各组成项目的。但是财务报告展示给信息使用者的应该是一幅完整的、相互关联的、反映企业财务状况、经营成果和现金流量的图像。缺乏会计原则会使会计信息缺乏整体的基调,从而影响企业整体图像的形成。国内也曾有学者尝试绕过会计原则去解决信息零散的问题。葛家澍(2001)认为FASB概念框架内的会计信息质量是财务信息内容质量,为了将分块的信息表述成反映企业经济事实的整体,还应该增加财务信息表述质量,后者主要以透明度为核心。云虹(2009)也类似地提出了财务报表内容质量和财务报表列报质量两个概念。然而,仅增强表述质量能否使信息成为完整的整体,这是个值得怀疑的问题,因为完整的整体需要人去把握。仅从客观上规定,无论规定多么详细,都很难保证信息成为完整的整体。

四、 在概念框架中加入会计原则的可能方案

1. 会计原则在概念框架中的位置。

首先,会计原则作为过程规范,应该放在结果规范(即会计信息质量特征)之后。演绎的思路是:为了达到某种信息质量特征,主体应该遵循什么样的原则。

其次,会计原则作为总体规范,应该放在细节规范(即要素定义、确认计量方法等)之前。演绎的思路是:在总的原则约束下,主体应怎样定义、确认、计量和列报会计要素。在加入会计原则之前,要素的定义、确认和计量方法是直接与会计信息质量特征相对应的,从而是偏向客观规则的。在加入会计原则之后,概念框架应该更加强调主体如何定义、确认和计量会计要素。这里需要转换逻辑,将客观规则主观化,变成行为规范。

2. 会计原则对应主体的分类。如前所述,会计原则对应的主体应该包括两种――会计实务人员和准则制定机构。尽管二者都被要求生成符合一定质量特征的信息,但两者的工作内容不同,相应地,原则也就不同。所以,会计实务人员和准则制定机构的原则应该分而视之。

国内也曾有学者持相似观点。曹伟(2004)将指导会计准则制定的会计信息质量标准称为会计信息内容的质量标准,将用来评价企业所披露的会计信息质量的标准称为会计信息披露的质量标准。可见,他试图从信息质量特征开始,将准则制定与会计实务区别对待。葛家澍(2009)也曾写道:“会计信息质量特征是会计选择的主要依据。会计选择是指会计和报告的各种方法仍须进行专业判断,使之更符合会计的信息质量特征……会计选择至少反映在两个层次上,第一个层次是准则制定机构,第二个层次是执行准则的各个主体”。

可见,将概念框架从信息质量特征开始向下将推导分成两路,是可取的方案。

实务人员应遵循的会计原则包括稳健性、实质重于形式、重要性、充分披露等。准则制定机构应遵循的原则包括系统完整性、一贯性、立场中立、相对稳定性、国际化、继承性等(陈国辉,1998)。更有意义的是,成本效益原则可以放在准则制定原则之内,而不必作为游离在体系外的约束条件勉强地放入会计信息质量特征中。由于会计信息供求存在特殊性,成本和效益的权衡不可能也不应该是企业考虑的事情,而应该是准则制定机构在全社会范围内考虑的约束条件,所以其放入准则制定原则之内是合情合理的。

3. 概念框架的修改。综上所述,财务报告的概念框架可以按如图1的方案修改。

图1的演绎过程可以这样描述:(1)为了达成决策有用的目标,应该正确划分报告主体,同时,会计信息应该具备某些质量特征。(2)准则制定机构应该权衡会计信息供给能力和决策有用的会计信息质量特征,遵循某些原则(包括成本效益原则)制定会计准则。首先,要定义会计要素。(3)为了达到特定的会计信息质量特征,会计实务人员遵循一定的原则(包括稳健性、实质重于形式、重要性、充分披露),根据准则制定机构定义的会计要素,进行会计确认、计量、列报和披露。

五、 在概念框架中加入会计原则的方案评价

问题的复杂化可能总比简单化更容易。前文在FASB的概念框架中加入了会计原则,将概念框架改造成了较为复杂的模式,这种做法有利也有弊。利好的方面之前已经详细说明,在此不再加以赘述。下面提出三个重要的弊端:

1. 会计原则缺乏完整的体系,所以可能无法反映会计信息质量特征的全部方面。准则制定机构可能无法仅凭借会计原则去定义要素,会计实务人员可能无法仅依靠会计原则进行会计确认和计量。如果要建立会计原则的完整体系,可能又会陷入会计信息质量特征和会计原则无法完美整合的僵局中。如果根据会计信息质量特征和会计原则两者共同定义要素和进行会计确认计量,虽然在互补的方面比较有优势,但是在重叠的方面却难以合理地分配权重。

2. 概念框架作为制定会计准则的权威依据,应该尽量客观。在其中加入主观元素可能有损概念框架的权威性和理论说服力。另外,主观元素可能缺乏指导性,因为对主观元素的理解可能因人而异。

3. 将准则制定机构的行为放入概念框架,且放置在与会计实务人员并列的比较低的层次,可能会引起准则制定机构地位和权威性的下降。

第7篇:地理信息概述范文

Abstract: In order to enhance the rate of accuracy and coverage fraction in the information extraction process,it has introduced the domain main body in the information extraction retrieval system. This paper introduced some basic concepts about main body,domain main body and discussed some mapping relations between the domain main body and the information extraction and has realized the handset domain main body in this information extraction prototype system and has applied this domain main body in the information extraction.

关键词: 概念;本体;信息抽取;领域本体

Key words: concept;main body;information extraction;domain main body

中图分类号:TP391 文献标识码:A文章编号:1006-4311(2010)14-0158-02

0引言

最近几年来,为了使人们能够按内容的语义表达需求,迅速准确地从成千上万的网页中过滤出自己感兴趣的内容,把本体广泛应用于各个信息领域中,同时已经成为目前信息科学研究的一个热点和难点,备受世界很多国家的重视。在信息检索和抽取[1]等领域中,本体发挥着越来越不可缺少的作用。信息抽取是把文本里包含的信息进行结构化处理,变成表格一样的组织形式。输入信息抽取系统的是原始文本,输出的是固定格式的信息点。信息点从各种各样的文档中被抽取出来,然后以统一的形式集成在一起。这就是信息抽取的主要任务。基于领域本体的信息抽取系统,可以实现让用户得到具有个性化的信息服务,同时通过领域本体为信息源提供相应的语义标注,这样可使系统对本领域内的概念以及概念之间的联系有统一高度的认识,从而在一定程度上提高信息服务的查准率和召回率,实现为用户更有针对的信息服务。

1领域本体与信息抽取

1.1 本体的基本概念本体论(ontology)是一个哲学上的概念,是指哲学中研究世界的本原或本性的部分。不少哲学家把本体论看作是西方传统哲学思想(从柏拉图到黑格尔)的主干或”第一哲学”。从本体论的基本概念出发,哲学上把本体论定义为”对世界上客观事物所进行的系统描述”。

1.2 领域本体的概念领域本体(Domain ontology)是用于描述指定领域知识的一种专门本体,它给出了领域实体概念及相互关系领域活动以及该领域所具有的特性和规律的一种形式化描述[2]。

1.3 领域本体[3]在信息抽取中的应用基于领域本体信息抽取是新型的信息抽取方式,它利用领域本体而不是扁平结构的辞典与词表来识别抽取信息,领域本体信息抽取可以在语义层而理解抽取信息,同时可以通过领域本体实例对抽取信息内容进行语义标注,从而提高了信息抽取的查准率和召回率。

1.4 信息抽取检索系统中领域本体的构建知识工程中的本体是人为设计的关于某个领域的概念模型的一种表示。目前己有的本体很多,出于对各自问题域和具体工程的考虑,构造本体的过程也是各不相同的。由于没有一个标准的本体构造方法,不少研究人员出于指导人们构造本体的目的,从实践出发,提出了不少有益于构造本体的标准。

2领域本体的构建

2.1 领域本体的设计原则通过分析总结,本体的设计原则可以概括如下[4]:①明确性和客观性:即本体应该用自然语言对所定义术语给出明确的、客观的语义定义。②完全性:即所给出的定义是完整的,完全能表达所描述术语的含义。③一致性:即由术语得出的推论与术语本身含义是相容的,不会产生矛盾。④最大单调可扩展性:即向本体中添加通用或专用的术语时,不需要修改其己有的内容。⑤最小承诺:即对待建模对象给出尽可能少的约束。⑥最小编码偏差:本体的建立应尽可能独立于具体的编码语言。⑦使用多样的概念层次结构实现多继承机制。⑧尽可能使用标准化的术语名称。

2.2 领域本体的构建步骤在实际的构建过程中,根据问题领域和具体工程的不同,形成多种构建本体的方法。目前,知识工程界比较成型的建模方法主要有:如骨架法[5]、企业建模法[6]等。参照这些构建领域本体的方法,结合信息抽取中的具体情况,并参考软件工程中的某些思想,领域本体的构建步骤如下所示。

具体如下:①确定领域本体的范围:明确构建的本体将覆盖的专业领域、应将本体的目的、作用以及本体的用户范围。②列出领域中的重要术语:列举出本系统想要陈述的或要向用户解释的所有概念。③建立本体框架:这时需要按照一定的逻辑规则把它们进行分组,形成不同的工作领域,在同一工作领域的概念,其相关性应该比较强。④设计元本体,重用已有的本体,定义领域中概念及概念之间的关系。⑤对领域本体编码、形式化。⑥领域本体的检验评价。

3信息抽取在手机领域本体的实现

根据以上关于领域本体的设计原则和实施步骤,本文在开发领域信息抽取原型系统时,主要使用手工和半手工的方式实现了手机领域本体,在系统的销售领域中起了很大作用。

3.1 手机领域本体的框架设计基于领域本体的web页面信息抽取主要是利用本身的描述信息进行抽取,因此对网页结构的依赖较少。采用这种方法进行信息抽取,预先需要领域专家采用手工方式书写某一应用领域的本体(其中包括对象的常值、关键字的描述信息)。根据领域本体的概念、概念属性以及属性之间的关系需要建立相应的关系数据库。然后根据本体中常值和关键字的描述信息产生抽取规则。对每个无结构的文本块进行抽取获得各语义项的值,最后将抽取出的目标信息放入根据领域本体的描述信息生成的数据库中。那么,下面对比较重要的数据表及其作用进行各个说明如下。

①实体概念数据表用于保存手机领域中可能相关的实体概念。刚刚建成时,可以通过人工查找、识别出领域实体的一些概念,并保存到数据库中。在此以后,可通过计算机辩别出领域实体概念,并把它追加到数据库中手工进行检验。②实体概念特征词数据表,该表存储每个实体概念在文本中又可能出现的近义形式或术语。例如实体概念“手机”而言,在文档中有可能变成为“大哥大”、“手提”、“mobile”、“mobilephone”。③属性概念数据表用于存储手机领域中可能存在的属性概念。该表主要用于保存属性概念中在真实文本中有可能出现的近义术语或形式。④属性值概念数据表用于保存领域中可能的属性值概念。该表主要用于保存每个属性值概念在文本中出现的术语或形式。⑤概念关系表主要描述手机领域的实体概念之间存在的种种关系。

3.2 领域本体中概念间关系的实现手机领域本体中概念间的关系的表示通过几个概念关系表和各数据表之间的关系来实现。该领域本体由多个数据表组成,它们不仅描述该领域的实体概念、属性概念、属性值和相对应的特征词,而且对实体概念之间的关系、实体概念、属性、属性值之间的关系进行描述。而实体概念关系表描述的是实体概念表中的两个实体概念之间的关系。实体概念、属性、属性值关系表描述的是实体概念、属性、属性值之间的相互关系,如表1所示。

3.3 手机领域本体的具体应用本文的信息抽取原型系统的命名实体识别、实体关系抽取和任务抽取3个抽取任务,对显示器领域本体都有大量的应用,主要集中在如下几方面。

①命名实体是文本中基本的信息元素,是正确理解文本的基础。命名实体识别就是要判断一个文本串是否代表一个命名实体,并确定它的类别,即发现命名实体和标注命名实体。在命名实体识别阶段,领域本体可以提供许多语义信息。利用这些语义信息对本体中的实例进行实体和关系的抽取有非常重要的意义。基于领域本体的抽取检索系统可以利用本体中的实例进行实体和关系的抽取,并不试图运用规则来发现新实例,不对知识库进行丰富,其目标是抽取的精准率和效率。②信息抽取系统基本上主要采用机器学习算法来实现抽取任务,其目标是最大程度地实现关系的抽取。它实现的关键是算法在关系识别任务中的正确率和效果,适合应用于精粒度的信息抽取。③信息抽取系统基本上都是基于模式匹配的,即首先从文本中学习出事件抽取模式,然后再用抽取模式去发现新的事件。而领域本体的语义信息能够用于抽取模式的获取过程事件抽取模式的自扩展过程,能够对已有的抽取模式进行语义扩展。④此外,在进行文本或某些网页的段落中的一些重要概念提取时,领域本体起了非常重要的作用。

参考文献:

[1]万捷,滕至阳.本体在基于内容信息检索中的应用[J].计算机工程,2003,29(4):122-123.

[2]张志刚.领域本体构建方法的研究与应用[D].大连:大连海事大学,2008.

[3]肖敏.领域本体的构建方法研究[J].情报杂志,2006(2):70-72.

[4]郭嘉琦.领域本体的构建及其在信息检索中的应用研究[D].北京:北京邮电大学,2007.

第8篇:地理信息概述范文

一、给予语言拐棍,培养学生的记忆力和概括能力

(一)提供关键词句,复述课文内容

1.抓住字词,复述插图。

低段教材中有很多篇课文的插图是采取连环画的形式呈现给小读者的,这些课文不仅插图色彩鲜艳、画面生动,紧扣原文意思,而且文字内容往往具有童话色彩,深受学生的喜爱。利用插图进行述说具有提示作用,同时能够培养学生的观察能力和想象能力。在运用这一策略时,教师可撷取文章中的新词、好词、重点词单独呈现出来,在让学生讲述时有意识地用上,从而达到巩固词语、初步运用的目的。

2. 提供字词,复述情节。

(1) 把课文内容用口语复述一遍。这种形式类似于讲故事,特别是对有生动故事情节的课文,学生也爱看爱说。很多故事性很强的课文的导语或课后练习题都明确提出了复述的要求。复述当然是建立在读通、读懂课文的基础上,可采用同桌合作、师生合作、小组合作的方式,以降低难度,而不要求一个人把整个故事说出来;也可以采取填空的方式,给学生一定的提示,让学生模仿原文的遣词造句进行复述,加深对新的句式和段式的记忆。

(2)概括地复述课文重要内容或主要内容。学生的概括能力不是天生就有的,尤其是低中段的学生,概括能力是很弱的,所以教师有必要提供一些帮助,让学生顺利地完成复述任务。在让学生复述课文重要内容或主要内容时,教师可以和学生一起抽取与课文的描写线索或写作特色、语言特色有密切关联的重点词语、句子,引导学生选择一种词序进行简单的复述。这样既可以达到概括课文主要内容的目的,又可以进行语言文字训练,使学生自觉主动地学习相关词句的运用,在积累语言的同时发展了思维。

(3)根据教师的板书概括地复述。板书往往具有提纲挈领的作用,就像写作的提纲,把文章的思路、特色很好地归纳了出来。这时引导学生根据板书内容复述既可以降低复述的难度,又可以进行创造性的表达,提高口语表达能力。

(二)结合口语交际,复述相关内容

课文中有不少口语交际的内容是要求学生把收集的资料有效地整理组合,通过复述的形式表达出来的。这些都要求学生在复述前做好充分的准备,深入理解语言,理清思路,锻炼思维。在复述的过程中教师则要全身心地投入,引导学生大胆地表达、认真地倾听,及时指出不当之处;同时,鼓励学生走出课堂,把故事或收集到的内容讲给父母听、讲给朋友听,进一步积累内化语言,培养对语言的概括能力。

二、赋予多种形式,培养学生的创造能力和想象能力

(一)改变人称和叙述顺序复述

这两种形式引导学生从不同角度、侧面改变课文的表现形式,用自己的语言进行再创造,促使学生打破思维的固定模式,对文章进行深入的分析,能更深入地理解作者的写作途径和方法。课文以第三人称来写的,教师可以引导学生用第一人称来进行复述,使学生进一步感悟课文所要表达的思想内涵。

(二) 增减情节复述

缩减情节不是任意地删去文章的某一部分,而是根据文章的内容、语言特色概括地简要地进行复述,锻炼学生的概括语言、重新组织语言的能力。课文《彩色的翅膀》、《少年闰土》、《凡卡》、《琥珀》都可以尝试。

(三) 结合综合性学习开展创造性复述

新课程增加了语文的综合性学习,旨在培养学生语文的实践能力和全面的语文素养。在综合性学习中往往要求学生就某一个专题搜集各类信息,这些信息为学生进行复述,进行自己观点的表达提供了很好的材料。教师要引导学生如何处理这些信息,如何更好地表达这些信息,进行有效地复述,让听者饶有兴趣地听,就成为活动成败的关键。所以,教师不能只做旁观者,在指导上尽量具体些、细致些,对学生的表现要以鼓励表扬为主,树立学生表达的自信心;随着学生能力的提升,可以慢慢放手让学生自己去实践、去展示。

(四)根据课文内容编成课本剧演出

小学生活泼好动,对严肃枯燥的形式往往兴致索然。在组织活动中进行语言的表达,不仅可以增添复述的情趣,还能在活动中锻炼学生的创新能力。

第9篇:地理信息概述范文

一、我国会计信息处理智能化理论研究现状

(一)模板理论 模板理论就是对不同类型的经济业务,事先都定义好一个具有借贷方向和会计科目的会计分录框架的文件,在以后发生经济业务时,由系统自动查找该类经济业务对应的会计分录框架文件,将其发生的金额(如果涉及数量、单价的,则自动填写数量和单价)填入会计分录框架内,形成记账凭证。模板理论的运用需要事先设置好企业所需用的会计科目名称和会计科目属性等,然后再逐一定义不同类型经济业务的会计分录模板,而这个定义工作需要专业会计人员来完成。

(二)专家知识库理论 专家知识库理论是利用财会领域专家的宝贵经验、智慧和思维方法,在计算机中建立专家知识库,再与分析策略、推理机相互配合,形成会计信息处理的智能化系统。具体如下:(1)专家知识库,即对所分析领域的知识进行系统整理并按照特定结构组织成机器可识别体系。(2)规则集,就是将分析策略用规则的形式表示出来,可以采用if……then……结构形式,其功能是对分析的过程进行规范,使系统能根据知识库内容按照规则进行分析。(3)推理机,就是在知识库和规则集基础上设计适当的推理软件工具,其功能是根据知识和规则对输入信息进行分析判断并输出判断结果。

(三)关键因素理论 关键因素理论是依据人工在编制会计分录所习惯采用的方法归纳而成。该理论认为,人工编制会计分录时,通常是以几个关键性因素的判断来完成的:首先判断该业务的类别,其次判断该业务发生的途径,第三判断该业务发生途径的过程类别,最后再判断业务操作的类别,依据这些特征最终形成会计分录。用集合论描述关系型数据库的方法可以表述如下:

会计分录={业务类别,业务途径,业务过程,业务操作}。

二、国外会计信息处理智能化理论研究现状

(一)会计信息系统需求分析的“资源、事件、参与者”理论(REA) “资源、事件、参与者”即REA理论,是由McCarthy于1982年基于会计理论提出。McCarthy认为,在获取会计事项的信息时,不要只侧重于捕获经济事项的借方和贷方信息,而应捕获企业控制的每一项资源(Resource),引起资源变动的每一项事件 (Event),在事件中的每一个参与人(Agent)的信息。REA理论提出后,得到了人们的普遍认可,但同时也提出了一些不足之处。首先,REA理论的分析范围主要限于企业经济事件,范围较窄。为此REA被扩展为REA-EO,即将REA的分析范围扩大到包括经济、经营和信息事件在内的整个企业范围。其次,将“参与者”(Agent)仅定义为一个单纯经济事件的参与者是不妥的,应替代为“具有不同的心理状态的个人”。第三,在应用REA对经济事件进行具体分析时,缺少一个清晰化的概念体系,因此难以将REA理论运用到信息系统的实现上。于是产生了“本体论”理论(ONTOLOGY)。

(二)面向会计信息系统实现的“本体论”(ONTOLOGY) 本体论是指概念化的明确范式,是从共享的角度出发对被研发专业领域已存在的概念(资源、事件、参与人)和概念之间的关系进行的分类、定义,用于解决专业领域人员与计算机编程人员之间的交流、沟通,支持程序的概念化设计,为实现信息系统提供可操作的范式。以会计领域为例,供货人、采购、销售、客户、支付凭据、收款凭据等是概念;采购导致货物流入,销售导致货物流出是概念之间的关系;供货人姓名、地址、账户,采购的支付方式、交易代码、总分类账户,资金流入的账户(现金账户或银行账户),销售的方式、交易代码、总分类账户,客户的姓名、地址、账户,存货的名称、存放地点、总分类账户等,就是可用于编程的具体范式。按照本体论对企业范围内各项要素划分出明确的范式后,编程人员可据以在计算机上实现数据的输入、编辑和常规输出的功能,但是要让计算机自动生成会计分录、现金流量表和增值税纳税申报表等,仍然需要一种特殊的方法,在操作员在前台进行数据的输入、编辑时,在后台由系统按照目标对象的要求自动生成前后一致的、具有解释力的特定标注,这就产生了系统智能化的“脚本”理论(Script)。

(三)实现会计信息系统智能化的“脚本”理论(Script) “脚本”是指一个连贯的行为或事件的序列。该概念是由Schank & Abelson于1977年为处理自然语言中语句的语义,理解故事的主题和大意提出的。1986年Schank将它用于动态记忆模型中,通过提供对事件的模式化答案,形成了一个具有分析、解释能力的机制,之后并将它用到了智能软件的开发中。一个脚本包括的内容:(1)相关的事件;(2)行为的顺序;(3)对行为、事件的解释;(4)特定的标注。特定标注是指用一种特定的语言形式,采用文本文件,将上述事件、行为,以及事件、行为之间的关系等记录并保存下来,在需要时以被程序直接调用。为标注脚本,目前已开发的标注语言有:XML(可扩展标注语言),GML(普通化标注语言),SGML(标准普通化标注语言),HTML(超文本标注语言)等。

三、会计信息处理智能化理论运用思考

会计信息处理智能化理论表明,非会计专业背景的计算机编程人员需要对企业资源、事件、参与人和经营管理等知识、概念进行学习掌握,同时专业会计人员需要对企业会计核算全过程涉及到的最小单位的概念、行为,以及这些概念、行为之间的关系,概念、行为与输出结果的关系进行规范化的描述(以下称之为“本体描述”),以供编程人员理解、掌握和交流,在此基础上,编程人员将其转化为计算机可识别的智能系统。实际上,在这个过程中,最困难的是本体描述,因为通常情况下,懂计算机编程的人员,不懂专业会计,而精通专业会计的人员又不懂计算机编程。为便于阐述本体描述,下面以2013年版增值税纳税申报表附表一中“一般计税方法计税”项目的智能化处理为例来说明。

(一)目标功能描述 增值税纳税申报表附表智能处理的功能是指在前台输入原始凭证或记账凭证时,在后台由系统直接捕获增值税纳税申报所需信息,并在月末自动生成增值税纳税申报表。

(二)本体描述 从目标功能来看,这一功能的实现涉及到三个本体类别:增值税纳税申报表附表本体(表1),销售业务的原始凭证或记账凭证本体(表2),销售凭证至增值税纳税申报表附表的行为关系本体(表3)。

(四)编写解释器 根据“销售凭证至增值税纳税申报表附表的行为关系本体描述”编制解释器,月末通过解释器读取脚本文件就可自动生成增值税纳税申报表了。