公务员期刊网 精选范文 集合的含义与表示范文

集合的含义与表示精选(九篇)

集合的含义与表示

第1篇:集合的含义与表示范文

本教学设计人员基本信息:

设计者:张文妍

教学内容:集合的包含和相等关系

1) 年级:高一年级

2) 所用教材出版单位:北京师范大学出版社

3) 教学内容所属章节:必修11 第一章 集合 第二节 (第一课时)

4) 学时数:45分钟

二、 教学构思

(一) 教材的地位和作用

本节内容在全书及章节的地位:《集合的基本关系(第一课时)》是高中数学新教材北师大版1第1章第二节.第二节是集合间的基本关系.本节主要讨论集合的包含和相等关系,给出子集的概念.用Venn图和数轴帮助学生理解集合间的基本关系.在给出集合间的“包含”与“相等”关系的基础上,给出了子集、真子集的概念及有关性质.

本节的处理主要突显集合间的内在联系,使学生能够对集合间的基本关系有一个整体的、明晰的认识,便于将所学知识体系化.本节教材从学生身边的实例以及已学知识入手,抽象概括出集合间的包含与相等概念,并给出子集、真子集的概念,用Venn图以及数轴来直观表示集合间的这些关系,体现了数形结合的思想.

数学思想方法分析:教学中力图向学生展示尝试观察、归纳、类比、联想等数学思想方法.

(二) 教学目标的确定

基础知识目标:了解集合之间的包含、相等关系的含义;理解子集、真子集的概念;能利用Venn图表达集合间的关系.

能力训练目标:培养抽象概括能力,培养学生观察、探究、创新能力.

教学重点:集合间的包含与相等关系,子集与真子集的概念.

教学难点:是属于关系(元素与集合)与包含关系(集合与集合)的区别.

二、 教法

我的教法设计是启发式教育,通过问题激发学生求知欲,使学生主动参与数学实践活动,发现、分析和解决问题,掌握数学基本知识和基本能力.

三、 教学程序

一) 引入课题

在上一节中,学习了集合的概念并用字母标记了一些特殊的数集,在这些特殊的数集中,我们会发现这样一个现象:自然数集N中的所有元素都在整数集Z中,整数集Z中所有的元素又都在有理数集Q中.那么这些集合之间有怎样的关系呢?(宣布课题)

二) 新课教学

1. 集合与集合之间的“包含”关系;

实例分析:

1) A={1,2,3},B={1,2,3,4};因此有: 若a∈A,则a∈B.

2) 所有的有理数都是实数,因此有:若a∈Q,则a∈R;

3) 高一(1)班50位同学组成集合B,女同学组成集合A, 集合A是集合B一部分,有:若a∈A,则a∈B.

集合A是集合B的部分元素构成的集合,我们说集合B包含集合A;通俗点说集合A更小,集合B更大.

(由实际较简单的例子,可由学生自己总结定义得出包含关系).

如果集合A的任何一个元素都是集合B的元素,我们说这两个集合有包含关系,称集合A是集合B的子集.(文字语言)若x∈A,x∈B则AB(或BA)(符号语言)

记作:AB(或BA) 读作:A包含于B(或B包含A)

当集合A不包含于集合B时,记作AB

(教师引入Venn图:为直观表示集合,我们的集合也有其另外的表示方式)

2. Venn图:封闭曲线的内部表示集合,用Venn图表示两个集合间的“包含”关系(图形语言)

数集的表示我们也常借助于数轴.如集合{x│x≥9}与集合{x│x≤3}的关系可以表示为

判断题:

1) A是B的子集含义是A中任何一个元素都是B中的元素.

2) 空集是任何集合的子集吗?

3) 任何一个集合是它本身的子集吗?(引入相等关系)

3. 集合与集合之间的 “相等”关系;

例如:A={x|(x-3)(x+2)=0}.B={-2,3}

AB且BA,则 A、B中的元素是一样的,因此 A=B

即A=BAB

BA

结论:任何一个集合是它本身的子集

强调:1) 集合A与集合B中的元素完全相同时,则A=B.

2) 证A=B,需证AB且BA都成立.

例:A={x2,x,xy},B={1,x,y}且A=B,求实数x,y的值.

4. 真子集的概念

若集合AB,并且A≠B,我们就说集合A是集合B的真子集.

记作:AB(或BA)读作:A真包含于B(或B真包含A)

如实例中:高一(1)班50位同学组成集合B,女同学组成集合A,A为B的真子集.

判断:① 空集没有子集.② 任何集合至少有两个子集.③ 空集是任何集合的真子集.④ 若空集真包含于集合A,则集合A不等于空集.

(让学生熟练掌握概念和内涵,并引出一些相关规定.)

5. 规定:

空集是任何集合的子集,是任何非空集合的真子集.

(空集不是空集的真子集, 只能说空集是任何非空集合的真子集)

6. 结论:AB,且BC,则AC(集合运算具有传递性)

(在这一节课中,概念较为简单,由例子直接可以引入,学生理解也较好,主要采用讲练结合.所花时间较少)

三) 例题讲解

例1 化简集合A={x|x-72},B={x|x≥5},并表示A、B的关系;

例2 写出集合{0,1,2}的所有的子集,并指出其中哪些是它的真子集.

结论:集合A中元素的个数记为n,则它的子集的个数为:2n

真子集的个数:2n-1,非空真子集个数:2n-2(在后继学习中会对此结论加以证明)

四) 课堂练习:P9练习题(学生口答或板演)

五) 归纳小结,强化思想

学生总结两个集合之间的基本关系,两个集合之间的基本关系只有“包含”与“相等”两种,可类比两个实数间的大小关系.教师强调:注意区别“属于”与“包含”两种关系及其表示方法;注意区别“包含于”、“包含”、“真包含”、“不包含”等概念的不同涵义与不同表示法;要注意区分“属于”与“包含”,即“I∧”与 “ ”的差异.要学生注意,数0、集合{0}与空集 的区别.有时候,集合间的关系不容易直接从表达式中看出,可引导学生恰当地使用Venn图或数轴等直观形式来确定集合间的关系.

六) 作业布置

1. 书面作业:习题1.2 5个小题

2. 提高作业:① 已知集合A={x|a<x<5},B={x|x≥2},且满足AB,求实数a的取值范围.② 设集合A={四边形},B={平行四边形},C={矩形},

D={正方形},E={菱形},F={梯形},试用Venn图表示它们之间的关系.

(作业形式体现作业的巩固性和发展性原则)

五、 教学评价

本节内容较易懂,为学生创设了的探究知识的情景,从而充分调动学生学习数学知识的积极性,使学生有自主发现知识、创造性地解决问题的时间、空间.

六、 板书设计:

§2 集合的基本关系

1. 概念 2. 给出实例 3. 例题1 4. 练习

(学生板书)

例题2

第2篇:集合的含义与表示范文

一、遗忘空集和本身

例1.满足M?哿{0,1,2}且M?哿{0,2,4}的集合M的个数有()。

(A)1个(B)2个(C)3个 (D)4个

错解:由已知,M?哿{0,2},用列举法得M为{0},{2},{0,2},故选(C)。

剖析:忽视了M=/,故应选(D)。

点评:在集合部分,空集是一个特殊的集合,其定义为不含任何元素的集合,它的具体表现形式很多,可能是方程(组)无解,也可能是不等式(组)无解,或者为其他完全不存在的集合对象。课本上明确指出了它的很多性质,如(1)/?哿A,其中A为任一集合,当A非空时/?芴A;(2)/I A=/,

次考试,笔者都发现错误率很高。

二、忽视集合中元素的互异性

例5.设A={-1,a},B={1,|a|},若A∩B≠/,求实数a的取值范围。

错解:|a|≠-1,由已知A∩B≠/|a|=aa≥0。

剖析:当a=1时,B={1,1}和集合中元素的互异性发生矛盾,所以a的范围应为{a|a≥0且a≠1},故本题应考虑|a|≠1这一隐藏条件。

剖析:当m=1时,A中有元素1重复,和互异性矛盾,应舍去,m=-1。

剖析:本题C的值出现了增解,因为当C=1时,集合B出现了相同的元素,和互异性矛盾,故应舍去,C=- 。

点评:集合中的元素有三大性质:⑴确定性、⑵互异性、⑶无序性,其中的互异性在解题时最易被忽视,所以在已知两个集合满足某些条件,确定某些字母时要注意将所求得的结果代入检验集合中有无重复元素。

三、不能正确理解集合中元素的形式和真正含义

例7.下列哪个集合不同于另外三个集合( )。

错解:笔者发现学生大部分选(A)、(B)或(D)。

剖析:事实上(A)、(B)、(D)都表示集合{1},而(C)则表示的以“x=1”这个表达式为元素的集合,应选(C)。

分析:上述五小题出错率都很高,应分别选(D),(C),(D),(D),(C),究其原因主要是完全曲解了这些集合中元素的表示形式及真正含义,它们有时表示定义域,有时为值域,有时表示点集,只有认真审题,了解元素的真正含义,才能立于不败之地。

点评:集合有多种表示方法,如列举法,描述法,图示法等。描述法{x|x具有性质p}用得最多,我们称之为代表元素描述法,它被广泛应用于方程(组)、不等式(组)、函数等的表示,学生往往只留意表示方法中竖线右边的内容,而忽视其左边的内容,造成对集合中元素的真正含义模糊不清,解题时屡屡犯错,常见错误有{x>2}=

四、对“/”、“∈”、“?哿”、“ ?芴 ”、“∩”等符号不能正确识记

点评:本题错误率很高,正确答案为(B),只有关系式②是正确的,“∈”表示集合和元素之间的关系,“?哿”表示集合与集合之间的关系,值得注意的是一个集合可以一个元素的形式出现在另一个集合中,此时它们即为元素和集合之间的关系,如②和③,对⑤来说,(1,1)并非集合{y|y=x -2x+2,x∈R}的元素,另外我们还应注意符号“?芴”不包括相等这种情况,因此①当A=/时出现了问题。

例10.若A、B、C为三个集合,A∪B=B∩C,则一定有( )。

(A)A?哿C (B)C?哿A (C)A≠C (D)A=/

错解:笔者发现学生选(A)、(B)、(C)或(D)均有。

剖析:学生不能正确理解集合中符号“∩,∪,?哿,∈”的含义。方法一:利用定义转化抽象的符号语言,设任意元素x∈A或x∈B,A∪B=B∩C x∈B且x∈C,A?哿C,选(A)。方法二:利用A∪B,B∩C的等价的图形语言转化抽象的符号语言。

五、区间端点取舍模糊不清

(1)若A?芴B,求a的取值范围;

(2)若A∩B=B,求a的取值范围;

(3)若A∩B为仅含一个元素的集合,求a的值。

分析:在考试中发现学生答案较多,如在解(2)时,至少会出现1<a<2,1≤a<2,1<a≤2,1≤a≤2四种答案,(1)和(3)亦存在类似问题,我们归纳起来发现这些错误的共同特征是区间端点问题。解答这类问题的方法是借助数轴求解,首先要特别注意已知集合是否包括区间的端点,如本题集合B改为B={x| x -(a+1)x+a<0}其答案又都发生变化,本题正确答案依次为(1)a>2(2)1≤a≤2(3)a≤1,笔者据多年教学经验认为对区间端点如a=1和a=2代入集合B={1}和B={x|1≤x≤2},由此易得区间端点是否满足题意。

例12.已知集合A={ x|-2≤x≤4},B={ x|x>a}。

(1)若A∩B≠/,求实数a的取值范围;

(2)若A∪B=B,求实数a的取值范围;

(3)若A∩B≠/,且A∩B≠A,求实数a的取值范围。

分析:本题所揭示问题和上题类似,读者不妨一试,能否得如下答案:(1)a<4、(2)a<-2、(3)-2≤a<4,将本题中集合A改为A={ x|-2<x<4},答案有何变化?集合B改为B={x|x≥a},答案又如何?

总之,集合的概念在中学数学教学中的地位十分重要,且应用非常广泛,被高考列入必考内容。我们应高度重视,对其概念能够透彻理解,减少考试中的不必要的失分。

第3篇:集合的含义与表示范文

关键~:图灵机 转移函数 读写头 等价

中图分类号:TP301 文献标识码:A 文章编号:1674-098X(2016)10(b)-0162-03

图灵机(Turing machine, TM)是由图灵在1936年提出的,它是一种精确的通用计算机模型,能模拟实际计算机的所有计算行为[1-2]。近年来,很多学者对图灵机进行了研究,如在文献[3]中,王强证明了四元图灵机与五元图灵机的等价性;文献[4]研究了一种三状态图灵机的设计;文献[5]研究了图灵机与Petri网。进一步,文献[6]提出了量子图灵机的概念并研究了它的性质。

众所周知,概念的定义形式是理解、推导和掌握与之相关的性质及结论的基础。在教学中,如何更好阐述概念, 帮助学生分析概念之间的联系,从而更好理解和应用此概念是课堂教学的主要任务。图灵机是《计算理论导引》课程里的一个基本概念,它在可计算性理论及计算复杂性理论研究中起着重要作用。近几年来,笔者在从事《计算理论导引》课程的教学中,采用了几种不同类型的教材[1-2,7-8],发现这些教材中对图灵机概念的描述在形式上不尽相同,但教材上却没有明确指出这些不同定义形式之间的等价性。因此,深入剖析不同图灵机概念之间的关系可以帮助学生在学习过程中更好理解和掌握图灵机,同时也为图灵机的应用奠定基础。下面先给出教科书上常见的三种不同图灵机概念的描述。

1 预备知识

定义1([7])图灵机M是一个七元组:

其中:

Q为状态的有穷集合,,q为M的一个状态;

q0为为M的开始状态。对于一个给定的输入串,M从状态q0启动,读写头注视着输入带的最左端的符号;

F为是M的终止状态集合,为M的一个终止状态。一般地,一旦M进入终止状态,它就停止运行;

为带符号表(tape symbol)。为M的一个带符号,表示在M的运行过程中,X可以在某一时刻出现在输入带上。

为称为空白符(blank symbol),含有空白符的带方格被认为是空的;

为为输入字母表。为M的一个输入符号。除了空白符号之外,只有中的符号才能在M启动时出现在输入带上;

δ为为M的转移函数。

(i)表示M在状态q读入符号X,将状态改为p,并在这个X所在的带方格中印刷符号Y,然后将读写头向右移动一格。

(ii)表示M在状态q读入符号X,将状态改为p,并在这个X所在的带方格中印刷符号Y,然后将读写头向左移动一格。

定义2([1,2])图灵机是一个七元组

,其中:,都是有穷集合。

(1)并且Q为状态集;

(2)为输入字母表,不包括特殊空白符号;

(3)为带字母表,其中:;

(4)是转移函数。

若机器处于状态q,读写头所在的带方格内包含符号,当时,机器在所在的带方格内写下b以取代,然后将读写头向右移动一格,并进入状态p。

若机器处于状态q,读写头所在的带方格内包含符号,当时,机器在所在的带方格内写下b以取代,然后将读写头向左移动一格,并进入状态p。

为起始状态;

为接受状态;

为拒绝状态,且。

定义3([8])图灵机是一个五元组,其中

Q为状态的有穷集。

为带字母表,包括空白符号和左端点符号,但不包含符号和。

为起始状态;

为停止状态集合。

是转移函数,使得:

对所有的,如果,则。

对所有的且,如果,则。

2 分析

下面对上述三种定义进行分析。

相同点:上述三个定义都含有有穷状态集、起始状态、带字母表、停止状态集、空白符号及转移函数。

不同点:

(1)带字母表不同:定义3中的带字母表除了包含字母表及空白符号外,还包含左端点符号,但定义1及定义2的带字母表不包含左端点符号,只包含字母表及空白符号。

(2)停止状态集合不同:定义1的停止状态集合只包含接受状态,没有拒绝状态。定义2的停止状态集合只包含一个接受状态,一个拒绝状态。定义3的停止状态集合既包含接受状态又包含拒绝状态。

(3)转移函数不同:定义1和定义2所定义的转移函数都是从集合到集合的一个映射,对中的任一个元素,图灵机既要在读写头所在的带方格内印刷一个字符,又要将读写头向左或向右移动一格。定义3的转移函数是从到的一个映射,对中的任一元素,图灵机或者在读写头所在的带方格内印刷一个字符,或者将读写头向左或向右移动。

(4)左端点符号不同:定义3中明确给出了左端点符号, 并规定在任何状态下,如果读写头所在的带方格是左端点符号,则图灵机的读写头必须向右移动一个带方格。定义1和定义2中没有给出左端点符号,但在计算时要求若图灵机读写头处于带的最左端方格,即使转移函数指示的是,此时读写头也必须停在原地不动。

上述三种定义虽然在形式上是不同的,但是它们在能力上却是等价的,下面讨论它们的等价性。

命题1:定义1与定义2是等价的,即:若M_1和M_2是由定义1和定义2所分别定义的图灵机,则L(M_1)=L(M_2)。

证明:显然,由定义2所定义的图灵机都是定义1所定义的图灵机,即:若M是满足定义2的图灵机,那么M满足定义1。

反过来,设是由定义1定义的图灵机,则构造图灵机如下:

,,,,其中转移函数定义为,对任意的。

(1)如果,那么令;

(2)如果,那么令;

(3)如果,那么令;

(4)如果,那么令。

显然,图灵机N是定义2所定义的图灵机。综上可知,定义1与定义2是等价的。

文献[3]讨论了四元图灵机与五元图灵机的等价性问题,并给出了四元图灵机和五元图灵机的转换算法。在下文中,将文献[3]的算法应用到定义2和定义3,得到了如下结论。

3 结语

虽然在不同的教材中图灵机的概念在形式上不尽相同, 但由命题1和命题2可知,它们在能力上完全等价。形式上,三种不同定义各有侧重,即定义1和定义2侧重于描述图灵机在每一个状态下读、写及转移。定义3则侧重于图灵机不仅可以读、写,而且其读写头还可以左移、右移或保持不变。如果在教学中,适当增加图灵机等价模型的实际应用内容,不仅可以帮助学生更好理解图灵机概念,还能激起学生对学习的兴趣,培养学生自学和探索的能力。

参考文献

[1] Michael Sipser,Introduction to the theory of computation (Second Edition)[M].北京:机械工业出版社,2006:140-142.

[2] Michael Sipser,著.计算理论导引[M].唐常杰,陈鹏,向勇,刘齐宏,译.北京:机械工业出版社,2006:87-88.

[3] 王强.四元图灵机与五元图灵机的等价性[J].计算机科学,2003(31):192-193.

[4] 丁勤.一种三状态图灵机的设计[J].淮阴师范学院学报:自然科学版,2006(5):158-161.

[5] 宋文,牟行军.计算的模型:图灵机与Petri网[J].西华大学学报:自然科学版,2012(31):1-6.

[6] 李永明,李平.基于量子逻辑的图灵机及其通用性[J].计算机学报,2012(35):1407-1420.

第4篇:集合的含义与表示范文

A1=(6X1-1)+(6X2-1),(X=X1+X2)。

A2=(6X1+1)+(6X2+ 1)。

A3=(6X1+1 )+(6X2-1)或A3=(6X1-1)+(6X2+ 1)。

则 A= Pn +B1

A= P n-1 + B2,

A= P1 +Bn.。

再筛取B数列中的素数,叫双筛素数,用ps 表示。P=A- ps ,A= ps+(A- ps)=P+P,故双筛素数与其对应的素数的组合,则是歌德巴赫猜想之正解。

【关键词】 偶数;奇数;合数;素数;双筛素数

一、非通用算术符号及定义

(1)P表示素数,Pn表示素数数列,ps表示双筛素数。

(2)j表示奇数,aj表示数列末项数。

(3)j-={6X-1|,X≥1,X∈N*}={5、11、17……}。j+=6X+1|, X≥1,X∈N*}=7、13、19……。(注:表达式中凡算数符号右上方标有“-”号的,只应用于6X-1数列,右上方标有“+”号的,只应用于6X+1数列)。

(4)H表示合数。H1p表示素数因子P产生的合数,H1P表示P产生的数列首项合数, Hn表示合数数列。

(5)X-H或X+H表示可计算合数的项函数,X-p或X+p表示可计算素数的项函数,X-Hf、X+Hf表示反方向筛出的合数项函数,X-Pf 、X+Pf表示反方向筛出的素数项函数, Hf与Pf表示反方向筛出的合数及素数,XPs- 、XPs+ 表示双筛素数项函数。

(6)g表示个数,如Pg表示素数的个数。

(7)CA(B),表示筛去{A}中子集{B}含有的元素。

二、双筛素数定义

双筛素数用ps表示,即由不小于6的偶数A含有的奇数数列的首末项,正反两方向筛出的素数,叫双筛素数。

三、合数计算单元域

定义一个奇数数列含有的奇数个数的区域,这个区域含有奇数的个数是数列的末项数减去首项数除以2,其中末项奇数不计算在内,如J1g=(9-1)/2=4,J3g=(25-9)/2=8……Jng=[(n+2)2 C n2]/2。可用集合表示,即:U1={1,3,5,7},U3={9,11,13……23}, U5={25,27,29……47}, U7={49,51……79},……,Un={ n 2,( n 2+2),……[( n +2)2 - 2]}。这个区域含有的合数是小于这个数列末项数的平方根的素数产生的合数。这个区域叫做合数计算单元域,简称合数单元域。

四、集合单元的划分及含有的素数因子

设U={X|X=2m-1,1≤m且m∈N*}={1,3,5,7,9,……n}。

令U1={1,3,5,7}叫做U1集合单元,不含素数因子。

U3={9,11,13,……,23}叫做U3集合单元, 素数因子Pn≤=3。

U5={52,(52+2),……[(5+2)2 C 2]}叫做U5集合单元。素数因子Pn≤≤=5,3。

Un ={[n2,(),……[(n+2)2 - 2]}叫做Un集合单元。Pn≤……7,5,3。

通过上述表述证明集合单元是连续的、递增的、无穷的。

五、集合单元含有的素数

U1={1,3,5,7}。

H1={1,},

H1U1,

Cu1H1 ={3,5,7,}。P=3,5,7。

U3={9,11,13,……,23}。Pn≤=3。

H3={x|x =9+(n-1)6,n∈N*}={9,15,21,}。H3U3

Cu3H 3 ={11,13,17,19,23}。 P=11,13,17,19,23。

U5={25,27,29,……,47}。Pn≤=5,3。

H3={27,33,39,45}, H5={x|x =15+(n-1)10,n∈N*}={25,35, 45}。H3 U5,H5U5。

其中H3∩H5={45∈H3,且45∈H5}。

(H3∪H5)={25,27,33,35,39,45}。

Cu5(H 3∪ H5) ={29,31,37,41,43,47}。P=29,31,37,41,43,47。

U7={49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79}。Pn≤=7,5,3。

H3={51,57,63,69,75, }。

H5={ 55,65,(75)}。

H7={49,(63),77 }。

注Hp={x|x =(2n+1)P,n∈N*}。

H3∩H5={75∈H3,且75∈H5} ,H3∩H7={63∈H3,且63∈H7}。

(H 3∪ H5∪ H7)= {49,51, 55,57, 63,65,69, 75,77, }。CU(H 3∪ H5 ∪ H7)= {53,59,61, 67,71,73, 79}。P=53,59,61, 67, 71,73, 79。

通过上述表述证明:(1)大于U1的Un集合单元都含有等于及小于n 的素数因子的子集(素数做为乘数时叫做素数因子),所有子集包含的元素都是合数,所有子集的并集包含的元素则是集合单元所包含的全部合数。(2)大于U3的Un集合单元必然含有U(n-2)单元,U(n-2-2)单元,......U3单元。Un产生的{Hn}数列,与U(n-2)产生的{H(n-2)}数列,与U(n-2-2)产生的{H(n-2-2)}数列,...与U3产生的{H3}数列必然产生交集元素。所以Un集合单元一定含有两个素因子的子集的交集元素。集合单元含有的数列末项数愈大,含有的子集愈多,产生的交集元素也愈多。并且诸子集的并集包含的元素是诸子集元素叠加排列的非连续的,无公差的全合数数列,其元素一定少于全集合所包含的元素。所以大于U1的集合单元一定存在所含子集的并集的补集,即一定含有素数。况且,U1单元含有3个素数,U3单元含有5个素数,之后每递增一个集合单元,则只增多一个素数因子,4个奇数,只产生3个合数(注:在Un={n2,(n2+2),...(n+2)2-2}域中n2是合数,H,g=1,在[(n2+2)...(n+2)2-2]域中{[(n+2)2-2]-(n2+2)}/2n={4n+2}/2n=2+2/2n,所以Hg=2.所以在Un={n2,(n+2)2-2}域中Hg=3。4>3,所以大于U1的任意集合单元Un都一定含有素数,且Pg>5。(3)集合单元是连续的,递增的,无穷的,素数也是逐集合单元连续分布的,无穷的。

六、大于3的奇数可用6的函数表示

如:5=6?-1。 11=6?-1。

7=6?+1。 13=6?+1。

9=6?+3。 15=6?+3。

所以大于3的奇数可分为三类,即:

j1=6X-1(X≥1且X∈N*)={5,11,17,……}。

j2=6X+1(X≥1且X∈N*)={7,13,19,……}。

j3=6X+3(X≥1且X∈N*)={9,15,21,……}。

所以奇数数列可排列为1、3、(6X1-1)、(6X1+1)、(6X1+3)、(6X2-1)、(6X2+1)、(6X2+3)……。

七、j1-=(6X-1)数列含有的合数H-n及合数项函数X-H值的计算

在(6X-1)数列中,35是首位合数,5?=35 , 6X-1=35 ,X=6.其中5=P-,7=P+。设 U={1,2,3……(aj1-+1)/6} 。

X1H5=6,X1H7=6。根据通项公式an=a1+(n-1)d所示:

XH5n=6+(n-1)5=5n+1。XH5={X|X=5n+1,1≤n,且n∈N*}={6,11,16,21……} , XH5U。

XH7n=6+(n-1)7=7n-1。XH7={X|X=7n-1,1≤n,且n∈N*}={6,13,20,27……},XH7U。

素因子11产生的首位合数是11?=77其中11=P-,7=P+。

X1H11= 77+1/6=13。

XH11n=13+(n-1)11=11n+2。XH11={X|X=11n+2,1≤n,且n∈N*}={13,24,35,46……},X11U。

素因子13a生的首位合数是13?=65 其中13=P+,5=P-。

X1H13=65+1/6=11。

X1H13n=11+(n-1)13=13n-2。XH13={X|X=13n-2,1≤n,且n∈N*}={11,24,37,50……},X13U。

X-H=(XH5∪XH7∪XH11……∪XHP)={6,11,13,16,20, 21……}。

XHp1=(P+Y?+1)/6或-P-Y?+1)/6,

XHpn= XHp1+(n-1)P。 ……7-1 。

所以,在(6X-1)数列中,含有的全部合数项函数X-H的值,等于集合XH5、XH7、XH11…的并集含有的元素的值。

八、j2+=(6X+1)数列含有的合数H+n及合数函数X+H值的计算

在(6X+1)数列中,25是首位合数,5?=25. 5=P-, 25=P-・-P-。设U={1,2,3……(aj2+-1)/6}。

X1H5=25-1/6=4。根据通项公式an=a1+(n-1)d所示:

X1H5n= XH51+(n-1)5=5n-1。XH5={X|X=5n-1,1≤n,且n∈N*}={4,9,14,19,24……},X5U。

素因子7产生的首位合数是7?=49 , 7=P+ ,49=P+Y

P+。

X1H7=(49-1)/6=8。

X1H7n= X1H7+(n-1)7=7n+1。XH7={X|X=7n+1,1≤n,且n∈N*}={8,15,22,29……},X7U。

同理,XH11n=11n-2。XH11={X|X=11n-2,1≤n,且n∈N*}={9,20,31,42……},XH11U。

X+H=(XH5∪XH7∪XH11……∪XHP)={4,8,9,14,15, 19,20……}。

X1Hp=(P-・5-1)/6或(P+・7-1)/6 ,

XHpn= XHp1+(n-1)P, ……8-1。

所以在(6X+1)数列中,含有的全部合数项函数X+H的值,等于集合XH5、XH7、XH11…的并集含有的元素的值。

九、j3=6X+3数列含有的合数

j3=6X+3(X≥1且X∈N*)={9,15,21,……}。集合含有的元素都是合数。

所以,大于3的素数只能只分布在6X-1(X∈N),和6X+1(X∈N)两个数列中。

十、计算奇数j1-=6X-1数列含有素数项函数X-p及素数P-的值

设任意奇数aj1-,则aj1-含有(6x-1)数列的项数函数X值是集合U包含的元素,U={1,2,3,……(aj1-+1)/6}。

X={1,2,3,……(aj1-+1)/6},又因为aj1-含有的素因子Pn

XH5={X|X=5n+1,1≤n,且n∈N*} XH5 U,

XH7={ X|X=7n-1,1≤n,且n∈N*} XH7U,

XH11={ X|X=11n+2,1≤n,且n∈N*} XH11U,

X-H=(XH5∪XH7∪XH11……∪XHP), X-p=Cu(X-H)。

P-=6YX-p-1。……10-1。

举例1,计算 j-1=6X-1=35,含有的素数。(含有,指小于末项数的素数)。

U={1,2,3,……(35+1)/6},X={1,2,3,4,5,6}。

Pn

XH5={X|X=5n+1,1≤n,且n∈N*}={6}。XH5U。

X-H={6}, X-p =Cu(X-H)={1、2、3、4、5}。

P-=6 X-p -1=6?-1=5。

6 X-p=6?-1=11。

6 X-p=6?-1=17。

6 X-p=6?-1=23。

6 X-p=6?-1=29。

所以,35含有的属于P-的素数是X=X-p时,则P-=6 X-p -1=5,11,17,23,29。

举例2,令j-1=6X-1=161,求含有的素数P的值。

解,aj-1=161 ,

U={1,2,3,……(161+1)/6} , X={1,2,3,……27},Pn

XH5={X|X=5n+1,1≤n,且n∈N*}={6,11,16,21,26}

XH5U,

XH7={X|X=7n-1,1≤n,且n∈N*}={6,13,20,27}

XH7U,

XH11={X|X=11n+2,1≤n,且n∈N*}={13,24}

XH11U,

X-H=(XH5∪XH7∪XH11)={6,11,13,16,20,21,24, 26,27}。

X-p =Cu(X-H={1,2,3,4,5、7,8,9,10,12,14,15,17,18,19,22,23,25}。

P-=6X-p -1=5,11,17,23,29,41,47,53,59,71,83,89,101,107,113,131,137,149。

十一、算奇数j+2=6X+1数列含有素数函数X+p及素数P+的值

设任意奇数aj+2,则aj+2含有6X+1数列的项数函数X值是集合U包含的元素,U={1,2,3……(aj+2-1)/6}。

X={1,2,3,……(aj+21)/6},Pn

XH5={X|X=5n-1,1≤n,且n∈N*} XH5,

XH7={X|X=7n+1,1≤n,且n∈N*} XH7U,

XH11={X|X=11n-2,1≤n,且n∈N*} XH11U,

X+H=(XH5∪XH7∪XH11……∪XHp), X+p =Cu(X+H).

P+=6 X+p +1。……11-1.

举例,计算j+2=6X+1=49含有的素数的值。

U={1,2,3……(49-1)/6}。X={1,2,3……8}。

又=7,所以49含有的素因子 Pn=7、5。

XH5={X|X=5n-1,1≤n, 且n∈N*}={4} XH5 U,

XH7={X|X=7n+1,1≤n, 且n∈N*}={8} XH7 U,

X+H= (XH5∪XH7)={4、8}。

X+p =Cu(X+H) = {1,2,3,5,6,7}。

P+=6 X+p +1=6×1+1=7。

=6×2+1=13。

=6×3+1=19。

=6×5+1=31。

=6×6+1=37。

=6×7+1=43。 P+n=43 ,37,31,19,13,7。

综上述证明,大于3的素数的值都是可以计算的。

十二、偶数A的特性

特性1:大于2的偶数可用6的函数表示

如:4=6×1-2 , 10=6×2-2, 16=6×3-2,

6=6×1, 12=6×2, 18=6×3,

8=6×1+2, 14=6×2+2, 20=6×3+2。

所以偶数A可分为三类,即:

A1=6X-2(X≥1,且X∈N*)=4,10,16……。

A2=6X+2(X≥1,且X∈N*)=8,14,20……。

A3=6X(X≥1,且X∈N*)=6,12,18…… 。

所以偶数数列可排列为2,(6X1-2),(6X1),(6X1+2),(6X2-2),(6X2)(6X2+2),(6X3-2),……。

特性2:偶数的组合

A1 =6X-2,令X=X1 +X2 ,(X∈N*)。

6X-2=6(X1+X2 -2=(6X1 -1)+(6X2 -1)。

A1 =6X-2=(6X1-1)+(6X2 -1)。

A2 =6X+2,令X=X1+X2 ,(X∈N*)。

6X+2=6(X1+X2 )+2=(6X1+1)+(6X2 +1)。

A2 =6X+2=(6X1 +1)+(6X2 +1)。

A3 =6X 令X=X1 +X2,(X∈N*)。

6X=6(X1 +X2)+1-1 =6X1 +6X2 +1-1,

A3=(6X1+1)+(6X2-1)或A3=(6 X1-1)+(6 X2+1)。

特性3:凡大偶数都可以表示成两个素数的和。

3-1,求证A1=6X-2=P+P,(X∈N*)。

解,已知: (1)A1=6X-2=(6X1-1)+(6X2-1)[X=X1+X2].

(2)A1含有(6X-1)项数函数值是集合U={1,2,3,……A1/6}包含的元素值。

(3)A1含有的产生合数的最大素数因子P< 。

(4)集合U含有的XHP 值的子集分别是:

XH5={X|X=5n+1,1≤n,且n∈N*}={6,11,16,21,……}, XH5U,

XH7={X|X=7n-1,1≤n,且n∈N*}={6,13,20,27,……}, XH7U,

XH11={X|X=11n+2,1≤n,且n∈N*}={13,24,35……}, XH11U,

XH13={X|X=13n-2,1≤n,且n∈N*}={11,24,37,…},XH13U,

XHP={X|X=P(n-1)+HP-1,1≤n,且n∈N*}={ N*,N* ,N*,…},XHPU。

(5)X-H =(XH5∪XH7∪XH11…∪XHP)={6,11,13,16,20,…}。

(6)X-p =CU(X-H)={1,2,3,4,5,7,8,9,10,12,14,15,17,18,19…}。

(7)A1含有素数P-=6・X-p -1=5,11,17,23,29,41,47,53,59,71,83,89,101,107,113… 。

又 A1 - P-n=B1,

A1 - P-n-1=B2,

A1 - P-1=Bn-1,

A1 - P-1 =Bn。

令P-n、P-n-1、…P-1均为(6X-1)数列含有的素数,B1、B2…Bn也必然是(6X-1)数列中的奇数,所以A1含有的两个(6X-1)数列,含有的奇数个数相同,只是排列顺序首、末项相反,但其各项位相互对应(对应:指an=an-m+am,则an-m与am是对应的)。再筛B数列,由于B数列是按A1数列的反方向排列的,且P-项位与B项位是相互对应的重叠的。又根据已知(7)、(6)、(5)、(1)、得知,在6X-1 数列中含有的X-H元素是非连续(连续,指自然数列或等差数列),无公差的数列,之余项一定都是X-p元素,故X-H 项与X-p项是互补元素,同理在6X-1 数列中含有的H-n数列也是非连续的,无公差的数列,之余项必然都是P-项,故H-项与P-项也是互补元素,当B数列按A1数列的反方向排列时,其项函数X也必然是按A1数列的反方向排列的。由于A1=6X-2,X=(A1+2)/6,X-Hf={(A1+2)/6-6,(A1+2)/6-11,(A1+2)/6-13,(A1+2)/6-16 . . . }。 X-pf = Cxp-(X-Hf ),H-f=6YX-Hf -1,而P-f=6YX-Pf -1。由于X-Hf项与X-pf项是互补元素,所以B数列含有的Hn-f数列与Pn-f数列也是两个互为补集元素的数列。又根据(5)X-H所列合数项元素的项位及项位差与(6)X-P所列素数项元素的项位及项位差都是完全不同的,所以H-项位及项位差与P-项位及项位差也都是不同的。当H-数列也按A1数列反方向排列时,其B数列含有的{Hf-}位与{Pf-}项位的项位差是不变的。况且{H-f }元素与{Pf-}元素又是互补元素,所以与各P-项位对应的各B项位就一定不完全是H-f 项位。CB(H-f )= pf,pf≠ 0 或pf≥1。所以在B1、B2……Bn中至少含有一个或多个双筛素数,用ps 表示,即,A1-P-= ps 。且与ps对应的项位数一定是素数, P- =A1- ps。

综上述,由于A1含有的正反两个数列同是6X-1数列,含有X-H的元素是固定的,相同的,所以用X-H=(XH5∪XH7∪XH11……∪XHP)={6,11,13,16,20,……}之元素,由大偶数A1反方向再次筛除X-p数列中的合数函数,剩余的函数则是双筛素数项函数X-pS 。

X-Hf=,{(A1+2)/6-6,(A1+2)/6-11,(A1+2)/6-13,(A1+2)/6-16…}。

X-ps = CXp-(X-Hf ) ……12-1。

ps = 6YX- pi -1 ……12-2。

又P-=A1-ps 。

A1 = ps +(A1- ps )= ps + P- =1+1……12-3。

举例:求证大偶数A=100=P+P。

A1=100=6X-2,U={1,2,3,……100/6}。X={1,2,……,16}。

XH7 ={X|X=7n+1,1≤n,且n∈N*}={8,15}, XH7U。

X+H=(XH5∪XH7) ={4,8,9,14,15}。

X+p =Cu(X+H)={1,2,3,5,6,7,10,11,12,13,16,17}。

X+Hf={(104-2)/6-4,(104-2)/6-8,(104-2)/6-9,(104-2)/6 -14,(104-2)/6-15 } ={13,9,8,3,2}。

根公式12-4。

X+ps =CXp+( X+Hf)={1,5,6,7,10,11,12,16,17}。

p+i=6YX+ps+1 =7,31,37,43,61,67,73,97,103。 (注(104-103

P+=A2-p+s=104-7,104-31,104=P++p+s=97+7=73+31 … 。A2=104=p+s +P+=1+1。

3-3,求证A3=6X=P+P,(X∈N*)。

已知:(1)A3=6X=(6X1+1)+(6X2-1)或A3=6X=(6X1-1)+(6X2+1),[X=X1+X2]。

(2)A3=A1+2。所以大偶数A3含有A1含有的全部双筛素数项函数X-pi,又A3=A2-2。所以大偶数A3含有A2含有的全部双筛素数项函数X+ pi。

(3)确定{xp-},{XH-}及{xp+},{XH+}含有的元素,又X=A3/6,从而确定{xHf-}{xpi-}及{xHf+ {xPi+}}含有的元素,X-pi=Cx-P (X+Hf),X+Pi=CXp+(X-Hf),则p-i=6YX-Pi-1,或 p+ i =6YX+P i +1。

p-=A3-p+ i,p+=A3-P- i

A3=p+ i+p-=1+1或A3=p-i+p+=1+1 ……12-7。

举例:求证大偶数A3=102=P+P。

102-2=100,XP-={1,2,3,4,5,7,8,9,10,12,14,15},XH-={6,11,13,16}。

102+2=104,

XP+={1,2,3,5,6,7,10,11,12,13,16},

XH+={4,8,9,14,15}。

又A3/6=17.xHf+={17-4,17-8,17-9,17-14,17-15}={13,9,8,3,2},X-ps=Cx-P (X+Hf)={1,4,5,7,10,12,14,15}。

XHf_={17-6,17-11,17-13,17-16}={11,6,4,1},X+Ps=CXp+(X-Hf)={2,3,5,7,10,12,13,16} 。

p-s=6YX-pi-1=5,23,29,41,59,71,83,89。p+s=6YX+P i+1=13,19,31,43,61,73,79,97。

取p+s =97,取p-s =89。

P-=A3-p+i=102-97=5,A3=102=97+5,P+=A3-p-i=102-89=13,

A3 =102=89+13。

A3=P+P=1+1。

综上所述,双筛素数的特性:

(1),确定性,不小于6的偶数都含有至少一个或多个双筛素数,偶数值愈大含有的双筛素数愈多。

(2),对应性,不小于6的偶数含有的双筛素数,所对应的项位数一定是素数,即:P=A-ps。

(3),歌德巴赫猜想解,P=A- ps,A= ps+(A- ps)=P+P。

十三、橹人定理:

不小于6的偶数A都含有至少一个或多个双筛素数pi,且与双筛素数相对应的项位数一定是素数,即

A- ps =P。又不小于6的偶数可用A1=6X-2,A2=6X+2,A3=6X只三个数列表示,其中,

A1 = p-s+ (A1 -p-s) =P+P,

A2 = p+s+ (A2 -p+s)=P+P,

A3 =p-s+ (A3 - p-s)=P+P或A3 =p+s+ (A3-p+s)=P+P。

第5篇:集合的含义与表示范文

遍布全世界的主机和服务器,错综相联的超媒体资源,这是互联网为我们所构建的一个巨大而丰富的电子信息空间。它无疑是现代社会最重要的信息获取手段,但是它的开放性、分布性、无序性以及惊人的发展速度也为人们对信息资源的利用带来了困难。正如在大海中行驶的船只需要导航系统确定方位一样,要想在茫茫的信息海洋中有效获取有用信息,也必须拥有便捷有效的信息导航技术。一般来说,www网络中常用的信息导航方式有三种:一是利用门户网站的分类索引;二是利用网络搜索引擎;三是利用网站的相关链接。但是目前这三种信息导航方式的效果都不尽如人意。分类索引所覆盖的网络站点范围太小,更新较慢,难以适应网络的快速增长,而且分类标准的不统一和不规范常常影响到用户对站点所属的判断,造成导航失败。搜索引擎虽然是目前主要的网络信息检索工具,但是通过简单的逻辑运算检索到的结果往往是数量庞大且鱼目龙杂,充斥着大量的无用和重复信息。网站的相关链接是指符合当前网站内容主题的内部和外部信息资源的超链接,这种导航方式虽然简单直接,但是信息量非常有限,而且对外部信息的链接常常出现错链和假链,即使是内部信息,也常常因为组织和描述方式的影响,造成用户的“资源迷向”。

用户在信息空间中的“迷航”会使他们感到厌倦而丧失获取信息的信心,分析其原因,主要包括以下几个方面[1,2]:

(1)网络的巨大信息量使人们必须依赖于自动化的处理技术。但是目前因特网的各个网端的技术支持环境比较复杂,信息资源的内容范围、组织结构和存储方式各不相同,呈现出分散、无序、变幻多端的特点,这使自动信息处理技术的应用困难重重。因此要提高信息导航的效率和质量,必须先解决资源异构的问题。

(2)网络信息空间中的数据大多以半结构化和非结构化的形式存在,对信息资源的内容缺乏形式化的语义描述,而且大部分资源间的链接也没有反映语义关系,这使得机器很难对网络信息空间进行深层次的理解和处理,对信息的自动导航也无法像人工操作那样准确有效。

(3)目前的网络导航系统缺乏个性化的信息服务。由于知识背景的差异和一词多义等方面的原因,不同的网络用户之间、用户与系统设计者之间对于问题和信息内容可能会具有不同的理解与认识,当用户按照自己的思路查找信息时,他所选择的导航路径可能是错误的或者低效的。因此信息导航必须考虑具体用户的特殊性,有针对性地提供导航服务。

(4)网络导航系统的设计缺乏规范。门户网站各自依据不同的标准建立自身的分类导航系统,网站的划分随意性较大,常常引起用户的困惑。一些著名的信息搜索引擎也各自采用不同的检索规则,有些系统不能利用历史信息或者不提供二次检索,给用户的使用带来不便。另外,在网站内部的导航系统设计上,也存在着导航结构不合理,导航要素不完整,导航界面不统一等问题。这些都可能造成用户的导航障碍。

由此可见,造成信息“迷航”问题的主要原因在于缺乏信息空间的合理组织和有效的导航机制,这也是第二代web网络技术难以克服的困难。为此,人们正在研制第二代web网络——Semantic Web,它以结构化信息表示为主,为网络导航研究开辟了新天地。

2 Semantic Web技术

Tim Berners Lee在1998年提出了Semantic Web的概念。2001年2月,W3C组织正式推出Semantic Web Activity,使网络环境下的语义处理技术研究渐入佳境。Semantic Web研究活动的目标是开发一系列可由计算机理解和处理的语义表示语言和技术,通过显式的语义表示和领域本体将网络信息空间编织成为一个巨大的机器可读的知识网络,以支持自动化的信息访问和知识管理,实现高质量的网络信息服务。目前关于Semantic Web的研究主要集中在网络信息资源及其内容的语义和语义关系表征,基于语义的数据自动分析、理解和处理,不同应用领域和系统间的数据自动交换、转换和复用[3]。Semantic Web虽然是现有web网络的延续,但在信息导航方面具有许多普通web没有的优势。Semantic Web中的节点既可以代表物理页面,也可以代表知识实体;Semantic Web中网页的内容不但可以被人理解,而且可以被机器理解;Semafitic Web中的链接不再是任意的,而是遵循一定的语义关系。通过Semantic Web技术,可以改变现有网络松散的数据结构,将信息资源结构化并赋予含义,使网络信息的整合和自动处理都变得更加容易[4]。

2.1 本体

所谓本体(Ontology),实质上是描述特定应用领域知识的公认的术语集。关于奉体的定义,比较著名的观点是“本体是概念模型的一个显式的规格说明”和“本体是共享概念的一个形式化的规格说明”,其中,“概念模型(Conceptualization)”是指通过对某个客观现象的相关概念进行辨析和提取而获得的关于该现象的抽象摸型;“显式(Explicit)”是指对所使用的概念的类型,以及这些概念在应用上的约束都给予明确的说明;“形式化(Formal)”表示本体以计算机可读的形式存在;“共享(Share)”表示本体中反映的是共同认可的知识”[5]。

本体通常表达为一组对象(概念)、关系、函数、定理和实例。本体中的对象类按照等级关系组织成基本的结构体系。等级关系包括例化(is-a)关系、类属(kind-of)关系和整部关系(part-of)。上层的对象类为父类,下层的对象类为子类。对象类具有各自的属性,并可依据父子关系继承。对属性的取值对象、取值范围、取值基数等都可以加以限制,还可以对属性的交换性、对称性、传递性、唯一性等进行定义。除了等级关系,本体中的对象类间还可以具有其他语义关系,形成语义网络形式的概念模型。本体是机器自动推理和智能化高级信息服务的基础,对网络而言,一个简单的本体的典型例子就是网络的分类索引(如Yahoo!的分类目录)。本体的应用对于提高网络导航的精度和效率具有重要的意义[1,4)。

2.2 RDF和RDFS

RDF是由W3C开发的元数据描述机制,其目的主要是为元数据在网络上的编码、交换和重用提供一个基础。它允许在XML的基础上以一种标准化的、互操作的方式对数据语义进行定义[4],提供了一个描述web资源的数据模型。RDF包含描述资源的属性和关系的声明。资源是任何用URl(Uniform Resource Identifier)唯一标识的实体对象。资源具有属性,属性则具有一定的值,该值可能是简单的字符串或数字,也可能是自身也具有属性的其他资源。这样,资源、资源属性和属性值构成了RDF声明中的三元关系模式,任何本体或描述性元数据都是这种三元关系模式的具体体现”[1,7]。

为了描述元数据元素间的复杂语义关系,W3C进一步定义了RDFS(RDF Schema)。它可以看成是一个本体定义语言,用来建立概念类体系结构、属性层次和类关系。

3 基于Semantic Web的智能导航机制

Semantic Web的出现为网络信息导航提供了新的研究思路,Semantic Web技术是解决无序网络空间中“迷航”问题的关键技术。基于Semantic Web的智能导航是一种以结构化、语义化的概念知识网络为基础,自动形成个性化导航结构的方法。它分为两个方面,一是基于Semantic Web的信息组织,即利用参考本体对各信息源进行语义描述和整合;二是基于Semantic Web的个性化导航结构模型的构建,即在有序语义组织的基础上,构造用户语义模型,并据此建立导航结构。图1显示了基于Semantic Web的智能导航机制的概念结构[8]。

3.1 基于Semantic Web的信息组织

基于Semantic Web的信息组织的基本思想是,将来自于多个异构信息源中的数据整合到一个语义统一的参考本体中。参考本体是通过分析领域中的各个信息资源集合,提取公共概念、属性和关系而构建的本体,它为所有信息资源提供统一的概念集合和通用语义。

信息整合的方法是先分别将各个信息源中的数据转换为通用的数据模型,然后建立各个数据模型和参考本体之间的映射关系。网络中的信息源具有各种各样的数据格式,其中大部分是HTML页面,有的包含表格和列表。另外还有XML文档、RDF文档以及关系数据库文档等。为了解决分布式异构信息源的语法相异问题,需要将数据转换为公用的数据模型格式,例如RDF。对于非RDF格式的信息数据,可以利用外覆包(wrapper)技术将其自动地转换为基于RDF的数据模型。外覆包对特定格式的数据文档进行解析,并采用RDF声明对其内容进行标注。下面是三种常用的外覆包:

(1)HTML外覆包。由于HTML页面属于半结构化的信息数据,因此HTML外覆包采用的是半指导性的标注方法。即预先手工标注一组HTML页面,然后对新的HTML页面进行结构分析,将新页面与标注页面进行比较,从中提取相关信息。HTML外覆包还可以处理异构的XML文件[1]。

(2)XML外覆包。根据DTD和Schema所定义的XML文档的内容结构和内容元素,建立概念集与DTD Schema之间的映射关系,从而自动地将XML文献中的DTD内容元素标记转换为对应的概念集元数据标记。

(3)关系数据库外覆包。将关系数据库中的数据元素和二维数据关系映射到概念集中,形成语义基础,以便从关系数据库中自动创建RDF声明。

由于不同的信息提供者可能会使用不同的词表来标注数据,因此在建立通用数据模型后,还必须在信息数据源和参考本体之间建立概念和关系的映射,以消除语义差别。根据RDF声明,在参考本体中注册相关内容的来源,使参考本体成为一个知识内容的集成文件。另外,采用基于本体的元数据发现和漫游技术,探测相关的RDF声明,可以自动地添加新的信息资源[8]。

3.2 基于Semantic Web的个性化导航

通过建立参考本体以及进行信息整合,无序异构的网络信息数据通过语义概念及语义关系被组织到一起,形成一个有序的公共语义知识模型。但是对于具体网络用户的信息导航,并不直接在全部公共语义模型上进行,而是依据用户语义模型有针对性地进行。

3.2.1 用户语义模型

用户语义模型是反映用户观点的概念集合和概念关系。概念集合的确定可以由用户直接提交或者根据用户的注册信息(用户的兴趣、爱好和知识背景等)按照一定的规则计算选择。而构建用户语义模型的关键步骤在于建立用户概念集合与参考本体间的语义映射,寻找参考本体中与用户相匹配的概念和关系。

为了将参考本体映射到用户语义模型,需要预先对参考奉体和用户概念集合进行数据训练,方法是为每个本体概念和用户概念各标注一定的相关资源作为训练数据,然后利用向量空间模型为每个概念生成向量,并计算其标准权重。

建立语义映射的过程通过计算用户概念集合中的概念向量uc与参考奉体中的每个概念向量间的匹配度来完成。假设在n维向量空间中,用户概念向量uc中第i项的权重为的匹配度为[9]:

首先将计算结果中匹配度高于阀值的若干概念向量与uc建立映射,形成从用户概念集合到参考本体的一对多的对应关系。如果参考本体的一些概念被重复映射,则需要选择其中匹配度最高的映射,以保证从参考本体到用户概念集合的一对一关系,即一个本体概念只能和一个用户概念相关,但一个用户概念可以和多个参考概念相关。在建立用户概念集合与参考奉体对应关系的同时,用户概念也继承了本体中的概念层次结构和其他语义关系,成为一个独立的语义模型。

原则上应该将参考本体中的所有概念都映射到用户语义模型中,但是由于用户语义模型是范围相对较小的概念集合,因此参考奉体中的概念实际上不可能被完全映射。为了保持映射的完整性,可以在用户语义模型中设立一个“其他”概念类,参考本体中的所有没有被映射的概念将成为它的子概念[9]。

举例来说,假设用户提供的信息表明其在体育领域感兴趣的概念为“足球”、“足球世界杯”、“足球亚洲杯”、“NBA”、“围棋”、“奥运会”,图2显示了这些用户相关概念经过映射后形成用户语义模型的过程。

用户概念集合中的每一个概念都在参考本体中找到了与之相对应的一个或多个概念,将这些概念从参考本体中提取出来,并根据其语义关系重新组合,就形成了用户语义模型的结构。例如:用户概念“NBA”的对应概念为“篮球”、“篮球赛事”和“美国篮球职业联赛(NBA)”,因此这三个概念都被包含在用户语义模型中,且它们之间的父子关系(即等级关系)保持不变。又如,虽然参考本体中的“其他赛事”概念和用户概念集合没有直接对应关系,但由于该概念和“足球赛事”与“篮球赛事”两个概念间有语义关系,且这两个概念均与用户相关,因此该概念也被包含在用户语义模型中。另外,“世界杯足球赛”概念实际上与“足球”和“足球世界杯”两个概念间都具有对应关系。但由于它与后者的匹配度比前者高,因此将它映射到后者。

3.2.2 个性化导航结构模型

导航结构模型显示了导航系统组织、关联和显示信息内容的方式。站点地图就是一种最简单直接的导航结构模型。个性化导航结构模型是基于用户语义模型创建的针对特定用户的导航结构,是个性化导航服务的实现。

导航结构的设计需要考虑三个基本要素:卡片、页面和链接。一张卡片只包含一种类型的信息内容,是导航结构模型中的最小组成单元。页面与物理的web页面相对应,一个页面上可以包含若干个卡片。链接则用于连接各个页面中的卡片以形成整体结构[8]。通常,导航结构模型总是从一个缺省的根页面开始,每一级页面都包含了到下一级页面的链接,信息内容通过卡片和页面进行分类和聚合,导航通过链接来进行。在个性化的导航结构建模中,导航结构是根据用户语义模型来确定内容和链接关系的。图3显示了一个导航结构的部分示例,它是在图2中的用户语义模型的基础上建立的。

导航结构的建模过程就是对各级贞面中的卡片的内容、类型和表示样式的确定过程。卡片的内容根据触发点和用户语义模型来选择,不同的用户将获得不同的信息内容。

导航结构中的卡片被分为两种类型:静态卡片和动态卡片。静态卡片的内容独立于数据源,主要包含静态文本、图片等。导航结构中的根页面通常都包含静态卡片,具有预先定义的锚点,指向下一级的页面。动态卡片的内容视数据源而定,如果数据源改变,则卡片的内容必须重新计算生成。动态卡片还可以细分为四种类型,每一种都代表了对信息进行结构化的一种典型方法:

(1)列表型(List)卡片:显示实体的实例列表,每一条实例都可具有指向该实例具体内容的链接入口。列表中的实例可以按照某种属性排序或索引。图3中的页面P2、P3、P4、P5都包含了列表型卡片。

(2)事实型(Fact)卡片:详细地显示一个实例的具体内容,如图3中的页面P4包含的“新闻内容”卡片和页面P5包含的“赛事内容”卡片。

(3)幻灯片型(Slide)卡片:顺序显示一组实例的具体内容,每次一个实例,且具有浏览附近实例的超链接,待显示的实例可以按照某种属性排序或索引。图3中的页面P6包含该类型的卡片,其中每个足球俱乐部的相关信息将被依次显示。

(4)查询型(Query)卡片:要求用户先填写一组实体属性的值,然后查询符合该值的实例并显示,通常该类型的卡片用于导航系统中的信息检索,如图3中的页面P7包含的卡片[8]。

另外,不同的卡片具有不同的表示样式,表示样式描述各种表示元素的属性,例如字体、颜色、布局等。表示样式可以根据用户喜好确定。

个性化导航机制的导航方法采用用户语义模型的查找与语义链的触发相结合的方式。当导航结构中的一个链接被触发时,该链接将被赋予一个查询式Q(C,T,S),式中三个变量的含义分别代表卡片的内容、类型和表示样式,在用适当的值填充变量后,即可利用查询式计算生成链接末端的卡片。例如在图3中,当链接L1被触发后,L1的查询式为:Q(“体育”,List,Stylel),其计算结果为页面P2中的卡片。Q中的变量C的值为L1的触发端点的概念“体育”,Q在计算时将检索用户语义模型,获取此概念的相关概念或相关资源作为卡片的内容。Q中变量T的值为List,因此Q生成的卡片将具有列表型的信息结构。同时,由于Q中变量S的值为Stylel,因此Q还要读取样式表中名称为Stylel的表示样式,并据此决定卡片的外观。同理,链接L2的查询式为Q(“足球俱乐部”,Slide,Stylel),其结果是生成一个信息结构为幻灯片类型,表示样式为Stylel,内容与足球俱乐部相关的卡片”[11,12]。

导航机制采用Semantic Web技术,揭示和整合网络信息资源的深层语义知识模型,能有效解决无序、异构网络信息空间中的“迷航”问题。它利用映射方法建立用户语义模型,可以充分表达用户需求的语义知识,以提高个性化导航的效率。

4 结束语

网络信息的利用状况不容乐观,迫使人们努力探索更为先进更为成熟的导航理论、方法和技术。第二代web技术——Semantic Web在信息服务中的应用,促进了网络导航新技术的发展。它作为导航系统的信息组织框架,能够使复杂的信息空间变得有序、清晰和直观,它采用机器可读的形式化的知识表示方式,有利于知识内容的自动获取。目前,Semantic Web技术正获得越来越多的应用,相信经过不断地研究和优化,以Semantic Web为基础的高级网络信息服务将逐步成熟,智能、高效、个性化的导航系统将成为开发网络信息资源的主流工具。

参考文献

1 丛敬军,阎辉.数字图书馆的知识信息导航技术研究.中国图书馆学报,2003,29(145):51~53

2 马瑞民,衣治安.Web上超文本数据导航方法的研究.情报学报,2001,20(5):538~544

3 张晓林.Semantic Web与基于语义的网络信息检索.情报学报,2002,21(4):413~420

4 刘柏嵩.基于知识的语义网:概念、技术及挑战.中国图书馆学报,2003,29(144):18~21

5 Mike Uschold,Michael Gruninger.Ontologies:Principles, Methods and Applications.Knowledge Engineering Review,1996,11(2):93~155

6 Jeff Heflinetal.Requirements for a web ontology language. w3.org/TR/webont-req/

7 张平,郭金庚.语义网描述语言分析.电脑开发与应用,2003,16(4):31~33

8 OntoWebber Model-Driven Ontology-Based Web Site Management.www-db.stanford.edu/pub/gio/2001/ Ontowebber01.pdf

9 Ontology-Based Personalized Search and Browsing. ittc.ku.edu/~sgauch/selectedpapera/WLAS2003.pdf

10 毕强,刘早学.QUIC——一个智能超文本导航系统.情报学报,2002,20(12):1277~1281

第6篇:集合的含义与表示范文

在实际教学中,常听到不少学生发出感叹:数学太难学了!数学真的就那么难学吗?为什么有的学生学起来如鱼得水,而有的学生却困难重重,积重难进?依据我们多年的教学实际和平常与学生的交流,深深体会到数学符号的学习和理解是造成一部分学生数学学习困难的一个相当重要的原因.那么优秀的学生是如何学习和理解数学符号的,他们学习和理解的方式,对于其他学生的学习和我们教师有效地进行符号教学有何启迪,而学习困难的学生学习和理解数学符号的障碍何在,教师应如何依据他们的困难进行教学,带着这些问题,我们调查了洛阳某高中二年级部分不同学力水平的学生对数学符号的学习和理解情况.该高中是一所普通中学.下文中,T表示老师;A1:男生,头脑灵活,数学成绩良好;A2:男生,思想活跃但粗心,数学成绩较好;A3:女生,比较踏实,数学成绩不错;B1:男生,踏实,但反应较慢,数学学习有困难;B2:男生,思想活跃,但不爱学习数学;B3和B4均是女生,数学成绩较差.

一、不同学力水平的学生学习数学符号的个案及其分析

1.不同学力水平的学生理解和记忆y=ax、y=xa的个案研究

下面是笔者与两位高中二年级学生之间就数学符号y=ax、y=xa的一段对话:

T:在学习中你是如何区别y=ax、y=xa的?

B1:不知道,经常把它们两个弄混.

T:你是如何记忆它们的?

B1:主要按课本上学习它们的先后顺序记忆,但后来总是弄混.

A1:初中学过y=x2,y=x3等幂的表示形式,所以就想到形如y=xa的函数为幂函数,另一个就是指数函数.

T:你们能否说出y=ax、y=xa的性质?

A1在纸上分别画出了y=x2和y=x3的图象,依据y=x2和y=x3图象说出y=xa的性质,而在说明y=ax的性质时,则画的是y=2x、y=3x的图象.

B1:这两个函数的性质是……

T:你能否画图说明?

此时B1努力地回忆这两个函数的图象,但把两种图象混在一起了.

2.关于理解直线a在平面α内和点A在平面α内的数学符号表示的个案

T:直线a在平面α内和点A在平面α内用数学符号怎样表示?

A2:aα和A∈α.

B2:aα和A∈α.

B3:a∈α和A∈α.

B4:aα和Aα.

T:为什么这样表示?

A2:直线和平面都可以看做集合,点看做元素,在代数中集合与集合之间用表示,元素与集合之间用∈表示.

B2:说不出来,反正老师是这样教的.

B3:点和直线都属于平面吧.

B4则画出了直线和点在平面内的图形.

学生B4、B3可能发现直线在平面内,点在平面内,与元素在集合内十分相似,于是就导致了错误的理解和联想.

分析:(1)学力水平高的学生在理解和记忆数学符号时,善于运用自己学过的知识对新知识进行理解和主动加工,使抽象的数学符号被赋予了具体的含义和丰富的经验背景,使新知对于自身来说是可以理解的.比如学生A1在理解和记忆y=ax、y=xa的概念和性质时,就能联系到初中学过y=2x、y=3x的有关知识;而在第二个案例中学生A2则联想到代数中集合与集合之间、元素与集合之间的符号的表示,并通过对比和概括内化到自己原有的认知结构当中,从而就扩大了自己原有的认知结构,使原有认知结构更加清晰和有序.

(2)学习困难的学生在理解数学符号时弄不清新旧知识之间的内在联系,或者使新旧知识发生了错误的联系,或者他们根本就没有想去寻找新旧知识的联系,换句话,学习困难的学生在学习数学符号时不理解符号的真正含义,既没有要求理解数学符号意义的心向,也没有掌握理解符号含义的方法,致使符号的外在表示和学生个体的内在经验背景脱节,既被动学习又机械记忆,数学符号在个体的认知结构中散落堆积,既加重学习的负担,又成了进一步学习的障碍.

(3)高学力水平的学生在学习和理解数学符号时,能对新知识进行主动的分析和加工,因而在记忆数学符号时就能自觉对数学符号表示的相关内容进行处理,使自己认知结构中相关的概念、公式、定理形成了网状排列,使新知识和旧知识保持了一定的连续性;而学习困难的学生的记忆基本是块状结构,即学什么就记什么,从不思考不同的数学符号所表达的相同的内容,它们记忆的大量数学符号是相互孤立的,即使有联系也是混乱和松散的,有时还是错误的,因此在回忆和提取时往往显得忙乱和无效.

3.不同学力水平的学生在解题中运用数学符号的个案研究

(1)F(x)的定义域为(c,d),求函数F(2x)的定义域,其中c>0,d>0.

(2)若F(xb)=logax,求F(an),其中n∈N,b≠0,a>0,a≠1.

A1:(1)因为c<x<d,所以c<2x<d,

即log2c<x<log2d,所以函数F(2x)的定义域是(log2c,log2d).

(2)令xb=t,则logax=(logat)/b.

所以F(t)=(logat)/b,F(an)=n/b.

T:为什么c<2x<d?

A1:因为F(2x)是关于x的一个复合函数,根据复合函数的定义,函数u=2x的值域应满足F(x)的定义域.

T:为什么令xb=t,解出F(t)=(logat)/b?

A1:要求F(an),必须把关于F(x)的对应法则求出来.

A2:(1)因为c<x<d,所以c<2x<d,即log2c<x<log2d,所以函数F(2x)的定义域是(log2c,log2d).

(2)令xb=an,则logax=n/b,

则F(an)=n/b.

T:F(x)与F(2x)中的x含义相同吗?

A2:虽然都是x,但它们的取值不同,在F(x)中x在(c,d)取值,而F(2x)中的x取值应保证2x∈(c,d),所以两个x含义不同.

B1:(1)F(x)的定义域是(c,d),即x的取值范围为(c,d),F(2x)中x的取值范围也为(c,d),所以F(2x)的定义域为(c,d).

(2)F(xb)=logax,所以F=(logax)/xb,F(an)=n/anb.

B2:因为F(xb)=logax,所以F(anb)=logaan=n.

分析:(1)学力水平高的学生在理解F(x)与F(2x)时是在理解F(x)本质意义(它只是一个加工的手段和模具)的前提下,把F(x)作为一个结构性概念来理解,因而能把F(x)与F(2x)从结构上看作对应法则是相同的,从而得出c<2x<d,而在做第(2)题时,能够从不同的表达式子中,发现内在相同的对应规则,比如A2认为F(xb)=logax和F(an)具有相同的规则,因此要求F(an),必须把相关的对应法则求出来.

(2)学力水平弱的学生看到符号,只能理解符号的表层的形式的意义,而体会不到其中的内在含义,比如B1认为F(x)与F(2x)中的x是相同的,因而取值范围也应相同,不

能从深层理解到F(x)与F(2x)的对应法则相同,只是自变量不同而已,这也从一个侧面反映出这一部分学生只是把符号F作为一个具体的运算符号,而体会不到函数中F的真正作用,比如学生B1由F(xb)=logax,得出F=(logax)/xb,同时这一部分的学生在后来的学习过程中,一方面由于对自己学习过程缺乏概括和总结的习惯和方法,另一方面可能缺乏对自己的思考过程进行反思,因而无法借助自己已有的经验理解形式化的符号运算所包含的意义,从而无法实现符号由方法性到结构性的过渡,因而在解决抽象的符号问题时遇到的困难是在所难免的.

二、数学符号教学的措施

1.在学生感知数学符号的过程中注意引导学生对符号进行主动加工的意识和习惯

在调查中我们发现学习困难的学生理解符号的困难,一方面在于没有掌握对符号进行加工的方法,而另一方面则在于没有对符号进行加工的习惯和意识.因此,在教学中,要处处注意引导学生对符号进行加工(即对符号所表达的内涵进行纵横联系,以激发学生头脑中与此符号有关的知识和经验),以养成他们遇到符号多思考的习惯.比如,在遇到新的符号时要启发学生:这个符号与我们前面学过的哪些知识有联系和区别,有什么样的联系和区别等等,所有这些问题都可以有效帮助学生理解数学符号的意义.同时既要引导学生对相同数学内容善于用不同数学符号进行表示,又要引导学生对数学的自然语言、图形语言、符号语言之间的相互转化(这种做法对于立体几何中数学符号的理解特别有效),以帮助学生理解不同符号内在的逻辑联系和符号自身的数学意义.比如在上述调查学生对直线在平面内和点在平面内的数学符号表示中,当笔者发现学生对这两个符号的错误理解时,就对学生进行了如下的启发和引导:

T:在代数中,集合与集合之间以及元素与集合之间用什么符号表示?

B:集合与集合之间用表示,元素与集合之间用∈表示.

T:在几何中,我们把点看成元素,而把直线和平面看成集合,那么直线在平面内和点在平面内用符号怎样表示?

此时那几个学生都正确地写出了相应的符号.如果教师在教学中时刻注意引导和启发学生对符号进行加工和联系,长此以往学生潜在的加工意识便被唤醒,在遇到数学符号和知识时就会自觉地对符号进行纵横联系,这种对知识进行再加工的意识和习惯一旦形成,也会迁移到其他的学习当中,对其他知识的学习也会有很大的帮助.

2.加强师生之间的交流促进学生对符号意义的理解和概括

在与学生的交谈中我们了解到,学生在理解、记忆数学符号方面的障碍,绝大多数发生在数学符号理解和建构的初期,由于学生没有及时觉察这种不适当或错误的建构,因而就没能采取及时的补救措施.那么如何在学生理解符号的初期,及时发现学生理解的障碍和错误,我们不妨借鉴维果斯基的社会建构的思想:使学生获得的知识经受由学生和老师所组成的这个小的社会共同体的检验,并为使其符合与社会的要求打下坚实的基础.因此,在课堂教学中通过学生与学生的交流,使其能学习他人之长,通过教师对数学符号的理解过程的展示,使学生从中得到启发,以引起个体对符号的理解进行对比和反思,通过学生与教师的交流,教师可以及时得到学生对符号理解的反馈,从中了解学生对符号的理解情况,以便使学生对自身不合理的建构进行调整和补救.

3.提供加工和反思的具体的、可以操作的方法

在提高学生对数学符号进行加工意识的同时,要使学生掌握对符号进行再加工的具体方法和措施.比如可以为学生提高反思的清单:这个符号的含义是什么?能用自己的话重新说一遍吗?这个符号和前面学过的符号之间有联系吗?如果有联系,联系是什么?我能说出来吗?这个符号我为什么理解错了,错误的原因我能找到吗?这些具体的运算中蕴涵有什么规律吗?规律是什么?这个规律可以用来解决那些问题?等等.

第7篇:集合的含义与表示范文

关键词:结构主义;现代逻辑学;结构;关系

关于数学与逻辑的关系问题,费雷格学派主张:“数学是逻辑学的一个分支”;布尔学派则认为:“逻辑学是数学的一个分支”[1]220。不争的事实则是:逻辑学与数学不能相互剥离,它们“血脉相连”、“生命相依”,二者“你中有我,我中有你”[1]220。从逻辑学和数学双重视域来看,形式化的现代逻辑学可以说是应用数学的一个分支,其高度抽象性和形式化特征决定了它像数学一样具有广泛的应用性。现代逻辑学的蓬勃发展,离不开对逻辑进行哲学反思。

逻辑哲学就是对逻辑进行哲学反思的科学。而数学哲学是数学的基础,“是研究数学的本体论、认识论和方法论以及其他问题的知识体系”,数学哲学研究的问题最后都会涉及到数学与逻辑的关系[2]15。虽然逻辑哲学与数学哲学在研究的论题、研究的视角、研究的侧重点和研究方式等方面都有所不同,但是由于逻辑(尤其是形式化的现代逻辑学)与数学具有如下共同特征:纯形式化特征、高度抽象性、极端精确性和严格性、广泛的应用性[2]15-16。这些共同特征以及数学和逻辑学常常具有一批共同或类似的课题,决定了逻辑哲学和数学哲学具有非常密切的关系。因此,从某种意义上说,对逻辑的哲学思考,很大程度上就是对数学的哲学思考。就像逻辑学与数学不能相互剥离一样,逻辑哲学和数学哲学其实也是很难剥离开来的。

20世纪以来,结构主义在数学哲学中占据着主导地位,那么结构主义是否在逻辑学中也有所反映呢?这正是本文要探讨的问题。

一结构主义的四大学派及其基本观点

19世纪,在微积分的算术化和集合论的建立基础上,逐步形成了数学基础的三大学派——逻辑主义、形式主义和直觉主义。逻辑实证主义者主张哲学唯一合法的研究领域是逻辑学,数学哲学则是研究数学语言的逻辑句法学和逻辑语义学[3]9。

20世纪初,哥德尔提出的不完全性定理说明,逻辑分析以存在建构自身作为参照,不然则会陷入无穷回归;而逻辑分析则是在集合论语言的基础上建构数学存在,这些观点蕴含了结构主义的思想[3]9。20世纪60年代,奎因认为,约束逻辑变元的取值其实就是存在,哲学本体论可以通过语言加以研究,利用语言可以研究存在,结构主义因而进行了数学哲学的范式转换。关系与其所依附的所有个体共同组成结构。根据结构所依附的个体的不同类型来看,数学结构主义主要包括四大学派:集合论结构主义[4]184-211[5]、先物(anterem)结构主义[4]188-198、范畴论结构主义[6][7]、模态结构主义[8]。

集合论结构主义使用模型论中熟知的方式,来描述数学结构及其相互关系。模态结构主义,不是通过对结构或位置进行字面上的量化,而是通过借助于适当的关系和定义域的(二阶)逻辑可能性,来满足经典公理系统的隐含定义条件[4]185。先物结构主义则主张:利用结构中的位置可以定义数学对象,数学对象的指称则要求结构与能够例示它们的任何系统是相互独立[9];数学公式能够由相干公式来描述,而且这些相干公式能够由实际存在的先物结构来满足[10]。范畴论结构主义本质上是通过一系列结构保持映射,为数学结构提供系统概念,从而为数学作出哲学解释[7]。夏皮诺(Shapiro)认为,虽然这些学派有着明显的区别,但是,不论是从主流数学的目的来看,还是从某种更深层次的哲学意义来看,这几大学派其实是等价的。例如:处理哲学问题的一种方法与处理这种问题的其他方法,具有关联性,这种关联性可以通过系统间的自然转换来表达[4]184。这些学派通过语言的途径,把数学哲学引向了对意义和真理的探讨以及对数学对象的存在建构[3]10。

结构主义对数学存在的语言建构是建立在逻辑主义、形式主义和直觉主义这三大学派的研究基础之上的。这三大学派认为:结构主义可以利用语言框架来建构数学对象,这一点在模态结构主义和集合论结构主义中表现得尤为明显,这使得结构主义的本体论建构与作为数学基础的逻辑研究之间能够建立起密切的关系,从而为逻辑学与本体论之间搭建了沟通的桥梁[3]12。范畴论结构主义挣脱了逻辑语言的束缚,创立了崭新的本体论语言,在把语言纳入存在的内涵的同时,还把存在上升到了语言的境界,并通过集合论与逻辑语言保持紧密的联系,从而使得存在建构能够像逻辑建构那样成为严密的科学[3]13。

二现代逻辑学具有结构主义特征

形式主义是20世纪上半叶出现的一种数学哲学思潮,它是极端唯名论在数学中的具体体现。而形式化则是现代逻辑学最重要的研究方法。形式化过程一般包括:进行预备性研究、构造形式系统并对其进行解释、关于形式系统的元逻辑研究这几大步骤[2]124-130。具体地说,对现实世界进行模拟的现代逻辑学形式系统,一般都遵循这样的研究思路:首先,根据研究对象给出一个没有歧义的形式语言,目的是规定哪些符号串是所研究的形式系统的合式公式;其次,给出这一形式语言的语义解释,这需要利用赋值给出合式公式有效性定义;然后,给出这一形式系统的公理和推理规则;再次,根据这一形式系统的语言、语义、公理和推理规则,寻找相关定理;最后,研究系统的可靠性、完全性、可判定性和复杂性等等。

哲学本体论是研究隐藏在真实世界背后存在的最高本质,即对本体、属性和关系进行哲学思考。因此,现代逻辑学本体论的现实原型就是现实世界的本体、属性和关系。从科学哲学的视角看,不论是计算机科学、应用数学,还是逻辑学,一般都遵循着相同的研究思想——结构主义的研究思想:重要的不是个体对象、集合,而是所研究对象的结构以及结构之间的关系。正如高斯所说:“数学是关于关系的科学,从关系中可以抽象出任何概念。”彭加勒也认为,“数学家不是研究对象,而是研究对象之间的关系”[11]1-34。计算科学的基本特征就是研究对象的构造性的数学特征,并利用定义和解释,在对现实中的对象进行抽象和模型化的基础上,给出相关定理的证明[12]89。

从19世纪末以来发展起来的数理逻辑、模态逻辑、动态逻辑(包括命题动态逻辑、量化动态逻辑)、认知逻辑、广义量词理论、类型逻辑语法、范畴类型逻辑等逻辑分支,都或明或暗地采用了结构主义的方法,即对象的结构化的总体特征常常靠利用公理化方法、对象间的映射与同构来加以研究。从20世纪以来,作为数学哲学的结构主义,就已经成为研究逻辑学的主导方法,在模态逻辑、命题动态逻辑、广义量词理论和范畴类型逻辑中表现得尤为突出。从总体上看,结构主义的特征在逻辑学一直或隐或显地存在着,正是这一结构主义特征激发了逻辑学界、科学哲学界等对结构主义进行深入研究的兴趣。

笔者认为:不论数学结构主义有多少种学派,也不论各学派之间有何分歧,逻辑学,尤其是形式化的现代逻辑学,几乎都或隐或显地采用了结构主义的研究方法。也就是说,形式化的现代逻辑学主要是描述各自论域中的各种研究对象的结构性特征及其相互关系,而不必考虑具体对象的内在的品质,不同的逻辑对象可以由其相应结构的性质或结构之间的基本关系来表示。

比如:模态逻辑充分考虑了含有“可能”和“必然”的模态语句的这一命题结构,引入了“可能”和(或)“必然”模态词,对传统的一阶逻辑进行扩展而得到的。因为预设的公理和推理规则不同,而得到的模态系统也不同,对这些模态系统的框架进行解释就可以得到不同的模型。认知逻辑则是模态逻辑的改版,即:把模态逻辑中的必然算子,解释成相信算子或知道算子等而得到的。虽然各个逻辑系统千差万别,但是,各个系统所给出的句法和语义,以及随之而定义的框架与模型和在此基础上对可靠性和完全性、可判定以及复杂性的探讨等等,都或隐或显地彰显了结构主义的特征。

由于很多数学都研究抽象的结构,因此,数学结构主义在数学哲学中占据着主导的地位。根据数学结构主义的观点,数学理论描述各自论域中的结构的性质,而不必考虑所讨论对象的内在品质[13]。狄德金主张把数学结构作为以集合、运算和关系的系统的基础,并认为同构概念与结构的类型紧密相关[3]10。为了准确清晰地表述“结构”或“结构映射”的概念,数学只有利用集合论,或者只有利用作为结合论的一个分支的模型论,才能够准确表征结构、结构映射等概念。因此,集合论就成为结构主义重建数学的语言基础,成为结构主义表述各种数学对象及其相互关系的基本语言。作为现代逻辑学的重要分支之一的广义量词理论,集合论语言是其基本语言,因此,广义量词理论也采用了结构主义的研究方法。下面,笔者将以广义量词理论为例,来考察结构主义在现代逻辑学中的具体体现。

三结构主义在现代逻辑学中的具体实例

广义量词理论是揭示广义量词的普遍语义性质和推理特征的自然语言逻辑理论。集合论视域下的广义量词是通过对自然语言中的名词短语或其限定词进行语义解释后而得到的。即:广义量词对应于所有名词短语或其限定词的指称。一阶逻辑的全称量词和存在量词也是广义量词。可见,广义量词理论是在一阶逻辑和集合论的基础上发展起来的,它对广义量词的真值定义是建立在标准模型论的基础之上,广义量词的量化论域是由个体组成的集合,真值的模型论概念则是利用非逻辑符号的解释和量化论域来加以表述的[14]40-41。广义量词理论以集合论语言作为其基本语言,而集合论语言是结构主义表述各种数学对象及其相互关系的基本语言,因此,广义量词理论在诸多方面都体现了数学结构主义的思想。

(一)广义量词的同构闭包性彰显了结构主义的思想

1957年,莫斯托维斯基(Mostowski)为〈1〉类型广义量词附加了这样条件:不允许我们对论域中的元素加以区分。1966年,林登斯托姆(Lindström)把这一条件推广到更为普遍的情况,而且这一条件得到了逻辑学家的公认。这一条件被称为同构闭包(isomorphismclosure),即:在逻辑中,只有结构才是重要的,个体对象、集合本身并不重要。这一思想与数学哲学中的结构主义思想不谋而合。用逻辑的术语来表述同构闭包的思想就是:如果一个逻辑语言中的语句在一个模型中为真,那么该语句在所有的同构模型中为真。即:逻辑是主题中立的[14]95。如果逻辑是独立于主题事物,那么逻辑常元将在论域间的任意双射下都是不变的,或者更弱一点地说,逻辑常元在论域的任意置换下是不变的[14]324-325。比如:假设把“学生”一一映射成“狗狗”,把“面包”一一映射成“骨头”,把“在吃”一一映射成“在啃”,那么,如果“每个学生最少吃三块面包”在一个模型中为真,那么“每个狗狗最少啃三块骨头”肯定在其同构模型中也为真。这说明,“每个”和“最少三(块)”具有同构闭包性。可见,逻辑学对所有对象都同等对待,逻辑性质不但在严格变换下是不变的,而且在所有双射下也是不变的[14]325。

同构闭包不仅仅局限于量词。比如,命题联结词也不关注主题事物:合取词可以统一运用于两个语句或两个集合或两个别的对象,而不考虑这两个对象的具体内容,仅仅考虑这两个对象的结构。这说明,同构闭包表达的思想与结构主义的思想也是相通的。对于自然语言量化而言,同构闭包具有重要的意义。莫斯托维斯、林登斯托姆、塔斯基和范本特姆都认为,满足同构闭包性是满足逻辑性的必要条件[14]327-328。值得我们注意的是,逻辑学家和计算机科学家,在实践中提出的所有形式语言都具有这样的性质:真在同构下得以保持,在系统中使用的所有算子以及由这些算子定义的别的所有算子,都满足同构闭包性[14]328。

(二)广义量词的真值定义体现了结构主义的思想

从语法的视角看,一个广义量词是一个变元约束算子,此算子把每个定义域与其任意子集间的一个二元关系联系起来。从语义的视角看,一个广义量词是一个映射,此映射通过表征广义量词的论元集合的性质或论元集合之间的关系,来揭示广义量词的语义性质[15]。例如:每个亚氏量词(即:all、some、no、notall这四个特殊的广义量词)实际上表示的是个体的集合之间的一个特殊的二元关系。比如:在“所有学生都去操场了”中,令论域中所有学生组成的集合用S表示,论域中所有去操场的个体组成的集合用P表示,这一语句就可以表示为all(S,P)这一三分结构,其真值定义all(S,P)⟺S⊆P的意思是,集合S是包含在集合P中,即:论域中,所有学生组成的集合包含在所有去操场的个体组成的集合中。

从以上的分析可以看出,广义量词理论很好地诠释了数学结构主义的内涵。比如:all(S,P)这一三分结构还可以表示“所有的人都是要死的”、“所有的狗狗都要睡觉”、“所有的大米都吃完了”等等,这里的“学生”“人”、“狗狗”“大米”等对象所组成的集合S,以及这些对象分别与“去操场了”、“要死的”、“要睡觉”和“吃完了”等对象所组成的集合P,这些具体对象本身并不重要,重要的是这些语句都可以用all(S,P)这一三分结构来加以统摄。其真值条件就是,当S⊆P(即S包含于P时)时,all(S,P)就为真。

(三)广义量词理论对单调性的处理也展示了结构主义的思想

广义量词的单调性是广义量词最为重要的语义性质。例如:至少三分之二的学生认真完成了作业。⟹至少三分之二的学生完成了作业。令S表示论域中所有学生组成的集合,P表示论域中认真完成作业的个体组成的集合,P′表示论域中完成作业的个体组成的集合。“至少三分之二的学生认真完成了作业”可表示成atleast2/3(S,P)这样的三分结构,“至少三分之二的学生完成了作业”可表示成atleast2/3(S,P)这样的三分结构。这一单调性推理可形式化为atleast2/3(S,P)⟹atleast2/3(S,P′),由于P⊆P′,由P到P′,集合在增大,因此,这一推理体现了“至少三分之二的”这一广义量词的右单调递增的性质。而P⊆P′可以理解为,所有的P都是P′,这可表示成all(P,P′)。具体地说,就是:所有认真完成了作业的个体都是完成了作业的个体。这一单调性推理其实是省略了all(P,P′)这一前提的广义三段论推理,其形式化结构为:atleast2/3(S,P)∧all(P,P′)⟹atleast2/3(S,P′)。事实上,所有关于广义量词的单调性推理,都是省略了一个暗含前提的广义三段论推理。

可见,广义量词理论对单调性的处理所使用的基本语言也是集合论语言,这一语言也是结构主义的基本语言,因而体现了结构主义的思想。1984年范本特姆提出的利用数字三角形方法,来表征具有驻留性、扩展性和同构闭包性的〈1〉类型和〈1,1〉类型广义量词的单调性,其背后也暗含了浓烈的结构主义思想。限于篇幅,不再详细论述。

(四)基于广义量词理论的广义三段论推理蕴涵了结构主义的思想

正如一阶逻辑的全称量词和存在量词是广义量词的特例一样,亚氏三段论也是广义三段论的特例。自亚里士多德开始的很长时期内,对亚氏三段论的有效性的研究,几乎都是采用的是非形式化的方法。自从有了广义量词理论后,对包括亚氏三段论在内的广义三段论的研究,就可以用形式化的方法来对其进行表示和有效性的证明[1]155-202。而且利用广义量词理论,不仅可以对24个有效的亚氏三段论进行形式化,而且还可以对其进行公理化[16]。这种形式化的逻辑研究方法不仅拓展了逻辑研究的范围、提升了逻辑学的研究能力,更重要的是有利于计算机科学中的知识表示、知识推理和自然语言信息处理。

广义量词理论完成以上这些任务主要还是利用了集合论语言,彰显了结构主义的思想。具体地说,就是充分利用了“含有〈1,1〉类型的广义量词Q的量化语句具有Q(S,P)这样的三分结构”这一知识。〈1,1〉类型的广义量词揭示的是所涉及的左论元所组成的集合与其右论元所组成的集合之间的二元关系。〈1〉类型的广义量词揭示的是所涉及的论元所组成的集合的性质。由于自然语言中的广义量词绝大多数都是〈1〉类型和〈1,1〉类型的广义量词,而且对〈1〉类型的广义量词的研究可以转化为对其〈1,1〉类型的亲缘广义量词的研究[1]46。因此,利用这一结构主义思想,就可以对自然语言中绝大部分广义三段论进行形式化和有效性的证明。简言之,这一结构主义的研究方法具有很强普适性。

例如:“所有渴望暴富的人都是浮躁之人。大多数人都是渴望暴富的人。所以,大多数人都是浮躁之人。”其中的“大多数的”对应的是〈1,1〉类型的广义量词。令论域中所有人组成的集合用S表示,论域中浮躁之人组成的集合用P表示,论域中渴望暴富的人组成的集合用M表示。利用结构主义的形式化表示方法,这一广义三段论,可以形式化为:all(M,P)∧most(S,M)⟹most(S,P)。利用广义量词的真值定义就可证明这一广义三段论的有效性。证明:假设all(M,P)与most(S,M)这两个条件均成立。根据all和most的真值定义可知:all(M,P)⟺M⊆P,且most(S,M)⟺|S∩M|≥|0.55|S|,因此,|S∩P|≥0.55|S|。再根据most的真值定义“most(S,P)⟺|S∩P|≥0.55|S|”可知:most(S,P)成立。证毕。对亚氏三段论和其他广义三段论的形式化及其有效性的证明均可以类似处理。可见,利用结构主义的形式化研究方法,可以简洁明了地对包括亚氏三段论在内的广义三段论进行形式化及其有效性的证明。

笔者多年的研究表明:这一结构主义研究方法普适性非常强。因为不论是自然语言中无处不在的广义量词的单调性推理,还是亚氏三段论推理,抑或是广义三段论推理,以及建基于这三种推理之上的语篇推理,都可以使用这种结构主义的研究方法来进行形式化及其有效性的证明。

四结论

第8篇:集合的含义与表示范文

1.1样品的采集

1.1.1粮食和蔬菜样品采集

在两电镀厂周边1.5km范围内,涉及大孙各庄镇后岭上村、大崔各庄、佟辛庄和薛家庄,以及木林镇陈家坨村、李各庄和业兴庄,采集9-10月份间公共种植、养殖已成熟可供食用或食用原料的产品,同时在1.5km范围外采集相应种类样品作为对照,涉及村庄包括大孙各庄镇的郭家坞村、四福庄、大石各庄、大坝洼庄,木林镇的东沿头村、蒋各庄、魏家店和杨镇的下坡村、二郎庙,以及李桥镇的王家场村。2011-2013年3年间共环境监测样品144件,主要环境监测样本类别为蔬菜(包括白菜、萝卜、玉米、小麦、菜花、油菜、生菜、菠菜和柿子椒)和粮食作物(包括玉米和小麦),其中有19件样品为对照(包括10件蔬菜和9件粮食作物)。

1.1.2土壤样品采集

每一环境监测地区,选取被采集农作物种植的土壤作为采集对象,范围以电镀厂为中心,在东、南、西、北四个方向各布一个采样点,最远端距离电镀厂1.5公里。同时根据采集土壤上农作物的覆盖率可以增加土壤的采样点,农田土壤环境环境监测采集耕作层土样,一般为0~20cm深土层。为保证样品的代表性,采取对角线法、梅花点法或棋盘式法采集混合样,每个采样区的样品为农田土壤混合样,采样量为1~2kg,对所得混合样反复按四分法弃取,最后留下所需的土量,装入布袋或塑料袋内检测。

1.2检测方法

农产品和土壤中的铬参照GB/T5009.123-2003《食品中铬的测定方法》和《环境环境监测分析方法》进行检测。

1.3质量控制

开展环境监测工作同时参加中国疾病预防控制中心组织的重金属分析质量考核,由北京市疾病预防控制中心统一提供部分环境监测的关键耗材。在环境监测中出现异常结果时,将样品送到市疾控中心进行复核。检测中同时使用标准参考物质,并保证测定结果在准许范围内。对于没有相应标准参考物质的项目,实验时做样品加标试验,控制加标回收率为80%~120%。每个检测样品进行两次平行测定,平行测定结果满足相应分析方法的误差要求,报告检测结果平均值。

1.4统计学分析

应用SPSS13.0软件对环境监测数据进行统计学分析,组间比较用两独立样本t检验和方差分析,两两比较用q检验,以α=0.05为检验水准。富集系数为作物重金属含量与所在土壤重金属含量的比值,他可以用来表示重金属在植物体内的积累特征及迁移难易程度,测出土壤样品及相对应的蔬菜样品中重金属含量后,可计算该地区重金属富集系数,以筛选出该地区适合种植的蔬菜品种。其计算方法为:富集系数=[作物重金属含量(鲜重)/土壤中重金属含量]×100%。

2环境监测结果与分析

2.1区内部分农作物铬污染整体环境监测情况

2011-2013年对区内采集的部分农作物中铬污染状况进行环境监测,总体合格率为93.8%。虽然两类农作物P50值均低于国家标准限值,但蔬菜P90值0.662mg/kg则高于0.5mg/kg的国家标准限值,说明重金属铬在区内部分蔬菜中存在一定程度的污染。通过对两类农作物铬污染水平进行比较,显示蔬菜被铬污染更严重(F=11.885,P=0.001;t=-2.226,P=0.029),见表1。

2.2粮食中重金属铬环境监测情况

对各年粮食中铬污染情况进行环境监测,P90值在2011年和2012年分别为0.217mg/kg和0.172mg/kg,较为平稳,但2013年达到0.490mg/kg,呈现上升趋势,见表2、图1。

2.3蔬菜中重金属铬环境监测情况对各年粮食中铬污染情况进行环境监测,整体合格率为87.7%,所有不合格样品均为2013年采集,2013年样品合格率仅为64.0%。P90值由2011年的0.232mg/kg到2012年的0.164mg/kg表现较平稳,但到2013年达到1.44mg/kg,远高于0.5mg/kg的国家标准限值上升趋势明显,提示存在污染。2013年蔬菜中铬含量水平也高于前两年,差异有统计学意义(F=8.904,P=0.001;q检验两两比较P值均为0.001),见表3、图2。

2.4距电镀厂不同距离农作物铬污染环境监测情况

对两电镀厂所在村(包括大孙各庄镇后岭上村和木林镇陈家坨村)、电镀厂周边1.5km范围内村庄(包括大孙各庄镇的大崔各庄、佟辛庄、薛家庄,以及木林镇的李各庄和业兴庄)、1.5km范围外村庄(包括大孙各庄镇的郭家坞、四福庄、大石各庄、大坝洼庄;木林镇的东沿头、蒋各庄和魏家店;以及杨镇的下坡村、二郎庙和李桥镇的王家场)内农作物铬含量进行比较显示,1.5km范围内村庄采集农作物铬含量高于电镀厂所在村和1.5km范围外村庄,且有统计学意义(F=4.683,P=0.011;q检验两两比较,P值分别为0.003和0.039),见表4。图22011-2013年蔬菜中铬污染水平变化趋势2.5不同种类农作物富集系数差异根据农作物铬富集系数含量高低可分为3类,一类为油菜、白菜、菜花,富集系数最高;其次为二类,包括生菜、小麦、玉米;萝卜、菠菜、柿子椒为三类,富集系数最低,其中富集系数最高的农作物是最低的农作物近五倍,见表5。

3结论

通过对顺义区两个重点电镀厂前期进行基本情况调查,两厂主要对金属表面进行耐磨耐腐处理时需要用到镀铬工艺。工厂用水均为自备井水,含铬的废水经过pH值调节、还原反应、混凝反应以及沉淀后,中水在生产中得到重新利用或在厂后河道排放,沉淀后的废渣有专业部门进行集中转运处置。但通过本次对两厂周边1.5km范围内外农作物铬含量进行环境监测比较发现,1.5km范围内农作物尤其是蔬菜依然存在铬污染情况。同时2013年还检测出部分蔬菜铬超过国家标准限值,蔬菜检测合格率仅为64%。顺义区曾在2011年针对重金属污染企业开展过专项检查,但是时隔两年环境监测力度有所下降,势必造成相关企业对工业废水废渣控制不利,导致2013年度铬对部分农作物的污染。同时通过对不同农作物铬污染情况进行比较显示,不同类作物对铬的蓄积作用存在较大差异,本次环境监测发现,油菜、白菜、菜花等农作物更易富集铬,这与2006年宋波等人对北京市蔬菜中白菜富集作用较弱的调查结果不符[3],出现这样结果不一致的情况可能与采样地点不同、土壤污染情况不同有关。生菜、玉米、小麦富集系数较低;最后萝卜、菠菜、柿子椒富集系数最低,这与韩静等人研究结果相符[4]。

第9篇:集合的含义与表示范文

关键词:粗糙集;属性约简;粗糙集应用;数据挖掘

中图分类号:TP18文献标识码:A文章编号:1009-3044(2008)28-0172-03

Rough Set Theory and Its Application Research

WEI Liang

(Electronics and Information School, Tongji University, Shanghai 201804, China)

Abstract: Rough set theory is a math theory which processes non-accurate, uncertain and incomplete knowledge. Currently, it has already been applied successfully in the area of Artificial Intelligence, Pattern Recognition, Machine Learning, Decision Analyzing and Data Mining etc. This paper introduces the rough set theory and its characteristics, reviews the development of this theory in different fields, and suggests evolutional trend in the coming future.

Key words: rough set; attribute reduction; rough set application; data mining

1 引言

波兰数学家Pawlak于1982年提出的粗糙集理论是一种新的处理模糊和不确定性知识的数学工具[1]。其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。粗糙集理论能有效地分析和处理不精确、不一致和不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。以粗糙集理论为基本框架的知识发现过程的研究,越来越引起人们的关注,特别是将粗糙集理论与机器学习、模式识别、数据库理论等相结合,并融合其它有效的数学工具与方法的研究,显示出基于粗糙集理论的多种软计算方法相结合算法在知识发现和优化过程中的强大的优越性,为知识发现的理论基础提供了一定的依据。目前粗糙集理论已成为人工智能领域中一个较新的学术热点,引起了越来越多科研人员的关注。

2 粗糙集理论的基本概念

设U是非空有限论域,R是U上的二元等价关系,R称为不可分辨关系,序对A=(U,R)称为近似空间。?坌(x,y)∈U×U,若(x,y)∈R,则称对象x与y在近似空间A中是不可分辨 的。U/R是U上由R生成的等价类全体,它构成了U的一个划分。可以证明,U上划分可以 与U上的二元等价关系之间建立一一对应。U/R中的集合称为基本集或原子集。若将U中的 集合称为概念或表示知识,则A=(U,R)称为知识库,原子集表示基本概念或知识模块。任意有限的基本集的并和空集均称为可定义集,否则称为不可定义的。可定义集也称为精确集,它可以在知识库中被精确地定义或描述,可表示已知的知识。可以验证所有可定义集全体可构成 U上的一个拓扑。

令知识库K=(U,R),集合X?哿U,R是一个等价关系:

分别称RX为X的R下近似(Lower Approximation)和RX为X的R上近似(Upper Approximation)。称集合BNR(X)=RX-RX为X的R边界域;POSR(X)RX为X的R正域; NEGR(X)=U-RX为X的R负域。下近似RX包含了所有使用知识R可确切分类到概念X的元素。上近似RX则包含了所有那些可能是属于概念X的元素。概念的边界区域BNR(X)由不能肯定分类到这个概念X或其补集X中的所有元素组成。关系如图1所示。

刻画粗糙集的方法有以下两种:一种是用表示近似精度的数值表示粗糙集的数字特征;数字特征表示粗糙集边界域的相对大小,但没有说明边界域的结构。另一种是用粗糙集的拓扑分类表示粗糙集的拓扑特征。拓扑特征给出边界域的结构信息,但没有给出边界域大小的信息。

由等价关系R定义的集合X的近似精度如下:

其中X≠Ф,|X|表示集合X的基数,显然,0≤αR(X)≤1。定义PR(X)=1-αR(X),称PR(X)为X的R粗糙度。粗糙度反映了利用知识R近似表示X的不完全程度。

设X是一个R粗糙集, 称X是R粗糙可定义的,当且仅当RX≠Ф且RX≠U;称X是R内不可定义的,当且仅当RX=Ф且RX≠U;称X是R外不可定义的,当且仅当RX≠Ф且RX=U;称X是R全不可定义的,当且仅当RX=Ф且RX=U。如果X是R粗糙可定义的,则意味着我们可以确定U中的某些元素属于X或X;如果X是R内不可定义的,则意味着我们可以确定U中的某些元素是否属于X,但不能确定U中任一元素是否属于X;如果X是R外不可定义的,则意味着我们可以确定U中的某些元素是否属于X,但不能确定U中任一元素是否属于X;如果X是R全不可定义的,则意味着我们不能确定U中的任一元素是否属于X或X。

粗糙集的数字特征(近似精度)和拓扑特征之间有一定的联系:

若集合是内不可定义的或全不可定义的,则其近似精度为0;

若集合是外不可定义的或全不可定义的,则其补集的近似精度为0。

实际应用时,应综合考虑边界域的两种信息。

3 属性约简

属性约简是粗糙集理论中的一个核心部分,同时也是粗糙集理论中最重要的概念之一。自粗糙集理论被提出后,研究学者在属性约简方面提出了许多算法,这些属性约简算法最终可以归结为三类:基于约简定义的Pawlak属性约简算法[2];基于差别矩阵的属性约简算法;基于启发式信息的属性约简算法。然而,到目前为止,还没有一个公认的、高效的最佳属性约简算法,另一方面,科学家在理论上证明求取处理对象的所有属性约简、所有最小约简是一个NP完全问题。

3.1 几种典型的约简算法

3.1.1 基本算法

基本算法首先在已有数据的基础上构造差别矩阵。然后在差别矩阵的基础上得到差别函数。对此得到的差别函数进行化简,使之成为析取范式。最后得到的每个主蕴含式均为约简。该算法可以求出所有的约简。然而,由于对大数据集的差别函数的约简是一个非常困难几乎不可能的问题,因此,此算法只适合于非常小的数据集。

3.1.2 基于差别矩阵的启发式算法

Skowron提出差别矩阵,并且提出差别矩阵可用于属性约简。在此基础上,利用差别矩阵得到了许多启发式约简算法。这些算法的共同点都是先得到差别矩阵,由差别矩阵求出属性核,在此基础上根据如信息熵、属性频率等启发式规则往属性核加入属性,直到满足条件为止。