公务员期刊网 精选范文 介绍一本好书范文

介绍一本好书精选(九篇)

介绍一本好书

第1篇:介绍一本好书范文

今天,我向同学们介绍一本书,《开心作文》。这本书一开始就是教我们“自由述说”,“语言实践”。比如说,《我的妈妈》,只让大家说自己妈妈的外貌、性格、爱好,我想大家看了一定会觉得很轻松。写作文和说话一样,把自己想说的告诉别人。真心诚意,说真话,别人才爱听。

说自己开心的事,让别人也能够分享你的开心;说自己烦恼的事,让别人也可以帮你分担烦恼——这就是作文。

我看了这本书后,变得有说有笑,思维活跃。连妈妈都说我变得话多了。

总之,大家要是看了这本书,也会突然开窍,变得聪明起来起来。说得漂亮了,具体了,完整了,自然也就出口成章了。

第2篇:介绍一本好书范文

美国着名作家马克·吐温曾将说过:“19世纪出了两个杰出人物,一个是拿破仑,另一个是海伦·凯勒。”如果说,拿破仑是战场上的胜利者,是叱诧于法国大革命时期的乱世枭雄;那么,海伦·凯勒则是生活中的勇士,是拒向命运低头、立志驱除人生黑暗的光明使者。

海伦的命运十分不幸。上帝只给予她19个月的光明和声音的快乐时光,一场突如其来的猩红热毫不留情地夺走了她的视觉和听力,使她与有声有色的世界隔绝了,留给她的只是黑暗和寂静。海伦跌入了人生的低谷,可她没有向命运低头,而是在这种恶劣的环境中坚强的站起来。海伦在家庭教师安妮·沙利文的教育和帮助下,凭借坚强的意志和顽强不屈的奋斗精神,学会了读书、写字、说话。海伦20岁时进入了着名的哈佛大学,并在24岁时以优异的成绩完成了四年的学业。面对命运对她的不公的待遇,她回报世界的是博大无私的爱心。

你想更深入了解海伦的一生吗?翻开这本可以洗刷灵魂的书——《假如给我三天光明》。那里记录着一位弱女子不平凡的一生,她是生活中的强者、世界人的榜样。

六年级:刘佳乐

第3篇:介绍一本好书范文

关键词:作者简介;编撰

先说作者姓名。作者姓名一般都是真实姓名。譬如学术类的,都使用真实姓名,因为这些学术成果都要和作者姓名相符才可以得到学术界的认可。而一些文学类图书的作者不想公开自己的真实姓名,采用笔名。还有一些作者,笔名已经很有名气了,也就是图书的署名。而作者为了说明自己的真实姓名,在笔名之后,又跟上了真实姓名,补充原名叫什么。这样的作者简介很多。譬如老舍,舒庆春,字舍予,笔名老舍,满族正红旗人。都要在笔名之后在介绍一下他的原名。再如,唐家三少,也是笔名,在作者简介之后,也要跟上他的真姓名,这个完全要尊重作者意愿。还有的作者原名之后还要跟上好几个笔名,以说明其他笔名发表的作品都是他个人的成果,也无可厚非。至于古人,还要有名号、字、堂号、别称,外称等等。这是时代的痕迹,也是必要的。

在作者简介当中,作者年龄是很微妙的,一些作者不愿意透露其真实的年龄,那就没必要非要暴露作者的隐私了。而一些作者也许在这个领域算是很年轻的作者,那就要有意识地标注其年龄。还如有些作者年龄很大了,譬如周有光、杨绛前些年的著作,一般都会特别注明其年龄。年龄的介绍完全采取作者自愿的原则,也要看著作本身的需要。而对于一些已经离世的作者,那就有必要介绍其年龄了,因为读者可以据此推断作者的时代背景,还是以老舍为例,老舍,舒庆春(1899.2.3-1966.8.24)。如果不知道其生年或者存疑,只能以问好代替,或者用“一说”做说明。如王维(701-761,一说699―761),河东蒲州(今山西运城)人,祖籍山西祁县。再如,墨子(生卒年不详),名翟(dí),东周春秋末期战国初期宋国人 ,一说鲁阳人,一说滕国人。

籍贯,多数作者都很注意这个问题,譬如鲁迅,浙江绍兴人,清楚了,这就是他的籍贯。而有的作者却不是,譬如苏轼,祖籍河北,四川眉县人。还如当代作家里面有一个很特别的人,弋舟,他的户籍在兰州,但他从来没有承认过自己是兰州人,他祖籍江苏,生在西安,成长在兰州,这种情况,他只能说自己是江苏人,可是也未必准确,他只好在文章里面专门讲。

学术背景是作者简介当中最重要的一部分,对于学术背景的介绍在很大程度上就是暗示本书的内容质量问题。学术背景中。首先要介绍他的身份,多重身份的主要介绍和本书相关的身份;再介绍研究方向、学术优长。譬如,广东人民出版社出版的《澳门之魂》一书,作者林广志,对于他的学术背景的介绍就很具体到位,“历史学博士,澳门科技大学社会和文化研究所所长、教授、博士生导师。曾在暨南大学、中国社会科学院经济研究所、澳门大学从事教学和研究工作。主要从事澳门经济史、社会史以及公共政策研究。在《历史研究》《中国经济史研究》《学术研究》等杂志发表相关论文30余篇。”如此,他的学术背景就很清楚了。但是,对于一般没有学术背景的作者而言,这一块只好短缺了。

在作者简介当中,还有一块内容也非常重要,那就是作者所获的荣誉和成果,这尤其对于一个还不是特别出名的作者来说就很重要了。譬如《大国商帮》这本书,作者杨黎光的成果就很好,“曾获得第一、二、三届‘鲁迅文学奖’;第一、二、三届‘中国报告文学大奖’;第一、四届‘徐迟报告文学奖’;‘新中国六十年优秀中短篇报告文学奖’;‘中国改革开放优秀报告文学奖’;首届冰心散文奖。”因为《大国商帮》是一本报告文学,所以,主要介绍他在报告文学领域取获得荣誉和成果,而把“首届冰心散文奖”放在最后。

在作者简介的最后,一般要加上作者所在的单位,譬如作家王十月,在他的简介最后要加上一句,现任《作品》杂志副主编。也有些作者不愿意不暴露自己的单位,尤其是作者所从事的工作是非本专业的,而且和本人的著述无关,也就不一定做介绍了。还有一些作者不愿意让读者知道自己的单位,以避免不必要的麻烦。这也是情有可原的,不必勉强。

当然,也有有一些作者不愿意作自我介绍,那么责任编辑也无可奈何,只好对作者一字不介绍,作者的名字只是在书名和版权页出现,当然,如果作者是大家名家那也就大可不必了。

参考文献:

[1] 中国文字学[M]. 上海古籍出版社 , 唐兰撰, 2005

[2] 广韵校本[M]. 中华书局 , 周祖谟著, 2004

第4篇:介绍一本好书范文

(一)塑造良好的风貌 陪同上司参与商务活动,秘书的风度如何,直接关系到企业形象.在日常工作和生活中,秘书就要时刻留意自己的仪表,出门做商务拜访更要注意外貌特征,一个好的秘书应当具有豁达开朗的气质和大方自然的风度,给人留下谦恭和蔼、坦荡潇洒、淳朴热情的印象。

(二)摆正自己的身份地位 不论代表公司出访,还是陪同上司出访,秘书都会受到其他公司的热情接待.这时秘书应该注意自身的言谈举止,不能得意忘形,认为自己高高在上,做出有违自己身份的事情,给公司形象抹黑.当然这并不意味着秘书完全变成上司的跟班,或是只是传达旨意的木偶.企业秘书在与外界交往的过程中,也是展示自己,推销自己的一个大好机会

(三)做恰当的介绍 陪同上司出访,秘书少不了要经常对人或事物作介绍.给随时遇到的人作介绍,是秘书第一要掌握的学问. 给人介绍的基本常识是:先将男士介绍给女士,将晚辈介绍给长辈,将下级介绍给上级.具体在公司之间的交往中,要求更加细致严格,要点如下:

应先把资历浅的介绍给资历深的人,再把资历深的人介绍给资历浅的人.

如果知道的话,称呼全名、职位和公司名称.

如果是许多人,从高职位到低职位依次介绍.

如果两个职位相等,先介绍年长者.

如果你不清楚他们的职位,应从身边最近的开始介绍,然后再介绍离你远的那位.

介绍自己时,应先称呼对方的姓名,如果不知道对方的姓名,千万不能在自我介绍前问对方.千万不能问“你是谁”或“你叫什么名字”,应该说,“您好,我是王琳,许总的秘书.”那么对方就会自我介绍了.如果他没有介绍自己,你介绍完自己后,再问:“您是……?”

第5篇:介绍一本好书范文

介绍信怎么写一

1. 介绍中学同学 introducing a middle school classmate

dear [mr. chang].

the bearer, [ms huan], is a classmate of mine at middle school, who has recently been assigned to work in your city. [she] is well educated, having good habits and agreeable manners. any assistance you may give [her] concerning [her] life will be esteemed as a great favor for me.

yours truly,

亲爱的[常先生]:

持信人[黄女士]是我的一位中学同学,最近[她]被派往你市工作。[她]受过良好的教育,没有不良的习惯,举止端庄。您对[她]生活上的任何帮助,将使我感同身受。

2. 介绍本人 self-introduction

dear [sirs],

from your advertisement in [yesterday’s usa today] i find that you are wanting a [chinese teacher] in your college. i beg leave to take the liberty of offering myself for the position.

born in [beijing] in [1970], i am a graduate of [beijing university], and therefore have a good knowledge both in chinese and english.

should my application be regarded favorably, i shall endeavor to justify the confidence you may repose in me.

faithfully yours,

亲爱的[先生们]:

[昨天《今日美国报》]载你院需[汉语教员],介绍信《介绍信怎么写》。我申请任此职务。

我[1970年]出生于[北京],毕业于[北京大学],汉语和英语均有所长。

如蒙录用,自当竭诚服务,以答雅意。

此致

敬礼!

介绍信怎么写二

介绍信怎么写

在校园招聘后毕业生们找到公司,各司其职。工作就免丌了到其他单位联系工作、了解

情况,参加社会活劢。这时候大家需一份要介绍信,介绍信言简意赅的表达出介绍派出人员

是谁,是来干吗的。使用介绍信,可以让对方明白你的身份和目的,以便得到对方的信任和

支持下面就和乔布小编一起来看看如何写好介绍信。

介绍信例文:

尊敬的贵单位领导:

兹有我院xxx 与业的XXX 学生去贵单位进行实习(与业实习戒毕业实习),实习期为 年

月 日至 年 月 日。实习是我院教学工作的重要环节,是学生获得实践经验,适应社会的有

效途径,学院高度重视学生实习工作。为此,诚恳地希望贵单位给予大力支持和协劣,使学

生切实圆满完成实习任务。同时,在实习过程中,请按照贵单位规章制度的要求,对学生严

格教育管理,并在实习结束时对学生的实习情况给予鉴定。

衷心感谢贵单位对我院教学工作的大力支持。

此致

敬礼!

写作要求:

1. 在公文纸正中的地方写“介绍信”三个字,字要比正文大些。

2.联系单位戒个人的称呼接洽事宜。要写得具体、简明,突出重点。

3. 被介绍人的姓名、身份、人数(派出人数较多,可写成“×××等×人”)。

4. 接洽事项和向接洽单位戒个人提出的希望。加上一些客套话“请接洽”、“请予协

劣”、“此致敬礼”等语。要注明使用介绍信的有效期限,天数要大写。

5. 字迹要工整,文章完整丌能随意涂改。

介绍信怎么写三

(一)普通介绍信,它是用来介绍联系接洽事宜的一种应用文体,具有介绍、证明的双重作用。

(二)专用介绍信。

介绍信分类

(一)便函式的介绍信,用一般的公文信纸书写。包括标题、称谓、正文、结尾、单位名称和日期、附注几部分。

1.标题

在第一行居中写“介绍信”三个字。

2.称谓

另起一行,顶格写收信单位名称或个人姓名,姓名后加“同志”、“先生”、“女士”等称呼,再加冒号。

3.正文

另起一行,开头空两格写正文,一般不分段。一般要写清楚:(1)派遣人员的姓名、人数、身份、职务、职称等。(2)说明所要联系的工作、接洽的事项等。(3)对收信单位或个人的希望、要求等,如“请接洽”等。

4.结尾

写上表示致敬或者祝愿的话,如“此致敬礼”等。

5.单位名称和日期

6.附注

注明介绍信的有效期限,具体天数用大写。

在正文的右下方写明派遣单位的名称和介绍信的开出日期,并加盖公章。日期写在单位名称下方。

(二)带存根的介绍信,这种介绍信有固定的格式,一般由存根、间缝、本文三部分组成。

1.存根

存根部分由标题(介绍信)、介绍信编号、正文、开出时间等组成。存根由出具单位留存备查。

2.间缝

间缝部分写介绍编号,应与存根部分的编号一致。还要加盖出具单位的公章。

3.正文

本文部分基本与便函式介绍人相同,只是有的要标题下再注明介绍信编号。

书写形式

一般有书信式和填表式两种。

第6篇:介绍一本好书范文

介绍信是机关、团体、企事业单位派出人员到其他单位从事各种社会活动时,为说明派出人员身份和承担任务所使用的一种专用书信。

介绍信的应用范围很广。学生到某单位实习,需要学校或院系开出介绍信;机关工作人员到基层搞调研,需要本机关开出介绍信;派人到其他单位商量协作事项,需要开出介绍信;派人出去推销产品,也要带上介绍信。

介绍信有时也可用于私人之间的交往,介绍一个朋友到另一个熟人那里去办理事务,也可以写一封介绍性质的书信。但这种介绍信与办理公务的介绍信有很大不同,不需要加盖公章,且行文更近似于一般的社交书信,没有固定的格定。

(二)介绍信的特点

1.证明性

介绍信主要的作用是证明被介绍人的身份,使对方能够予以信任并配合办理事务,所以,证明性是其第一特点。

2.模式性

介绍信模式性很强,不少单位都有事先印制好的空白介绍信,其中一些常用语都已事先印好,只需要将一些事先不能确定的项目填写进去,就是一封完整的介绍信了。即使是临时手写的介绍信,也有固定的格式。

3.简便性

介绍信篇幅短小,内容一目了然,在办理事务的过程中应用起来十分方便快捷。

4.时效性

一封介绍信只在规定的时间内有效,不能长期使用。

(三)手写式介绍信的写作

这种介绍信是临时手写而成的,所写内容有一定的随机性,因而比较灵活,可根据具体需要进行措辞和表达。

1.标题

在信纸上方居中书写“介绍信”三字。

2.称呼

在标题下方顶左边书写派出人员所去单位的名称,有时也可以写对方个人姓名或职务。称呼之后加冒号。

3.正文

在称呼之后另起一行书写,通常要写明被介绍者的姓名、性别、职务,去对方单位办理什么事务,以及希望对方给予办理等请求性话语。

4.模式化祝颂语

在正文之后,为表示对对方的尊重,要写上祝颂语,通常是“此致/敬礼”之类的模式化语言。

5.署名、公章和日期

最后是单位名称、公章和开出日期。

(四)印刷式介绍信的模式

印刷式介绍信,由存根和信面两部分组成。

1.存根部分

存根部分的项目有:

标题。由“介绍信”三字组成,后加括号标明“存根”二字。

编号。形式为“××字××号”。

正文。形式为“×××等×人前往×××联系××”。

日期。形式为“××年××月××日”。

存根与信面之间,有一条虚线,中间标有“第 号”字样,供填写编号用。介绍信填写完毕后,在信面加盖公章的同时,还要在此虚线上加盖骑缝章。

2.信面部分

信面部分的项目有:

标题。居中印刷“介绍信”三字。

称呼。留出空白供填写,但在适当位置印有冒号。

正文。可确定的文字事先印好,不可确定的文字留下空白。一般的形式为:

兹介绍 等同志 人,前往贵处联系 ,请予接洽并给予协助为盼。

祝颂语。一般为“此致/敬礼!”

有效期。标明有效期为多少天。

署名和公章。印上单位名称并加盖公章。

日期。填写具体年月日。

【 例 文 一 】

介 绍 信

××报社:

兹介绍我院×××教授前往贵社联系20__级新闻专业学生实习事宜,敬请接洽并予以协助。

此致

敬礼!

××大学新闻学院

20__年2月23日

【 例 文 二 】

介绍信(存根)

××字第××号

×××等×人前往××××联系××××

××年××月××日

…………………… 第 × × 号 ……………………

介 绍 信

××字第××号

××××:

兹介绍×××等×位同志前往你处联系×××××事宜,敬请接洽并予以协助。

此致

敬礼!

第7篇:介绍一本好书范文

答:入党介绍人与培养联系人的任务从总体上讲是一致的。他们都是为了协助党组织做好对申请入党人的教育、培养和考察工作。但是,他们的具体任务又有所不同。培养联系人的具体任务是:在党支部和党小组的指导下,负责对所联系的入党积极分子进行具体的培养、教育和考察工作;经常向党组织汇报入党积极分子的情况和培养、考察情况.并填写考察记录,在党组织研究发展党员时,对所联系的入党积极分子是否具备党员条件提出意见。

人党介绍人的具体任务是:了解被介绍人各方面的情况,向他介绍和讲解党的基本知识,针对被介绍人的缺点和不足,进行具体的教育、帮助;指导被介绍人填写入党志愿书,并认真填写自己的意见;在讨论接收预备党员的支部大会上负责地介绍被介绍人的情况;被介绍人批准为预备党员以后,继续负责对其进行教育、帮助。

问:发展对象自己约请入党介绍人需要注意哪些问题?

答:发展对象要注意约请政治上坚定,责任心强,对自己比较了解的正式党员作入党介绍人。不能约请预备党员、受处分尚未恢复党员权利或尚在缓期登记期间的党员,以及民主评议后的不合格党员和限期改正错误的党员作自己的入党介绍人。一般情况下也不宜约请亲属中的党员作自己的入党介绍人。

问:不是本单位党支部的党员可否担任入党介绍人?

答:入党介绍人一般应由本单位党支部的正式党员担任,因为同一单位党支部的党员对申请入党人的政治、思想、工作、学习等方面的情况比较熟悉和了解,担任入党介绍人有利于对其进行培养、教育和考察。在特殊情况下,如发展对象所在单位党支部没有符合条件的正式党员时,也可以由其上级党组织范围内的其他支部的正式党员担任。

问:一名正式党员能否同时担任几名发展对象的入党介绍人?

答:为了使入党介绍人能够认真担负起对被介绍人进行培养、教育和考察的责任,一般情况下,一名正式党员不宜同时担任几名发展对象的入党介绍人。为此,党支部在指定党员作入党积极分子的培养联系人时就要注意。

问:党支部书记能否担任入党介绍人?

答:规定,接收预备党员时,申请入党的人要有两名正式党员作介绍人。《中国共产党发展党员工作细则(试行)》规定:“人党介绍人一般由培养联系人担任,也可由发展对象自己约请,或由党组织指定”。因此,党支部书记可以担任入党介绍人。

有人担心党支部书记担任入党介绍人会影响支部发展党员的审查把关作用。为了避免这种情况,要严格按规定办事,接收新党员要广泛听取党内外群众的意见,进行严格的审查,在支部大会上集体讨论决定和表决,并报上级党组织审查批准。任何个人都不得违反这些规定。

问:党委负责同志可否担任入党介绍人?

答:党委负责同志首先是—名党员。如果其对申请入党人的情况比较了解,并且能够切实担负培养、教育和考察的责任,可以担任入党介绍人。

问:直系亲属能否担任入党介绍人?

答:在一般情况下,不宜由申请入党人的直系亲属担任其入党介绍人。党支部应向申请入党人及其亲属讲明道理,做好思想工作。

问:受留党查看处分,尚未恢复党员权利的党员能否担任入党介绍人?

第8篇:介绍一本好书范文

自我介绍是互相认识的方式,小编为大家提供大一新生个性自我介绍,让大家能马上记住你。欢迎大家阅读。

大一新生自我介绍范文大家..好.

说实话,在这么多人面前做自我介绍,这让我有些紧张.

从小到大,需要自我介绍的地方太多了.呵呵.

可我却到现在都没能掌握它.

太多的介绍都是如出一辙的,这一点我很讨厌.

我呢,长发,个子还算高.这些都能看得到的.

看不到的,比如,我很乐观.

呵,这都是我自己的观点了.

更多的内容需要大家去挖掘了.

每个人都会有不同的看法的,我更喜欢听别人口中的我.

谢谢."

大一新生自我介绍范文不管大学以前你是怎样的,来到新的环境,这是一个大家重新认识自己的机会,就应该以新的面貌出现。作为新生一个好的自我介绍就显得尤为重要,小编汇总了各种版本和风格的新生开学自我介绍,给大家参考。

文艺版大家好,我叫xxx,毕业于XX高中 。我从小便喜好文学,对我而言,相比理科中奇妙的符号数字和多变的几何图形,我更喜爱文学中的那一片人文气息。无人时,我喜欢静静的看书,沉浸甚至沉醉于那一部部文学名著中。书中那片浓郁的人文气息,沁人心脾,让我不由的深陷其中,无法自拔。

不过由于过于以书为友,反而让我忽略了现实中的人际交流,在面对陌生的环境和陌生的人时,我会由于茫然不知所措而显得过于沉默乃至沉闷,这也算是我最大的一个缺点吧,所以我希望在大学里多和同学们交流,努力改掉这个缺点。

在今后的四年里,我希望在收获好成绩的同时,也能收获到数份珍贵的友谊!

在此先谢谢大家了!

随和版大家好,我是xxx,来到这里,我非常的兴奋,因为我又能在新的环境中,找到新的朋友了。

我是一名学习一般,相貌一般,体格一般的内向学生。我沉着冷静,比较和善,也比较好相处,大家可以和我多交朋友。我喜欢看书,特别是喜欢xxx的书,希望在大学能够交到一些志同道合的书友。

我和在座的同学们一样,渴望展翅高飞,渴望将来有更大的发展空间,有施展才华的更广阔的天地。我想,有耕耘就会有收获。未来的四年里,由各位老师的倾情传授,我们一定会有一个更加无限美好的未来。

第9篇:介绍一本好书范文

我从事计算语言学教学和研究已经50多年,在这半个多世纪的漫长岁月中,针对计算语言学的跨学科性质,我在北京大学学习过语言学,在中国科学技术大学研究生院学习过信息科学,在法国格勒诺布尔理科医科大学学习过数学,前后花了将近20年的时间更新自己的知识,成为跨学科背景的计算语言学家。现在我们已经进入了信息网络时代,以自然语言信息处理作为研究目标的计算语言学正越来越受到语言学家的关注。然而,由于大多数语言学家仅具有文科背景,他们对于计算语言学中涉及的数学知识和计算机知识了解不多,尽管他们怀着关注计算语言学的强烈愿望,可是一旦看到计算语言学的专业文献、接触到其中的数学和计算机方面的问题,往往望而生畏,敬而远之。他们精研通达的语言学知识,难以与数学知识和计算机知识融会贯通起来,这是十分可惜的!

我常常想,如果有计算语言学家能够用一般语言学家可以理解的方式,深入浅出地阐述计算语言学的原理和方法,一定会吸引更多的语言学家参加到计算语言学的队伍中,更好地推动我国计算语言学的教学和研究。

2004年我在英国伯明翰大学访问时,在伯明翰市中心的一个书店里偶然发现了Ruslan Mitkov主编的《牛津计算语言学手册》,很快就被它简洁明了、深入浅出的写作风格吸引住了。我觉得这本书就是我多年来梦寐以求的深入浅出的计算语言学著作,非常适合文科背景的语言学家阅读,决心把这本书引进到国内来。

2005年回国之后,我马上找到外语教学与研究出版社的朋友,向他们介绍这本书的价值。他们被我的诚意感动,很快就决定引进这本书,并且与牛津大学出版社商量,双方一致同意合作在国内出版。2009年9月,《牛津计算语言学手册》正式在国内发行。这是一件大快人心的好事!

本书由Ruslan Mitkov教授主编,收录了包括语言学家、计算机专家和语言工程人员在内的49位学者撰写的38篇针对计算语言学主要领域的综述性文章,各章的写作风格力求一致,使得全书前后关联、浑然一体、可读性强。《牛津计算语言学手册》内容丰富、深入浅出,全面地反映了国外计算语言学的最新成果,是我们了解国外计算语言学发展动向的一个窗口,正好满足了我国语言学界学习和了解国外计算语言学的研究成果和最新动态的要求。

本书主编Ruslan Mitkov是计算语言学家及语言工程专家,毕业于德国德累斯顿大学(Dresden University),现为英国伍尔弗汉普顿大学(University of Wolverhampton)教授。他的研究兴趣是回指消解、机器翻译和自动索引,曾于2002年出版过名为《回指消解》(Anaphora Resolution)的专著。著名计算语言学家Martin Kay(马丁?凯伊)为本书作序。Martin Kay是美国斯坦福大学语言学教授,曾任计算语言学会主席、国际计算语言学委员会主席,是国际计算语言学界的领军人物。

二、内容简介

本书内容分三大部分:1.与计算语言学有关的语言学基础理论(1~9章);2.计算语言学中自然语言的处理、方法与资源(10~26章);3.计算语言学的应用(27~38章),几乎涵盖了计算语言学的所有领域。书末有按照字母顺序编排的计算语言学术语表,每个术语均有简要的定义和解释,便于读者查询。下面分别介绍各章的内容。

第1章“音系学”(phonology)介绍了描写音系学和计算音系学的基本知识,着重介绍了非线性音系学中的有限状态模型、音位的特征-值矩阵描述方法以及音系学研究中的计算工具。

第2章“形态学”(morphology)介绍了诸如语素、词、屈折、派生等形态学的基本知识,分析了形态学对于音系学的影响,着重介绍计算形态学中的有限状态分析方法,并介绍了双层形态学和双层规则的形式化描述方法。最后介绍了结构段形态学。

第3章“词典学”(lexicography)首先简要地回顾了词典学的发展历史,接着讨论了人编词典在计算机应用中的不足,说明了计算词典学对于传统的词典编纂技术提出的挑战。本章着重讨论了词汇在计算语言学中的功能以及计算技术在词典编纂中的作用;说明了计算技术改变了词典编纂工作的面貌,为新型词典的编纂提供了有力的技术手段。本章强调指出,计算机辅助的词典编纂应该成为今后词典编纂工作的发展方向。

第4章“句法学”(syntax)首先列举了一些有趣的句法现象,分析了这些现象在计算上的意义,接着介绍正则语法和有限状态语法、上下文无关的短语结构语法、转换语法、扩充转移网络、各种基于约束的特征结构语法(功能语法、词汇功能语法、中心语驱动的短语结构语法、PATR语法)。最后,介绍了两种在语言学和计算上有意义的句法框架(广义短语结构语法、树邻接语法)。

第5章“语义学”(semantics)集中介绍了计算语义学的基本内容。首先讨论语义的表示问题,介绍了语义的高阶逻辑(higher-order-logic)表示法和语义的特征值矩阵(Attribute-Value Matrix)表示法。其次讨论句法语义接口,介绍了“并行对应模型”(Parallel Correspondence Model,简称PCM);针对 Frege的“组成性原则”(principle of compositionality),介绍了“非组成性的语义学”。最后介绍了语义解释的动态模型。

第6章“话语”(discourse)首先列举了一些话语平面的现象,阐明“话语”研究的对象是句子之间的关联问题,计算语言学中的话语研究要揭示句子之间关联的机制。接着讨论参照表示(referring expressions)和话语结构(discourse structure),说明参照表示的工作原理和参照表示的选择方法,并讨论主题(theme)与述题(rheme)、话题(topic)与焦点(focus),以及预设(presupposition)、蕴含(implicature)等问题。最后讨论“话语树”(discourse tree),介绍了“修辞结构理论”(rhetorical structure theory)和“中心理论”(centering theory)。

第7章“语用学和对话”(pragmatics and dialogue)讨论语用学及其在计算机对话模型中的应用。首先介绍言语行为(speech act)、言外语力(illocutionary force)、合作原则(cooperative principle,简称CP)、关联(relevance)等语用学的基本概念,并且介绍了意图(intention)、信念(belief)、知识(knowledge)和推论(inference)等与概念表达有关的问题。着重讨论了计算语用学中的对话模型(dialogue model),说明了从话语行为到对话行为的计算机制,并介绍了对话的管理模型(dialogue management models)。

第8章“形式语法与形式语言”(formal grammars and languages)介绍形式语言理论的基本知识,分别论述了形式语法和自动机,把形式语法看成是语言的生成装置,把自动机看成语言的识别装置。为了便于文科背景的读者理解本章的内容,对于一些基本概念都给出了定义和实例;为了避免抽象的数学推理,对于一些基本的结论不在数学上加以证明。首先介绍了Chomsky的形式语法,给出了形式语法的Chomsky分类,分别讨论了上下文无关语言(context-free languages)、线性和正则语言(linear and regular languages)、半线性语言(semilinear languages)、上下文有关语言(context-sensitive languages)、柔性上下文有关语言(mildly context-sensitive languages)。接着介绍自动机理论,分别讨论了有限自动机(finite automata)、下推自动机(pushdown automata)、线性有界自动机(linear bounded automata)、图灵机(Turing machine)。

第9章“计算复杂性”(complexity)介绍自然语言处理中的计算复杂性问题。首先介绍计算复杂性的度量方法和计算复杂性的类别,分别讨论了多项式算法(Polynomial algorithm,简称P)和非确定多项式算法(Nondeterministic Polynomial algorithm,简称NP),并介绍了自然语言处理中关于“NP完全问题”(NP-complete problem)的一些研究。接着讨论正则语言问题的计算复杂性,介绍了确定性(determinism)和非确定性(non-determinism)的概念、线性(linearity)和有限状态特性(finite-stateness)的概念,说明了有限状态方法的可应用性。然后讨论上下文无关语言的计算复杂性,介绍了基于搜索的上下文无关识别(search-based context-free recognition)、自顶向下识别(top-down recognition)、线性时间与空间中的确定性语法识别(deterministic grammar recognition in linear time and space)。最后讨论了概率语法和启发式搜索、并行处理和实际效用等问题,说明计算复杂性分析在理解自然语言的复杂性以及在建立实际的自然语言处理系统中的用途。

第10章“文本切分”(text segmentation)介绍两方面的内容:一方面是“词例还原”(tokenization),一方面是“句子分离”(sentence splitting)。词例还原的目标是把文本中的单词、标点符号、数字、字母数字字符切分出来,以便进行进一步处理。本章分别介绍了单词自动切分、缩写切分(例如:“Mr.,Dr.,kg.”中的小黑点)、连字符处理(例如:“self-asessment,forty-two,F-16”中的连字符)的技术,并且讨论了汉语和日语等东方语言中有关“词例还原”(也就是“切词”)的特殊问题。句子分离的目标是把文本中的句子分离出来,在很多自然语言处理系统中,都需要进行句子分离。本章介绍了基于规则的句子分离、基于统计的句子分离、非规范输入文本中的句子分离等技术。

第11章“词类标注”(part-of-speech tagging)介绍了词类标注器(POS tagger)的设计技术以及兼类词的排歧(disambiguation)方法。简要回顾了词类标注发展的历史,介绍了基于局部性手写规则的词类标注器、基于n-元语法的词类标注器、基于隐马尔科夫模型(Hidden Markov Models)的词类标注器、基于机器学习的词类标注器、基于全局性手写规则的词类标注器、基于混合方法的词类标注器,重点介绍了手工排歧语法(handwritten disambiguation grammars)。

第12章“句法剖析”(parsing)介绍了自动句法剖析的基本概念和关键技术。句法剖析的深度因自然语言处理的具体要求的不同而不同,有浅层的句法剖析(shallow parsing),也有深层的句法剖析(deep parsing)。本章首先介绍了浅层句法剖析,这种剖析只要把句子剖析为语块(chunks)就可以了。之后,介绍了依存剖析(dependency parsing)。在介绍上下文无关剖析(context-free parsing)时,比较详细地讨论了CYK算法、自底向上剖析、左角分析法、自底向上的活性线图分析法(bottom-up active chart)。在介绍基于合一的剖析(unification-based parsing)时,讨论了特征-值矩阵。剖析时可能得到若干个结果,因此,本章还讨论了剖析结果的排歧问题。最后,讨论了剖析算法准确性的评测、剖析程序的效率以及剖析语法覆盖面的度量方法等问题。

第13章“词义排歧”(word-sense disambiguation,简称WSD)讨论如何利用上下文来确定多义词的准确意义。首先介绍了在计算语言学研究早期所提出的WSD优选语义学方法、词专家剖析方法。这些方法由于缺乏可供使用的词汇资源,出现了“知识获取的瓶颈问题”(knowledge acquisition bottleneck)。这些问题由于大规模词汇库和知识库的出现而得到缓解,又由于统计方法和机器学习方法的应用而可以从语料库中获取精确的数据。近年来,在WSD中普遍使用基于词典的方法、联结主义方法(connectionist)、统计方法、机器学习方法,取得了很大的进步。最后讨论WSD的评测,介绍了SENSEVAL的评测活动,并介绍WSD的一些实际应用。

第14章“回指消解”(anaphora resolution)首先列举了一些回指现象,说明了回指现象的各种变体。接着讨论回指消解所需要的知识源、回指消解的过程、回指消解在自然语言处理中的应用。最后回顾了回指消解研究的发展历史和现状,讨论了今后回指消解研究中应当注意的问题。

第15章“自然语言生成”(natural language generation,简称NLG)介绍了自然语言生成研究的理论和实践问题,力图说明在人们的心智上以及在计算机中,语言究竟是怎样产生出来的。自然语言生成是一个知识密集的问题,可以从语言学、认知科学和社会学的角度来探讨。可以把自然语言生成看成一个映射问题,也可以把它看成一个选择问题,还可以把它看成一个规划问题。自然语言生成可以分为四个问题:宏观规划(macroplanning)、微观规划(microplanning)、表层实现(surface realization)、物理表达(physical presentation)。对于宏观规划,介绍了说话内容的规划、文本的规划,以及使用修辞结构理论的规划方法;对于微观规划,着重介绍了词汇生成的问题。最后介绍了表层生成的技术。

第16章“语音识别”(speech recognition)研究如何把作为声学信号的声波转换为单词的序列。现在,最有效的语音识别方法是语音信号统计建模的方法。本章简要地介绍了语音识别中的主要方法和技术:声学语音信号的建模、语音识别中的词汇表示、语音识别中的语言模型和解码。重点介绍独立于说话人的大词汇量连续语音识别(large-vocabulary continuous speech recognition,简称LVCSR)的最新的技术。目前,语音识别主要应用于自动听写机的设计、口语对话系统、语音文献的自动转写、语音信息检索等领域中。最后讨论了语音识别技术未来的研究前景。

第17章“文本-语音合成”(text-to-speech synthesis,简称TTS)介绍文本-语音合成的最新成果。TTS既涉及自然语言处理技术,也涉及数字信号的处理技术。本章主要从自然语言处理的角度来介绍TTS。首先介绍TTS系统的概貌以及它的商业应用价值。然后描述TTS系统的功能结构以及TTS系统的组成部分,TTS系统中的自动形态-句法分析、自动语音分析、自动韵律生成,说明了如何从文本中近似地计算语音的声调和时长。最后介绍了声波生成的两种技术:规则合成技术(synthesis by rules)与毗连合成技术(concatenative synthesis)。

第18章“有限状态技术”(finite-state technology)首先举例介绍有限状态语言、词汇转录机、重写规则等基本概念,然后介绍基本正则表达式的运算方法和复杂的正则表达式,最后讨论有限状态网络的形式特性。

第19章“统计方法”(statistical methods)介绍了计算语言学中的统计方法。目前,统计方法已经成为自然语言处理的主流方法。本章首先介绍数理统计的基本概念(如:样本空间、概率测度、随机变量、条件概率、熵、随机过程)以及如何把它们应用于自然语言的模拟问题,分别介绍了隐马尔科夫模型(hidden Markov models)和最大熵模型(maximum-entropy models),最后介绍了这些模型的一些技术细节,如:韦特比搜索(Viterbi search)、最大熵方程(maximum-entropy equation)等。

第20章“机器学习”(machine learning)介绍了如何通过有指导的训练实例(supervised training examples)来自动地获取语言资源中蕴含的决策树(decision-tree)和规则(rules),描述了怎样从经过标注的训练实例中进行推理的各种算法和知识表达技术,并介绍了如何使用已经获得的知识来进行分类的基于实例的分类方法(instance-based categorization),较详细地介绍了k-邻近分类算法(k nearest-neighbour categorization algorithm)。这些机器学习的技术可以应用来解决计算语言学中的形态分析、词类标注、句法剖析、词义自动排歧、信息抽取、前指消解等各种各样的问题。

第21章“词汇知识的获取”(lexical knowledge acquisition)首先介绍了词汇知识自动获取的一些背景,包括词汇知识的形式、词汇知识获取的资源和工具、单词的共现和相似度。然后介绍了从语料库中自动获取词汇的搭配关系(lexical collocation)和联想关系(lexical association)的方法,词汇相似度(similarity)计算与叙词表(thesaurus)构建的方法,动词的次范畴框架(subcategorization frame)的获取方法;分析了词汇语义学(lexical semantics)和词汇知识获取的关系。最后介绍了从机器可读的词典中获取词汇知识的方法。由于在自然语言处理中越来越重视词汇知识的作用,自然语言处理的形式模型中越来越多地采用“词汇化”(lexicalized)的方法,词汇知识的自动获取是当前计算语言学研究的亮点之一。

第22章“评测”(evaluation)专门讨论自然语言处理系统的评测问题。评测是推动自然语言处理研究发展的一个重要手段,评测的结果对于自然语言处理系统的投资者、开发者和使用者都是很有价值的。在自然语言处理技术发展的早期主要使用基于技术的评测(technology-based evaluation),在自然语言处理技术比较成熟时,就可以使用以用户为中心的评测(user-centred evaluation)。根据评测时的输入与输出,评测技术又可以分为分析成分的评测(evaluation of analysis components)、输出技术的评测(evaluation of output technologies)和交互系统的评测(evaluation of interactive systems)。分析成分的评测把语言映射为它的内部表达作为输出(例如:有标记的片段、树形图、抽象的意义表达式等)。输出技术的评测要把处理的结果用具体的语言表示出来(例如:文摘、生成的文本、翻译的译文等)。这种评测可以分别使用内部评测指标(intrinsic measures)和外部评测指标(extrinsic measures)来进行。交互系统的评测容许用户与系统进行交互。本章总结了评测的各种技术,并指出它们的优点和缺点。

第23章“子语言和可控语言”(sublanguage and controlled language)首先讨论了在限定语义领域中的计算语言学,指出了在当前的水平之下,在某些限定领域中应用自然语言处理技术的必要性。然后举例说明了某些自发形成的子语言,分析了子语言的特性,讨论了子语言在机器翻译、文本数据抽取、自然语言生成、自动文摘中的应用问题。接着讨论可控语言,分析了使用可控语言的必要性和局限性,介绍了可控语言的一个实例――简化英语AECMA。最后讨论子语言与可控语言的关系,分析了把子语言转变为可控语言的途径。

第24章“语料库语言学”(corpus linguistics)主要讨论了语料库在自然语言处理中的应用问题。首先从语料的抽样框架、语料的代表性、语料的平衡性等方面说明了建立语料库的基本要求,简要地回顾了语料库的发展历史,然后着重地讨论了语料库的标注(annotation)问题。标注过的语料库的优点是:开发和研究上的方便性、使用上的可重用性、功能上的多样性和分析上的清晰性。学术界对于语料库标注的批评主要来自两方面:一方面认为,语料库经过标注之后失去了客观性,所得到的语料库是不纯粹的;另一方面认为,手工标注的语料库准确性高而一致性差,自动或半自动的标注一致性高而准确性差,语料库的标注难以做到两全其美,而目前大多数的语料库标注都需要人工参与,因而很难保证语料库标注的一致性。在分析了语料库在自然语言处理中的应用问题之后,作者指出,不论标注过的语料库,还是没有标注过的语料库,在自然语言处理中都是有用的,语料库语言学有助于计算语言学的发展。

第25章“知识本体”(ontology)讨论了知识本体及其在自然语言处理中的应用。首先,分别介绍了哲学传统的知识本体、认知和人工智能传统的知识本体、语言学传统的知识本体,并讨论了语言学中的知识本体与词汇语义学的关系;然后,说明在自然语言处理中,知识本体可以用来帮助系统进行语言的结构分析(例如:英语中的PP附着问题、错拼更正、句法检错、语音识别),也可以用来进行局部的自然语言理解(例如:信息检索中的问题搜索、文本分类),并具体说明了知识本体在信息检索、信息抽取、自动文摘、语义相似度计算、词义排歧中的应用。

第26章“树邻接语法”(tree-adjoining grammar,简称TAG)介绍一种局部化的语法形式模型:树邻接语法(TAG)和词汇化的树邻接语法(lexicalized tree-adjoining grammar,简称LTAG)。首先讨论上下文无关语法CFG的局部化问题,说明TAG与CFG的不同:TAG以句法结构树作为核心操作对象,在树的基础上来组织语言知识,它的产生式规则也对应着树结构,它以线性的一维形式来表达二维的树结构;而CFG以符号串作为操作对象,CFG是一个基于符号串的形式语法,而TAG是基于树的形式语法。然后讨论上下文无关语法CFG的词汇化问题,介绍了LTAG。LTAG对于TAG的扩充主要在于把每一个初始树(initial tree)和辅助树(auxiliary tree)都与某一个或某一些叫作“锚点”(anchor)的具体单词关联起来。最后讨论LTAG的一些重要特性及其与别的形式系统的关系。

第27章“机器翻译:总体回顾”(machine translation:general overview)介绍了从20世纪50年代到90年代的基于规则的机器翻译系统(rule-based machine translation,简称rule-based MT)的主要概念和方法:直接翻译方法、中间语言方法、转换方法、基于知识的方法,并介绍了主要的机器翻译工具,简要回顾了机器翻译的历史。

第28章“机器翻译:新近的发展”(machine translation:latest developments)介绍了当前机器翻译系统的研究、开发和应用的情况,讨论了经验主义的机器翻译系统:基于实例的机器翻译(example-based MT)和统计机器翻译(statistical MT),并把它们与传统的基于规则的机器翻译系统进行了对比,同时还介绍了把各种方法融为一炉的混合机器翻译系统(hybrid MT)。当前基于规则的机器翻译的开发中,回指消解的研究以及基于中间语言和基于知识的机器翻译的研究取得较大进展,本章也做了介绍;此外,还介绍了口语的机器翻译,讨论了少数民族语言和不发达语言的机器翻译前景,讨论了因特网上的机器翻译(特别是网页翻译)问题。最后,本章介绍了译者的电子翻译工具,特别讨论了双语语料库、翻译记忆、双语上下文索引等问题,并介绍了一些面向译者的词处理工具。

第29章“信息检索”(information retrieval)主要介绍了文本的信息检索。信息检索系统的任务在于,对于用户提出的提问或者命题,给出与之有关的文献集合,作为检索的结果。首先分析了信息检索系统的软件组成成分,包括文献处理、提问处理、检索匹配技术。然后讨论自然语言处理技术对于信息检索的推动和促进作用,讲述了如何使用自然语言处理所得到的形态信息、短语信息、句法信息来改进信息检索中的索引技术,并且指出,当前的趋向是使用语义信息来进行信息检索。最后展望信息检索的发展前景。

第30章“信息抽取”(information extraction,简称IE)讨论如何从自由文本中自动地识别特定的实体(entities)、关系(relation)和事件(events)的方法和技术。本章主要讨论两种类型的信息抽取:一种是名称的自动抽取(extraction of names),一种是事件的自动抽取(extraction of events),并介绍书写抽取规则的方法。对于名称的自动抽取,本章介绍了名称标注器(name tagger);对于事件的自动抽取,介绍了事件识别器(event recognizer)。同时,还介绍了如何从已经标注了有关名称或事件信息的文本语料库中自动地学习和抽取规则的方法,这种方法也就是信息抽取的统计模型。最后,介绍了信息抽取的评测和应用。

第31章“问答系统”(question answering,简称QA)讨论如何从大规模真实的联机文本中对于指定的提问找出正确回答的方法和技术,这是文本信息处理的一个新的发展趋向。由于QA要对指定的提问给出一套数量不多的准确回答,在技术上,它更接近于信息检索(information retrieval),而与传统的文献检索(document retrieval)有较大的区别――QA要生成一个相关文献的表作为对于用户提问的回答。与信息抽取相比,QA要回答的提问可以是任何提问,而信息抽取只需要抽取事先定义的事件和实体。在开放领域的QA系统中,使用有限状态技术和领域知识,把基于知识的提问处理、新的文本标引形式以及依赖于经验方法的回答抽取技术结合起来,这样,就把信息抽取技术大大地向前推进了一步。本章首先介绍了QA系统的类别和QA系统的体系结构,接着介绍了开放领域QA系统中的提问处理、开放领域QA系统中的提问类型以及关键词抽取技术,并讨论了开放领域QA系统中的文献处理方法和提问抽取方法,最后展示了QA系统的发展前景。

第32章“自动文摘”(text summarization)介绍对单篇或多篇文本进行自动文摘的方法。首先讨论自动文摘的性质和自动文摘的过程。接着介绍自动文摘的三个阶段:第一阶段是主题辨认(topic identification),第二阶段是主题融合(topic fusion),第三阶段是文摘生成(summary generation);并介绍了多文本的自动文摘。最后,介绍自动文摘的评测方法,讨论了自动文摘评测的两个指标:压缩比(compression ratio,简称CR)和内容保留率(retention ratio,简称RR)。

第33章“术语抽取和自动索引”(term extraction and automatic indexing)介绍术语自动处理的技术。术语广泛地出现在科技文献中,术语的自动识别对于科技文献的分析、理解、生成、翻译具有关键性作用。随着网络的普及和数字技术的发展,出现在互联网、政府、工业部门和数字图书馆中的专业文献日益增多,术语的自动处理对于这些文献的信息检索、跨语言问答、多媒体文本自动索引、计算机辅助翻译、自动文摘等都具有重要作用。本章把面向术语的语言自动处理分为术语发现(term discovery)和术语识别(term recognition)两个部门,分别介绍了主要的技术和系统,最后介绍了双语言术语的自动抽取技术。

第34章“文本数据挖掘”(text data mining,简称TDM)介绍了本文数据挖掘技术。文本数据挖掘的目的在于从大规模真实文本数据中发现或推出新的信息,找出文本数据集合的模型,发现文本数据中所隐含的趋势,从文本数据的噪声中分离出有用的信号。本章首先讨论文本数据挖掘与信息检索的区别,分析了文本数据挖掘与计算语言学和范畴元数据(category metadata)的关系。本章举出实例,具体说明了怎样使用生物医学文献中的文本数据来推测偏头痛(migraine headaches)的病因,怎样使用专利文献中的文本数据来揭示专利文本与已经发表的研究文献之间的关系,并介绍了LINDI(Linking Information for Novel Discovery and Insight)系统。这个系统的软件能够根据大规模的文本集合来发现文本中蕴含的重要的新信息。

第35章“自然语言接口”(natural language interaction简称NLI)介绍计算机自然语言接口系统。这样的NLI系统可以把用户使用的口头自然语言或书面自然语言提出的问题转化为计算机可以处理的形式。首先介绍了NLI系统的基本组成部分、意义表达语言(meaning representation language,简称MRL)、同义互训软件(paraphraser)、问题生成软件(response generator)以及可移植工具(portability tools)。然后介绍口语对话系统(spoken dialogue systems,简称SDS),分别介绍了SDS的单词识别软件、任务模型、用户模型、话语模型、对话管理软件、消息生成软件、语音合成软件。最后讨论SDS系统的灵活性、现状以及将来的应用前景。

第36章“多模态和多媒体系统中的自然语言”(natural language in multimodal and multimedia systems)讨论自然语言在多模态系统和多媒体系统应用中的重要作用,说明了怎样把自然的口语或书面语与多媒体输入协同地融合为一体,怎样把自然语言与其他的媒体结合起来以生成更加有效的输出,怎样使用自然语言处理技术来改善多媒体文献的存取。首先介绍包含自然语言的多模态和多媒体输入的分析问题,讨论了怎样把自然语言处理技术作为多模态分析的基础,怎样把不同的模态结合起来的技术。接着介绍包含自然语言的多媒体输出的生成问题,讨论了怎样把自然语言处理技术作为多媒体生成的基础,并讨论了不同模态的协调问题(包括不同模态的配置、不同模态输出的裁剪、模态输出中空间和时间的配合)。还讨论了用于多媒体数据存取的自然语言处理技术(包括基于自然语言处理的图形和图像检索、图形和图像数据库的自然语言接口、多媒体信息的自然语言摘要)。最后讨论在多媒体环境中使用语言的问题。

第37章“计算机辅助语言教学中的自然语言处理”(natural language processing in computer-assisted language learning)介绍在计算机辅助语言教学(computer-assisted language learning,简称CALL)中使用自然语言处理技术的问题。首先介绍CALL的发展历史,接着介绍在自然语言处理背景下的CALL,语料库与CALL,双语语料库,讨论自然语言处理技术在形态学教学、语法教学、偏误的识别与诊断中的应用。最后讨论自然语言处理技术在CALL中应用的评估问题。

第38章“多语言的在线自然语言处理”(multilingual on-line natural language processing)讨论在因特网上的多语言处理问题。因特网现在已经发展成多语言的网络,英语独霸互联网天下的局面已经成为历史,非英语的网站越来越多,语言障碍日益严重。为了克服语言障碍,机器翻译当然是一个最重要的手段,除了机器翻译之外的各种使用自然语言处理技术的多语言处理工具也雨后春笋般地开发出来。本章介绍了语种辨别(language identification)、跨语言信息检索(cross-language information retrieval,简称CLIR)、双语言术语对齐(bilingual terminology alignment)和语言理解助手(comprehension aids)4个方面的研究情况。语种辨别的目的在于让计算机自动地判断书面文本是用什么语言写的,这显然是多语言自动处理必须经过的第一步。跨语言信息检索CLIR的目的在于使用一种语言提问来检索其他语言文本的信息。本章介绍了在CLIR中的译文发现技术(finding translation)、翻译变体的修剪技术(pruning translation alternatives)和翻译变体的加权技术(weighting translation alternatives)。在这些应用中,双语言词典或多语言词典是最重要的资源,而这些词典的覆盖面可以通过使用双语言术语对齐的技术来加以提升。语言理解助手的功能在于给用户提供软件工具来理解外语书写的文本,而不必使用全自动机器翻译的技术。本章介绍了施乐公司欧洲研究中心(Xerox Research Centre Europe,简称XRCE)的语言理解助手LocoLex和语义模型,并介绍了施乐公司使用语言助手来改善数字图书馆Callimaque的技术。

本章最后附有各章作者简介、计算语言学术语表、作者索引和主题索引,便于读者查阅。

三、简评

本书是手册性的专著,有如下三个明显特点:

1.深入浅出。本书各章写作风格一致,内容协调,浑然一体,特别适合对计算语言学感兴趣和初入门的读者阅读。本书使用流畅的文笔和有趣的实例来介绍艰深的技术问题,尤其适合文科背景的读者阅读。

2.专家执笔。本书的38章分别由各个领域内的46位知名专家执笔,由于这些专家具有所属领域的精湛知识,对于自己的领域有深刻的理解,有力地保证了本书的学术质量和专业水平。

3.涵盖全面。本书几乎涵盖了计算语言学的所有领域,反映了当前计算语言学的最新成就,使我们对计算语言学能够获得全面而系统的认识。

我国曾经翻译出版过有关计算语言学和自然语言处理的大部头专著,如冯志伟和孙乐翻译的《自然语言处理综论》(电子工业出版社,2005)被称为自然语言处理教材的“黄金标准”。但是,这部专著主要针对理工科背景的读者而写,数学公式较多,文科背景的读者阅读和理解起来常常会感到困难。与《自然语言处理综论》相比,本书尽量避免使用繁难的数学公式,文笔浅显而流畅,内容新颖而有趣,更适合文科背景的读者阅读。目前,计算语言学这个新兴的学科不仅吸引了大量理工科背景的研究人员,同时也有不少文科背景的研究人员投身到计算语言学的研究行列中来。本书的上述特点正好可以满足文科背景研究人员的需要。当然,由于本书内容涵盖面广、专业性强,对理工科背景的研究人员也有很大的参考价值。