「自然语言处理,可以不去管语义的表示,b如,我说,请帮我开门,你走过去把门打开,我就认为你理解了语义。对计算机也如此,它只要完成了人类语言下达的任务,就可以了,至於这个语义如何表示,不重要。」
柳凛cHa话道,「不是不重要吧,也许是因为非常难。做个类b,听到指令,难度为1,完成指令,难度为3,理解指令,难度为5,而讲这个理解的结果表示出来,难度可能是100。这几乎是一个哲学上的终极问题。」
「对对,」山丰也悟道一些,说道,「就像人为什麽要活着,这是一个哲学上的终极问题,但是人可以不用Ga0明白这个问题,而活着。自然语言处理也如此,我们不必Ga0懂什麽是语义,如何表示语义,而直接完成语义的要求。」
三人稍微停顿了一会,吴湛说,「这应该不是哲学问题,这应该是语言学的终极问题,也是现在语言学的困境之一,连一些最基本的概念都没有Ga0清楚。我们这个学科叫计算语言学,就是让计算机掌握语言学中的理论和知识,可是,语言学中那些最基本的概念,现在用人类语言都还没有说清楚,其中的理论,用人类语言都还没有建构起来。所以,计算语言学要想发展,也许得绕过语言学。这也是现在学术界,更倾向使用自然语言处理,这种更笼统、实用的说法。」
「我读到一本书,讲人类认识划分三个部分,信仰、哲学、科学,就是说最初人类对某种观念只能无条件地崇拜和相信,这是信仰,也是宗教的基础。然後,人类开始质疑一些说法,试图找到相信它的根据,这就是哲学。再进一步,如果人类用严谨的语言,在某个知识领域,建立起一套经严格证明,且实践检验正确的系统,则是科学。吴湛,你认为,计算语言学现在处於哪个阶段?」
「哲学阶段?」吴湛似答似闻,然後陷入思考。
「不,山丰,你这个问题其实很复杂,有好多层面。」柳凛接着讲,「首先,不是任何观念都能从信仰发展成科学,b如神的崇拜、X善论、X恶论等等,它们可能永远停留在信仰阶段。另外,哲学和语言学的关系也很复杂,也学语言学b哲学还基础,也就是说,从信仰到哲学,可能还需要过语言学这一关,哲学的思考和论述,都必须借助人类语言,因此,如果语言学中有些概念不清,哲学的很多概念也说不清,也就无法进入科学阶段。这有点类似哲学和逻辑学的关系,虽然通常将逻辑学归於哲学,但实际上,它是哲学的基础。首先有了基本的逻辑,哲学的论述才能开展。语言学也如此,首先有了基本的语言单元,哲学的大厦才能搭建。」柳凛滔滔不绝,讲了很多,自己也意识到,有点跑题了,就停了下来。
吴湛说,「计算语言学现在属於计算机科学的分支,当然希望进入科学的阶段,像今天听到的图语言模型,就是一个尝试,不过这些年,国内外太多这些理论出来了,柳凛最近迷上的LFG,也是其中之一,其实都走的是sky的路子,用在计算机语言的设计和处理上,大获成功,用在人类语言,就漏洞百出,sky自己也修改不停,目前还是看不到曙光,像今天这麽大口气的,还很少听到,像古代练丹师给皇帝推荐的长生不老丹。」
「那你们说,我们该怎麽对待这个专业?」山丰问。
「先别那麽大口气,具T问题具T分析,一个问题一个算法,尝试通过实验的方法不断改进算法,一点点提高。这是目前可以实实在在做的。」吴湛给出了建议。
「这属於头疼医头、脚痛医脚,只见树木,不见森林,还是要看你自己的兴趣和长处。一个一个小问题的慢慢改进,什麽时候是头?其实是在逃离问题,等别人突破,跟在後面做点小改进。而且,这些方法,大部分,其实稍微分析,几乎都到了无法再提高的瓶颈。数学上,不是有很多函数吗?看起来在不断增长,其实,理论上早就发现一个无法突破的上限。最近兴起了语料库方法,思路和sky完全不同,也许提供了通用方法的另一种途径?」柳凛说。
「国外已经兴起很久了,中国关注的人还不多,清华的h昌宁最近出了一本书,做了一些介绍。不过,看起来,需要相当多人工标注的数据,这不是一年两年的事,也许要一代人两代人,我们现在也只能浅尝辄止。你如果想长期在这个领域做,先别想太宏大目标,关键还是争取到项目,就像今天的锺妍那样,有资金支持,先活着,打零工呗,有一个机会就抓一个机会。其实,这就是所谓的坚持,尤其看不到希望的坚持,你可以说是得过且过,也可以说是持之以恒。」吴湛总
-->>(第4/6页)(本章未完,请点击下一页继续阅读)