当前位置:  开发笔记 > 人工智能 > 正文

对自然语言处理感兴趣的人有什么好的起点?

如何解决《对自然语言处理感兴趣的人有什么好的起点?》经验,为你挑选了2个好方法。

粗暴的呼叫,NLP是一个比大多数人认为的更广泛的领域.基本上,语言可以分为几类,这需要你学习完全不同的东西.

在开始之前,让我告诉你,如果没有某个(密切相关的)领域的学位,我怀疑你会有任何显着的成功(至少是专业人士).有很多理论涉及,大部分是干燥的东西,很难学.你需要很多耐力,最重要的是:时间.

如果你对文本的意义感兴趣,那么,这就是下一件大事.语义搜索引擎被预测为启动Web 3.0,但我们还远离'那里'.从文本中提取逻辑取决于几个步骤:

标记化,分块

在词汇层面消除歧义(时间过得像箭一样,但果实像香蕉一样苍蝇.)

句法分析

形态分析(时态,方面,案例,数量,诸如此类)

一个小清单,在我的头顶.还有更多:-),以及每个点的更多细节.例如,当我说"解析"时,这是什么?有许多不同的解析算法,并且解析形式也同样多.最强大的是Tree-adjoining语法和Head-driven短语结构语法.但是他们两个都很难在现场使用(现在).通常,您将处理一些半生不熟的生成方法,并且必须自己进行形态分析.

从那里走向语义是一大步.语法/语义接口既依赖于所使用的语法语义框架,也没有单一的工作解决方案.在语义方面,有经典的生成语义,然后是话语表征理论,动态语义等等.即使是所有基于的逻辑形式主义仍然没有明确定义.有人说应该使用一阶逻辑,但这似乎不够; 然后是蒙塔古所使用的内涵逻辑,但这似乎过于复杂,而且计算上不可行.还有动态逻辑(Groenendijk和Stokhof开创了这个东西.很棒的东西!)而且最近,今年夏天,Jeroen Groenendijk提出了一种新的形式主义,好奇的 语义学,也很有趣.

如果你想在一个非常简单的层面上开始,请阅读Blackburn和Bos(2005),它是伟大的东西,以及对计算语义的事实上的介绍!我最近将他们的系统扩展到覆盖问题的分区理论(问题回答是野兽!),正如Groenendijk和Stokhof(1982)提出的那样,但不幸的是,该理论在个体领域具有O(n²)的复杂性. .在这样做的同时,我发现B&B的实现有点,呃...... hackish,在某些地方.尽管如此,它确实可以帮助您深入研究计算语义,并且它仍然是一个令人印象深刻的展示,可以做些什么.此外,他们还应该获得额外的冷点来实现在Pulp Fiction(电影)中定义的语法.

当我在它的时候,拿起Prolog.计算语义学的许多研究都是基于Prolog.立即学习Prolog!是一个很好的介绍.我还可以推荐"Prolog的艺术"和Covington的"Prolog Programming in Depth"和"Prolog Programmers的自然语言处理",前者可以在线免费获得.



1> Aleksandar D..:

粗暴的呼叫,NLP是一个比大多数人认为的更广泛的领域.基本上,语言可以分为几类,这需要你学习完全不同的东西.

在开始之前,让我告诉你,如果没有某个(密切相关的)领域的学位,我怀疑你会有任何显着的成功(至少是专业人士).有很多理论涉及,大部分是干燥的东西,很难学.你需要很多耐力,最重要的是:时间.

如果你对文本的意义感兴趣,那么,这就是下一件大事.语义搜索引擎被预测为启动Web 3.0,但我们还远离'那里'.从文本中提取逻辑取决于几个步骤:

标记化,分块

在词汇层面消除歧义(时间过得像箭一样,但果实像香蕉一样苍蝇.)

句法分析

形态分析(时态,方面,案例,数量,诸如此类)

一个小清单,在我的头顶.还有更多:-),以及每个点的更多细节.例如,当我说"解析"时,这是什么?有许多不同的解析算法,并且解析形式也同样多.最强大的是Tree-adjoining语法和Head-driven短语结构语法.但是他们两个都很难在现场使用(现在).通常,您将处理一些半生不熟的生成方法,并且必须自己进行形态分析.

从那里走向语义是一大步.语法/语义接口既依赖于所使用的语法语义框架,也没有单一的工作解决方案.在语义方面,有经典的生成语义,然后是话语表征理论,动态语义等等.即使是所有基于的逻辑形式主义仍然没有明确定义.有人说应该使用一阶逻辑,但这似乎不够; 然后是蒙塔古所使用的内涵逻辑,但这似乎过于复杂,而且计算上不可行.还有动态逻辑(Groenendijk和Stokhof开创了这个东西.很棒的东西!)而且最近,今年夏天,Jeroen Groenendijk提出了一种新的形式主义,好奇的 语义学,也很有趣.

如果你想在一个非常简单的层面上开始,请阅读Blackburn和Bos(2005),它是伟大的东西,以及对计算语义的事实上的介绍!我最近将他们的系统扩展到覆盖问题的分区理论(问题回答是野兽!),正如Groenendijk和Stokhof(1982)提出的那样,但不幸的是,该理论在个体领域具有O(n²)的复杂性. .在这样做的同时,我发现B&B的实现有点,呃...... hackish,在某些地方.尽管如此,它确实可以帮助您深入研究计算语义,并且它仍然是一个令人印象深刻的展示,可以做些什么.此外,他们还应该获得额外的冷点来实现在Pulp Fiction(电影)中定义的语法.

当我在它的时候,拿起Prolog.计算语义学的许多研究都是基于Prolog.立即学习Prolog!是一个很好的介绍.我还可以推荐"Prolog的艺术"和Covington的"Prolog Programming in Depth"和"Prolog Programmers的自然语言处理",前者可以在线免费获得.



2> 小智..:

乔姆斯基完全是寻找NLP的错误来源(并且他自己也说得很重要) - 参见:Abney的" 统计方法和语言学 ".

上面提到的Jurafsky和Martin是标准参考,但我自己更喜欢Manning和Schütze.如果你对NLP很认真,你可能想要阅读这两本书.有在线提供曼宁课程之一的视频.

推荐阅读
小妖694_807
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有