比如我提出个问题,怎样切词提取关键词,怎么创建简单的语料库,怎样组合词语匹配到提出的问题。我想用php实现,求思路,求技术指点,求各种助攻,先拜谢了
这个问题我来回答完全就是献丑了。。。
这个问题应该是学习机器学习、NLP相关的研究生能够回答的吧。
分词。我只用过python的jieba
这个分词库。一般分词都是有第三方库吧。
创建语料库。这个没接触过,不了解。网上有很多开源的语料库。
组合词语匹配提出的问题。这个我感觉不是我能解决的,我只能提出我的想法,首先提取出问题的关键词或者关键短语吧,之前在github上有一个用TextPage算法实现的提取关键词和摘要的代码,然而效果不咋滴;然后,使用关键词或者关键短语到你的训练数据中匹配到解决问题的方法;最后在组合为句子或者段落。