我一直在尝试使用:
$string="The Dr. is here!!! I am glad I'm in the U.S.A. for the Dr. quality is great!!!!!!"; preg_match_all('~.*?[?.!]~s',$string,$sentences); print_r($sentences);
但它不适用于Dr.,USA等.
有没有人有更好的建议?
对此没有任何简单的解决方案.你需要在你的应用程序中做一些自然语言处理(NLP)并识别每个句子.有一些东西叫OpenNLP,它是一个基于JAVA的NLP解析器工具.或Ruby中的Stanford NLP解析器.你可以找到类似PHP的东西.
在这里,我在PHP中找到了一组用于自然语言处理的类.