我有兴趣编写一个PHP脚本(我确实欢迎与语言无关的建议),这些脚本会将用英语(phoenetically)编写的句子或单词翻译成另一种语言的脚本.因为我正在看英语写的电音(即通过耳朵):我必须处理同一个单词的变体拼写.
假设罗马化没有标准(例如,在中文中,你有简化的韦德等)
有没有人对我可以从哪里开始有任何建议?
编辑:我纯粹是为了教育目的这样做,和我最初的印象是为了搞清楚(不同的拼写之间的连接可能在IM消息,写的罗马化形式的Facebook帖子的语料库中找到语言),你需要某种机器学习工具.但是,我想知道我是否走在正确的轨道上,并且我想要了解下一步我应该研究什么以使其工作(例如:我应该研究哪种机器学习工具?) .