我需要一个通用的音译或替换正则表达式,它将扩展的拉丁字符映射到类似的ASCII字符,并将所有其他扩展字符映射到''(空字符串),以便......
é变成了e
ê成为e
á成为一个
ç变成c
Ď成为D.
等等,但是像‡或Ω或‰这样的东西只是被条纹化了.
使用Unicode :: Normalize来获取NFD($ str).在这种形式中,具有变音符号的所有字符将变成基本字符,然后是组合变音字符.然后只需删除所有非ASCII字符.