当前位置:  开发笔记 > 编程语言 > 正文

PHP Regex用于人名

如何解决《PHPRegex用于人名》经验,为你挑选了2个好方法。

我遇到了一个正在用于人类名字的正则表达式的问题.

$rexName = '/^[a-z' -]$/i';

假设名为Jürgen的用户希望注册?还是Böb?这在欧洲非常普遍.这有特别的符号吗?

编辑:,只是把Jürgen的名字扔给了一个正则表达式的创造者,然后它在ü字母处分开了......

http://www.txt2re.com/index.php3?s=J%FCrgen+Blalock&submit=Show+Matches

EDIT2:好的,因为检查这些特定的东西很难,为什么不使用只检查非法字符的正则表达式呢?

$rexSafety = "/^[^<,\"@/{}()*$%?=>:|;#]*$/i";

(现在哪些实际上可以用于任何黑客攻击?)

例如.这允许'和 - 标志,但你需要一个; 使它在SQL中工作,那些将被停止.任何其他常用于HTML注入SQL攻击的字符,我都缺少?



1> Pascal MARTI..:

我真的会说:不要试图验证名称:不管怎样,你的代码会遇到一个它认为"错误"的名字......当你的应用程序告诉他" 你的名字 "时,你会怎么想?无效 "?

根据你真正想要实现的目标,你可以考虑使用某种黑名单/过滤器来排除你想到的"非名字":它可能会让一些"坏名字"通过,但至少,它不应阻止任何现有名称访问您的应用程序.

以下是一些可以想到的规则示例:

没有号码

没有特殊的性格,喜欢"~{()}@^$%?;:/*§£ø和其他一些人

没有那3个空格?

没有"管理员","支持","主持人","测试"以及人们在不想输入真实姓名时往往会使用的其他一些明显的非名字......

(但是,如果他们不想给你他们的名字,他们仍然不会,即使你禁止他们输入一些随机字母,他们也可以只使用一个真实姓名......这不是他们的名字)

是的,这并不完美; 是的,它会让一些非名字传递......但是对你的应用程序来说可能比说"你的名字错了"更好(是的,我坚持^^)


并且,回答你留下的另一个答案:

我可以禁止SQL注入和XSS攻击的大多数命令字符,

关于SQL注入,您必须在将数据发送到数据库之前将其转义; 而且,如果你总是逃避这些数据(你应该!),你不必关心用户可能输入的内容:因为它是逃逸的,所以总是存在风险.

关于XSS也是如此:因为你总是在输出数据时逃避你的数据(你应该!),没有注入的风险;-)


编辑:如果你只是使用那样的正则表达式,它将无法正常工作:

以下代码:

$rexSafety = "/^[^<,\"@/{}()*$%?=>:|;#]*$/i";
if (preg_match($rexSafety, 'martin')) {
    var_dump('bad name');
} else {
    var_dump('ok');
}

会给你至少一个警告:

Warning: preg_match() [function.preg-match]: Unknown modifier '{'

你必须逃脱至少一些特殊的角色; 我会让你深入了解PCRE模式以获取更多信息(关于PCRE /正则表达式真的有很多了解;我将无法解释所有这些)

如果您确实想要检查这些字符中是否存在这些字符,那么您可能会得到类似的结果:

$rexSafety = "/[\^<,\"@\/\{\}\(\)\*\$%\?=>:\|;#]+/i";
if (preg_match($rexSafety, 'martin')) {
    var_dump('bad name');
} else {
    var_dump('ok');
}

(这是一个快速而肮脏的主张,必须加以完善!)

这个说"OK" (嗯,我肯定希望我自己的名字没问题!)
和一些特殊字符相同的例子,如下:

$rexSafety = "/[\^<,\"@\/\{\}\(\)\*\$%\?=>:\|;#]+/i";
if (preg_match($rexSafety, 'ma{rtin')) {
    var_dump('bad name');
} else {
    var_dump('ok');
}

会说"坏名声"

但是请注意我还没有完全测试过,它可能需要更多的工作!除非您仔细测试,否则请勿在您的网站上使用此功能!


另请注意,单个引用在尝试执行SQL注入时可能会有所帮助......但它可能是某些名称中合法的字符...所以,仅排除某些字符可能就不够了;-)



2> Gumbo..:

PHP的PCRE实现支持跨越更大字符集的Unicode字符属性.所以你可以使用\p{L}(字母字符),\p{P}(标点字符)和\p{Zs}(空格分隔符)的组合:

/^[\p{L}\p{P}\p{Zs}]+$/

但是可能存在这些字符类别未涵盖的字符,而可能存在一些您不希望被允许的字符.

所以我建议你不要在数据上使用正则表达式,这些表达式具有如真实人名这样模糊的值范围.


编辑    在编辑问题时,现在看到您只想防止某些代码注入攻击:您应该更好地逃避这些角色,而不是将它们作为潜在的攻击企图拒绝.

使用mysql_real_escape_string或准备语句用于SQL查询,htmlspecialcharsHTML输出和其他语言的其他适当功能.

推荐阅读
TXCWB_523
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有