我有一个表单接受来自PHP用户的URL.
我应该允许或禁止哪些角色?目前我用
$ input = preg_replace("/ [^ a-zA-Z0-9 - \?:#.()\,/ \&\'\\"] /","",$ string);
$输入= SUBSTR($输入,0255);
因此,它被修剪为255个字符,只能包含字母,数字和? - _:#(),&'"/
我应该剥离的任何东西,我不是,或者我正在剥离的东西,可能需要在一个有效的URL?
定义URL规范的RFC 1738规定只有字符
abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789+.-
可以在URL方案中使用,也可以仅在字符中使用
abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789$-_.+!*'(),;/?:@=&
可以在URL的特定于方案的部分中使用未编码的.(;/?:@=&
如果使用未编码,必须用于"保留目的",但如果您只是检查无效字符,则无需担心).因此,如果您想要完全通用,我会检查此正则表达式的URL:
"/([a-zA-Z+.-]+:\/\/)?([a-zA-Z0-9\$\-_\.\+\!\*'\(\),\;\/\?\:\@\=\&]+)/"
(可能一些逃脱不是必要的).如果您只是在寻找HTTP URL,(其中一些)其他答案应该没问题.