当前位置:  开发笔记 > 编程语言 > 正文

正则表达式匹配DNS主机名或IP地址?

如何解决《正则表达式匹配DNS主机名或IP地址?》经验,为你挑选了4个好方法。

有没有人有一个方便的正则表达式,可以匹配任何合法的DNS主机名或IP地址?

编写一个可以在95%的时间内工作的一个很容易,但是我希望得到一些经过充分测试的东西,以完全匹配最新的RFC主机名规范.



1> Jorge Ferrei..:

您可以单独使用以下正则表达式,也可以将它们组合在一个联合OR表达式中.

ValidIpAddressRegex = "^(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.){3}([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])$";

ValidHostnameRegex = "^(([a-zA-Z0-9]|[a-zA-Z0-9][a-zA-Z0-9\-]*[a-zA-Z0-9])\.)*([A-Za-z0-9]|[A-Za-z0-9][A-Za-z0-9\-]*[A-Za-z0-9])$";

ValidIpAddressRegex匹配有效的IP地址和ValidHostnameRegex有效的主机名.根据您使用的语言\可能必须使用\来转义.


ValidHostnameRegex根据RFC 1123有效.最初,RFC 952指定主机名段不能以数字开头.

http://en.wikipedia.org/wiki/Hostname

RFC 952中主机名的原始规范,强制标签不能以数字或连字符开头,并且不得以连字符结尾.但是,后续规范(RFC 1123)允许主机名标签以数字开头.

Valid952HostnameRegex = "^(([a-zA-Z]|[a-zA-Z][a-zA-Z0-9\-]*[a-zA-Z0-9])\.)*([A-Za-z]|[A-Za-z][A-Za-z0-9\-]*[A-Za-z0-9])$";


在人们在代码中盲目使用它之前,请注意它并不完全准确.它忽略了RFC2181:"DNS本身只对可用于识别资源记录的特定标签设置了一个限制.一个限制与标签的长度和全名有关.任何一个标签的长度限制在1和63个八位字节.完整域名限制为255个八位字节(包括分隔符)."
您可能想要添加IPv6.OP没有指定*什么类型的地址*.(顺便说一句,它可以在[这里]找到(http://stackoverflow.com/questions/53497/regular-expression-that-matches-valid-ipv6-addresses/53499#53499))
@UserControl:非拉丁语(Punycoded)主机名必须首先转换为ASCII格式(`éxämplè.com`=`xn - xmpl-loa1ab.com`),然后进行验证.
你的主机名表达式匹配一些无效的值:我试过`123.456.789.0`它说它是一个有效的主机名.
这里:http://stackoverflow.com/questions/4645126/looking-for-regex-for-hostname-validation - 我解释说以数字开头的名称也被视为有效.此外,只有一个点是值得怀疑的问题.很高兴收到更多反馈.
我认为ValidIpAddressRegex有问题.http://regexr.com?35830因为正则表达式引擎在第一场比赛结束时渴望它看到2并且认为匹配.所以在我做的解决方案中我做的是反向命令http://regexr.com? 35833 `((((25 [0-5])|(2 [0-4]\d)|?([01]\d\d)))\){3}((((25 0 -5])|(2 [0-4]\d)|?([01]\d\d))))`
Valid952HostnameRegex中有一个小错误,我更正了它:"^(([a-zA-Z] | [a-zA-Z] [a-zA-Z0-9\ - ]*[a-zA-Z0 -9])\)+([A-ZA-Z] | [A-ZA-Z] [A-ZA-Z0-9\ - ]*[A-ZA-Z0-9])$"

2> Sakari A. Ma..:

smink的主机名正则表达式不遵守主机名中单个标签长度的限制.有效主机名中的每个标签长度不得超过63个八位字节.

ValidHostnameRegex="^([a-zA-Z0-9]|[a-zA-Z0-9][a-zA-Z0-9\-]{0,61}[a-zA-Z0-9])\
(\.([a-zA-Z0-9]|[a-zA-Z0-9][a-zA-Z0-9\-]{0,61}[a-zA-Z0-9]))*$"

请注意,第一行末尾的反斜杠(上图)是用于拆分长行的Unix shell语法.它不是正则表达式本身的一部分.

这里只是一行中的正则表达式:

^([a-zA-Z0-9]|[a-zA-Z0-9][a-zA-Z0-9\-]{0,61}[a-zA-Z0-9])(\.([a-zA-Z0-9]|[a-zA-Z0-9][a-zA-Z0-9\-]{0,61}[a-zA-Z0-9]))*$

您还应该单独检查主机名的总长度不得超过255个字符.有关更多信息,请参阅RFC-952和RFC-1123.


优秀的主机模式.它可能取决于一个人的语言的正则表达式实现,但对于JS,它可以稍微调整为更简洁而不会丢失任何东西:`/ ^ [az\d]([az\d\ - ] {0,61} [az\d] )(\ [AZ\d](即[az\d\ - ].{0,61} [AZ\d])??)*$/i`

3> Alban..:

要匹配有效的IP地址,请使用以下正则表达式:

(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)(\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)){3}

代替:

([01]?[0-9][0-9]?|2[0-4][0-9]|25[0-5])(\.([01]?[0-9][0-9]?|2[0-4][0-9]|25[0-5])){3}

说明

许多正则表达式引擎匹配OR序列中的第一种可能性.例如,尝试以下正则表达式:

10.48.0.200

测试

测试之间的区别好 VS 坏


不要忘记开始^和结束$或类似0.0.0.999或999.0.0.0的东西也会匹配.;)

4> Alex Volkov..:

我似乎无法编辑热门帖子,所以我会在这里添加我的答案.

对于主机名 - 简单的答案,在egrep示例这里 - http://www.linuxinsight.com/how_to_grep_for_ip_addresses_using_the_gnu_egrep_utility.html

egrep '([[:digit:]]{1,3}\.){3}[[:digit:]]{1,3}'

虽然这种情况不考虑第一个八位字节中的0值,以及大于254(ip地址)或255(网络掩码)的值.也许额外的if语句会有所帮助.

至于合法的DNS主机名,只要你只检查互联网主机名(而不是内联网),我写了下面的剪辑,混合了shell/php,但它应该适用于任何正则表达式.

首先访问ietf网站,下载并解析法律级别1域名列表:

tld=$(curl -s http://data.iana.org/TLD/tlds-alpha-by-domain.txt |  sed 1d  | cut -f1 -d'-' | tr '\n' '|' | sed 's/\(.*\)./\1/')
echo "($tld)"

这应该给你一个很好的重新代码,检查顶级域名的合法性,如.com .org或.ca

然后根据此处找到的指南添加表达式的第一部分 - http://www.domainit.com/support/faq.mhtml?category=Domain_FAQ&question=9(任何字母数字组合和' - '符号,短划线不应该在八位字节的开头或结尾.

(([a-z0-9]+|([a-z0-9]+[-]+[a-z0-9]+))[.])+

然后将它们放在一起(PHP preg_match示例):

$pattern = '/^(([a-z0-9]+|([a-z0-9]+[-]+[a-z0-9]+))[.])+(AC|AD|AE|AERO|AF|AG|AI|AL|AM|AN|AO|AQ|AR|ARPA|AS|ASIA|AT|AU|AW|AX|AZ|BA|BB|BD|BE|BF|BG|BH|BI|BIZ|BJ|BM|BN|BO|BR|BS|BT|BV|BW|BY|BZ|CA|CAT|CC|CD|CF|CG|CH|CI|CK|CL|CM|CN|CO|COM|COOP|CR|CU|CV|CX|CY|CZ|DE|DJ|DK|DM|DO|DZ|EC|EDU|EE|EG|ER|ES|ET|EU|FI|FJ|FK|FM|FO|FR|GA|GB|GD|GE|GF|GG|GH|GI|GL|GM|GN|GOV|GP|GQ|GR|GS|GT|GU|GW|GY|HK|HM|HN|HR|HT|HU|ID|IE|IL|IM|IN|INFO|INT|IO|IQ|IR|IS|IT|JE|JM|JO|JOBS|JP|KE|KG|KH|KI|KM|KN|KP|KR|KW|KY|KZ|LA|LB|LC|LI|LK|LR|LS|LT|LU|LV|LY|MA|MC|MD|ME|MG|MH|MIL|MK|ML|MM|MN|MO|MOBI|MP|MQ|MR|MS|MT|MU|MUSEUM|MV|MW|MX|MY|MZ|NA|NAME|NC|NE|NET|NF|NG|NI|NL|NO|NP|NR|NU|NZ|OM|ORG|PA|PE|PF|PG|PH|PK|PL|PM|PN|PR|PRO|PS|PT|PW|PY|QA|RE|RO|RS|RU|RW|SA|SB|SC|SD|SE|SG|SH|SI|SJ|SK|SL|SM|SN|SO|SR|ST|SU|SV|SY|SZ|TC|TD|TEL|TF|TG|TH|TJ|TK|TL|TM|TN|TO|TP|TR|TRAVEL|TT|TV|TW|TZ|UA|UG|UK|US|UY|UZ|VA|VC|VE|VG|VI|VN|VU|WF|WS|XN|XN|XN|XN|XN|XN|XN|XN|XN|XN|XN|YE|YT|YU|ZA|ZM|ZW)[.]?$/i';

    if (preg_match, $pattern, $matching_string){
    ... do stuff
    }

您可能还想添加一个if语句来检查您检查的字符串是否短于256个字符 - http://www.ops.ietf.org/lists/namedroppers/namedroppers.2003/msg00964.html

推荐阅读
135369一生真爱_890
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有