3赞

如何在linux shell中使用正则表达式从文件中提取IP地址？

作者：mylvfamily | 2023-09-01 10:54

如何解决《如何在linuxshell中使用正则表达式从文件中提取IP地址？》经验，为你挑选了4个好方法。

如何在linux shell中通过regexp提取文本部分？可以说,我有一个文件,其中每一行都是一个IP地址,但位于不同的位置.使用常见的unix命令行工具提取这些IP地址的最简单方法是什么？

1> brien..：

您可以使用grep将它们拉出来.

grep -o '[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}' file.txt

2> Sarel Botha..：

这里的大多数示例都匹配999.999.999.999,这在技术上不是有效的IP地址.

以下内容仅匹配有效的IP地址(包括网络和广播地址).

grep -E -o '(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)' file.txt

如果要查看匹配的整行,请省略-o.

从技术上讲,它匹配233.123.123.123,即使它前面有一个1.它不限制IP地址之前和之后的内容.

3> Sankalp..：

这在访问日志中对我来说很好.

cat access_log | egrep -o '([0-9]{1,3}\.){3}[0-9]{1,3}'

让我们一个一个地打破它.

[0-9]{1,3}表示[]中提到的范围的一到三次出现.在这种情况下,它是0-9.所以它匹配10或183等模式.

其次是'.'.我们需要将其作为'.'来逃避.是一个元字符,对shell有特殊意义.

所以现在我们的模式就像'123'.'12".等等

这种模式重复三次(带有'.').所以我们将它括在括号中. ([0-9]{1,3}\.){3}

最后,这种模式会重演,但这次没有'.'.这就是为什么我们在第3步中单独保留它. [0-9]{1,3}

如果ips位于每行的开头,就像我的情况一样:

egrep -o '^([0-9]{1,3}\.){3}[0-9]{1,3}'

其中'^'是一个锚点,告诉你在一行的开头搜索.

4> JB...：

我通常从grep开始,以使正则表达式正确.

# [multiple failed attempts here]
grep    '[0-9]*\.[0-9]*\.[0-9]*\.[0-9]*'                 file  # good?
grep -E '[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}' file  # good enough

然后我尝试将其转换sed为过滤掉剩下的行.(阅读完这个帖子后,你和我不再这样做了:我们将改为使用grep -o)

sed -ne 's/.*\([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\).*/\1/p  # FAIL

那时我通常因为sed没有像其他人一样使用相同的正则表达而烦恼.所以我搬到了perl.

$ perl -nle '/[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}/ and print $&'

无论如何,Perl很高兴知道.如果您安装了少量CPAN,您甚至可以以较低的成本使其更可靠:

$ perl -MRegexp::Common=net -nE '/$RE{net}{IPV4}/ and say $&' file(s)

推荐阅读

程序员
如果可能的话，如何使Momentjs不是Angularjs中的全局变量

如何解决《如果可能的话，如何使Momentjs不是Angularjs中的全局变量》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在meanjs中获得基本网址？

如何解决《如何在meanjs中获得基本网址？》经验，为你挑选了1个好方法。 ... [详细]
程序员
有没有办法从一个点填充,直到它使用HTML Canvas和JavaScript到达边框？

如何解决《有没有办法从一个点填充,直到它使用HTMLCanvas和JavaScript到达边框？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何从WPF RichTextBox中删除特定字符串？

如何解决《如何从WPFRichTextBox中删除特定字符串？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在visual studio上以管理员身份运行最近的项目或解决方案

如何解决《如何在visualstudio上以管理员身份运行最近的项目或解决方案》经验，为你挑选了3个好方法。 ... [详细]
程序员
使用正则表达式替换字符串中的参数

如何解决《使用正则表达式替换字符串中的参数》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python Scatter Plot,每个X都有多个Y值

如何解决《PythonScatterPlot,每个X都有多个Y值》经验，为你挑选了1个好方法。 ... [详细]
程序员
删除由角度组件创建的主机HTML元素选择器

如何解决《删除由角度组件创建的主机HTML元素选择器》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何设置'crates.io'的本地存储库？

如何解决《如何设置'crates.io'的本地存储库？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Azure Portal无法创建新的os磁盘,vm映像等

如何解决《AzurePortal无法创建新的os磁盘,vm映像等》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何管理iOS apns令牌更改

如何解决《如何管理iOSapns令牌更改》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Javascript在每个第二个字符后添加冒号(:)

如何解决《使用Javascript在每个第二个字符后添加冒号(:)》经验，为你挑选了2个好方法。 ... [详细]
程序员
IB Designables:无法更新自动布局状态:代理引发了"CALayerInvalidGeometry"异常

如何解决《IBDesignables:无法更新自动布局状态:代理引发了"CALayerInvalidGeometry"异常》经验，为你挑选了0个好方法。 ... [详细]
程序员
SQLSTATE [HY000] [2002] php_network_getaddresses:getaddrinfo失败:提供nodename或servname,或者不知道

如何解决《SQLSTATE[HY000][2002]php_network_getaddresses:getaddrinfo失败:提供nodename或servname,或者不知道》经验，为你挑选了1个好方法。 ... [详细]
程序员
抛出constexpr功能

如何解决《抛出constexpr功能》经验，为你挑选了2个好方法。 ... [详细]
程序员
通过IO了解Haskell中的纯函数

如何解决《通过IO了解Haskell中的纯函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Yii2中的视图文件中使用ArrayHelper

如何解决《在Yii2中的视图文件中使用ArrayHelper》经验，为你挑选了1个好方法。 ... [详细]
程序员
尾递归与原始递归

如何解决《尾递归与原始递归》经验，为你挑选了1个好方法。 ... [详细]
程序员
语法错误:'delimiter'在这里输入无效

如何解决《语法错误:'delimiter'在这里输入无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么不能满足相关类型的From <>的更高的kinded特性限制,但Into <>可以吗？

如何解决《为什么不能满足相关类型的From<>的更高的kinded特性限制,但Into<>可以吗？》经验，为你挑选了0个好方法。 ... [详细]

mylvfamily

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章