当前位置:  开发笔记 > 编程语言 > 正文

一个编码精明的grep替换?

如何解决《一个编码精明的grep替换?》经验,为你挑选了1个好方法。

我很沮丧,grep在我的UTF-16文档中找不到像"你好"这样的词.

任何人都可以推荐一个试图猜测文件编码然后正确处理它的grep版本吗?



1> popcnt..:

ack作为基于perl的grep替代品?

你肯定想看看ack.

它支持Unicode编码,基本上是grep,但更好.

尝试使用grep匹配的Unicode语言环境

如果您使用的是Linux,Unix等,则可能需要将LANG envariable更改为与您的文档匹配的编码.

首先检查您的语言环境.以下是我的MacBook Pro上默认设置的内容:

 $ locale 
 LANG="en_US.UTF-8"
 LC_COLLATE="en_US.UTF-8"
 LC_CTYPE="en_US.UTF-8"
 LC_MESSAGES="en_US.UTF-8"
 LC_MONETARY="en_US.UTF-8"
 LC_NUMERIC="en_US.UTF-8"
 LC_TIME="en_US.UTF-8" 
 LC_ALL=

说,在bash下:

$ LANG="foo" grep 'gotta be found now' file.name

一些更永久的东西(小心这个):

$ export LANG="foo"
$ grep 'bar' mitz.vah

推荐阅读
围脖上的博博_771
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有