3赞

支持Unicode的字符串(1)程序

作者：牛尾巴2010 | 2023-08-30 12:18

如何解决《支持Unicode的字符串(1)程序》经验，为你挑选了1个好方法。

有没有人有一个代码示例用于unicode感知字符串程序？编程语言并不重要.我想要一些与unix命令"strings"基本相同的东西,但它也可以在unicode文本(UTF-16或UTF-8)上运行,拉动英语字符和标点符号的运行.(我只关心英文字符,而不是任何其他字母).

谢谢!

1> jpalecek..：

你只是想使用它,还是因某些原因坚持使用代码？

在我的Debian系统上,似乎strings命令可以开箱即用.请参阅联机帮助页中的exercept:

  --encoding=encoding
       Select the character encoding of the strings that are to be found.  Possible values for encoding are: s = single-7-bit-byte characters (ASCII, ISO  8859,
       etc.,  default),  S  = single-8-bit-byte characters, b = 16-bit bigendian, l = 16-bit littleendian, B = 32-bit bigendian, L = 32-bit littleendian. Useful
       for finding wide character strings.

编辑:好的.我不知道C#所以这可能有点毛茸茸,但基本上,你需要搜索交替的零和英文字符的序列.

byte b;
int i=0;
while(!endOfInput()) {
  b=getNextByte();
LoopBegin:
  if(!isEnglish(b)) {
    if(i>0) // report successful match of length i
    i=0;
    continue;
  }
  if(endOfInput()) break;
  if((b=getNextByte())!=0)
    goto LoopBegin;
  i++; // found another character
}

这应该适用于小端.

推荐阅读

程序员
样式本机JavaScript通知

如何解决《样式本机JavaScript通知》经验，为你挑选了0个好方法。 ... [详细]
程序员
具有外部身份验证的AWS API Gateway

如何解决《具有外部身份验证的AWSAPIGateway》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何明确地广播张量以匹配张量流中的另一个形状？

如何解决《如何明确地广播张量以匹配张量流中的另一个形状？》经验，为你挑选了1个好方法。 ... [详细]
程序员
字符串在Javascript中无法正确排序

如何解决《字符串在Javascript中无法正确排序》经验，为你挑选了1个好方法。 ... [详细]
程序员
UWP:你如何降低所选图像的质量？

如何解决《UWP:你如何降低所选图像的质量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在android测试上重启应用程序

如何解决《在android测试上重启应用程序》经验，为你挑选了0个好方法。 ... [详细]
程序员
VS 2015的RESTful Web服务

如何解决《VS2015的RESTfulWeb服务》经验，为你挑选了1个好方法。 ... [详细]
程序员
laravel 5中的VARCHAR max

如何解决《laravel5中的VARCHARmax》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将ICollection <T>转换为IReadOnlyCollection <T>？

如何解决《如何将ICollection<T>转换为IReadOnlyCollection<T>？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在haskell中使用ffmpeg-light查找mp4元数据？

如何解决《如何在haskell中使用ffmpeg-light查找mp4元数据？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在获取路由中将默认参数传递给laravel控制器

如何解决《如何在获取路由中将默认参数传递给laravel控制器》经验，为你挑选了1个好方法。 ... [详细]
程序员
尝试在Chrome中调试时,React Native Android崩溃

如何解决《尝试在Chrome中调试时,ReactNativeAndroid崩溃》经验，为你挑选了0个好方法。 ... [详细]
程序员
pyspark将列拆分为多个没有pandas的列

如何解决《pyspark将列拆分为多个没有pandas的列》经验，为你挑选了1个好方法。 ... [详细]
程序员
表单提交后加载模式

如何解决《表单提交后加载模式》经验，为你挑选了2个好方法。 ... [详细]
程序员
OCaml:设计文本冒险游戏的数据类型

如何解决《OCaml:设计文本冒险游戏的数据类型》经验，为你挑选了1个好方法。 ... [详细]
程序员
在[...]中出乎意料的'''

如何解决《在[]中出乎意料的'''》经验，为你挑选了1个好方法。 ... [详细]
程序员
触发器在被同一表激发后无法读取该表

如何解决《触发器在被同一表激发后无法读取该表》经验，为你挑选了1个好方法。 ... [详细]
程序员
根据订单中的值过滤列表？

如何解决《根据订单中的值过滤列表？》经验，为你挑选了1个好方法。 ... [详细]
程序员
GoLang的结构

如何解决《GoLang的结构》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用toInt函数的字符串到int转换

如何解决《使用toInt函数的字符串到int转换》经验，为你挑选了3个好方法。 ... [详细]

牛尾巴2010

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章