为什么在与UNIX/Linux环境交互时使用UTF-8编码？

作者：家具销售_903 | 2023-09-04 15:22

如何解决《为什么在与UNIX/Linux环境交互时使用UTF-8编码？》经验，为你挑选了2个好方法。

我知道这是习惯,但为什么呢？是否存在真正的技术原因,为什么任何其他方式都是一个非常糟糕的想法,还是仅仅基于编码和向后兼容的历史？另外,不使用的危险是什么UTF-8,还有其他一些编码(最值得注意的是UTF-16)？

编辑:通过互动,我主要是指shell和libc.

1> Jonathan Lef..：

部分原因是文件系统期望NUL('\ 0')字节终止文件名,因此UTF-16不能很好地工作.您必须修改大量代码才能进行更改.

@ dan04鉴于NT早于UTF-8,使用UTF-8而不是UCS2编写NT会很困难.这需要非凡的远见.

实际上Windows通过这样做增加了对"UCS-2"的支持,然后当它发现16位还不够时它是"640k重新"...... ;-)

Windows通过制作整个Windows API的重复版本添加了对UTF-16的支持.添加对UTF-8的支持会简单得多.

2> Joseph Holst..：

正如jonathan-leffler所提到的,主要问题是ASCII空字符.传统上,C期望字符串为空终止.因此,标准C字符串函数将阻塞任何包含等于ASCII null(0x00)的字节的UTF-16字符.虽然您当然可以使用广泛的字符支持进行编程,但UTF-16在文件名,文本文件,环境变量中不适合使用Unicode的外部编码.

此外,UTF-16和UTF-32具有大端和小端方向.要解决此问题,您需要外部元数据,如MIME类型或字节方向标记.它注意到,

在8位环境中透明地使用UTF-8的地方,使用BOM会干扰任何在开头需要特定ASCII字符的协议或文件格式,例如使用"#!" 在Unix shell脚本的开头.

UTF-16的前身,称为UCS-2,不支持代理对,也有同样的问题.应避免使用UCS-2.

推荐阅读

程序员
的JavaScript.如果方法命名为字符串加args,我如何调用原型方法？

如何解决《的JavaScript.如果方法命名为字符串加args,我如何调用原型方法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在EPPlus导出中检测数据表日期字段和强制日期格式

如何解决《在EPPlus导出中检测数据表日期字段和强制日期格式》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用多个线程时性能提升很少

如何解决《使用多个线程时性能提升很少》经验，为你挑选了1个好方法。 ... [详细]
程序员
读取字符串并与特定值进行比较

如何解决《读取字符串并与特定值进行比较》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法在C++中的for循环条件语句中使用vector.size()

如何解决《无法在C++中的for循环条件语句中使用vector.size()》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用carthage集成ReactiveCocoa失败

如何解决《使用carthage集成ReactiveCocoa失败》经验，为你挑选了1个好方法。 ... [详细]
程序员
将过滤器应用于WordPress短代码输出

如何解决《将过滤器应用于WordPress短代码输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
与填充的传单边界

如何解决《与填充的传单边界》经验，为你挑选了1个好方法。 ... [详细]
程序员
EMV离线批准/拒绝

如何解决《EMV离线批准/拒绝》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何测试ViewController的Deinit

如何解决《如何测试ViewController的Deinit》经验，为你挑选了0个好方法。 ... [详细]
程序员
Logicify jQuery位置选择器插件 - 以编程方式设置位置

如何解决《LogicifyjQuery位置选择器插件-以编程方式设置位置》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何让inputAccessoryView锚定在UITabBar之上？

如何解决《如何让inputAccessoryView锚定在UITabBar之上？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在bash脚本中从grep打印输出会产生损坏的字符串

如何解决《在bash脚本中从grep打印输出会产生损坏的字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
在使用redux构建React应用程序时,何处存储WebRTC流

如何解决《在使用redux构建React应用程序时,何处存储WebRTC流》经验，为你挑选了1个好方法。 ... [详细]
程序员
"在arraylist构造函数中没有为add(java.lang.String)找到合适的方法吗？

如何解决《"在arraylist构造函数中没有为add(java.lang.String)找到合适的方法吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
rails link_to使用get而不是post

如何解决《railslink_to使用get而不是post》经验，为你挑选了1个好方法。 ... [详细]
程序员
Rmarkdown - 在文档中运行代码并显示错误

如何解决《Rmarkdown-在文档中运行代码并显示错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Ubuntu 15.04上使用Mono导入库错误

如何解决《在Ubuntu15.04上使用Mono导入库错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
传递属于self的函数是否会在不在闭包中时导致保留周期？

如何解决《传递属于self的函数是否会在不在闭包中时导致保留周期？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用python Bokeh分组条形图更改条形宽度？

如何解决《使用pythonBokeh分组条形图更改条形宽度？》经验，为你挑选了1个好方法。 ... [详细]

家具销售_903

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章