12赞

如何输入4字节的UTF-8字符？

作者：coco2冰冰 | 2023-09-04 06:12

如何解决《如何输入4字节的UTF-8字符？》经验，为你挑选了1个好方法。

我正在编写一个小应用程序,我需要使用不同字节长度的utf-8字符进行测试.

我可以输入unicode字符进行测试,用utf-8编码1,2,3个字节就好了,例如:

string in = "pi = \u3a0";

但是如何获得用4字节编码的unicode字符？我试过了:

string in = "aegan check mark = \u10102";

据我所知,应该输出.但是当我打印出来时,我得到了ᴶ0

我错过了什么？

编辑:

我通过添加前导零来实现它:

string in = "\U00010102";

希望我早点想到这个:)

1> gz...：

模式中有一个较长的逃逸形式,\U后跟八位数,而不是\u四位数.这也用于Java和Python,其中包括:

>>> '\xf0\x90\x84\x82'.decode("UTF-8")
u'\U00010102'

但是,如果您使用字节字符串,为什么不像上面那样转义每个字节,而不是依靠编译器将转换转换为UTF-8字符串？这似乎也更便携 - 如果我编译以下程序:

#include 
#include 

int main()
{
    std::cout << "narrow: " << std::string("\uFF0E").length() <<
        " utf8: " << std::string("\xEF\xBC\x8E").length() <<
        " wide: " << std::wstring(L"\uFF0E").length() << std::endl;

    std::cout << "narrow: " << std::string("\U00010102").length() <<
        " utf8: " << std::string("\xF0\x90\x84\x82").length() <<
        " wide: " << std::wstring(L"\U00010102").length() << std::endl;
}

在我的当前选项cl的win32上给出:

warning C4566: character represented by universal-character-name '\UD800DD02' cannot be represented in the current code page (932)

编译器尝试将字节字符串中的所有unicode转义转换为系统代码页,与UTF-8不同,它不能代表所有unicode字符.奇怪的是,它已经理解\U00010102为\uD800\uDD02UTF-16(其内部unicode表示)并在错误消息中损坏了转义...

运行时,程序打印:

narrow: 2 utf8: 3 wide: 1
narrow: 2 utf8: 4 wide: 2

请注意,UTF-8字节串和宽字符串是正确的,但编译器无法转换"\U00010102",给出字节字符串"??",结果不正确.

推荐阅读

程序员
元组没有属性“ isdigit”

如何解决《元组没有属性“isdigit”》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在TensorFlow中将张量转换为numpy数组？

如何解决《如何在TensorFlow中将张量转换为numpy数组？》经验，为你挑选了4个好方法。 ... [详细]
程序员
Xcode 7:无法使用单元测试目标创建Swift命令行工具

如何解决《Xcode7:无法使用单元测试目标创建Swift命令行工具》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Windows上使用Visual Studio Code设置Kestrel调试？

如何解决《如何在Windows上使用VisualStudioCode设置Kestrel调试？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Android-NavigationView从右到左

如何解决《Android-NavigationView从右到左》经验，为你挑选了2个好方法。 ... [详细]
程序员
从列表中取出元素

如何解决《从列表中取出元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
PHP7中的foreach更改

如何解决《PHP7中的foreach更改》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Xcode帐户首选项中，如何刷新与Apple ID连接的团队？

如何解决《在Xcode帐户首选项中，如何刷新与AppleID连接的团队？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Git挂钩创建提交日志并添加到当前提交

如何解决《使用Git挂钩创建提交日志并添加到当前提交》经验，为你挑选了0个好方法。 ... [详细]
程序员
NestedScrollView和CollapsingToolbarLayout快速滚动

如何解决《NestedScrollView和CollapsingToolbarLayout快速滚动》经验，为你挑选了0个好方法。 ... [详细]
程序员
对多个电子邮件执行一次批处理脚本

如何解决《对多个电子邮件执行一次批处理脚本》经验，为你挑选了0个好方法。 ... [详细]
程序员
C中的文件识别不必要的行

如何解决《C中的文件识别不必要的行》经验，为你挑选了1个好方法。 ... [详细]
程序员
循环内的递归函数

如何解决《循环内的递归函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
TensorFlow培训

如何解决《TensorFlow培训》经验，为你挑选了1个好方法。 ... [详细]
程序员
显示名称不会出现在Windows 10中的大图标/平铺下面

如何解决《显示名称不会出现在Windows10中的大图标/平铺下面》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何防止在非const对象上意外调用变异函数？

如何解决《如何防止在非const对象上意外调用变异函数？》经验，为你挑选了5个好方法。 ... [详细]
程序员
loopback在单个请求中保存相关的hasmany模型

如何解决《loopback在单个请求中保存相关的hasmany模型》经验，为你挑选了0个好方法。 ... [详细]
程序员
react.js替换img src onerror

如何解决《react.js替换imgsrconerror》经验，为你挑选了5个好方法。 ... [详细]
程序员
获取MVC中的子域以实现国际化

如何解决《获取MVC中的子域以实现国际化》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用JavaScript切换元素的可见性

如何解决《使用JavaScript切换元素的可见性》经验，为你挑选了1个好方法。 ... [详细]

coco2冰冰

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章