19赞

在C++源代码中使用Unicode

作者：路人甲 | 2023-09-02 13:11

如何解决《在C++源代码中使用Unicode》经验，为你挑选了4个好方法。

C++源代码的标准编码是什么？C++标准是否甚至对此有所说明？我可以用Unicode编写C++源代码吗？

例如,我可以在评论中使用非ASCII字符,例如中文字符吗？如果是这样,是允许完全Unicode还是只是Unicode的一个子集？(例如,那个16位的第一页或者它被称为的任何东西.)

此外,我可以使用Unicode作为字符串吗？例如:

Wstring str=L"Strange chars: âÂ ?š? ? €€";

Johannes Sch.. 35

使用C++进行编码非常复杂.这是我对它的理解.

每个实现都必须支持基本源字符集中的字符.这些包括§2.2/ 1中列出的常见字符(C++ 11中的§2.3/ 1).这些字符都应该合而为一char.此外,实现必须支持使用调用的方式命名其他字符的方法,universal-character-names并且看起来像\uffff或\Uffffffff可以用于引用Unicode字符.它们的一个子集可用于标识符(在附录E中列出).

这很好,但是从文件中的字符到源字符(在编译时使用)的映射是实现定义的.这构成了所使用的编码.这是字面意思(C++ 98版):

如果需要,物理源文件字符以实现定义的方式映射到基本源字符集(引入行尾指示符的换行符).Trigraph序列(2.3)由相应的单字符内部表示代替.不在基本源字符集(2.2)中的任何源文件字符将替换为指定该字符的通用字符名称.(实现可以使用任何内部编码,只要在源文件中遇到实际扩展字符,并且在源文件中表示为与通用字符名称相同的扩展字符(即使用\ uXXXX表示法),等效).

对于gcc,您可以使用该选项进行更改-finput-charset=charset.此外,您可以在运行时更改用于表示值的执行字符.适当的选项是-fexec-charset=charsetchar(默认为utf-8)和-fwide-exec-charset=charset(默认为utf-16或者utf-32取决于大小wchar_t).

1> Johannes Sch..：

使用C++进行编码非常复杂.这是我对它的理解.

这很好,但是从文件中的字符到源字符(在编译时使用)的映射是实现定义的.这构成了所使用的编码.这是字面意思(C++ 98版):

如果需要,物理源文件字符以实现定义的方式映射到基本源字符集(引入行尾指示符的换行符).Trigraph序列(2.3)由相应的单字符内部表示代替.不在基本源字符集(2.2)中的任何源文件字符将替换为指定该字符的通用字符名称.(实现可以使用任何内部编码,只要在源文件中遇到实际扩展字符,并且在源文件中表示为与通用字符名称相同的扩展字符(即使用\ uXXXX表示法),等效).

2> Head Geek..：

据我所知,C++标准没有提及源代码文件编码的任何内容.

通常的编码是(或曾经是)7位ASCII - 一些编译器(例如Borland的编码器)会忽略使用高位的ASCII字符.如果您的编译器和编辑器接受它们,那么没有技术上的原因无法使用Unicode字符 - 大多数现代的基于Linux的工具,以及许多基于Windows的更好的编辑器,可以毫无问题地处理UTF-8编码,尽管我我不确定微软的编译器会不会.

编辑:看起来微软的编译器会接受Unicode编码的文件,但有时也会产生8位ASCII的错误:

warning C4819: The file contains a character that cannot be represented
in the current code page (932). Save the file in Unicode format to prevent
data loss.

3> MSalters..：

除了litb的帖子,MSVC++也支持Unicode.据我所知,它从BOM中获取Unicode编码.它肯定支持代码int (*?)();或const std::set ?; 如果你真的进入代码obfuscuation:

typedef void ?; // Also known as \u203C
class oo? {
    operator ?() {}
};

4> Max Lybbert..：

这里有两个问题.第一个是C++代码(和注释)中允许的字符,例如变量名.第二个是字符串和字符串文字中允许的字符.

如上所述,C++编译器必须支持一个非常受限制的基于ASCII的字符集,用于代码和注释中允许的字符.在实践中,这个字符集对于一些欧洲字符集(特别是一些没有几个字符的欧洲键盘 - 如方括号 - 可用)效果不佳,因此有向图和三字符的概念是介绍.许多编译器目前接受的不仅仅是这个字符集,但没有任何保证.

至于字符串和字符串文字,C++具有宽字符和宽字符串的概念.但是,该字符集的编码未定义.在实践中它几乎总是Unicode,但我认为这里没有任何保证.宽字符串文字看起来像L"字符串文字",这些可以分配给std :: wstring.

C++ 11增加了对Unicode字符串和字符串文字的明确支持,编码为UTF-8,UTF-16大端,UTF-16小端,UTF-32大端和UTF-32小端.

推荐阅读

程序员
为什么[False]中的False == False返回True？

如何解决《为什么[False]中的False==False返回True？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Java 8中做红宝石注入的优雅方式

如何解决《在Java8中做红宝石注入的优雅方式》经验，为你挑选了1个好方法。 ... [详细]
程序员
片段 - 在运行方法之前等待onCreateView()完成

如何解决《片段-在运行方法之前等待onCreateView()完成》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在使用scalaz时为布尔创建半群？

如何解决《如何在使用scalaz时为布尔创建半群？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Service Fabric具有配置覆盖的多个服务实例

如何解决《ServiceFabric具有配置覆盖的多个服务实例》经验，为你挑选了1个好方法。 ... [详细]
程序员
来自抽象类的unique_ptr的shared_ptr

如何解决《来自抽象类的unique_ptr的shared_ptr》经验，为你挑选了1个好方法。 ... [详细]
程序员
Facebook注销无法在Android上使用[Facebook SDK 4]

如何解决《Facebook注销无法在Android上使用[FacebookSDK4]》经验，为你挑选了1个好方法。 ... [详细]
程序员
Postgres - 将两列聚合成一个项目

如何解决《Postgres-将两列聚合成一个项目》经验，为你挑选了4个好方法。 ... [详细]
程序员
在Python中用空格排序字符串列表

如何解决《在Python中用空格排序字符串列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
何时使用ScreenAdapter和何时使用Screen

如何解决《何时使用ScreenAdapter和何时使用Screen》经验，为你挑选了1个好方法。 ... [详细]
程序员
NSDateFormatter无法在12小时制设置时返回英国地区的日期时间

如何解决《NSDateFormatter无法在12小时制设置时返回英国地区的日期时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Code :: Blocks中使用C11标准

如何解决《如何在Code::Blocks中使用C11标准》经验，为你挑选了1个好方法。 ... [详细]
程序员
phantomjs +网络字体+字体加载器

如何解决《phantomjs+网络字体+字体加载器》经验，为你挑选了0个好方法。 ... [详细]
程序员
java 8中是否有一个实现"以null结尾"的流而不必自己滚动的类？

如何解决《java8中是否有一个实现"以null结尾"的流而不必自己滚动的类？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Elm中创建Date变量

如何解决《如何在Elm中创建Date变量》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何设置Carthage使用我自己的Stash(Bitbucket)私有存储库中的框架？

如何解决《如何设置Carthage使用我自己的Stash(Bitbucket)私有存储库中的框架？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在字符串后替换 - 在字符之前

如何解决《在字符串后替换-在字符之前》经验，为你挑选了1个好方法。 ... [详细]
程序员
Closure Compiler Externs - 警告 - 从未定义过属性

如何解决《ClosureCompilerExterns-警告-从未定义过属性》经验，为你挑选了0个好方法。 ... [详细]
程序员
找到具有正好3个除数的数字的更好解决方案

如何解决《找到具有正好3个除数的数字的更好解决方案》经验，为你挑选了2个好方法。 ... [详细]
程序员
为什么我的css不适用？

如何解决《为什么我的css不适用？》经验，为你挑选了1个好方法。 ... [详细]

路人甲

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章