当前位置:  开发笔记 > 编程语言 > 正文

什么时候应该使用HTML实体

如何解决《什么时候应该使用HTML实体》经验,为你挑选了4个好方法。

这让我困惑了一段时间.随着UTF-8作为Web开发的事实标准的出现,我不确定在哪种情况下我应该使用html实体,而我应该使用UTF-8字符.

示例:em dash,&ersand等.

请详细说明这个问题.我们将不胜感激.



1> William Bren..:

根据我收到的评论,我进一步研究了这一点.似乎目前最好的做法是放弃使用HTML实体并使用实际的UTF-8字符.列出的理由如下:

    UTF-8编码更易于阅读和编辑,以便了解角色的含义并知道如何键入.

    对于那些不理解它们的人来说,UTF-8编码与HTML实体编码一样难以理解,但它们具有渲染为特殊字符而不是难以理解十进制或十六进制编码的优点.

只要您的页面编码正确设置为UTF-8,就应该使用实际字符而不是HTML实体.我阅读了几个关于这个主题的文档,但最有帮助的是:

UTF-8:字符编码的秘密

维基百科特殊字符帮助

来自UTF-8:字符编码的秘密文章:

维基百科是一个很好的案例研究,用于最初使用ISO-8859-1的应用程序,但是当它变得非常麻烦而不支持外语时转换为UTF-8.为了用户友好性和可搜索性,机器人现在将实际浏览文章并将字符实体转换为其对应的真实字符.

那篇文章也给出了一个涉及中文编码的好例子.以下是懒惰的缩写示例:

UTF-8:

?????????

HTML实体:

這兩個字是甚麼意思

UTF-8和HTML实体编码对我来说都没有意义,但至少UTF-8编码可以识别为外语,并且它将在编辑框中正确呈现.本文继续讨论关于HTML实体编码版本的以下内容:

对于我们这些真正了解角色实体的人来说非常不方便,对于那些不熟悉这些角色实体的穷人来说,完全无法理解!即使是更加用户友好,"可理解"的角色实体,如θ 将让那些对学习HTML不感兴趣的用户摸不着头脑.另一方面,如果他们在编辑框中看到θ,他们就会知道它是一个特殊的角色,并相应地对待它,即使他们不知道如何自己编写该角色.

正如其他人所指出的那样,您仍然必须将HTML实体用于保留的XML字符(&符号,小于号,大于号).



2> JacquesB..:

如果编辑器支持Unicode,则通常不需要使用HTML字符实体.在以下情况下,实体非常有用:

键盘不支持您需要输入的字符.例如,许多键盘没有em-dash或版权符号.

您的编辑器不支持Unicode(几年前很常见,但可能不是今天).

您希望在源代码中明确说明发生了什么.例如, 代码比相应的空格字符更清晰.

您需要HTML特殊字符,如<,&".


旁注:维基百科仍然要求` `而不是实际的空白字符,部分原因是因为Firefox将U + 00A0转换为U + 0020形式.因此,在这种情况下使用实体是确保每次Firefox用户编辑时都不会搞砸源的唯一方法.
一个很好的总结,但是关于最后一点,它是`<`经常需要转义,从不```(和```需要很少在属性值内转义).

3> Ned Batcheld..:

我不会将UTF-8用于容易在视觉上混淆的字符.例如,很难将emdash与减号区分开,尤其是与空间区分不间断的空间.对于这些字符,绝对使用实体.

对于易于理解的字符(例如上面的中文示例),如果您愿意,请继续使用UTF-8.



4> Marco Luglio..:

我个人用utf-8做了很长时间,然而,在一个html页面中,你总是需要将&符号(&),大于(>)和小于(<)字符转换为它们的等效实体,& ;, > 和<

此外,如果您打算使用utf-8文本进行一些编程,还有一些需要注意的事项.

XML在使用实体时需要一些额外的行来验证.

有些图书馆与utf-8并不相称.例如,某些Linux发行版中的PHP在其正则表达式库中完全支持utf-8.

限制使用html实体的文本中的字符数更难,因为单个实体使用许多字符.此外,总是存在将实体削减一半的风险.

推荐阅读
吻过彩虹的脸_378
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有