当前位置:  开发笔记 > 编程语言 > 正文

PHP UTF-8问题 - 如果我在PHP中创建一个字符串...是UTF-8吗?

如何解决《PHPUTF-8问题-如果我在PHP中创建一个字符串是UTF-8吗?》经验,为你挑选了1个好方法。

在PHP中,如果我创建一个这样的字符串:

$str = "bla bla here is my string";

那么我是否能够使用mbstring函数作为UTF8对该字符串进行操作?

// Will this work?
$str = mb_strlen($str); 

此外,如果我有另一个字符串,我知道是UTF-8(说它是一个POSTed表单值,或来自数据库的UTF-8字符串),我可以连接这两个,没有任何问题吗?

// What about this, will this work? 
$str = $str . $utf8_string_from_database;

chazomaticus.. 10

第一个问题:它取决于字符串中的确切内容.

在PHP中(无论如何最多为PHP5),字符串只是字节序列.没有与之相关的隐含或显式字符集; 这是程序员必须跟踪的东西.所以,如果你只在引号之间放置有效的UTF-8字节(如果文件本身被编码为UTF-8那么相当容易),那么字符串将是UTF-8,你可以安全地使用它的mb_strlen().

此外,如果您正在使用mbstring函数,则需要使用mbstring.internal_encoding或任何mbstring函数的最后一个参数明确告诉它字符串是什么字符集.

第二个问题:是的,有警告.

两个独立有效的UTF-8字符串可以安全地按字节顺序连接(与PHP的.运算符一样),并且仍然是有效的UTF-8.但是,如果没有自己做一些工作,你永远不能确定POSTed字符串是有效的UTF-8.如果您仔细设置连接字符集,数据库字符串会更容易一些,因为大多数DBMS都会为您进行任何转换.



1> chazomaticus..:

第一个问题:它取决于字符串中的确切内容.

在PHP中(无论如何最多为PHP5),字符串只是字节序列.没有与之相关的隐含或显式字符集; 这是程序员必须跟踪的东西.所以,如果你只在引号之间放置有效的UTF-8字节(如果文件本身被编码为UTF-8那么相当容易),那么字符串将是UTF-8,你可以安全地使用它的mb_strlen().

此外,如果您正在使用mbstring函数,则需要使用mbstring.internal_encoding或任何mbstring函数的最后一个参数明确告诉它字符串是什么字符集.

第二个问题:是的,有警告.

两个独立有效的UTF-8字符串可以安全地按字节顺序连接(与PHP的.运算符一样),并且仍然是有效的UTF-8.但是,如果没有自己做一些工作,你永远不能确定POSTed字符串是有效的UTF-8.如果您仔细设置连接字符集,数据库字符串会更容易一些,因为大多数DBMS都会为您进行任何转换.

推荐阅读
牛尾巴2010
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有