15赞

在PHP中检测文件编码

作者：牛尾巴2010 | 2023-08-31 11:03

如何解决《在PHP中检测文件编码》经验，为你挑选了3个好方法。

我有一个脚本,它将多个文件合并为一个,当其中一个文件具有UTF8编码时,它会中断.我认为我应该utf8_decode()在读取文件时使用该函数,但我不知道如何判断哪个需要解码.

我的代码基本上是:

$output = '';
foreach ($files as $filename) {
    $output .= file_get_contents($filename) . "\n";
}
file_put_contents('combined.txt', $output);

目前,在UTF8文件的开头,它在输出中添加了这些字符: ï»¿

1> Ben Blank..：

尝试使用该mb_detect_encoding功能.此函数将检查您的字符串并尝试"猜测"其编码是什么.然后,您可以根据需要进行转换.作为brulak建议,不过,你可能会更好过转换到 UTF-8,而不是从,保存您传输的数据.

mb_detect_encoding（）无法正确检测文本中的编码更改。因此，我脚本第2行中的解决方法：/sf/ask/17360801/

2> powtac..：

为了确保输出是UTF-8,无论输入是什么类型,我都使用此检查:

if(!mb_check_encoding($output, 'UTF-8')
    OR !($output === mb_convert_encoding(mb_convert_encoding($output, 'UTF-32', 'UTF-8' ), 'UTF-8', 'UTF-32'))) {

    $output = mb_convert_encoding($content, 'UTF-8', 'pass'); 
}

// $output is now safely converted to UTF-8!

第二个`mb_convert_encoding`调用中的`$ content`也不应该是'$ output`吗？否则,`$ content`来自哪里？

如果有人想知道"pass"=>如果设置了"pass",则不执行字符编码转换.http://php.net/manual/en/mbstring.supported-encodings.php

3> 小智..：

mb_detect_encoding功能应该是你的最后选择.这可能会返回错误的编码.Linux命令file -i /path/myfile.txt运行良好.在PHP中,您可以使用:

function _detectFileEncoding($filepath) {
    // VALIDATE $filepath !!!
    $output = array();
    exec('file -i ' . $filepath, $output);
    if (isset($output[0])){
        $ex = explode('charset=', $output[0]);
        return isset($ex[1]) ? $ex[1] : null;
    }
    return null;
}

推荐阅读

程序员
JBoss-如何在jboss-deployment-structure中排除javax.validation？

如何解决《JBoss-如何在jboss-deployment-structure中排除javax.validation？》经验，为你挑选了1个好方法。 ... [详细]
程序员
一种方法调用,多种可能的错误条件 - 如何在面向对象编程中进行管理？

如何解决《一种方法调用,多种可能的错误条件-如何在面向对象编程中进行管理？》经验，为你挑选了1个好方法。 ... [详细]
程序员
添加矢量中相同的值

如何解决《添加矢量中相同的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Xcode中的UITests之间保持应用程序打开

如何解决《如何在Xcode中的UITests之间保持应用程序打开》经验，为你挑选了2个好方法。 ... [详细]
程序员
D3找到线的角度

如何解决《D3找到线的角度》经验，为你挑选了1个好方法。 ... [详细]
程序员
邮件合并复选框形式字段

如何解决《邮件合并复选框形式字段》经验，为你挑选了1个好方法。 ... [详细]
程序员
golang将一个字符串添加到切片... interface {}

如何解决《golang将一个字符串添加到切片interface{}》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以使用SpriteKit在应用程序上使用Xcode UI Testing？

如何解决《是否可以使用SpriteKit在应用程序上使用XcodeUITesting？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将<script>中的字符串插入<a href="">

如何解决《将<script>中的字符串插入<ahref="">》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python中seaborn tsplot函数中的标准偏差和误差条

如何解决《Python中seaborntsplot函数中的标准偏差和误差条》经验，为你挑选了2个好方法。 ... [详细]
程序员
我可以使用TensorFlow测量单个操作的执行时间吗？

如何解决《我可以使用TensorFlow测量单个操作的执行时间吗？》经验，为你挑选了5个好方法。 ... [详细]
程序员
类型动画师的预期资源[ResourceType]

如何解决《类型动画师的预期资源[ResourceType]》经验，为你挑选了1个好方法。 ... [详细]
程序员
Jekyll：在SCSS部分中使用_config.yml中的值

如何解决《Jekyll：在SCSS部分中使用_config.yml中的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用HttpsUrlConnection而不是DefaultHttpClient

如何解决《如何使用HttpsUrlConnection而不是DefaultHttpClient》经验，为你挑选了3个好方法。 ... [详细]
程序员
使用RxAndroid安排

如何解决《使用RxAndroid安排》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Python中创建类的不同实例？

如何解决《如何在Python中创建类的不同实例？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用.translate()从Python 3.x中的字符串中删除标点符号？

如何解决《如何使用.translate()从Python3.x中的字符串中删除标点符号？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Jmeter MarshalException:错误编组参数

如何解决《JmeterMarshalException:错误编组参数》经验，为你挑选了0个好方法。 ... [详细]
程序员
C ++ JSON解串器

如何解决《C++JSON解串器》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何用CSS实现单行省略号

如何解决《如何用CSS实现单行省略号》经验，为你挑选了1个好方法。 ... [详细]

牛尾巴2010

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章