1赞

用PHP清理用户输入的最佳方法是什么？

作者：个性2402852463 | 2023-09-04 21:12

如何解决《用PHP清理用户输入的最佳方法是什么？》经验，为你挑选了12个好方法。

是否有一个catchall函数适用于清理SQL注入和XSS攻击的用户输入,同时仍允许某些类型的html标记？

1> troelskn..：

这是一种常见的误解,即用户输入可以被过滤.PHP甚至还有一个(现已弃用的)"功能",称为魔术引号,它建立在这个想法的基础之上.这是胡说八道.忘记过滤(或清洁,或任何人称之为).

为了避免出现问题,你应该做的很简单:每当你在外国代码中嵌入一个字符串时,你必须根据该语言的规则来逃避它.例如,如果在某些SQL目标MySql中嵌入字符串,则必须为此目的使用MySql函数转义字符串(mysqli_real_escape_string).(或者,对于数据库,如果可能,使用预处理语句是更好的方法)

另一个例子是HTML:如果在HTML标记中嵌入字符串,则必须使用它进行转义htmlspecialchars.这意味着每个单词echo或print语句都应该使用htmlspecialchars.

第三个例子可能是shell命令:如果你要将字符串(例如参数)嵌入到外部命令中,并用它们调用它们exec,那么你必须使用escapeshellcmd和escapeshellarg.

等等等等 ...

您需要主动过滤数据的唯一情况是,您是否接受预先格式化的输入.例如.如果您允许用户发布HTML标记,那么您计划在网站上显示该标记.但是,你应该不惜一切代价避免这种情况,因为无论你如何过滤它,它总是一个潜在的安全漏洞.

"这意味着每个echo或print语句应该使用htmlspecialchars" - 当然,你的意思是"每个...语句输出用户输入"; htmlspecialchars() - ifying"echo'Hello,world!';" 会很疯狂;)

有一种情况我认为过滤是正确的解决方案:UTF-8.您不希望在整个应用程序中使用无效的UTF-8序列(根据代码路径,您可能会获得不同的错误恢复),并且可以轻松地过滤(或拒绝)UTF-8.

@jbyrd - 不,LIKE使用专门的正则表达式语言.您必须两次转义输入字符串 - 一次用于regexp,一次用于mysql字符串编码.它是代码中代码中的代码.

此时,不推荐使用`mysql_real_escape_string`.现在使用[预备语句](http://bobby-tables.com/php.html)来防止SQL注入是一种很好的做法.所以切换到MySQLi或PDO.

因为你限制了攻击面.如果您提前清理(输入时),则必须确保应用程序中没有其他漏洞可以输入错误数据.如果你做得很晚,那么你的输出功能就不必"信任"给它安全的数据 - 它只是假设一切都是不安全的.

@porneL:是的,此时过滤掉换行以外的控制字符也是值得的.然而,鉴于大多数PHP应用程序甚至无法获得HTML转义,但我不打算推出过长的UTF-8序列问题(它们只是IE6 pre-Service-Pack-2和旧版本中的一个问题.歌剧).

我意识到这是一个老问题，但是从PHP 5.2.0开始，PHP引入了Filters（http://www.php.net/manual/en/book.filter.php）和函数filter_var（），它们在传递时值和适当的过滤器将清除或验证提供的用户输入。

@Jens Roland - 你说得对; 安全很难.试图将其委托给一个框架可能不是一个好策略.更好地理解我们正在处理的事情.听起来你有最常见的基础.

虽然有用，但不能回答实际问题。他们想在输入中允许一些HTML标记。关于如何执行此操作的唯一建议是考虑使用htmlspecialchars不允许它们。支持它们可能是某种客户需求。我已经看到许多网站在输入上支持某些HTML标记（例如slashdot.org），因此我只能假设这是可能的。

@tastro不，您不会在输入数据时进行清理-在使用数据时会进行清理。例如越晚越好。这将为您提供最佳的安全级别。

2> Andy Lester..：

不要试图通过清理输入数据来阻止SQL注入.

相反,不要在创建SQL代码时使用数据.使用使用绑定变量的Prepared Statements(即使用模板查询中的参数).这是防止SQL注入的唯一方法.

有关阻止SQL注入的更多信息,请访问我的网站http://bobby-tables.com/.

或者访问[官方文档](http://php.net/manual/en/pdo.prepared-statements.php)并学习PDO和准备好的声明.微小的学习曲线,但如果你很熟悉SQL,你就可以轻松适应.

请注意,预准备语句不会添加任何安全性,参数化查询会这样做.它们碰巧在PHP中很容易一起使用.

对于SQL注入的具体情况,*this*是正确的答案!

3> Daniel Papas..：

不可以.如果没有任何上下文,您无法对数据进行一般过滤.有时您想要将SQL查询作为输入,有时您希望将HTML作为输入.

您需要过滤白名单上的输入 - 确保数据符合您期望的某些规格.然后,您需要在使用它之前将其转义,具体取决于您使用它的上下文.

转义SQL数据的过程 - 防止SQL注入 - 与转换(X)HTML数据的过程非常不同,以防止XSS.

4> SchizoDuckie..：

PHP现在具有新的漂亮的filter_input函数,例如,现在有一个内置的FILTER_VALIDATE_EMAIL类型可以让你找到"最终的电子邮件正则表达式"

我自己的过滤器类(使用javascript来突出显示错误的字段)可以由ajax请求或普通表单发布.(见下面的例子)

/**
 *  Pork.FormValidator
 *  Validates arrays or properties by setting up simple arrays. 
 *  Note that some of the regexes are for dutch input!
 *  Example:
 * 
 *  $validations = array('name' => 'anything','email' => 'email','alias' => 'anything','pwd'=>'anything','gsm' => 'phone','birthdate' => 'date');
 *  $required = array('name', 'email', 'alias', 'pwd');
 *  $sanitize = array('alias');
 *
 *  $validator = new FormValidator($validations, $required, $sanitize);
 *                  
 *  if($validator->validate($_POST))
 *  {
 *      $_POST = $validator->sanitize($_POST);
 *      // now do your saving, $_POST has been sanitized.
 *      die($validator->getScript()."");
 *  }
 *  else
 *  {
 *      die($validator->getScript());
 *  }   
 *  
 * To validate just one element:
 * $validated = new FormValidator()->validate('blah@bla.', 'email');
 * 
 * To sanitize just one element:
 * $sanitized = new FormValidator()->sanitize('blah', 'string');
 * 
 * @package pork
 * @author SchizoDuckie
 * @copyright SchizoDuckie 2008
 * @version 1.0
 * @access public
 */
class FormValidator
{
    public static $regexes = Array(
            'date' => "^[0-9]{1,2}[-/][0-9]{1,2}[-/][0-9]{4}\$",
            'amount' => "^[-]?[0-9]+\$",
            'number' => "^[-]?[0-9,]+\$",
            'alfanum' => "^[0-9a-zA-Z ,.-_\\s\?\!]+\$",
            'not_empty' => "[a-z0-9A-Z]+",
            'words' => "^[A-Za-z]+[A-Za-z \\s]*\$",
            'phone' => "^[0-9]{10,11}\$",
            'zipcode' => "^[1-9][0-9]{3}[a-zA-Z]{2}\$",
            'plate' => "^([0-9a-zA-Z]{2}[-]){2}[0-9a-zA-Z]{2}\$",
            'price' => "^[0-9.,]*(([.,][-])|([.,][0-9]{2}))?\$",
            '2digitopt' => "^\d+(\,\d{2})?\$",
            '2digitforce' => "^\d+\,\d\d\$",
            'anything' => "^[\d\D]{1,}\$"
    );
    private $validations, $sanatations, $mandatories, $errors, $corrects, $fields;


    public function __construct($validations=array(), $mandatories = array(), $sanatations = array())
    {
        $this->validations = $validations;
        $this->sanitations = $sanitations;
        $this->mandatories = $mandatories;
        $this->errors = array();
        $this->corrects = array();
    }

    /**
     * Validates an array of items (if needed) and returns true or false
     *
     */
    public function validate($items)
    {
        $this->fields = $items;
        $havefailures = false;
        foreach($items as $key=>$val)
        {
            if((strlen($val) == 0 || array_search($key, $this->validations) === false) && array_search($key, $this->mandatories) === false) 
            {
                $this->corrects[] = $key;
                continue;
            }
            $result = self::validateItem($val, $this->validations[$key]);
            if($result === false) {
                $havefailures = true;
                $this->addError($key, $this->validations[$key]);
            }
            else
            {
                $this->corrects[] = $key;
            }
        }

        return(!$havefailures);
    }

    /**
     *
     *  Adds unvalidated class to thos elements that are not validated. Removes them from classes that are.
     */
    public function getScript() {
        if(!empty($this->errors))
        {
            $errors = array();
            foreach($this->errors as $key=>$val) { $errors[] = "'INPUT[name={$key}]'"; }

            $output = '$$('.implode(',', $errors).').addClass("unvalidated");'; 
            $output .= "new FormValidator().showMessage();";
        }
        if(!empty($this->corrects))
        {
            $corrects = array();
            foreach($this->corrects as $key) { $corrects[] = "'INPUT[name={$key}]'"; }
            $output .= '$$('.implode(',', $corrects).').removeClass("unvalidated");';   
        }
        $output = "";
        return($output);
    }


    /**
     *
     * Sanitizes an array of items according to the $this->sanitations
     * sanitations will be standard of type string, but can also be specified.
     * For ease of use, this syntax is accepted:
     * $sanitations = array('fieldname', 'otherfieldname'=>'float');
     */
    public function sanitize($items)
    {
        foreach($items as $key=>$val)
        {
            if(array_search($key, $this->sanitations) === false && !array_key_exists($key, $this->sanitations)) continue;
            $items[$key] = self::sanitizeItem($val, $this->validations[$key]);
        }
        return($items);
    }


    /**
     *
     * Adds an error to the errors array.
     */ 
    private function addError($field, $type='string')
    {
        $this->errors[$field] = $type;
    }

    /**
     *
     * Sanitize a single var according to $type.
     * Allows for static calling to allow simple sanitization
     */
    public static function sanitizeItem($var, $type)
    {
        $flags = NULL;
        switch($type)
        {
            case 'url':
                $filter = FILTER_SANITIZE_URL;
            break;
            case 'int':
                $filter = FILTER_SANITIZE_NUMBER_INT;
            break;
            case 'float':
                $filter = FILTER_SANITIZE_NUMBER_FLOAT;
                $flags = FILTER_FLAG_ALLOW_FRACTION | FILTER_FLAG_ALLOW_THOUSAND;
            break;
            case 'email':
                $var = substr($var, 0, 254);
                $filter = FILTER_SANITIZE_EMAIL;
            break;
            case 'string':
            default:
                $filter = FILTER_SANITIZE_STRING;
                $flags = FILTER_FLAG_NO_ENCODE_QUOTES;
            break;

        }
        $output = filter_var($var, $filter, $flags);        
        return($output);
    }

    /** 
     *
     * Validates a single var according to $type.
     * Allows for static calling to allow simple validation.
     *
     */
    public static function validateItem($var, $type)
    {
        if(array_key_exists($type, self::$regexes))
        {
            $returnval =  filter_var($var, FILTER_VALIDATE_REGEXP, array("options"=> array("regexp"=>'!'.self::$regexes[$type].'!i'))) !== false;
            return($returnval);
        }
        $filter = false;
        switch($type)
        {
            case 'email':
                $var = substr($var, 0, 254);
                $filter = FILTER_VALIDATE_EMAIL;    
            break;
            case 'int':
                $filter = FILTER_VALIDATE_INT;
            break;
            case 'boolean':
                $filter = FILTER_VALIDATE_BOOLEAN;
            break;
            case 'ip':
                $filter = FILTER_VALIDATE_IP;
            break;
            case 'url':
                $filter = FILTER_VALIDATE_URL;
            break;
        }
        return ($filter === false) ? false : filter_var($var, $filter) !== false ? true : false;
    }       



}

当然,请记住,您需要进行sql查询转义,具体取决于您使用的数据库类型(例如,mysql_real_escape_string()对于SQL Server无用).您可能希望在适当的应用程序层(如ORM)自动处理此问题.另外,如上所述:输出到html使用其他php专用函数,如htmlspecialchars;)

对于真正允许带有类似剥离类和/或标记的HTML输入,取决于其中一个专用的xss验证包.不要将自己的注册内容写入PARSE HTML!

这看起来可能是一个用于验证输入的方便脚本,但它与问题完全*无关.

5> Peter Bailey..：

不,那里没有.

首先,SQL注入是一个输入过滤问题,XSS是一个输出转义问题 - 所以你甚至不会在代码生命周期中同时执行这两个操作.

基本的经验法则

对于SQL查询,绑定参数(与PDO一样)或对查询变量使用驱动程序本机转义函数(例如mysql_real_escape_string())

使用strip_tags()过滤掉不需要的HTML

htmlspecialchars()在此处转义所有其他输出并注意第二和第三参数.

如果您的用户数据将进入数据库并稍后显示在网页上,那么它通常不会比编写的更多地阅读吗？对我来说,在存储它之前过滤它一次(作为输入)更有意义,而不是每次显示它时都必须过滤它.我是否遗漏了一些东西,或者是否有很多人投票支持这个和接受的答案中的不必要的性能开销？

对我来说最好的答案.它很简短,如果你问我,我会很好地解决这个问题.是否有可能通过$ _POST或$ _GET以某种方式攻击PHP,或者这是不可能的？

6> jasonbar..：

要解决XSS问题,请查看HTML Purifier.它相当可配置,并具有良好的跟踪记录.

至于SQL注入攻击,请确保检查用户输入,然后通过mysql_real_escape_string()运行它.但是,该函数不会破坏所有注入攻击,因此在将数据转储到查询字符串之前检查数据非常重要.

更好的解决方案是使用预准备语句.该PDO库和mysqli扩展支持这些.

7> dangel..：

PHP 5.2引入了filter_var函数.

它支持大量的SANITIZE,VALIDATE过滤器.

http://php.net/manual/en/function.filter-var.php

8> Hamish Downe..：

在你有一个页面的特定情况下可以帮助的一个技巧,/mypage?id=53你在WHERE子句中使用id是为了确保id肯定是一个整数,如下所示:

if (isset($_GET['id'])) {
  $id = $_GET['id'];
  settype($id, 'integer');
  $result = mysql_query("SELECT * FROM mytable WHERE id = '$id'");
  # now use the result
}

但是当然只能删除一个特定的攻击,所以阅读所有其他答案.(是的,我知道上面的代码不是很好,但它显示了具体的防御.)

我使用$ id = intval($ id)代替:)

9> Mark Martin..：

使用PHP清理用户输入的方法:

使用MySQL和PHP的现代版本.

明确设置charset:

$mysqli->set_charset("utf8");

^手册

$pdo = new PDO('mysql:host=localhost;dbname=testdb;charset=UTF8', $user, $password);

^手册

$pdo->exec("set names utf8");

^手册

$pdo = new PDO(
"mysql:host=$host;dbname=$db", $user, $pass, 
array(
PDO::ATTR_ERRMODE => PDO::ERRMODE_EXCEPTION,
PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES utf8"
)
);

^手册

mysql_set_charset('utf8')

^{[在PHP 5.5.0中弃用,在PHP 7.0.0中删除].}

使用安全字符集:

选择utf8,latin1,ascii ..,不要使用易受攻击的字符集big5,cp932,gb2312,gbk,sjis.

使用空间化功能:

MySQLi编写的语句:

$stmt = $mysqli->prepare('SELECT * FROM test WHERE name = ? LIMIT 1'); 
$param = "' OR 1=1 /*";
$stmt->bind_param('s', $param);
$stmt->execute();

PDO :: quote() - 在输入字符串周围放置引号(如果需要)并使用适合于底层驱动程序的引用样式转义输入字符串中的特殊字符:

$pdo = new PDO('mysql:host=localhost;dbname=testdb;charset=UTF8', $user, $password);^{explicit set the character set}
$pdo->setAttribute(PDO::ATTR_EMULATE_PREPARES, false);^{disable emulating prepared statements to prevent  fallback to emulating statements that MySQL can't prepare natively (to prevent injection)}
$var  = $pdo->quote("' OR 1=1 /*");^{not only escapes the literal, but also quotes it (in single-quote ' characters)}
$stmt = $pdo->query("SELECT * FROM test WHERE name = $var LIMIT 1");

PDO准备语句:vs MySQLi预处理语句支持更多数据库驱动程序和命名参数:

$pdo = new PDO('mysql:host=localhost;dbname=testdb;charset=UTF8', $user, $password);^{explicit set the character set}
$pdo->setAttribute(PDO::ATTR_EMULATE_PREPARES, false);^{disable emulating prepared statements to prevent  fallback to emulating statements that MySQL can't prepare natively (to prevent injection)}
$stmt = $pdo->prepare('SELECT * FROM test WHERE name = ? LIMIT 1');
$stmt->execute(["' OR 1=1 /*"]);

~~mysql_real_escape_string~~ ^{[在PHP 5.5.0中已弃用,在PHP 7.0.0中删除].}

mysqli_real_escape_string转义字符串中的特殊字符,以便在SQL语句中使用,同时考虑连接的当前字符集.但是建议使用Prepared Statements,因为它们不仅仅是转义字符串,一个语句提出了一个完整的查询执行计划,包括它将使用哪些表和索引,这是一种优化的方式.

在查询中的变量周围使用单引号('').

检查变量包含您期望的内容:

如果您期望一个整数,请使用:

ctype_digit — Check for numeric character(s);
$value = (int) $value;
$value = intval($value);
$var = filter_var('0755', FILTER_VALIDATE_INT, $options);

对于字符串使用:

is_string() — Find whether the type of a variable is string

使用过滤器函数 filter_var() - 使用指定的过滤器过滤变量:

$email = filter_var($email, FILTER_SANITIZE_EMAIL);
$newstr = filter_var($str, FILTER_SANITIZE_STRING);

预定义过滤器

filter_input() - 按名称获取特定的外部变量,并可选择对其进行过滤:

$search_html = filter_input(INPUT_GET, 'search', FILTER_SANITIZE_SPECIAL_CHARS);

preg_match() - 执行正则表达式匹配;

编写自己的验证功能.

10> Andrew..：

你在这里描述的是两个不同的问题:

消除/过滤用户输入数据.

逃避输出.

1)应始终假定用户输入不良.

使用预准备语句,或/和使用mysql_real_escape_string进行过滤绝对是必须的.PHP还内置了filter_input,这是一个很好的起点.

2)这是一个很大的主题,它取决于输出数据的上下文.对于HTML,有像htmlpurifier这样的解决方案.根据经验,总是逃避你输出的任何东西.

这两个问题都太大了,无法在一篇文章中介绍,但有很多帖子更详细:

方法PHP输出

更安全的PHP输出

11> Alejandro Si..：

如果您正在使用PostgreSQL,可以使用pg_escape_string()转义PHP的输入

 $username = pg_escape_string($_POST['username']);

从文档(http://php.net/manual/es/function.pg-escape-string.php):

pg_escape_string()转义用于查询数据库的字符串.它返回PostgreSQL格式的转义字符串,不带引号.

12> Ondřej Šotek..：

避免清理输入和转义数据时出错的最简单方法是使用像Symfony,Nette等PHP框架或该框架的一部分(模板引擎,数据库层,ORM).

像Twig或Latte 这样的模板引擎默认情况下输出转义 - 如果您根据上下文(网页的HTML或Javascript部分)正确转义输出,则无需手动解决.

框架自动清理输入,你不应该直接使用$ _POST,$ _GET或$ _SESSION变量,而是通过路由,会话处理等机制.

对于数据库(模型)层,有像Doctrine这样的ORM框架或者像Nette Database这样的PDO包装器.

您可以在此处阅读更多相关信息 - 什么是软件框架？

用PHP清理用户输入的最佳方法是什么？

使用PHP清理用户输入的方法:

使用MySQL和PHP的现代版本.

明确设置charset:

使用安全字符集:

使用空间化功能:

检查变量包含您期望的内容:

将值分配给Pandas中的多个列

我如何跳过foreach循环中的空格？

如何将包含现有文件的本地项目导入Source树

在每页上加载Visual Composer(AJAX安装程序)

了解iOS中的收据验证和收据刷新

SSDT Schema Compare会不断为用户找到差异？

我可以在JSFiddle上使用Polymer吗？

覆盖AspNet.Security.OpenIdConnect.Server中的TokenEndPoint

用包含零的行来标准化矩阵 - MATLAB

Bash输出误解

VS 2015无法打开编译器生成的文件：”：无效的参数

Android精确闹钟总是3分钟

对任意类型进行Swift排序

没有子节的GraphQL变异

_,在Golang中意味着什么？

模式匹配比Haskell中的case表达更优选的现实例子？

删除的默认光标图标是什么？

如何在Android中以编程方式设置按钮边框颜色？

RxAndroid与Retrofit 2.0

SqlDependency仅在订阅时触发