规则 1:绝不要信任外部数据或输入
关于 Web 应用程序安全性,必须认识到的第一件事是不应该信任外部数据。外部数据(outside data) 包括不是由程序员在 PHP 代码中直接输入的任何数据。在采取措施确保安全之前,来自任何其他来源(比如 GET 变量、表单 POST、数据库、配置文件、会话变量或 cookie)的任何数据都是不可信任的。
例如,下面的数据元素可以被认为是安全的,因为它们是在 PHP 中设置的。
清单 1. 安全无暇的代码
- 以下为引用的内容:
- $myUsername = 'tmyer';
- $arrayUsers = array('tmyer', 'tom', 'tommy');
- define("GREETING", 'hello there' . $myUsername);
- ?>
但是,下面的数据元素都是有瑕疵的。
清单 2. 不安全、有瑕疵的代码
- 以下为引用的内容:
- $myUsername = $_POST['username']; //tainted!
- $arrayUsers = array($myUsername, 'tom', 'tommy'); //tainted!
- define("GREETING", 'hello there' . $myUsername); //tainted!
- ?>
为什么第一个变量 $myUsername 是有瑕疵的?因为它直接来自表单 POST。用户可以在这个输入域中输入任何字符串,包括用来清除文件或运行以前上传的文件的恶意命令。您可能会问,“难道不能使用只接受字母 A-Z 的客户端(Javascrīpt)表单检验脚本来避免这种危险吗?”是的,这总是一个有好处的步骤,但是正如在后面会看到的,任何人都可以将任何表单下载 到自己的机器上,修改它,然后重新提交他们需要的任何内容。
解决方案很简单:必须对 $_POST['username'] 运行清理代码。如果不这么做,那么在使用 $myUsername 的任何其他时候(比如在数组或常量中),就可能污染这些对象。
对用户输入进行清理的一个简单方法是,使用正则表达式来处理它。在这个示例中,只希望接受字母。将字符串限制为特定数量的字符,或者要求所有字母都是小写的,这可能也是个好主意。
清单 3. 使用户输入变得安全
- 以下为引用的内容:
- $myUsername = cleanInput($_POST['username']); //clean!
- $arrayUsers = array($myUsername, 'tom', 'tommy'); //clean!
- define("GREETING", 'hello there' . $myUsername); //clean!
- function cleanInput($input){ $clean = strtolower($input);
- $clean = preg_replace("/[^a-z]/", "", $clean);
- $clean = substr($clean,0,12);return $clean;
- }
- ?>