问题解读
  我觉得,这个问题每年带来的成本可以高达数十亿美元了。本文来谈谈,假定我们有如下 SQL 模板语句:
  <code>select * from T where f1 = ‘{value1}’ and f2 = {value2}
  </code>
  现在我们需要根据用户输入值填充该语句:
  <code>value1=hello
  value2=5
  </code>
  我们得到了下面的 SQL 语句,我们再提交给数据库
  <code>select * from T where f1=’hello’ and f2=5
  </code>
  问题在于,攻击者可以构造如下的用户输入值:
  <code>value1=anything’ or 1=1 or f1=’whatever
  value2=5
  </code>
  拼接好的终语句变成了:
  <code>select * from T where f1=’anything’ or 1=1 or f1=’whatever’ and f2=5
  </code>
  攻击者成功地改变了模板语句的语义。这种问题不单单发生在 SQL 上,还出现在通常使用模板的任何语言上,比如 HTML 和 shell 脚本
  常规解决方案的说明
  SQL 是具备任意性和一致性的公理,token 和派生规则构成其公理化基础。要注意的一个词语是「任意性」。与 SQL 等价的公理化数不胜数。对于这种任意等价的表示,每一条合法的语句都能被准确地映射到 SQL 里的合法语句,其它语言亦然。在这种任意等价表示中,如果某语句是不合法的,那么它在 SQL 里也是不合法的。攻击者不可能构造出可以满足任何可能的、任意与 SQL 等价的规则。
  策略1:根据不同的派生规则,用另一种语法扩展模板语句 例子1:前缀语言
  SQL 使用中缀表示法【注1】。中缀表示法等价于 lisp 风格的前缀表示法【注2】。中缀与前缀:
  <code>a OP1 b OP2 c <=> (OP1 a (OP2 b c))
  </code>
  a、b、c 是标识符或值,OP1、OP2 是操作符或功能。
  前缀表示法的示例语句:
  <code>(select * T (and (= f1  ‘{value1}’) (= f2 {value2})))
  </code>
  该语句是等价的。它们在语义上属于外延。自动把 SQL 的中缀表示法转换成前缀表示法或其它表示法,都不算问题了。然而,攻击者的注入在前缀语法方面是不合法的:
  <code>(select * T (and (= f1  ‘anything’ or 1=1 or a=’whatever’) (= f2 5)))
  </code>
  语法错误。攻击者想要的是:
  <code>(select * T (or (= f1 ‘anything’) (or (=1 1) (and (= a ‘whatever’) (= f2 5)))))
  </code>
  这是不同的。攻击者的注入不能输出合法的前缀语言。
  例子2:欧拉表示法
  另一个替代方法将数得着欧拉表示法了。从中缀表示法到欧拉:
  <code>a OP1 b OP2 c <=> OP1(a,OP2(b,c))
  </code>
  例子中的语句:
  <code>select( *,T,and(=(f1,'{value1}’),=(f2,{value2})))
  </code>
  而注入的语句将出现语法错误:
  <code>select( *,T,and(=(f1,’anything’ or 1=1 or a=’whatever’),=(f2,5)))
  </code>
  攻击者本来是想写成:
  <code>select( *,T,or(=(f1,’anything’,or(=(1,1),and(=(a,’whatever’),=(f2,5))))))
  </code>
  攻击者正在做错误的事情。他的注入根本没有注意到所选的任意标记法。
  例子3:对象标记法(object notation)
  还有一种替代方法,对象标记法。从前缀表示法到对象:
  <code>a OP1 b OP2 c <=> a.OP1(b).OP2(c)
  </code>
  例子的代码:
  <code>T.where(f1.=(‘{value1}’).and(f2.=({value2})).select(*)
  </code>
  注入再一次折戟于语法:
  <code>T.where(f1.=(‘anything’ or 1=1 or a=’whatever’).and(f2.=5)).select(*)
  </code>
  我不再提供正确答案了,读者可以当做练习,看看攻击者应该写成什么样子。
  策略2:为 SQL 选择其它任意 token
  keyword 常常是一门语言里的任意 token。重要的是它们在派生规则里的位置、而非它们的任意体现。你总是可以用其它 keyword 替换现有 keyword,并且来回转换。举个例子,我们可以将下面 SQL 语句中的 keyword 转换成我们姑且称为「任意的 brainfuck」:
  <code>{“select“:”iph0ohKi”, “*“:”ieZoh4xa”, “from“:”aeZi5uja”, “where“:”OoJ4aX4n”, “=“:”eeQu2Zad”, “(“:”eiD5aera”,”)“:”Soo2uach”, “or“:”Ocaig5Es”}</code>
  为了论证起见,我们将把操作数映射为 半任意的结构化序列:
  <code>T <=> @phai1Oa6@T@
  hello <=> @phai1Oa6@hello@
  </code>
  phai1Oa6 是任意选取的字符序列。对于当前情形,例子:
  <code>select * from T where f1 = ‘{value1}’ and f2 = {value2}
  </code>
  变成了:
  <code>iph0ohKi ieZoh4xa aeZi5uja @phai1Oa6@T@ OoJ4aX4n @phai1Oa6@f1@ eeQu2Zad ‘{value1}’ @phai1Oa6@and@ @phai1Oa6@f2@ eeQu2Zad {value2}
  </code>
  这是合法的、任意的 brainfuck 语言。经过注入之后,我们得到了:
  <code>iph0ohKi ieZoh4xa aeZi5uja @phai1Oa6@T@ OoJ4aX4n @phai1Oa6@f1@ eeQu2Zad ‘anything‘ or 1=1 or a=’whatever’ @phai1Oa6@and@ @phai1Oa6@f2@ eeQu2Zad 5
  </code>
  你可以看到,它包含的 token 有 ‘or’ 和 ‘=’,它们在任意的 brainfuck 语言中是不合法的。我们的语法说,你必须这样使用:
  <code>or <=> Ocaig5Es
  = <=> eeQu2Zad
  </code>
  这些 token 也不是操作数,因为它们将只能被视作:
  <code>or <=> @phai1Oa6@or@
  = <=> @phai1Oa6@=@
  </code>
  换句话说,注入之后的语句变得不合法、也不可用了。
  策略3:验证不变量
  你数数下面模板语句例子中的 token 有几个?
  <code>[1] select [2] * [3] from [4] T [5] where [6] f1 [7] = [8] ‘{value1}’ [9] and [10] f2 [11] = [12] {value2}
  </code>
  12 个。模板填充之后,总数必须仍然为 12,但是我们却看到了攻击者所引发的结果:
  <code>[1] select [2] * [3] from [4] T [5] where [6] f1 [7] = [8] ‘anything’ [9] or [10] 1 [11] = [12] 1 [13] or [14] a [15] = [16] ‘whatever’ [17] and [18] f2 [19] = [20] 5
  </code>
  现在有 20 个 token 。违反这种不变量,暴露了有问题的地方。同样适用于相同语句的表示,除了任意的、brainfuck 语言。模板的填充根本不可能导致 token 数量的变化。
  事实上,你可以试着使用其它不变量,并在填充之后进行验证。攻击者必须和它们保持一致。
  结论
  有些人提倡,程序员在填充 SQL 模板时,应该更加小心。应对 SQL 注入问题,只是需要在编程方面多加小心。很明显,这种方式算不上解决方案。人们仍然在校验用户输入值方面出现错误,终接受了带有恶意的用户输入值。换句话说,单凭我们所有人更努力地工作,是无法根本解决这种问题的。
  真正的解决方案在于,SQL 语句本身的任意性,并要求所有现存不变量都符合任意的等价结构的规则。无需程序员的干预,能自动完成。
  攻击者不得不符合一种未知的、任意的 brainfuck 语法的规则。想要符合一组未知的规则,将是难以解决的问题。因此,攻击者通常无法得手。
  本文是翻译,版权归原作者所有
  原文地址(original source):https://bitcoinrevolt.wordpress.com/2016/03/08/solving-the-problem-of-sql-injection-requires-another-approach/
  原文作者(author):eriksank
  注释 注1:中缀表示法(或中缀记法)是一个通用的算术或逻辑公式表示方法, 操作符是以中缀形式处于操作数的中间(例:3 + 4)。与前缀表达式(例:+ 3 4)或后缀表达式(例:3 4 +)相比,中缀表达式不容易被电脑解析,但仍被许多程序语言使用,因为它符合人们的普遍用法。https://zh.wikipedia.org/wiki/%E4%B8%AD%E7%BC%80%E8%A1%A8%E7%A4%BA%E6%B3%95
  注2:波兰表示法(Polish notation,或波兰记法),是一种逻辑、算术和代数表示方法,其特点是操作符置于操作数的前面,因此也称做前缀表示法。https://zh.wikipedia.org/wiki/%E6%B3%A2%E5%85%B0%E8%A1%A8%E7%A4%BA%E6%B3%95 译文: 《解决 SQL 注入的另类方法 》| 腊八粥通过本文的介绍希望对您了解和学习mysql能够提供帮助.