等式与不等式(高中)

                     

贡献者: 欄、停敘

预备知识 函数集合

   相等和不等关系是从小学阶段就开始接触的基础概念,但由此延伸出的方程、不等式、恒等式、方程组、解等概念,许多人往往只有一个模糊的感觉,而并不能清晰描述它们是什么。人教版初中教材中给出的 “方程” 定义是 “含有未知数的等式称作方程(equation)”1,给 “未知数” 的定义则是 “方程的求解目标”,这看上去是一种令人迷惑的循环定义,进而造成有些人困惑形如 $x=3$ 的等式是否也是一个方程。到高中阶段,在高中教材中依然没有系统性的澄清这些概念。

   因此,很多学生在阅读题目时,对解题任务的理解感到模糊,不清楚解方程、联立方程究竟意味着什么,这种认识上的模糊甚至延续到大学阶段,影响对更复杂概念的掌握和后续学习的进展,很多研究者在使用这些术语时也很混乱。本文旨在解决上面提到的问题。

1. 一些相关的基础概念

   下面会先介绍一些基础概念。这些概念的数量很多且前后勾连,且有不少与教材上语焉不详的定义存在出入。这里不要求完整记忆,只需要认真理解并清楚自己脑海中习惯的表达与下面概念的对应即可。

运算符与关系符

   表示数学运算的符号,如加、减、乘、除及各种函数(例如 $\sin,\cos$)等,被称为运算符(operator)2。在数学学习的基础阶段经常会接触到的五种基本运算符——加、减、乘、除及有理数次的乘方——被归类为代数运算符(algebraic operators)。这些代数运算符专注于基本的算术计算,是构建许多数学表达式的核心部分。

   用于表示两个数学元素之间关系的符号称为关系符(relation)3。例如,“$>$”、“$<$”、“$\leq$”、“$\geq$”、“$\neq$” 这些符号称为不等号(inequality symbols),而 “$=$” 称为等号(equality symbol)。此外,还有许多关系符号,比如:在集合论中,有表示包含关系 “$\subset$” 和表示属于关系的 “$\in$”;在几何中,有表示平行关系的 “$\mathrel{/\mskip-2.5mu/}$” 和垂直关系的 “$\perp$”;在数理逻辑中,有表示等价关系的 “$\equiv$”、表示蕴含关系的 “$\Rightarrow$” 以及表示互为充要条件关系的 “$\iff$” 等。

表达式

   由数字、变量和运算符组成的数学符号组合称为数学表达式(mathematical expression),或简称表达式(expression),也叫式子。表达式可以被看作一种 “描述工具”,其主要作用在于用符号表示某种数学上的数量关系或状态,而不一定需要得到一个具体的数值。例如,$3x + 2$ 和 $ \sin\left(x\right) $ 都是表达式,它们描述了一种数量关系或函数的性质,而不是一道必须求解的题目。

   表达式可以通过各种数学操作来进行简化和转化,比如合并同类项、约分等,这些操作称为 “恒等变形”。在特定情况下,如果知道表达式中变量的具体值,还可以将该值代入表达式,从而计算出一个数值结果。

   在初中阶段学习的代数式(algebraic expression)是一个特定类型的数学表达式。代数式仅由代数运算符连接数或字母组成,比如 $2x + 3$ 或 $x^2 - 4x + 4$。这也意味着代数式的运算范围相对有限,通常只涉及基本的代数运算,而不会涉及如三角函数或对数等更复杂的运算。可以说,代数式是表达式中的 “基础款”。代数式的核心特点在于运算简单且易于处理,是数学学习的入门工具。

2. 等式和不等式

   等式(equation)不等式(inequality)在定义上几乎完全相同,两者的区别主要在于所使用的关系符号不同,以及由此导致的操作规则的变化。由于本章主要讨论定义,为了简化理解,可以先专注于等式的定义。一旦掌握了等式的概念和性质,再推广到不等式就会变得更加容易。

等式

   在介绍下面的概念之前,有必要先引入一个英语单词 “equation”。它在中文中通常翻译为 “方程” 或 “等式”。这里提到的 “方程” 并不完全等同于日常所理解的方程。为了避免混淆,本节接下来的内容将统一使用 “等式” 一词4等式(equation)是指由等号($=$)连接两个表达式构成的数学符号组合,表示二者之间的相等关系。

   如果将等式中的表达式视为函数的对应关系,那么等式可以看作是描述两个函数之间的相等关系。这时,称函数的自变量称为未知数(unknown),而使等式成立的条件称为等式的解(solution),这里对应的就是未知数的取值5,也称 “解满足给定的方程”,所有满足等式的解构成的集合称为解集(solution set)。如果没有值使条件成立,则解集为空集。

   根据未知数允许的取值范围 $M$ 与解集 $S$ 的交集 $C=M\cap S$ 的不同情况,可以将等式分为以下几类:

   总之,理解概念是最重要的。在中文用词上,通常 “等式” 这个词包含了上面提到的三种类型——矛盾式、条件等式和恒等式。而 “方程” 则特指条件等式,表示在特定条件下成立的等式,“方程无解” 则指矛盾等式,之后不引起歧义时也会如此使用。在解题和讨论时,明确所指的对象,可以避免不必要的混淆。

   现在回答 “如何看待 $x = 3$?” 这个问题。$x = 3$ 既可以看作是一个方程(条件等式),即一个条件下成立的等式;也可以看作是这个方程的解(恒等式),即它的取值范围是解集 $\{3\}$。从解的角度来看,可以将 $x = 3$ 表示为 $x \in \{3\}$。这种写法清晰地表明了 $x$ 是要表示的值,而非条件等式的情况,可以避免歧义。因此,在不产生歧义的情况下,通常直接使用 $x = 3$ 来表示解,而需要特别强调解集时采用解集的写法会更为精确,尤其是在讨论不等式时。

不等式

   在理解了等式那些错综复杂的概念之后,不等式的定义就更容易掌握了。不等式(inequation)是由不等号连接两个表达式组成的数学符号组合,用来表示两个表达式之间的不等关系6。“不等式” 是一个宽泛的称谓,无论解集与给定范围的关系如何,只要包含不等号都会称为不等式,这使得在使用时会容易忽略它到底是指一个具有条件解的 “不等式方程” 还是一个在所有取值范围上都成立的 “恒等不等式”(这两个术语并非正式定义,仅用作便于理解的表述)。

   在不等式的研究中,许多概念,例如未知数、解、解集,以及矛盾不等式、条件不等式和恒成立不等式,与等式中的定义类似,仅仅因为不等号的存在而带来了一些细微的差别。在理解不等式时,以下两个要点尤其重要:

方程组

   在初中时,就已经接触过方程组,当时给出的定义是 “把两个必须同时满足的方程合在一起组成一个方程组”。这个定义虽然简单,但传达了一个核心概念,即方程组涉及的每个方程都必须同时成立。用大括号将多个方程括在一起,正是为了表示它们的联合条件。

   方程组(system of equations)指的就是一组需要同时成立的方程。注意到这里使用的英语单词是 “system”,中文里它通常翻译为 “系统”。因此其实可以将方程组看作是一个 “系统”,或者说方程组本身就是描述了一个系统7。每个等式的解集 $S_i$ 都相当于要从总体范围 $M$ 中划分出一部分,这一过程就像描述 “硬的、红色的、圆的水果”,每个描述词(“硬的”、“红色的”、“圆的”)都对 “水果” 进行了限定,而每个方程也都类似于为系统添加了一个限制条件,这个过程中的限制条件称为约束(constraint),从 “约束” 的角度理解方程组提供了一个重要的视角。最终,所有的形容词同时成立的水果指的是包含 “苹果” 水果等构成的集合,而同样地,同时使所有方程成立的条件称为方程组的解(solution),而方程组的解集也就是各方程解集的交集。

   方程组中的方程经过变形后,在大多数情况下8,一个方程会对一个变量提供约束,从而,通常方程组是针对多个变量的。

   不仅方程可以用来描述约束,不等式也可以发挥类似的作用。通常,只有不等式构成的一组称为不等式组(system of inequalities)。如果既包含等式又包含不等式,则直接称为约束系统(system of constraints)9。约束系统通常出现在优化问题中,尤其是在线性规划和非线性规划中。在这些情境中,线性系统(linear system)非线性系统(nonlinear system)的定义取决于方程组中方程的类型(线性或非线性)。无论是方程组、不等式组还是约束系统,其解集都由所有约束条件共同定义,即由使所有约束同时成立的变量值构成。

   对于两个表达式 $f$ 和 $g$,方程组 $\begin{cases}f = 0 \\ g = 0\end{cases}$ 与方程 $f \cdot g = 0$ 的区别体现了 “交集与并集”,“且与或” 的性质,这个性质在解析几何中有着重要的应用:

   简单来说,方程组 $\begin{cases}f = 0 \\ g = 0\end{cases}$ 的解集是 $f = 0$ 和 $g = 0$ 解集的交集,而方程 $f \cdot g = 0$ 的解集是它们的并集。

3. 解

   根据前面的定义,方程和不等式仅在其解集中成立。换句话说,方程或不等式的解集包含了所有能够满足该等式或不等式的条件。在介绍函数的零点时就提及过:函数的零点与方程的解有密切联系,如果将方程变为 $F(x)=0$ 的形式,那么方程的解即函数的零点。而如果方程对应的函数没有零点,那么意味着,这个方程无解。方程的解可以分为两大类:

   总体而言,解析解精确,但并不总是存在;数值解虽然是近似的,却能够为几乎所有方程提供可用的结果。在高中阶段基本只关注解析解,但需要意识到在实际数学应用中,存在许多方程无法获得解析解,或解析求解极为复杂,在保证精度的前提下,数值解是一种重要的替代方案。

求解规则

   如果两个方程组或两个方程的解集完全相同,则称它们等价(equivalent)。求解一个方程(或方程组)时,通常通过变换将其转换为一个等价的方程(组),以便更容易求解。然而,在一些情况下,为了简化方程或产生某些错误时,把给定的方程变换成另一个方程后,会使得原本方程的解集成为新方程解集的真子集。这意味着在求解过程中可能引入增根(extraneous solution,也称伪解)。为了避免这种情况,一般会将求得的解代入原方程进行验算,以确保所有解均为原方程的有效解。这是一种良好的解题习惯,能够有效减少因变换操作导致的错误。同时,对增根的研究,也促进了对同一问题不同的审视视角,产生了许多新理论,如复数等。而了解清楚求解规则成立的原因,对解析几何的学习非常重要。下面介绍的具体规则,都是前面等价原则的具体体现,如果遇到陌生情况拿不准,一定要回归到等价的原则上来分析。

   等式的等价变换包括在等式两侧同时进行相同的运算操作,例如加(任意)、乘(非零)的等价表达式10(包括相同或恒等两种情况),以及在等式两侧套用相同的函数。加、乘相同表达式的操作一般被简化为移项(如 $x+1=0\to x=-1$)、消去(如 $x+2=2x\to 2=x$)和约化(如 $2x=2\to x=1$)。而函数作用时可能会带来增根11,例如 $x+1=1$ 两侧套用 $f(x)=x^2$ 后,变成 $(x+1)^2=1$,带来增根 $x=-2$。乘以与零等价的表达式是一种需要特别注意的操作,因为它可能会引入增根,甚至导致解集错误。例如,对于方程 $x+1=0$,如果两侧分别乘以 $x-2=0$ 两侧的表达式,则得到 $(x+1)(x-2)=0$,从而引入了增根 $x=-2$。而若在 $x+1=1$ 的两侧乘以 $x-2=0$ 的表达式,则得到 $(x+1)(x-2)=0$,与原方程没有共同解。因此,只有在与 $0$ 等价的方程情境下,才能合理地乘以与零等价的表达式,以确保不会产生错误。

   不等式的等价变换包括在不等式两侧同时加(任意)、乘(非零)等价的表达式以及施加相同的单调函数。与等式不同的是,在乘以负数以及施加单调递减的函数时,需要改变不等号方向,即 $\{<,\leq\}$ 与 $\{>,\geq\}$ 的互换(如 $x>2\to-x<-2$ 以及 $\displaystyle x-2>3\to\left({1\over2}\right)^{x-2}<\left({1\over2}\right)^3$)。由于不等式通常以解集的形式给出,验证增根较为困难,因此确保按照条件变换,避免变换后不等式的解集与原不等式不同尤为重要。乘以与零等价的表达式,会导致不等式变成等式。

   因式分解则常用来将复杂的表达式简化为更易处理的形式。根据之前的讨论,通过因式分解,可以将原本复杂的表达式化为 $h=f\cdot g=0$ 的形式,一般 $f,g$ 的求解会较 $h$ 更容易。根据方程解集的特性,分别求得二者再取并集即可。不等式部分稍微复杂,若 $h=f\cdot g\geq0$,则解集为:$\begin{cases}f \geq 0 \\ g \geq 0\end{cases}$ 与 $\begin{cases}f \leq 0 \\ g \leq 0\end{cases}$ 的并集,或者说 $f,g$ 同号;若 $h=f\cdot g\leq0$,则解集为:$\begin{cases}f \leq 0 \\ g \geq 0\end{cases}$ 与 $\begin{cases}f \geq 0 \\ g \leq 0\end{cases}$ 的并集,或者说 $f,g$ 异号。

   方程组的求解过程可以看作是分别求每个方程的解集,然后取其交集。不过相较于求解方程,求解方程组有一个好处是,由于方程组中的方程需要同时成立,于是这些等式可以视为在变量取值范围为解集的前提下恒成立,从而允许在一个方程 $A$ 进行变换时,将另一个方程 $B$ 的等式两侧作为等价量代入。这个操作进一步简化为方程加减(如 $\begin{cases}x+y= 0 \\ x-y =2\end{cases}\to 2x=2$)、代入(如 $\begin{cases}x+y= 0 \\ x=2\end{cases}\to 2+y=0$)等操作。

有理不等式的解集

   有一类常见的不等式,形如 $F(x) \geq 0$ 或 $F(x) \leq 0$ 的不等式,其中 $\displaystyle F(x)={P(x)\over Q(x)}$ 为一个有理表达式,即 $P(x),Q(x)$ 为多项式,称为有理不等式(rational inequality)

   求解有理不等式时,通常会使用根轴法(sign chart method),它通过分析函数分子和分母的符号变化,找到 $x$ 的解集区间。根轴法的基本步骤如下:

  1. 标准化:在确保将 $\displaystyle F(x)={P(x)\over Q(x)}$ 分子分母中相同的因式约分后,将其化作 $P(x)Q(x)$,分别因式分解得到 $P^{m_1}_1(x)\cdots P^{m_p}_p(x)Q^{n_1}_1(x)\cdots Q^{n_q}_q(x)$,其中 $m_i$ 和 $n_j$ 表示每个因式的指数。要求每个因式的最高次都是正的,如果有负号放在最外面(如 $(x-1)(1-x)\to-(x-1)^2$),因式分解要彻底(如:$x^2+bx+c$ 如果 $b^2-4c\geq0$ 则继续分解为两个因式,否则因式分解到此为止。)
  2. 标出零点:将分解后的每个因式 $P_i(x),Q_j(x)$ 分别设为零,得到方程 $P_i(x) = 0$ 及 $Q_j(x) = 0$,解得各自的零点并将它们标在数轴上。如果某个因式无解,则不标记。
  3. 穿轴画线:根据第一步的最外层符号确定画线的起始位置。如果外层符号为正,从数轴右上方开始;如果为负,从数轴右下方开始。然后从右至左画线,经过每个零点时在数轴的上方和下方切换。当笔尖到达一个零点时,判断是否 “穿过” 该点:如果该因式的指数为奇数($m_i$ 或 $n_j$ 为奇数),则穿过零点,从上方切到下方或从下方切到上方;如果指数为偶数,则不穿过该点,笔尖接触该点后停留在同一侧继续向左。
  4. 确定结果:画线完成后,曲线在数轴上方的区域表示 $F(x) > 0$,下方的区域表示 $F(x) < 0$。根据题目要求选择符合不等式条件的区间。如果不等式包含 $\geq$ 或 $\leq$ 符号,还需判断区间端点的取值情况。检查每个端点属于分子 $P(x)$ 还是分母 $Q(x)$:如果端点来自 $P(x)$,则可以取该点;如果端点来自 $Q(x)$,则该点不能取。

  

未完成:根轴法画图

例 1 求解不等式 $\displaystyle \frac{x^2 - 1}{x + 2} \leq 0$

   解:

  1. 原不等式等价于 $\begin{cases}(x-1)(x+1)(x+2)\leq0 \\ x+2\neq0\end{cases}$
  2. 求解的零点分别为 $x=-2,-1,1$,标记在数轴上。
  3. 由于外面的符号为正,因此从右上角开始,依次穿过 $1,-1,-2$。
  4. 在数轴下方的部分是 $(-\infty,-2)\cup(-1,1)$。分子的零点分别是 $-1,1$,在这两点处可取等,因此最终结果为 $(-\infty,-2)\cup[-1,1]$。

   根轴法本质上是通过数轴上的符号分析来粗略描绘不等式表达式对应的函数图像,以便确定解集。对于形如 $\displaystyle F(x) = \frac{P(x)}{Q(x)} \geq 0$ 的不等式,由于分母 $Q(x) \neq 0$,即 $\left(Q(x)\right)^2 > 0$ 恒成立,因此可以在不等式两侧同时乘以正数 $\left(Q(x)\right)^2$,从而将不等式 $\displaystyle F(x) \geq 0$ 转化为 $\displaystyle\begin{cases}P(x)Q(x) \geq 0 \\ Q(x) \neq 0\end{cases}$,这与 $F(x) \geq 0$ 具有相同的解集。从数轴右上方还是右下方开始,取决于 $F(x)$ 在 $+\infty$ 处的性质。当 $x$ 趋向于正无穷时,表达式 $F(x)$ 的符号决定了初始的绘图方向(即开始的位置)。至于是否 “穿越” 每个零点及为何 “穿越”,穿越或保持在同侧取决于零点附近 $P(x)$ 或 $Q(x)$ 的变化方向——即它们的指数(奇次还是偶次),这涉及极限分析,此处暂不介绍。

有理方程的解

   和有理不等式类似,形如 $F(x)=0$ 的方程,其中 $\displaystyle F(x)={P(x)\over Q(x)}$ 为一个有理表达式,即 $P(x),Q(x)$ 为多项式,称为有理方程(rational equation)

   求解有理方程比处理不等式要稍微简单一些,因为无需考虑不等号的方向变化。解有理方程的过程主要集中在求出 $P(x) = 0$ 的解 $x_0$。然后,将 $x_0$ 代入 $Q(x)$ 检查 $Q(x_0) \neq 0$ 是否成立。若成立,则 $x_0$ 是 $F(x) = 0$ 的解;否则,需舍弃该解。通常,在求解之前,会先将 $P(x)$ 和 $Q(x)$ 因式分解并约分,以减少复杂性。

   在这个过程里,关键步骤便是求解 $P(x) = 0$,即所谓的多项式方程(polynomial equation)代数方程(algebraic equation)。求解代数方程的过程相对直接,通过因式分解可以得到 $P(x) = P^{m_1}_1(x) \cdots P^{m_p}_p(x)$,然后将各个分解因式分别设为零,从而得出所有解。然而,有些多项式方程如 $(x - 1)^2 = 0$ 包含重根,这是代数方程解的一个独特特性。

定义 1 重根与单根

   如果 $x_0$ 是 $P(x)$ 的根,则 $P(x)$ 可因式分解为:

\begin{equation} P(x) = (x - r)^n \cdot R(x)~. \end{equation}
其中 $R(x_0) \neq 0$。若 $n>1$,则称 $x_0$ 是 $P(x)$ 的重根(multiple root),并且 $n$ 称为这个根的重数(multiplicity);若 $n=1$,则称 $x_0$ 是 $P(x)$ 的单根(single root)

   在学过导数之后,可以从导数的角度理解重根:若多项式 $P(x) = a_n x^n + a_{n-1} x^{n-1} + \cdots + a_1 x + a_0$ 的一个根 $x_0$,满足 $P(x)$ 的某阶导数 $P^{(k)}(x)$ 在 $x_0$ 处的值 $P^{(k)}(x_0)=0$,则称 $x_0$ 为 $P(x)$ 的一个重数为 $k$ 的重根,特别地,当 $k=1$ 时,称为单根。这个定义与上面给出的是等价的。

   重数 $n$ 表示根 $x_0$ 在方程中出现的次数,这一性质赋予多项式在重根处的独特表现。具体来说,在图像上,较高重数的根会使得函数曲线在该根附近的区域表现出一种更 “贴近” 的趋势,且对函数零点附近值的正负关系产生影响。例如,重数为偶数时,曲线在该根处 “贴近” 但不穿越 $x$ 轴,保持同侧;而重数为奇数时,曲线在该根处穿越 $x$ 轴,改变正负关系。在极限计算中,重数越高则该根对整体表达式的影响更为显著。高重数的根会加大函数在该处的 “吸引力”,即函数值在趋近该点时衰减或增长得更快。这种特性在分析函数的行为、研究渐近性和估算变化趋势时尤为重要。

代数基本定理

   从前面的讨论可以看到,不论是有理方程还是有理不等式,求解代数方程都是它们求解过程中的重要部分,那么有没有办法可以快速地知道有多少个解呢?答案是肯定的。法国数学家达朗贝尔(Jean-Baptiste le Rond d'Alembert),在 1746 年详细给出了一个有缺陷的解答,1799 年高斯(Gauss)在他的博士论文中给出了第一个被广泛接受的证明,称作代数基本定理(Fundamental theorem of algebra)

定理 1 代数基本定理

   任何单变量的 $n$ 次多项式方程,在复数域上都有 $n$ 个解,重根按重数计入。

   这意味着,实数作为系数的多项式方程,可以在复数域得到全部解。而这里多项式的系数也可以从实数放松至复数。因此,在复数范围内,可以找到所有复数多项式方程的解。这种特性称为代数封闭(algebraically closed),即此时,代数方程不存在无解的情况。12


1. ^ 注意并非是 “含有字母的等式”,这是一个讹传。
2. ^ 在数学领域深入研究后,这一概念被称为算子(operator),并且具有更严格的定义,会在泛函分析中学习。在计算机科学、物理等其他领域中也会使用 “运算符” 这个术语,但其定义可能有所不同。
3. ^ 在一些领域中,如计算机科学,关系符也可以视作一种特殊的运算符,称作 “关系运算符”,其运算结果是关系判定的真值。例如,$2=3$ 的运算结果为 $\rm False$,而 $2=1+1$ 的运算结果为 $\rm True$。
4. ^ 当然,很多时候,为了区分会将 “equality” 译作等式,而 “equation” 译作方程。
5. ^ 在大学阶段,还会研究各种各样的微分方程,微分方程也是一种方程,只不过它将某个不确定的函数关系作为未知量或求解目标。这时方程的解,也就是使等式成立的条件,就是某个或某类特定的函数。具体可以参见常微分方程简介常微分方程
6. ^ 由于一般情况下 $<,\leq$ 以及 $>,\geq$ 的情况接近,而 $\neq$ 的结论一般是平凡的。下面在讨论时为免麻烦,基本只讨论 $\leq,\geq$ 的情况。
7. ^ 很多时候,如果看到数学领域的 “某某系统”,可能是指 “某某方程组”。
8. ^ 如果一个方程不提供约束时,称其与其他的方程线性相关
9. ^ 有些时候,也会将上述两种情况都称作 “不等式组”,或粗糙地将所有的约束系统都称为 “方程组”。下面统称约束系统
10. ^ 其中,减法可看作加上表达式的相反数,除法则相当于乘以表达式的倒数。由于倒数定义要求 $0$ 没有倒数,因此不能除以 $0$。
11. ^ 此时施加的函数不是单调函数。
12. ^ 鉴于高中阶段对复数的探索比较浅显,此处的内容仅作扩展,详细了解可以参考复变函数

                     

© 小时科技 保留一切权利