贡献者: 欄、停敘
相等和不等关系是从小学阶段就开始接触的基础概念,但由此延伸出的方程、不等式、恒等式、方程组、解等概念,许多人往往只有一个模糊的感觉,而并不能清晰描述它们是什么。人教版初中教材中给出的 “方程” 定义是 “含有未知数的等式称作方程(equation)”1,给 “未知数” 的定义则是 “方程的求解目标”,这看上去是一种令人迷惑的循环定义,进而造成有些人困惑形如 $x=3$ 的等式是否也是一个方程。到高中阶段,在高中教材中依然没有系统性的澄清这些概念。
因此,很多学生在阅读题目时,对解题任务的理解感到模糊,不清楚解方程、联立方程究竟意味着什么,这种认识上的模糊甚至延续到大学阶段,影响对更复杂概念的掌握和后续学习的进展,很多研究者在使用这些术语时也很混乱。本文旨在解决上面提到的问题。等式和不等式在定义上几乎完全相同,两者的区别主要在于所使用的关系符号不同,以及由此导致的操作规则的变化。为了简化理解,可以先专注于等式的定义。一旦掌握了等式的概念和性质,再推广到不等式就会变得更加容易。
下面会先介绍一些基础概念。这些概念的数量很多且前后勾连,且有不少与教材上语焉不详的定义存在出入。这里不要求完整记忆,只需要认真理解并清楚自己脑海中习惯的表达与下面概念的对应即可。
表示数学运算的符号,如加、减、乘、除及各种函数(例如 $\sin,\cos$)等,被称为运算符(operator)2。在数学学习的基础阶段经常会接触到的五种基本运算符——加、减、乘、除及有理数次的乘方——被归类为代数运算符(algebraic operators)。这些代数运算符专注于基本的算术计算,是构建许多数学表达式的核心部分。
用于表示两个数学元素之间关系的符号称为关系符(relation)3。例如,“$>$”、“$<$”、“$\leq$”、“$\geq$”、“$\neq$” 这些符号称为不等号(inequality symbols),而 “$=$” 称为等号(equality symbol)。此外,还有许多关系符号,比如:在集合论中,有表示包含关系 “$\subset$” 和表示属于关系的 “$\in$”;在几何中,有表示平行关系的 “$\mathrel{/\mskip-2.5mu/}$” 和垂直关系的 “$\perp$”;在数理逻辑中,有表示等价关系的 “$\equiv$”、表示蕴含关系的 “$\Rightarrow$” 以及表示互为充要条件关系的 “$\iff$” 等。
由数字、变量和运算符组成的数学符号组合称为数学表达式(mathematical expression),或简称表达式(expression),也叫式子。表达式可以被看作一种 “描述工具”,其主要作用在于用符号表示某种数学上的数量关系或状态,而不一定需要得到一个具体的数值。例如,$3x + 2$ 和 $ \sin\left(x\right) $ 都是表达式,它们描述了一种数量关系或函数的性质,而不是一道必须求解的题目。
表达式可以通过各种数学操作来进行简化和转化,比如合并同类项、约分等,这些操作称为 “恒等变形”。在特定情况下,如果知道表达式中变量的具体值,还可以将该值代入表达式,从而计算出一个数值结果。
在初中阶段学习的代数式(algebraic expression)是一个特定类型的数学表达式。代数式仅由代数运算符连接数或字母组成,比如 $2x + 3$ 或 $x^2 - 4x + 4$。这也意味着代数式的运算范围相对有限,通常只涉及基本的代数运算,而不会涉及如三角函数或对数等更复杂的运算。可以说,代数式是表达式中的 “基础款”。代数式的核心特点在于运算简单且易于处理,是数学学习的入门工具。
在介绍下面的概念之前,有必要先引入一个英语单词 “equation”。它在中文中通常翻译为 “方程” 或 “等式”。这里提到的 “方程” 并不完全等同于日常所理解的方程。为了避免混淆,本节接下来的内容将统一使用 “等式” 一词4。等式(equation)是指由等号($=$)连接两个表达式构成的数学符号组合,表示二者之间的相等关系。
如果将等式中的表达式视为函数的对应关系,那么等式可以看作是描述两个函数之间的相等关系。这时,称函数的自变量称为未知数(unknown),而使等式成立的条件称为等式的解(solution),这里对应的就是未知数的取值5,也称 “解满足给定的方程”,所有满足等式的解构成的集合称为解集(solution set)。如果没有值使条件成立,则解集为空集。
根据未知数允许的取值范围 $M$ 与解集 $S$ 的交集 $C=M\cap S$ 的不同情况,可以将等式分为以下几类:
总之,理解概念是最重要的。在中文用词上,通常 “等式” 这个词包含了上面提到的三种类型——矛盾式、条件等式和恒等式。而 “方程” 则特指条件等式,表示在特定条件下成立的等式,“方程无解” 则指矛盾等式,之后不引起歧义时也会如此使用。在解题和讨论时,明确所指的对象,可以避免不必要的混淆。
现在回答 “如何看待 $x = 3$?” 这个问题。$x = 3$ 既可以看作是一个方程(条件等式),即一个条件下成立的等式;也可以看作是这个方程的解(恒等式),即它的取值范围是解集 $\{3\}$。从解的角度来看,可以将 $x = 3$ 表示为 $x \in \{3\}$。这种写法清晰地表明了 $x$ 是要表示的值,而非条件等式的情况,可以避免歧义。因此,在不产生歧义的情况下,通常直接使用 $x = 3$ 来表示解,而需要特别强调解集时采用解集的写法会更为精确,尤其是在讨论不等式时。
等式具有对称性和传递性,即:
在理解了等式那些错综复杂的概念之后,不等式的定义就更容易掌握了。不等式(inequation)是由不等号连接两个表达式组成的数学符号组合,用来表示两个表达式之间的不等关系6。“不等式” 是一个宽泛的称谓,无论解集与给定范围的关系如何,只要包含不等号都会称为不等式,这使得在使用时会容易忽略它到底是指一个具有条件解的 “不等式方程” 还是一个在所有取值范围上都成立的 “恒等不等式”(这两个术语并非正式定义,仅用作便于理解的表述)。
在不等式的研究中,许多概念,例如未知数、解、解集,以及矛盾不等式、条件不等式和恒成立不等式,与等式中的定义类似,仅仅因为不等号的存在而带来了一些细微的差别。在理解不等式时,以下两个要点尤其重要:
不等式也具有传递性,即若 $a\leq b,b\leq c$,则 $a\leq c$,更换不等号也成立。但不等式没有对称性,即若 $a\leq b$,无法得到 $b\leq a$,不等式的对称性称作反对称性,即如果想要成立需要改变不等号方向。事实上不等式的复杂之处往往体现在不等号的开口方向上。
在初中时,就已经接触过方程组,当时给出的定义是 “把两个必须同时满足的方程合在一起组成一个方程组”。这个定义虽然简单,但传达了一个核心概念,即方程组涉及的每个方程都必须同时成立。用大括号将多个方程括在一起,正是为了表示它们的联合条件。
方程组(system of equations)指的就是一组需要同时成立的方程。注意到这里使用的英语单词是 “system”,中文里它通常翻译为 “系统”。因此其实可以将方程组看作是一个 “系统”,或者说方程组本身就是描述了一个系统7。每个等式的解集 $S_i$ 都相当于要从总体范围 $M$ 中划分出一部分,这一过程就像描述 “硬的、红色的、圆的水果”,每个描述词(“硬的”、“红色的”、“圆的”)都对 “水果” 进行了限定,而每个方程也都类似于为系统添加了一个限制条件,这个过程中的限制条件称为约束(constraint),从 “约束” 的角度理解方程组提供了一个重要的视角。最终,所有的形容词同时成立的水果指的是包含 “苹果” 水果等构成的集合,而同样地,同时使所有方程成立的条件称为方程组的解(solution),而方程组的解集也就是各方程解集的交集。
方程组中的方程经过变形后,在大多数情况下8,一个方程会对一个变量提供约束,从而,通常方程组是针对多个变量的。
不仅方程可以用来描述约束,不等式也可以发挥类似的作用。通常,只有不等式构成的一组称为不等式组(system of inequalities)。如果既包含等式又包含不等式,则直接称为约束系统(system of constraints)9。约束系统通常出现在优化问题中,尤其是在线性规划和非线性规划中。在这些情境中,线性系统(linear system)和非线性系统(nonlinear system)的定义取决于方程组中方程的类型(线性或非线性)。无论是方程组、不等式组还是约束系统,其解集都由所有约束条件共同定义,即由使所有约束同时成立的变量值构成。
对于两个表达式 $f$ 和 $g$,方程组 $\begin{cases}f = 0 \\ g = 0\end{cases}$ 与方程 $f \cdot g = 0$ 的区别体现了 “交集与并集”,“且与或” 的性质,这个性质在解析几何中有着重要的应用:
简单来说,方程组 $\begin{cases}f = 0 \\ g = 0\end{cases}$ 的解集是 $f = 0$ 和 $g = 0$ 解集的交集,而方程 $f \cdot g = 0$ 的解集是它们的并集。
1. ^ 注意并非是 “含有字母的等式”,这是一个讹传。
2. ^ 在数学领域深入研究后,这一概念被称为算子(operator),并且具有更严格的定义,会在泛函分析中学习。在计算机科学、物理等其他领域中也会使用 “运算符” 这个术语,但其定义可能有所不同。
3. ^ 在一些领域中,如计算机科学,关系符也可以视作一种特殊的运算符,称作 “关系运算符”,其运算结果是关系判定的真值。例如,$2=3$ 的运算结果为 $\rm False$,而 $2=1+1$ 的运算结果为 $\rm True$。
4. ^ 当然,很多时候,为了区分会将 “equality” 译作等式,而 “equation” 译作方程。
5. ^ 在大学阶段,还会研究各种各样的微分方程,微分方程也是一种方程,只不过它将某个不确定的函数关系作为未知量或求解目标。这时方程的解,也就是使等式成立的条件,就是某个或某类特定的函数。具体可以参见常微分方程简介或常微分方程
6. ^ 由于一般情况下 $<,\leq$ 以及 $>,\geq$ 的情况接近,而 $\neq$ 的结论一般是平凡的。下面在讨论时为免麻烦,基本只讨论 $\leq,\geq$ 的情况。
7. ^ 很多时候,如果看到数学领域的 “某某系统”,可能是指 “某某方程组”。
8. ^ 如果一个方程不提供约束时,称其与其他的方程线性相关。
9. ^ 有些时候,也会将上述两种情况都称作 “不等式组”,或粗糙地将所有的约束系统都称为 “方程组”。下面统称约束系统。