极限内语言识别是归纳推理的一种形式模型,它是由马克·戈尔德(E. Mark Gold)在他的同名论文介绍的。[1]在这个模型中,他向学习者提供一些形式语言的表示方法(即字符串)。对这个模型的学习过程是无止尽的,每次阅读形式语言的一个符号时,学习者都应该为该语言提供一个表示(例如形式文法)。据说,如果给定一类语言中任何语言的任何表示,学习者可以在极限内识别该类语言,且表达这一语言的错误率较小,并因此在若干数量的步骤中收敛于正确的表示,然而不一定能够保证其正确性,因为一段时间后,任意出现的符号都可能成为该表达的反例。
戈尔德定义了两种类型的表达方式:
这个模型是正式研究可学习性概念的早期尝试。戈尔德的论文[2] 介绍了级别更高的模型作为对比
可学习性的一个弱化了的形式模型是莱斯利·瓦利安特在1984年提出的“可能的近似正确的学习(PAC) ”模型。
教师 | 学习者 | ||
---|---|---|---|
Guess | Query | ||
0. | abab | ||
1. | yes | abab | baba |
2. | yes | a*(ba)*b* | aa |
3. | no | (ab)*(ba)*(ab)*(ba)* | bababa |
4. | yes | (ab+ba)* | babb |
5. | no | (ab+ba)* | baaa |
... | ... |
教师 | 学习者 | |
---|---|---|
1. | abab | abab |
2. | baba | a*(ba)*b* |
3. | aa | (ab)*(ba)*(ab)*(ba)* |
4. | bababa | (ab+ba)* |
5. | babb | (ab+ba)* |
6. | baaa | (ab+ba)* |
7. | ε | (ab+ba)* |
... | ... |
教师 | 学习者 | |
---|---|---|
1. | abab | abab |
2. | ba | abab+ba |
3. | baba | abab+ba+baba |
4. | ba | abab+ba+baba |
5. | baba | abab+ba+baba |
6. | abab | abab+ba+baba |
7. | ε | abab+ba+baba+ε |
... | ... |
教师 | 学习者 | |
---|---|---|
1. | abab | abab |
2. | baba | abab+baba |
3. | baabab | (b+ε)(ab)* |
4. | baabab | (b+ε)(ab)*+baabab |
5. | abbaabba | (ab)*(ba)*(ab)*(ba)* |
6. | baabbaab | (ab+ba)* |
7. | bababa | (ab+ba)* |
... |
了解学习课程的具体例子(在表格中)是很有启发性的,这一课程对极限内语言识别进行了说明。
可学习性模型 | 语言类别 |
---|---|
异常文本表达 | |
递归可枚举 | |
递归的 | |
完整表达 | |
原始递归 | |
上下文敏感 | |
上下文无关 | |
正则 | |
超级有限 | |
普通文本表达 | |
有限 | |
单元素 |
该表显示了在学习模式的极限下哪些语言类别是可识别的。在右边,每个语言类都是所有低级类的超类。每个学习模型(即演示的类型)可以在极限范围内识别比自身等级低的所有类别。需要注意的是,有限语言的类别在极限内可以通过文本表达来识别(参见上面的示例2),而正则语言的类别则不能。
模式语言,由达娜·安格林(Dana Anguin)在1980年的另一篇论文中介绍,[9] 也可以通过正常的文本表达来识别;表中省略了它们,因为它们在单元素语言之上,在原始递归语言类之下,但是它们之间的类不可比。
安格林论文中的条件1[6]并不总是容易验证的。因此,人们提出了语言类别可学习性的各种充分条件。
如果一类语言中的每一个非空字符串集最多包含在有限的多种语言中,则该类语言的厚度是有限的。这正是安格林论文中的条件3。[10] 安格林证明,如果一类递归语言具有有限的厚度,那么它是可以在极限内学习的。[11]
一个有限厚度的类必然满足MEF条件和MFF条件;换句话说,有限厚度意味着=M有限厚度。[12]
如果对于每一个无限的字符串序列… 每一个无限的语言序列 ,存在一个有限的数n 与...不一致 。[13]
证明了一类递归可枚举语言如果具有有限的弹性,则在极限内是可学习的。
收敛前假设变化次数的界限。
如果一类语言中存在一种语言具有无限交叉属性,那么这类语言就具有无限弹性。 如果有无限序列 不同的语言 和有限子集序列 使得:
请注意,L不一定是某类语言。
不难看出,如果一类语言中有一种具有无限交叉性质的语言,那么该类语言就具有无限的弹性。
^Gold, E. Mark (1967). "Language identification in the limit" (PDF). Information and Control. 10 (5): 447–474. doi:10.1016/S0019-9958(67)91165-5..
^p.457.
^Theorem I.8,I.9, p.470-471.
^Theorem I.6, p.469.
^Dana Angluin (1980). "Inductive Inference of Formal Languages from Positive Data" (PDF). Information and Control. 45 (2): 117–135. doi:10.1016/S0019-9958(80)90285-5..
^p.121 top.
^p.123 top.
^Table 1, p.452, in (Gold 1967).
^Dana Angluin (1980). "Finding Patterns Common to a Set of Strings" (PDF). Journal of Computer and System Sciences. 21: 46–62. doi:10.1016/0022-0000(80)90041-0..
^p.123 mid.
^p.123 bot, Corollary 2.
^Andris Ambainis; Sanjay Jain; Arun Sharma (1997). "Ordinal mind change complexity of language identification" (PDF). Computational Learning Theory. LNCS. 1208. Springer. pp. 301–315.; here: Proof of Corollary 29.
^Motoki, Shinohara, and Wright (1991) "The correct definition of finite elasiticity: corrigendum to identification of unions", Proc. 4th Workshop on Computational Learning Theory, 375-375.
^Wright, Keith (1989) "Identification of Unions of Languages Drawn from an Identifiable Class". Proc. 2nd Workwhop on Computational Learning Theory, 328-333; with correction in:[13].
暂无