自然语言中的”语言“:规则的组合
<aside>
<img src="" alt="" width="40px" /> 1 关键字/保留字 const
int
2 标记符 WhatIsYourName
AnyNumber
3 常量 “123"
4 分割符号 ()
5 操作符号 +
*
⇒表达式⇒语句⇒函数⇒程序
</aside>
形式语言中的“语言”:一个集合【by Chomsky】
<aside> 🚧 1 字母表 $\Sigma$:任意字符(非空性$\Sigma\ne\emptyset$,有穷性,单一性-可区分,不重复) 2 字符串:字母表的任意排列、重复,$\varepsilon$ 为空串 3 语言$L$:任意多个字符串的集合,如$\{\varepsilon\},\empty$,$(\Sigma,L\subseteq \Sigma^)$ 3-1 句子$x$- $x$$\Sigma,\forall L\subseteq \Sigma^,\forall x\in L$
</aside>
既然语言是集合,那么它也可以定义运算。
连接运算:
引入闭包
的概念(方便描述连接后的形式)
克林闭包:A中所有元素的任意次连接构成的集合
$$ A^*=\bigcup_{i=0}^{\infty}A^i. $$
正闭包:
$$ A^+=\bigcup_{i=1}^{\infty}A^i,\\A^*=A^+\bigcup\{\varepsilon\} $$
这样使用闭包的概念,可以标识字母表的所有表示(类似于$\text{span}$的功能)
语言可以从两方面定义,可以证明这两种方法是等价的。
$\textcircled{1}$产生语言:基本句子+句子形成规则(语法规则)↔形式语言;
产生式:$S$ start 符合语言的串;$\to$ 定义为,是,替代为; 推导过程:右边代替左边,$S$等为非终结符,可以递归替换。
定义式:
$$ \left\{\begin{matrix} I\to L\ \ \ \\ I\to LS\\ S\to SS|L|D \end{matrix}\right. $$
$\textcircled{2}$接受语言:模式接受,所有能接受的串构成语言↔自动机;