源代码仓库:CompilePrincipleLearning/experiment_2 · yusixian/CompilePrincipleLearning (github.com)
一. 实验目的
二. 实验内容及要求
编写识别单词的词法分析程序。
根据某一文法编制调试LL(1)分析程序,以便对任意输入的符号串进行分析。本次实验的目的主要是加深对预测分析LL(1)分析法的理解。
例:对下列文法,用LL(1)分析法对任意输入的符号串进行分析:
(1)E->TG
(2)G->+TG|—TG
(3)G->ε
(4)T->FS
(5)S->*FS|/FS
(6)S->ε
(7)F->(E)
(8)F->i
输出的格式如下:
(1) LL(1)分析程序,编制人:姓名,学号,班级
(2) 输入一以#结束的符号串(包括 +*()i#
):i*(i+i)+(i*i)#
(3) 输出过程步骤如下:
(4)输入符号串为非法符号串(或者为合法符号串)
备注:
(1) 在“ 所用产生式 ”一列中如果对应有推导则写出所用产生式;如果为匹配终结符则写明匹配的终结符;如分析异常出错则写为“分析出错”;若成功结束则写为“分析成功”。
(2)在此位置输入符号串为用户自行输入的符号串。
(3)上述描述的输出过程只是其中一部分的。
注意:1.表达式中允许使用运算符(+-*/)、分割符(括号)、字符i,结束符#;
2.如果遇到错误的表达式,应输出错误提示信息(该信息越详细越好);
3.对学有余力的同学,测试用的表达式事先放在文本文件中,一行存放一个表达式,同时以分号分割。同时将预期的输出结果写在另一个文本文件中,以便和输出进行对照;
4.可采用的其它的文法
三. 实验过程
1、采用的数据结构
产生式类型定义为type,左侧为origin,大写字符,右侧产生的字符
struct type { /*产生式类型定义 */
char origin; /*产生式左侧字符 大写字符 */
string array; /*产生式右边字符 */
int length; /*字符个数 */
type():origin('N'), array(""), length(0) {}
void init(char a, string b) {
origin = a;
array = b;
length = array.length();
}
};
初始化数据结构如下:
e.init('E', "TG"), t.init('T', "FS");
g.init('G', "+TG"), g1.init('G', "^");
s.init('S', "*FS"), s1.init('S', "^");
f.init('F', "(E)"), f1.init('F', "i");
2、头文件声明和全局变量定义
如下
#include <iostream>
#include <string>
#include <fstream>
#include <vector>
#include <cstring>
using namespace std;
const string ExpFileName = "./exp.txt";
char analyeStack[20]; /*分析栈*/
char restStack[20]; /*剩余栈*/
const string v1 = "i+*()#"; /*终结符 */
const string v2 = "EGTSF"; /*非终结符 */
const string acceptStr = "i+*()#"; // 接受的字符串
int top, ridx, len; /*len为输入串长度 */
struct type { /*产生式类型定义 */
char origin; /*产生式左侧字符 大写字符 */
string array; /*产生式右边字符 */
int length; /*字符个数 */
type():origin('N'), array(""), length(0) {}
void init(char a, string b) {
origin = a;
array = b;
length = array.length();
}
};
type e, t, g, g1, s, s1, f, f1; /* 产生式结构体变量 */
type C[10][10]; /* 预测分析表 */
4、函数汇总
(1)函数汇总表
读取文件函数,返回一个string动态数组,以行数分割
主程序入口,从此进入,填充初始分析表及产生式初始化,调用读取文件函数开始分析
(2)函数的调用关系
5、实验结果
输入
文件exp.txt
i*(i+i)+(i*i)#
i*i-i/1#
i+i*i+i*(i+i*i)#
i+*i(i)+i(i+i*i)#
i+i(i)#code.txt
输出
完整代码
/*
* @Author: cos
* @Date: 2022-04-12 23:03:36
* @LastEditTime: 2022-04-13 01:32:58
* @LastEditors: cos
* @Description:
* @FilePath: \CS\experiment_2\main.cpp
*/
#include <iostream>
#include <string>
#include <fstream>
#include <vector>
#include <cstring>
using namespace std;
const string ExpFileName = "./exp.txt";
char analyeStack[20]; /*分析栈*/
char restStack[20]; /*剩余栈*/
const string v1 = "i+*()#"; /*终结符 */
const string v2 = "EGTSF"; /*非终结符 */
int top, ridx, len; /*len为输入串长度 */
struct type { /*产生式类型定义 */
char origin; /*产生式左侧字符 大写字符 */
string array; /*产生式右边字符 */
int length; /*字符个数 */
type():origin('N'), array(""), length(0) {}
void init(char a, string b) {
origin = a;
array = b;
length = array.length();
}
};
type e, t, g, g1, s, s1, f, f1; /* 产生式结构体变量 */
type C[10][10]; /* 预测分析表 */
void print() {/*输出分析栈和剩余栈 */
for(int i = 0; i <= top + 1; ++i) /*输出分析栈 */
cout << analyeStack[i];
cout << "\t\t";
for(int i = 0; i < ridx; ++i) /*输出对齐符*/
cout << ' ';
for(int i = ridx; i <= len; ++i) /*输出剩余串*/
cout << restStack[i];
cout << "\t\t\t";
}
// 读文件
vector<string> readFile(string fileName) {
vector<string> res;
try {
ifstream fin;
fin.open(fileName);
string temp;
while (getline(fin, temp))
res.push_back(temp);
return res;
} catch(const exception& e) {
cerr << e.what() << '\n';
return res;
}
}
bool isTerminator(char c) { // 判断是否是终结符
return v1.find(c) != string::npos;
}
void init(string exp) {
top = ridx = 0;
len = exp.length(); /*分析串长度*/
for(int i = 0; i < len; ++i)
restStack[i] = exp[i];
}
void analyze(string exp) { // 分析一个文法
init(exp);
int k = 0;
analyeStack[top] = '#';
analyeStack[++top] = 'E'; /*'#','E'进栈*/
cout << "步骤\t\t分析栈 \t\t剩余字符 \t\t所用产生式 " << endl;
while(true) {
char ch = restStack[ridx];
char x = analyeStack[top--]; /*x为当前栈顶字符*/
cout << ++k << "\t\t";
if(x == '#') {
cout << "分析成功!AC!\n" << endl; /*接受 */
return;
}
if(isTerminator(x)) {
if (x == ch) { // 匹配上了
print();
cout << ch << "匹配" << endl;
ch = restStack[++ridx]; /*下一个输入字符*/
} else { /*出错处理*/
print();
cout << "分析出错,错误终结符为" << ch << endl; /*输出出错终结符*/
return;
}
} else { /*非终结符处理*/
int m, n; // 非终结符下标, 终结符下标
v2.find(x) != string::npos ? m = v2.find(x) : -1; // m为-1则说明找不到该非终结符,出错
v1.find(ch) != string::npos ? n = v1.find(ch) : -1; // n为-1则说明找不到该终结符,出错
if(m == -1 || n == -1) { /*出错处理*/
print();
cout << "分析出错,错误非终结符为" << x << endl; /*输出出错非终结符*/
return;
}
type nowType = C[m][n];/*用来接受C[m][n]*/
if(nowType.origin != 'N') {/*判断是否为空*/
print();
cout << nowType.origin << "->" << nowType.array << endl; /*输出产生式*/
for (int j = (nowType.length - 1); j >= 0; --j) /*产生式逆序入栈*/
analyeStack[++top] = nowType.array[j];
if (analyeStack[top] == '^') /*为空则不进栈*/
top--;
} else { /*出错处理*/
print();
cout << "分析出错,错误非终结符为" << x << endl; /*输出出错非终结符*/
return;
}
}
}
}
int main() {
e.init('E', "TG"), t.init('T', "FS");
g.init('G', "+TG"), g1.init('G', "^");
s.init('S', "*FS"), s1.init('S', "^");
f.init('F', "(E)"), f1.init('F', "i"); /* 结构体变量 */
/*填充分析表*/
C[0][0] = C[0][3] = e;
C[1][1] = g;
C[1][4] = C[1][5] = g1;
C[2][0] = C[2][3] = t;
C[3][2] = s;
C[3][4] = C[3][5] = C[3][1] = s1;
C[4][0] = f1; C[4][3] = f;
cout << "LL(1)分析程序分析程序,编制人:xxx xxx 计科xxxx班" << endl;
cout << "提示:本程序只能对由'i','+','*','(',')'构成的以'#'结束的字符串进行分析,每行一个读入的字符串" << endl;
cout << "读取的文件名为:" << ExpFileName << endl;
vector<string> exps = readFile(ExpFileName);
int len = exps.size();
for(int i = 0; i < len; i++) {
string exp = exps[i];
cout << "------------------待分析字符串" << i+1 << ":"<< exp << "--------------------" << endl;
bool flag = true;
for(int j = 0; j < exp.length(); j++) {
if(!isTerminator(exp[j])) {
cout << "第"<< i+1 << "行输入的字符串不合法,请重新输入" << endl;
flag = false;
break;
}
}
if(flag) {
cout << "字符串" << i+1 << ":" << exp << endl;
analyze(exp);
}
}
return 0;
}