编译原理实验三、词法分析实验报告

单词/符号	编码	正规式
begin	beginsym	begin
end	endsym	end
input	inputsym	input
output	outputsym	output
if	ifsym	if
then	thensym	then
else	elsesym	else
elif	elifsym	elif
do	dosym	do
while	whilesym	while
break	breaksym	break
var	varsym	var
and	andsym	and
or	orsym	or
not	notsym	not
true	truesym	true
false	falsesym	false

标识符：

单词/符号	编码	正规式
<标识符>	ident	(字母)(字母\|数字)*

常数：

单词/符号	编码	正规式
<常数>	digit	(数字)(数字)*

运算符：

单词/符号	编码	正规式
+	plus	+
-	minus	-
*	times	*
/	divide	/
%	mod	%
=	becomes	=
==	eql	==
!=	neq	!=
<	lss	<
<=	leq	<=
>	gtr	>
>=	geq	>=

界符：

单词/符号	编码	正规式
(	lparen	(
)	rparen	)
[	lbracket	[
]	rbracket	]
{	lcurbkt	{
}	rcurbkt	}
,	comma	,
.	period	.

输入样例：

begin

var a = 6

if a%2 != 0

then a=a+1

else a=a-1

end

输出样例：

(beginsym , begin)

(varsym , var)

(ident , a)

(becomes , =)

(digit , 6)

(ifsym , if)

(ident , a)

(mod , %)

(digit , 2)

(neq , !=)

(digit , 0)

(thensym , then)

(ident , a)

(becomes , =)

(ident , a)

(plus , +)

(digit , 1)

(elsesym , else)

(ident , a)

(becomes , =)

(ident , a)

(minus , -)

(digit , 1)

(endsym , end)

注：本次实验会进行大量的字符串处理及查表操作，建议各位同学使用C++、Java或python语言完成作业，不建议使用C语言。

三、实验环境

Windows或Linux系统，gcc 7.3.0，g++ 7.3.0，Java JDK 1.8，Python 3.6(以上编译器\解释器均可使用更高版本)。

四、数据准备

data文件夹下的三个txt文件，为本次实验中需要进行词法分析的源程序代码数据。

五、词法分析器程序设计描述

六、词法分析器程序实现展示

关键模块：

初始化数据keyWord、keyCode、symbolCode

class Classfier{

private:

mapkeyCode,symbolCode;

setkeyWord;

public:

Classfier(){

keyCode.insert(pair("begin","beginsym"));

keyCode.insert(pair("end","endsym"));

keyCode.insert(pair("input","inputsym"));

keyCode.insert(pair("output","outputsym"));

keyCode.insert(pair("if","ifsym"));

keyCode.insert(pair("then","thensym"));

keyCode.insert(pair("else","elsesym"));

keyCode.insert(pair("elif","elifsym"));

keyCode.insert(pair("do","dosym"));

keyCode.insert(pair("while","whilesym"));

keyCode.insert(pair("break","breaksym"));

keyCode.insert(pair("var","varsym"));

keyCode.insert(pair("and","andsym"));

keyCode.insert(pair("or","orsym"));

keyCode.insert(pair("not","notsym"));

keyCode.insert(pair("true","truesym"));

keyCode.insert(pair("false","falsesym"));

keyWord.insert("begin");

keyWord.insert("end");

keyWord.insert("input");

keyWord.insert("output");

keyWord.insert("if");

keyWord.insert("then");

keyWord.insert("else");

keyWord.insert("elif");

keyWord.insert("do");

keyWord.insert("while");

keyWord.insert("break");

keyWord.insert("var");

keyWord.insert("and");

keyWord.insert("or");

keyWord.insert("not");

keyWord.insert("true");

keyWord.insert("false");

symbolCode.insert(pair("+","puls"));

symbolCode.insert(pair("-","minus"));

symbolCode.insert(pair("*","times"));

symbolCode.insert(pair("/","divide"));

symbolCode.insert(pair("%","mode"));

symbolCode.insert(pair("=","becomes"));

symbolCode.insert(pair("==","eql"));

symbolCode.insert(pair("!=","neq"));

symbolCode.insert(pair("<","lss"));

symbolCode.insert(pair("<=","leq"));

symbolCode.insert(pair(">","gtr"));

symbolCode.insert(pair(">=","geq"));

symbolCode.insert(pair("(","lparen"));

symbolCode.insert(pair(")","rparen"));

symbolCode.insert(pair("[","lbracket"));

symbolCode.insert(pair("]","rbracket"));

symbolCode.insert(pair("{","lcurbkt"));

symbolCode.insert(pair("}","lcurbkt"));

symbolCode.insert(pair(",","comma"));

symbolCode.insert(pair(".","period"));

}

判断字符是否为数字或字母函数、判断字符串是否为数字或关键字函数、输出函数

bool isLetter(char ch){

if((ch>='A'&&ch<='Z')||(ch>='a'&&ch<='z')){

return true;

}else{

return false;

}

bool isNumber(char ch){

if(ch>='0'&&ch<='9'){

return true;

}else{

return false;

}

void printResult(string code,string word){

cout<<"("<

}

代码：

#include

using namespace std;

#define IDENT "ident"

#define DIGIT "digit"

#define ERROR "error"

bool isLetter(char ch){

if((ch>='A'&&ch<='Z')||(ch>='a'&&ch<='z')){

return true;

}else{

return false;

}

bool isNumber(char ch){

if(ch>='0'&&ch<='9'){

return true;

}else{

return false;

}

void printResut1(string code,string word){

cout<<"("<

}

class Classfier{

private:

mapkeyCode,symbolCode;

setkeyWord;

public:

Classfier(){

keyCode.insert(pair("begin","beginsym"));

keyCode.insert(pair("end","endsym"));

keyCode.insert(pair("input","inputsym"));

keyCode.insert(pair("output","outputsym"));

keyCode.insert(pair("if","ifsym"));

keyCode.insert(pair("then","thensym"));

keyCode.insert(pair("else","elsesym"));

keyCode.insert(pair("elif","elifsym"));

keyCode.insert(pair("do","dosym"));

keyCode.insert(pair("while","whilesym"));

keyCode.insert(pair("break","breaksym"));

keyCode.insert(pair("var","varsym"));

keyCode.insert(pair("and","andsym"));

keyCode.insert(pair("or","orsym"));

keyCode.insert(pair("not","notsym"));

keyCode.insert(pair("true","truesym"));

keyCode.insert(pair("false","falsesym"));

keyWord.insert("begin");

keyWord.insert("end");

keyWord.insert("input");

keyWord.insert("output");

keyWord.insert("if");

keyWord.insert("then");

keyWord.insert("else");

keyWord.insert("elif");

keyWord.insert("do");

keyWord.insert("while");

keyWord.insert("break");

keyWord.insert("var");

keyWord.insert("and");

keyWord.insert("or");

keyWord.insert("not");

keyWord.insert("true");

keyWord.insert("false");

symbolCode.insert(pair("+","puls"));

symbolCode.insert(pair("-","minus"));

symbolCode.insert(pair("*","times"));

symbolCode.insert(pair("/","divide"));

symbolCode.insert(pair("%","mode"));

symbolCode.insert(pair("=","becomes"));

symbolCode.insert(pair("==","eql"));

symbolCode.insert(pair("!=","neq"));

symbolCode.insert(pair("<","lss"));

symbolCode.insert(pair("<=","leq"));

symbolCode.insert(pair(">","gtr"));

symbolCode.insert(pair(">=","geq"));

symbolCode.insert(pair("(","lparen"));

symbolCode.insert(pair(")","rparen"));

symbolCode.insert(pair("[","lbracket"));

symbolCode.insert(pair("]","rbracket"));

symbolCode.insert(pair("{","lcurbkt"));

symbolCode.insert(pair("}","lcurbkt"));

symbolCode.insert(pair(",","comma"));

symbolCode.insert(pair(".","period"));

}

~Classfier(){

keyCode.empty();

symbolCode.empty();

keyWord.empty();

}

bool isKeyWord(string word){

set::iterator it = keyWord.find(word);

return !(it == keyWord.end());

}

bool isDigit(string word){

int size = word.size();

for(int i=0;i

if(!isNumber(word[i])){

return false;

}

return true;

}

string getKeyWordCode(string word){

return keyCode[word];

}

string getSymbolCode(string symbol){

return symbolCode[symbol];

}

};

int main(){

string path;

Classfier clsfier;

cout<<"请输入要进行词法分析的文件名：";

cin>>path;

fstream file;

file.open(path.c_str(),ios::in);

while(!file.is_open()){

cout<<"文件打开失败，请重新输入：";

cin>>path;

file.open(path.c_str(), ios::in);

}

string line;

while(getline(file,line)){

if(line.empty()) continue;

int size = line.size(),i=0;

while(i

if(line[i]==' '){

while(i

++i;

}

}else if(isLetter(line[i])){

string word;

while(i

word.push_back(line[i++]);

}

if(clsfier.isKeyWord(word)){

printResut1(clsfier.getKeyWordCode(word),word);

}else{

printResut1(IDENT,word);

}

}else if(isNumber(line[i])){

string word;

while(i

word.push_back(line[i++]);

}

if(clsfier.isDigit(word)){

printResut1(DIGIT,word);

}else{

printResut1(ERROR,word);

}

}else if(line[i]=='='||line[i]=='<'||line[i]=='<'){

string word;

word.push_back(line[i++]);

if(line[i]=='='){

word.push_back(line[i++]);

printResut1(clsfier.getSymbolCode(word),word);

}else{

printResut1(clsfier.getSymbolCode(word),word);

}

}else if(line[i]=='!'){

string word;

word.push_back(line[i++]);

if(line[i]=='='){

word.push_back(line[i++]);

printResut1(clsfier.getSymbolCode(word),word);

}else{

printResut1(ERROR,word);

}

}else{

string word;

word.push_back(line[i++]);

switch(word[0]){

case'+':

case'-':

case'*':

case'/':

case'%':

case'(':

case')':

case'[':

case']':

case'{':

case'}':

case',':

case'.':

printResut1(clsfier.getSymbolCode(word),word);

break;

default:

printResut1(ERROR,word);

break;

}

file.close();

return 0;

}

七、实验结果及分析

第一组实验：

运行结果：

第二组实验：

实验结果：

第三组实验：

输出结果：

八、实验心得体会

本次实验进行了大量的字符串处理及查表操作，需要思路清晰，以及在细节上的处理，最难的地方在于找逻辑关系。通过如何设计、编制并调试词法分析程序，把理论知识应用于实验中，理解了词法分析在整个编译过程中的作用，掌握了词法分析的基本原理及运行过程，也让我重新熟悉了C++的相关内容，对以后的编程有很大的帮助。

相关阅读:
nesp实验八路由器RIP协议路由实验
 LM2904DT运算放大器中文资料规格书PDF数据手册引脚图参数图片功能概述
 #gStore-weekly | gStore源码解析（四）：安全机制之黑白名单配置解析
 机器人运动学、动力学与控制及Matlab实现
 【Python】Python 子类继承父类构造函数说明
 攻防世界-WEB-easyupload
【动态规划】Leetcode 279. 完全平方数【中等】
python渗透测试入门——取代netcat
hadoop 大数据环境配置 ssh免密登录 centos配置免密登录 hadoop(四)
iterative farthest point sample (IFPS or FPS)
原文地址：https://blog.csdn.net/m0_56638814/article/details/127690954

编译原理实验三、 词法分析实验报告

关键模块：

代码：

第一组实验：

第二组实验：

第三组实验：

编译原理实验三、词法分析实验报告