傻瓜的解析器和编译器.从哪儿开始？

作者：李桂平2402851397 | 2023-09-01 11:10

如何解决《傻瓜的解析器和编译器.从哪儿开始？》经验，为你挑选了1个好方法。

这是一个很好的列表,但对于这个领域的完整newb来说,最好的是什么.一个来自更高级别背景的人(VB6,C#,Java,Python) - 不熟悉C或C++.在这个阶段,我对Lex/Yacc的手写解析更感兴趣.

如果我刚刚主修计算机科学而不是心理学,我可能会在大学里上课.那好吧.

1> Toon Krijthe..：

请看一下:学习编写编译器

也很有趣:

如何编写编程语言

解析我在哪里可以了解它

解析器解释器和编译器的学习资源(好的,你已经提到了这个.

关于这个主题还有更多内容.但我可以简单介绍一下:

第一步是词法分析.字符流被转换为令牌流.令牌可以很简单,如== <= + - (等),它们可以像标识符和数字一样复杂.如果你愿意,我可以详细说明这一点.

下一步是将令牌流转换为syntaxtree或其他表示.这称为解析步骤.

在创建解析器之前,您需要编写语法.例如,我们创建一个表达式解析器:

令牌

addOp = '+' | '-';
mulOp = '*' | '/';
parLeft = '(';
parRight = ')';
number = digit, {digit};
digit = '0'..'9';

Each token can have different representations: + and = are both addOp and 
23 6643 and 223322 are all numbers.

语言

exp = term | exp, addOp, term;  
// an expression is a series of terms separated by addOps.
term = factor | term, mulOp, factor;
// a term is a series of factors separated by mulOps
factor = addOp, factor | parLeft, exp, parRight | number;
// a factor can be an addOp followed by another factor, 
// an expression enclosed in parentheses or a number.

词法分析员

我们创建一个状态引擎,遍历char流,创建一个令牌

s00 
  '+', '-' -> s01       // if a + or - is found, read it and go to state s01.
  '*', '/' -> s02
  '('      -> s03
  ')'      -> s04
  '0'..'9' -> s05
  whitespace -> ignore and retry  // if a whitespace is found ignore it
  else ERROR      // sorry but we don't recognize this character in this state.
s01
  found TOKEN addOp     // ok we have found an addOp, stop reading and return token
s02 
  found TOKEN mulOp
s03
  found TOKEN parLeft
s04
  found TOKEN parRight
s05
  '0'..'9'     -> s05    // as long as we find digits, keep collecting them
  else found number      // last digit read, we have a number

分析器

现在是时候创建一个简单的解析器/评估器了.这在代码中已完成.通常它们是使用表创建的.但我们保持简单.读取令牌并计算结果.

ParseExp
  temp = ParseTerm // start by reading a term
  while token = addOp do
    // as long as we read an addop keep reading terms
    if token('+') then temp = temp + ParseTerm  // + so we add the term
    if token('-') then temp = temp - ParseTerm  // - so we subtract the term
  od
  return temp // we are done with the expression

ParseTerm
  temp = ParseFactor
  while token = mulOp do
    if token('*') then temp = temp * ParseFactor
    if token('/') then temp = temp / ParseFactor
  od
  return temp

ParseFactor
  if token = addOp then
    if token('-') then return - ParseFactor  // yes we can have a lot of these
    if token('+') then return ParseFactor
  else if token = parLeft then
    return ParseExpression
    if not token = parRight then ERROR
  else if token = number then
    return EvaluateNumber   // use magic to translate a string into a number

这是一个简单的例子.在实际示例中,您将看到错误处理是解析器的重要组成部分.

我希望这有点澄清;-).

推荐阅读

程序员
Rcpp函数在给定值的矢量及其频率的情况下找到中值

如何解决《Rcpp函数在给定值的矢量及其频率的情况下找到中值》经验，为你挑选了1个好方法。 ... [详细]
程序员
将动态创建的下拉列表的自定义属性值添加到另一个元素

如何解决《将动态创建的下拉列表的自定义属性值添加到另一个元素》经验，为你挑选了0个好方法。 ... [详细]
程序员
Akka HTTP Streaming JSON反序列化

如何解决《AkkaHTTPStreamingJSON反序列化》经验，为你挑选了0个好方法。 ... [详细]
程序员
睡NSThread Vs. GCD派遣之后

如何解决《睡NSThreadVs.GCD派遣之后》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Laravel Schema Builder在表上设置注释

如何解决《如何使用LaravelSchemaBuilder在表上设置注释》经验，为你挑选了1个好方法。 ... [详细]
程序员
R:删除重复的值并将第一个保留在二进制向量中

如何解决《R:删除重复的值并将第一个保留在二进制向量中》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在Xcode中归档/导出Framework？

如何解决《如何在Xcode中归档/导出Framework？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在其他子元素溢出JQuery时显示子元素

如何解决《如何在其他子元素溢出JQuery时显示子元素》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何基于异步源设置initialValues,例如使用redux-form的ajax调用

如何解决《如何基于异步源设置initialValues,例如使用redux-form的ajax调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
atom-typescript找不到打字

如何解决《atom-typescript找不到打字》经验，为你挑选了1个好方法。 ... [详细]
程序员
char*/字符串连接没有复制？

如何解决《char*/字符串连接没有复制？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在linux mint上安装python3-venv模块

如何解决《在linuxmint上安装python3-venv模块》经验，为你挑选了3个好方法。 ... [详细]
程序员
Microsoft.AspNetCore.Razor.Tools的作用是什么？

如何解决《Microsoft.AspNetCore.Razor.Tools的作用是什么？》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法启动'./qemu/linux-x86_64/qemu-system-i386':没有此类文件或目录

如何解决《无法启动'./qemu/linux-x86_64/qemu-system-i386':没有此类文件或目录》经验，为你挑选了4个好方法。 ... [详细]
程序员
黑客/覆盖Javascript

如何解决《黑客/覆盖Javascript》经验，为你挑选了0个好方法。 ... [详细]
程序员
打字稿,声明和CommonJS

如何解决《打字稿,声明和CommonJS》经验，为你挑选了1个好方法。 ... [详细]
程序员
删除pythonlist中的项目

如何解决《删除pythonlist中的项目》经验，为你挑选了1个好方法。 ... [详细]
程序员
Oracle通过递归获得所有组合可能性

如何解决《Oracle通过递归获得所有组合可能性》经验，为你挑选了1个好方法。 ... [详细]
程序员
删除没有特定扩展名文件的所有文件夹和子目录

如何解决《删除没有特定扩展名文件的所有文件夹和子目录》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么Member Detector后备必须是int？

如何解决《为什么MemberDetector后备必须是int？》经验，为你挑选了0个好方法。 ... [详细]

李桂平2402851397

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章