4赞

如何在ANTLR 3中处理字符串文字中的转义序列？

作者：手机用户2402851155 | 2023-08-31 11:14

如何解决《如何在ANTLR3中处理字符串文字中的转义序列？》经验，为你挑选了2个好方法。

我一直在查看ANTLR v3文档(以及我对"The Definitive ANTLR reference"的可靠副本),我似乎无法找到一种在字符串文字中实现转义序列的简洁方法(我目前正在使用Java目标).我希望能够做到这样的事情:

fragment 
ESCAPE_SEQUENCE
    : '\\' '\'' { setText("'"); }
    ;

STRING  
    : '\'' (ESCAPE_SEQUENCE | ~('\'' | '\\'))* '\''
      { 
        // strip the quotes from the resulting token
        setText(getText().substring(1, getText().length() - 1));
      } 
    ;

例如,我希望输入标记" 'Foo\'s House'"成为字符串" Foo's House".

不幸的是,片段中的setText(...)调用ESCAPE_SEQUENCE设置了整个STRING令牌的文本,这显然不是我想要的.

有没有办法实现这个语法而不添加一个方法来返回结果字符串并手动替换转义序列(例如,setText(escapeString(getText()))在STRING规则中的某些内容)？

1> Bruno Ransch..：

以下是我在我编写的JSON解析器中完成此操作的方法.

STRING      
@init{StringBuilder lBuf = new StringBuilder();}
    :   
           '"' 
           ( escaped=ESC {lBuf.append(getText());} | 
             normal=~('"'|'\\'|'\n'|'\r')     {lBuf.appendCodePoint(normal);} )* 
           '"'     
           {setText(lBuf.toString());}
    ;

fragment
ESC
    :   '\\'
        (   'n'    {setText("\n");}
        |   'r'    {setText("\r");}
        |   't'    {setText("\t");}
        |   'b'    {setText("\b");}
        |   'f'    {setText("\f");}
        |   '"'    {setText("\"");}
        |   '\''   {setText("\'");}
        |   '/'    {setText("/");}
        |   '\\'   {setText("\\");}
        |   ('u')+ i=HEX_DIGIT j=HEX_DIGIT k=HEX_DIGIT l=HEX_DIGIT
                   {setText(ParserUtil.hexToChar(i.getText(),j.getText(),
                                                 k.getText(),l.getText()));}

        )
    ;

我使用了这种方法,但请注意,我必须在每一步附加"getText()"而不是"escaped.getText()".该片段将未转义的文本写入整个STRING令牌,getText()返回该令牌.对我来说,escaped.getText()返回原始片段,反斜杠完好无损.

2> 小智..：

对于ANTLR4,Java目标和标准转义字符串语法,我使用了一个专用的单例类:CharSupport来翻译字符串.它在antlr API中可用:

STRING          :   '"' 
                (   ESC  
                |   ~('"'|'\\'|'\n'|'\r') 
                )* 
                    '"' { 
                        setText( 
                            org.antlr.v4.misc.CharSupport.getStringFromGrammarStringLiteral(
                                getText()
                            )
                        ); 
                    }
                ;

正如我在V4文档和实验中看到的那样,lexer部分不再支持@init!

推荐阅读

程序员
GetWindowRect返回包含"不可见"边框的大小

如何解决《GetWindowRect返回包含"不可见"边框的大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
给定一个数组,找到小于c的n个数字的组合

如何解决《给定一个数组,找到小于c的n个数字的组合》经验，为你挑选了0个好方法。 ... [详细]
程序员
我如何找到谷歌bigquery数据集大小,而不是表大小

如何解决《我如何找到谷歌bigquery数据集大小,而不是表大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
基于Python中的键的多个词典中的平均值？

如何解决《基于Python中的键的多个词典中的平均值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ggplot和png的rmarkdown错误

如何解决《ggplot和png的rmarkdown错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
将远程转储还原到RDS

如何解决《将远程转储还原到RDS》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何限制nohup.out日志的大小

如何解决《如何限制nohup.out日志的大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查Eigen :: Matrix4f是否接近单位矩阵？

如何解决《如何检查Eigen::Matrix4f是否接近单位矩阵？》经验，为你挑选了1个好方法。 ... [详细]
程序员
React Native,TouchableOpacity包装浮动按钮什么都没得到

如何解决《ReactNative,TouchableOpacity包装浮动按钮什么都没得到》经验，为你挑选了1个好方法。 ... [详细]
程序员
C中头文件中的内联函数

如何解决《C中头文件中的内联函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
反序列化非标准字符串

如何解决《反序列化非标准字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
脚本返回"已杀"

如何解决《脚本返回"已杀"》经验，为你挑选了1个好方法。 ... [详细]
程序员
将非必需的字符串属性从null水合为空字符串

如何解决《将非必需的字符串属性从null水合为空字符串》经验，为你挑选了0个好方法。 ... [详细]
程序员
加载模板dom时,angular2模板/钩子中的脚本标记

如何解决《加载模板dom时,angular2模板/钩子中的脚本标记》经验，为你挑选了2个好方法。 ... [详细]
程序员
GIT推送错误 - 重复请求

如何解决《GIT推送错误-重复请求》经验，为你挑选了1个好方法。 ... [详细]
程序员
node.js可以排队多少个事件？

如何解决《node.js可以排队多少个事件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何获得火花工作的指标？

如何解决《如何获得火花工作的指标？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在通过Openpyxl创建的图表中显示数据标签

如何解决《如何在通过Openpyxl创建的图表中显示数据标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Ruby 2.2.3和rest-client保存文件

如何解决《如何使用Ruby2.2.3和rest-client保存文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
流程中的集合执行策略

如何解决《流程中的集合执行策略》经验，为你挑选了1个好方法。 ... [详细]

手机用户2402851155

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章