4赞

为什么SparkSQL在SQL查询中需要两个字面转义反斜杠？

作者：wurtjq | 2023-09-06 19:00

如何解决《为什么SparkSQL在SQL查询中需要两个字面转义反斜杠？》经验，为你挑选了0个好方法。

当我从Spark 2.0 REPL(spark-shell)运行下面的Scala代码时,它按照我的意图运行,用简单的正则表达式拆分字符串.

import org.apache.spark.sql.SparkSession

// Create session
val sparkSession = SparkSession.builder.master("local").getOrCreate()

// Use SparkSQL to split a string
val query = "SELECT split('What is this? A string I think', '\\\\?') AS result"
println("The query is: " + query)
val dataframe = sparkSession.sql(query)

// Show the result
dataframe.show(1, false)

给出预期的产出

+---------------------------------+
|result                           |
+---------------------------------+
|[What is this,  A string I think]|
+---------------------------------+

但我感到困惑的是需要使用单个但不是双反斜杠来逃避文字问号(这里表示为四个反斜杠,因为我们当然必须在不使用三重引用时转义Scala中的反斜杠).

我确认我的同事为Spark 1.5编写的一些非常相似的代码使用单个(文字)反斜杠工作得很好.但是,如果我只在Spark 2.1中使用单个字面反斜杠,我会从JVM的正则表达式引擎中获得错误"Dangling meta character '?' near index 0".我知道这意味着问号没有正确转义,但它闻起来像反斜杠本身必须首先转换Scala 然后 SQL.

我猜这可以用于将控制字符(如换行符)插入SQL查询本身.如果这已经从Spark 1.5改为2.1,我只是感到困惑？

我已经搜索了相当多的东西,但没有找到任何东西.要么发生了变化,要么我的同事的代码以无意的方式运行.

我也尝试使用Python/pyspark,并且适用相同的条件 - SQL中需要双反斜杠.

有谁能解释一下？

我在Windows上运行相对简单的设置,包括Spark 2.1.0,JDK 1.8.0_111和Hadoop winutils.exe.

推荐阅读

程序员
`cv.glmnet`适用于RStudio但不适用于RScript

如何解决《`cv.glmnet`适用于RStudio但不适用于RScript》经验，为你挑选了1个好方法。 ... [详细]
程序员
将系统属性传递给spring boot

如何解决《将系统属性传递给springboot》经验，为你挑选了1个好方法。 ... [详细]
程序员
d3.js geo worldmap - 合并俄罗斯(从美国右边的左边小部分向左移位)

如何解决《d3.jsgeoworldmap-合并俄罗斯(从美国右边的左边小部分向左移位)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在.cshtml中使用@：

如何解决《如何在.cshtml中使用@：》经验，为你挑选了1个好方法。 ... [详细]
程序员
Modelica质量/能量/动量平衡

如何解决《Modelica质量/能量/动量平衡》经验，为你挑选了1个好方法。 ... [详细]
程序员
NPM + Zurb Foundation + WebPack:无法解析模块'基础'

如何解决《NPM+ZurbFoundation+WebPack:无法解析模块'基础'》经验，为你挑选了4个好方法。 ... [详细]
程序员
使用推土机可以将多个字段映射到一个字段吗？

如何解决《使用推土机可以将多个字段映射到一个字段吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
(Android)尝试抛出OutOfMemoryError时抛出OutOfMemoryError

如何解决《(Android)尝试抛出OutOfMemoryError时抛出OutOfMemoryError》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用ng-repeat或ng-model填充textarea,以便它不会使用迭代数据创建一个新的textarea

如何解决《使用ng-repeat或ng-model填充textarea,以便它不会使用迭代数据创建一个新的textarea》经验，为你挑选了1个好方法。 ... [详细]
程序员
Fullcalendar:如何删除事件

如何解决《Fullcalendar:如何删除事件》经验，为你挑选了1个好方法。 ... [详细]
程序员
覆盖动画填充模式:在JavaScript/CSS中转发

如何解决《覆盖动画填充模式:在JavaScript/CSS中转发》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何获取byte []以在视图上显示为div的背景图像（C＃，ASP.NET，MVC）

如何解决《如何获取byte[]以在视图上显示为div的背景图像（C＃，ASP.NET，MVC）》经验，为你挑选了0个好方法。 ... [详细]
程序员
有没有办法确定C++编译器实现的语言功能？

如何解决《有没有办法确定C++编译器实现的语言功能？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Seaborn热图旁边添加列

如何解决《如何在Seaborn热图旁边添加列》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么TypeError上的JSON.stringify返回一个空对象

如何解决《为什么TypeError上的JSON.stringify返回一个空对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
角饼干

如何解决《角饼干》经验，为你挑选了3个好方法。 ... [详细]
程序员
从协议扩展实例方法中读取静态var

如何解决《从协议扩展实例方法中读取静态var》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我使用框架获得不可用的声明

如何解决《为什么我使用框架获得不可用的声明》经验，为你挑选了1个好方法。 ... [详细]
程序员
将可变长度JSON数组解码为Rust数组

如何解决《将可变长度JSON数组解码为Rust数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
git rebase是否会产生比git merge更多的冲突？

如何解决《gitrebase是否会产生比gitmerge更多的冲突？》经验，为你挑选了1个好方法。 ... [详细]

wurtjq

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章