8赞

Hive的UDF实现详解

作者：kikokikolove | 2021-08-15 03:47

Hive自身查询语言HQL能完成大部分的功能，但遇到特殊需求时，需要自己写UDF实现。以下是一个完整的案例。1、eclipse中编写UDF①项目中加入hive的lib下的所有jar包和Hadoop中share下hadoop-common-2.5.1.jar（Hadoop目前最新版本2.5.1）。②UDF类要继承org.

Hive自身查询语言HQL能完成大部分的功能，但遇到特殊需求时，需要自己写UDF实现。以下是一个完整的案例。

1、eclipse中编写UDF

①项目中加入hive的lib下的所有jar包和Hadoop中share下hadoop-common-2.5.1.jar（Hadoop目前最新版本2.5.1）。
②UDF类要继承org.apache.hadoop.hive.ql.exec.UDF类，类中要实现evaluate。当我们在hive中使用自定义的UDF的时候，hive会调用类中的evaluate方法来实现特定的功能
③导出项目为jar文件。
注：项目的jdk与集群的jdk要一致。
具体例子：

package com.zx.hive.udf;

import org.apache.hadoop.hive.ql.exec.UDF;

public class UdfTestLength extends UDF{

    public Integer evaluate(String s)
    {
        if(s==null)
        {
            return null;
        }else{
            return s.length();
        }
    }
}

将上面的类打成jar的形式，我使用eclipse直接导出为test-udf.jar包，然后放在/root目录中。

（转载请注明，更多内容见：http://blog.csdn.net/hwwn2009/article/details/41289197）

2、自定义函数调用过程：

①添加jar包（在hive命令行里面执行）
hive> add jar /root/test-udf.jar;

②创建临时函数，hive命令行关闭后，即失效。
hive> create temporary function testlength as ‘com.zx.hive.udf.UdfTestLength';

③调用
hive> select id, name, testlength(name) from student;

④将查询结果保存到HDFS中

hive> create table result row format delimited fields terminated by '\t' as select id,testlength(nation) from student;

（转载请注明，更多内容见：http://blog.csdn.net/hwwn2009/article/details/41289197）

推荐阅读

程序员
在UIView上绘制点和线

如何解决《在UIView上绘制点和线》经验，为你挑选了1个好方法。 ... [详细]
程序员
将CardView置于RecyclerView中,只有一个元素

如何解决《将CardView置于RecyclerView中,只有一个元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
尝试将我的Web应用程序从VS Community 2015发布到Azure时出错.错误:找不到现有的已加载项目:http:// localhost:55809

如何解决《尝试将我的Web应用程序从VSCommunity2015发布到Azure时出错.错误:找不到现有的已加载项目:http://localhost:55809》经验，为你挑选了3个好方法。 ... [详细]
程序员
使用gnome-terminal的桌面应用程序:脚本和图标的相对路径

如何解决《使用gnome-terminal的桌面应用程序:脚本和图标的相对路径》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么&p + 1给出与p相同的结果

如何解决《为什么&p+1给出与p相同的结果》经验，为你挑选了1个好方法。 ... [详细]
程序员
Retrofit2.0返回404未找到

如何解决《Retrofit2.0返回404未找到》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java - 返回指定泛型类型的列表

如何解决《Java-返回指定泛型类型的列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Swift在iOS中打印视图

如何解决《使用Swift在iOS中打印视图》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Android PdfDocument API创建PDF文件 - 文件太大

如何解决《使用AndroidPdfDocumentAPI创建PDF文件-文件太大》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用主键作为JPA和Hibernate的外键引用？

如何解决《如何使用主键作为JPA和Hibernate的外键引用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
詹金斯现在需要SVN的"领域".你怎么找到它,应该输入什么？

如何解决《詹金斯现在需要SVN的"领域".你怎么找到它,应该输入什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Java for Android中以编程方式找到"数据"的路径？

如何解决《如何在JavaforAndroid中以编程方式找到"数据"的路径？》经验，为你挑选了1个好方法。 ... [详细]
程序员
从Unity C中的其他脚本访问bool#

如何解决《从UnityC中的其他脚本访问bool#》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从ASP.NET 5 Web Api返回HTTP 500？

如何解决《如何从ASP.NET5WebApi返回HTTP500？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何将字符串转换为unsigned int？C

如何解决《如何将字符串转换为unsignedint？C》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用ACF从分类术语中获取图像

如何解决《使用ACF从分类术语中获取图像》经验，为你挑选了1个好方法。 ... [详细]
程序员
滚动在chrome中的svg外部对象内部不起作用

如何解决《滚动在chrome中的svg外部对象内部不起作用》经验，为你挑选了0个好方法。 ... [详细]
程序员
C#类转换为类

如何解决《C#类转换为类》经验，为你挑选了1个好方法。 ... [详细]
程序员
在DICTATION_MODE中使用android.speech.SpeechRecognizer时出现延迟

如何解决《在DICTATION_MODE中使用android.speech.SpeechRecognizer时出现延迟》经验，为你挑选了0个好方法。 ... [详细]
程序员
有没有办法获取Spark Dataframe的前1000行？

如何解决《有没有办法获取SparkDataframe的前1000行？》经验，为你挑选了1个好方法。 ... [详细]

kikokikolove

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章