12赞

PIG - Scalar在输出中有多行

作者：贾志军 | 2023-06-15 17:23

如何解决《PIG-Scalar在输出中有多行》经验，为你挑选了2个好方法。

我有一个电影数据库的以下数据集:

评分:UserID,MovieID,评级电影:MovieID,类型用户:UserID,性别,年龄

我写了一个PIG脚本,以获得评分最高的电影的年龄组(20-30)的女性用户.以下是我到目前为止的代码:

users_input = load '/users.dat' USING PigStorage('\u003B') as (UserID: long, gender: chararray, age: int, occupation: int, zip: long);
movies_input = load '/movies.dat' USING PigStorage('\u003B') as (MovieID: long, title: chararray, genre: chararray);
ratings_input = load '/ratings.dat' USING PigStorage('\u003B') as (UserID: long, MovieID: long, rating: int, timestamp: chararray);

movie_filter = filter movies_input by (genre matches '.*Action.*') OR (genre matches '.*War.*');

temp = COGROUP movie_filter by MovieID, ratings_input by MovieID;

temp1 = FILTER temp BY COUNT(movie_filter) > 0;

temp2 = FOREACH temp1 GENERATE group, AVG(ratings_input.rating) AS ratings;

temp3 = ORDER temp2 BY ratings DESC;

temp4 = LIMIT temp3 1;

temp5 = FOREACH temp4 GENERATE ratings;

temp6 = FILTER temp3 BY (temp5.ratings == ratings);

female_users = filter users_input by gender == 'F';
age_users = filter female_users by age >=20 AND age <=30;
age_use = FOREACH age_users GENERATE UserID;

MovID = FOREACH temp6 GENERATE group;

all_users_records = FILTER ratings_input BY (MovID.group == MovieID);

all_users = FOREACH all_users_records GENERATE UserID;

female_aged_records = FILTER all_users BY (UserID == age_use.UserID);

female_aged_users = FOREACH female_aged_records GENERATE UserID;

store all_users into '/output_pig' using PigStorage();

我执行此操作但最终得到错误:" Scalar在输出中有多行.第一:(11),第二:(24) "

有人可以帮帮我吗？提前致谢.

1> jhofman..：

正如其他人所说,这不是一个非常有用的错误信息.你可能有一个点,你需要一个双分号.

2> noob333..：

@jhofman,我认为你的意思是双冒号(关系运算符)'::'而不是点.

最后,pig脚本应如下所示:

...
temp2 = FOREACH temp1 GENERATE组,AVG(ratings_input::评级)AS评级;
...
temp6 = FILTER temp3 BY(temp5::评级==评级);
...
all_users_records = FILTER ratings_input BY(MovID:: group == MovieID);

all_users = FOREACH all_users_records GENERATE UserID;

female_aged_records = FILTER all_users BY(UserID == age_use :: 用户身份);

推荐阅读

程序员
Laravel雄辩的模型如何从关系表中获取数据

如何解决《Laravel雄辩的模型如何从关系表中获取数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
并行检查md5文件

如何解决《并行检查md5文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何按计划扩展或缩小Azure App Service实例大小？

如何解决《如何按计划扩展或缩小AzureAppService实例大小？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Magento2:将产品属性添加为媒体图像

如何解决《Magento2:将产品属性添加为媒体图像》经验，为你挑选了1个好方法。 ... [详细]
程序员
将Node.js内存使用限制为每个进程少于300MB

如何解决《将Node.js内存使用限制为每个进程少于300MB》经验，为你挑选了1个好方法。 ... [详细]
程序员
React Native Child Parent通信

如何解决《ReactNativeChildParent通信》经验，为你挑选了1个好方法。 ... [详细]
程序员
c编译器警告:在参数列表中声明'struct x'

如何解决《c编译器警告:在参数列表中声明'structx'》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python:忽略xml.etree.ElementTree中的命名空间？

如何解决《Python:忽略xml.etree.ElementTree中的命名空间？》经验，为你挑选了0个好方法。 ... [详细]
程序员
iOS:NSCalendarUnitWeekday的值是星期一的1

如何解决《iOS:NSCalendarUnitWeekday的值是星期一的1》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从Laravel中的路由传递Request对象？

如何解决《如何从Laravel中的路由传递Request对象？》经验，为你挑选了1个好方法。 ... [详细]
程序员
警告：出于安全原因已禁用ini_set（）

如何解决《警告：出于安全原因已禁用ini_set（）》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何指定War文件中资源的路径？

如何解决《如何指定War文件中资源的路径？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用C将十六进制值存储到数组后打印十六进制值

如何解决《使用C将十六进制值存储到数组后打印十六进制值》经验，为你挑选了1个好方法。 ... [详细]
程序员
'$ {var ///+}'在shell脚本中的含义是什么？

如何解决《'${var///+}'在shell脚本中的含义是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
VS2015在DebuggerStepTrough中抛出异常？

如何解决《VS2015在DebuggerStepTrough中抛出异常？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在h2o中加载大于内存大小的数据

如何解决《在h2o中加载大于内存大小的数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
背包01扭曲

如何解决《背包01扭曲》经验，为你挑选了0个好方法。 ... [详细]
程序员
具有多个位置块的nginx配置

如何解决《具有多个位置块的nginx配置》经验，为你挑选了0个好方法。 ... [详细]
程序员
OpenGL ES透明度不起作用,而是只是与背景混合

如何解决《OpenGLES透明度不起作用,而是只是与背景混合》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何更改Ionic 2中导航栏的背景颜色？

如何解决《如何更改Ionic2中导航栏的背景颜色？》经验，为你挑选了2个好方法。 ... [详细]

贾志军

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章