作者:wurtjq | 2021-09-09 03:09
工作中需要做一个php的模块,对论坛的各个板块的内容做统计,然后进行数据抽取。每个板块有一些主要关注的话题或内容。比如汽车版块,会主要关注安全性,汽车的维护知识,如何选车等。然后把该汽车版块的所有帖子
工作中需要做一个php的模块,对论坛的各个板块的内容做统计,然后进行数据抽取。每个板块有一些主要关注的话题或内容。比如汽车版块,会主要关注安全性,汽车的维护知识,如何选车等。然后把该汽车版块的所有帖子根据这些关注内容进行分类,算分,统计。最后得出一些数据,供以后的数据挖掘用。
问题是:网站上有很多版块,每个板块的焦点话题集合不一样,对每个话题算分的算法也有所不同,而且话题集合会随时间不断改变,比如夏天有关空调维修的话题较多,冬天关于热车的话题较多。
这样,就希望设计一个面向对象的动态模块来实现对所有论坛的算分统计工作。
我目前的想法是:设计一个板块算分主类,其包含一个话题集合类,一个分数计算算法类,一个分数结果类。 这样,对每一个版块,我们产生一个板块算分主类的对象,再输入具体的数据进行计算。计算出的结果保持在mysql数据库中。
请问,这中间具体该如何设计,比如设计模块和相应的interface该是怎样的呢?我们希望尽量保持灵活性。
回复内容:
工作中需要做一个php的模块,对论坛的各个板块的内容做统计,然后进行数据抽取。每个板块有一些主要关注的话题或内容。比如汽车版块,会主要关注安全性,汽车的维护知识,如何选车等。然后把该汽车版块的所有帖子根据这些关注内容进行分类,算分,统计。最后得出一些数据,供以后的数据挖掘用。
问题是:网站上有很多版块,每个板块的焦点话题集合不一样,对每个话题算分的算法也有所不同,而且话题集合会随时间不断改变,比如夏天有关空调维修的话题较多,冬天关于热车的话题较多。
这样,就希望设计一个面向对象的动态模块来实现对所有论坛的算分统计工作。
我目前的想法是:设计一个板块算分主类,其包含一个话题集合类,一个分数计算算法类,一个分数结果类。 这样,对每一个版块,我们产生一个板块算分主类的对象,再输入具体的数据进行计算。计算出的结果保持在mysql数据库中。
请问,这中间具体该如何设计,比如设计模块和相应的interface该是怎样的呢?我们希望尽量保持灵活性。