python 利用百度API进行淘宝评论关键词提取

作者：coco2冰冰 | 2022-02-22 06:58

这篇文章主要介绍了python利用百度API进行淘宝评论关键词提取，帮助大家更好的理解和学习使用python，感兴趣的朋友可以了解下

利用百度API自然语言处理技术中的评论观点抽取方面，对淘宝购物的评论进行分析，把关键词进行提取，方便买家快速了解该商品的相关特点，具体实现过程如下：

1、创建相关新应用

首先，需要登录百度AI平台，创建一个关于自然语言处理技术的应用（领取免费额度），获得AppID、API Key和Secret Key如下：

然后下载Python的SDK，然后可以通过阅读API的使用手册和自然语言处理技术的观点抽取相关案例：

2、获取Access Token

使用百度API时需要先获取Access Token，并且需要用到上一步获取的参数API Key和Secret Key，在百度给出的使用说明中，建议用POST的方式对URL进行请求来获取access_token，同时可以加入Header，该方式支持UTF-8编码，具体实现代码如下：

import json
import time
import requests
from urllib.request import urlopen

#定义获取token函数
def get_token():
  req = Request(Token_url)
  req.add_header('Content-Type', 'application/json; charset=UTF-8')
  try:
    f = urlopen(req,timeout=5)
    result_str = f.read().decode('utf-8')
  except URLError as err:
    print(err)
  result = json.loads(result_str)
  #返回Access Token字符串
  return result['access_token']

3、分析评论并进行观点抽取

在获取Access Token后就可以使用百度API对评论进行分析并抽取关键词。在使用说明中，调用API时需要输入参数text和type，其中text为需要分析的文本，而type分成了13各类别，具体取值说明如下：

因为本文分析的是淘宝购物评论文本数据，所以该参数取值选择了12。其次，返回格式需要指定输入为UTF-8编码，对于调用后返回的参数，本文用到了prop、adj和sentiment三个参数，解释如下：

具体实现代码如下：

def analysis_comment(host,comment):
  #定义分析类别（购物）
  data = json.dumps(
    {
      "text":comment,
      "type":12
    })
    
  request = Request(url=host,data=data.encode('utf-8'))
  request.add_header('Content-Type', 'application/json; charset=UTF-8')
  response = urlopen(request)
  content = response.read().decode('utf-8')
  rdata = json.loads(content)

  print("--------------------------------------------------------------")
  print("评论：")
  print("  " + comment)
  print("\n评论关键字：")
  #把积极、中性、消极关键词分类出来并打印
  for item in rdata['items']:
    if item['sentiment'] == 2:
      print(u"  积极的评论关键词：" + item['prop'] + item['adj'])
    if item['sentiment'] == 1:
      print(u"  中性的评论关键词：" + item['prop'] + item['adj'])
    if item['sentiment'] == 0:
      print(u"  消极的评论关键词：" + item['prop'] + item['adj'])

4、运行结果

在对上述函数进行定义后，运行改代码，调用函数：

if __name__ == '__main__':
  #定义访问url（API Key和Secret Key换成自己的）
  Comment_url = "https://aip.baidubce.com/rpc/2.0/nlp/v2/comment_tag"
  Token_url = "https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=your_API_Key&client_secret=your_Secret_Key"

  A_t = get_token()
  host = Comment_url + "?charset=UTF-8&access_token="+A_t
  
  comment1 = {"text":"版型不错，颜色很好看，面料非常舒服而且厚度适中"}
  comment2 = {"text":"上身效果一般，做工也一般，会有点起球，没有想象中好"}
  comment3 = {"text":"设计做工一点都不好，袖子特别长，衣服比例设计非常差，性价比不高"}
  comment1 = comment1["text"]
  comment2 = comment2["text"]
  comment3 = comment3["text"]
  
  analysis_comment(host,comment1)
  analysis_comment(host,comment2)
  analysis_comment(host,comment3)

运行结果如下：

然而，从结果中可以看出，在第二句评论中，“一般”这个词应该定义为中性，而该模型将其定义为消极，说明该模型在一定程度上仍存在一些瑕疵，这也是后期需要改进的地方。

以上就是python 利用百度API进行淘宝评论关键词提取的详细内容，更多关于python 淘宝评论关键词提取的资料请关注其它相关文章！

推荐阅读

程序员
使用transform:scale进行滚动时的振动屏幕

如何解决《使用transform:scale进行滚动时的振动屏幕》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Swift删除iOS目录中的文件

如何解决《使用Swift删除iOS目录中的文件》经验，为你挑选了2个好方法。 ... [详细]
程序员
对于Android开发,我可以在图像视图上使用JPG图像而不是PNG图像吗？

如何解决《对于Android开发,我可以在图像视图上使用JPG图像而不是PNG图像吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Unity支持阿拉伯语

如何解决《Unity支持阿拉伯语》经验，为你挑选了0个好方法。 ... [详细]
程序员
奇怪的C++模式减少了编译时间

如何解决《奇怪的C++模式减少了编译时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何保持引用以进行正确的SQL查询

如何解决《如何保持引用以进行正确的SQL查询》经验，为你挑选了1个好方法。 ... [详细]
程序员
反应原生背景流程

如何解决《反应原生背景流程》经验，为你挑选了0个好方法。 ... [详细]
程序员
UITableViewCells中的选中标记显示不正确

如何解决《UITableViewCells中的选中标记显示不正确》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何获取添加到主屏幕在网站上弹出在移动浏览器中打开

如何解决《如何获取添加到主屏幕在网站上弹出在移动浏览器中打开》经验，为你挑选了4个好方法。 ... [详细]
程序员
如何在Qt Cmake项目中使用QML_IMPORT_PATH？

如何解决《如何在QtCmake项目中使用QML_IMPORT_PATH？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Javascript中更改类的样式？

如何解决《如何在Javascript中更改类的样式？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在UITableView中使用外部数据源

如何解决《如何在UITableView中使用外部数据源》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在1D Tensor中查找重复元素

如何解决《如何在1DTensor中查找重复元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
模块"模板"不可用!在角js？

如何解决《模块"模板"不可用!在角js？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在tablayout中的文本旁边设置图标

如何解决《如何在tablayout中的文本旁边设置图标》经验，为你挑选了0个好方法。 ... [详细]
程序员
CMake和qmake之间有什么区别和相似之处？

如何解决《CMake和qmake之间有什么区别和相似之处？》经验，为你挑选了5个好方法。 ... [详细]
程序员
尽管配置容量很高,但DynamoDB Update/Put受限制

如何解决《尽管配置容量很高,但DynamoDBUpdate/Put受限制》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么更有效？在javascript或php中生成每个tr？

如何解决《什么更有效？在javascript或php中生成每个tr？》经验，为你挑选了0个好方法。 ... [详细]
程序员
BigInteger,整数太大了

如何解决《BigInteger,整数太大了》经验，为你挑选了1个好方法。 ... [详细]
程序员
pthread_self()返回的线程ID与调用gettid(2)返回的内核线程ID不同

如何解决《pthread_self()返回的线程ID与调用gettid(2)返回的内核线程ID不同》经验，为你挑选了2个好方法。 ... [详细]

coco2冰冰

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章