python爬虫之生活常识解答机器人

作者：乐韵答题 | 2021-11-02 23:08

这篇文章主要介绍了python爬虫之生活常识解答机器人,文中有非常详细的代码示例,对正在学习python的小伙伴们有非常好的帮助,需要的朋友可以参考下

一、前言

今天教大家如何用Python爬虫去搭建一个「生活常识解答」机器人。

思路：这个机器人主要是依托于“阿里达摩院发布的语言模型PLUG”，通过爬虫的方式，发送post请求（提问），然后返回json数据（回答）

二、问答平台

这个「生活常识解答」机器人采用的是：阿里达摩院发布的语言模型PLUG（最近刚发布的，目前是测试阶段）

该模型参数规模达270亿，采用1TB以上高质量中文文本训练数据，包括了新闻、小说、诗歌、常识问答等类型。

三、原页面效果

这里是需要登录阿里云账号，登录之后可以在网页进行测试问答！

因此我们下面将通过抓包方式获取这个问答的请求链接，然后在python代码中requests发送post请求去进行提问，然后返回结果（答案）。

四、抓包

在浏览器里面F12，点击network，然后点击一下提问，获取链接。

首先是发送的参数（提问）

然后是返回的json数据

因此这个数据包的相关信息（请求链接，参数，返回结果）我们已经知道了，下面开始编写python代码

五、编写代码

首先是导入python库和请求头

import requests
import json
header={
    'content-type':'application/json',
    'cookie':'上面页面中你自己的cookie',
 
 
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3947.100 Safari/537.36',
}

经过测试，有用的请求头参数是上面三个（content-type、cookie、User-Agent），缺一不可。

参数（其中q是问题，length是返回答案长度，type是对应常识问题）

q = "程序员脱发用什么洗发水好？"
data = {
    'length':'128',
    'type':'2',
    'passage':q,
}

发送请求

url = "https://nlp.aliyun.com/otherApi/yymx/cdgmwbsc"
text = requests.post(url,data = json.dumps(data),headers=header).json()
print(text['res'])

返回结果

下面为了能够多轮提问，将请求部分代码放到循环中（如果输入是exit则退出循环）

六、总结

今天小编主要就教大家用Python爬虫去搭建一个「生活常识解答」机器人。

这个机器人主要是依托于“阿里达摩院发布的语言模型PLUG”，通过爬虫的方式，发送post请求（提问），然后返回json数据（回答）。轻松实现多轮提问。

到此这篇关于python爬虫之生活常识解答机器人的文章就介绍到这了,更多相关python机器人内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

推荐阅读

程序员
为什么这行代码在运行？

如何解决《为什么这行代码在运行？》经验，为你挑选了1个好方法。 ... [详细]
程序员
R Leaflet - 使用带有colorNumeric()调色板的日期或字符图例标签

如何解决《RLeaflet-使用带有colorNumeric()调色板的日期或字符图例标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
计算numpy数组中列的出现次数

如何解决《计算numpy数组中列的出现次数》经验，为你挑选了0个好方法。 ... [详细]
程序员
swagger生成Nodejs:错误:请求实体太大

如何解决《swagger生成Nodejs:错误:请求实体太大》经验，为你挑选了0个好方法。 ... [详细]
程序员
适用于Chrome node.js的VS Code + Debugger

如何解决《适用于Chromenode.js的VSCode+Debugger》经验，为你挑选了0个好方法。 ... [详细]
程序员
关闭空的iTextSharp文档时出错

如何解决《关闭空的iTextSharp文档时出错》经验，为你挑选了1个好方法。 ... [详细]
程序员
JavaFX的ListChangeListener.Change.getRemoved()可以返回非连续的项吗？

如何解决《JavaFX的ListChangeListener.Change.getRemoved()可以返回非连续的项吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么我们需要flatMap(一般情况下)？

如何解决《为什么我们需要flatMap(一般情况下)？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何决定当时/捕获的承诺

如何解决《如何决定当时/捕获的承诺》经验，为你挑选了0个好方法。 ... [详细]
程序员
Spark中的特征规范化算法

如何解决《Spark中的特征规范化算法》经验，为你挑选了1个好方法。 ... [详细]
程序员
Gradle exec任务返回非零退出值并使构建失败但我想不会失败而是执行另一个任务

如何解决《Gradleexec任务返回非零退出值并使构建失败但我想不会失败而是执行另一个任务》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Swift 2编程从持久ID中查找歌曲

如何解决《使用Swift2编程从持久ID中查找歌曲》经验，为你挑选了1个好方法。 ... [详细]
程序员
(Swift)滚动时NSTimer停止

如何解决《(Swift)滚动时NSTimer停止》经验，为你挑选了1个好方法。 ... [详细]
程序员
Symfony 3.0和HWIOAuthBundle不能一起工作？

如何解决《Symfony3.0和HWIOAuthBundle不能一起工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Flask和SQLalchemy NoForeignKeysError:无法确定关系User.posts上的父/子表之间的连接条件

如何解决《Flask和SQLalchemyNoForeignKeysError:无法确定关系User.posts上的父/子表之间的连接条件》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android RecyclerView Checkbox随机检查

如何解决《AndroidRecyclerViewCheckbox随机检查》经验，为你挑选了0个好方法。 ... [详细]
程序员
自定义标签指示器(箭头向下像指示器)

如何解决《自定义标签指示器(箭头向下像指示器)》经验，为你挑选了1个好方法。 ... [详细]
程序员
从浏览器捕获系统声音

如何解决《从浏览器捕获系统声音》经验，为你挑选了0个好方法。 ... [详细]
程序员
Gradle发布到Artifactory的特定回购

如何解决《Gradle发布到Artifactory的特定回购》经验，为你挑选了0个好方法。 ... [详细]
程序员
Xamarin Forms，如何将输入的日期从日期选择器中转换为您选择的格式？

如何解决《XamarinForms，如何将输入的日期从日期选择器中转换为您选择的格式？》经验，为你挑选了1个好方法。 ... [详细]

乐韵答题

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章