13赞

用树莓派实现对话机器人_PHP教程

作者：保佑欣疼你的芯疼 | 2021-08-30 06:04

用树莓派实现对话机器人。用树莓派实现对话机器人最近用树莓派实现了一个能和人对话的机器人，简要介绍一下。树莓派（RaspberryPi）是世界上最流行的微型电脑

用树莓派实现对话机器人

最近用树莓派实现了一个能和人对话的机器人，简要介绍一下。

树莓派（Raspberry Pi）是世界上最流行的微型电脑主板，是开源硬件的领导产品，它为学生计算机编程教育而设计，只有信用卡大小，且价格低廉。支持linux(debian)等操作系统。最重要的是资料完善，社区活跃。
我用的是树莓派B+版本，基本配置是博通BCM2836处理器，4核900M主频，1G RAM。

我的目标是做成一个和人对话的机器人，这就需要机器人有输入设备和输出设备。输入设备是麦克风，输出可以是HDMI、耳机或音响，我这里用了音响。下面是我的树莓派照片。4个USB接口分别连了无线网卡、无线键盘、麦克风、音响供电。

我们可以把机器人的对话分成三个部分：听、思考、说。
“听”，是把人说的话记录下来，并转换成文字。
“思考”，就是根据不同的输入给出不同的输出。比如，对方说“现在时间”，你就可以回答“现在是北京时间xx点xx分”。
“说”，是把文字转换成语音，并播放出来。

这三个部分涉及到大量语音识别、语音合成、人工智能等技术，这些都是要花大量时间精力研究的，好在有些公司已经开放了接口给客户使用。这里，我选择了百度的API。下面分别说明这三个部分的实现。

“听”

首先是把人说的话录制下来，我使用了arecord工具。命令如下：

arecord -D "plughw:1" -f S16_LE -r 16000 test.wav

其中，-D参数后接录制设备，连接麦克风后，树莓派上有2个设备：内部设备和外部usb设备，plughw:1代表使用外部设备。-f表示录制的格式，-r表示声音采样频率。由于后面提到的百度语音识别对音频文件格式是有要求的，我们需要录制成符合要求的格式。另外，在这里我没有指定录制的时间，它会一直录制下去，直到用户按下ctrl-c。录制后的音频文件保存为test.wav。
接下来，我们要把音频转换成文字，即语音识别（asr），百度的语音开放平台提供了免费的服务，并支持REST API
文档见： http://yuyin.baidu.com/docs/asr/57
流程基本就是获取token，把需要识别的语音信息、语音数据、token等发送给百度的语音识别服务器，就能获取到对应的文字。因为服务器支持REST API，我们可以用任何语言来实现客户端的代码，这里使用的是python

# coding: utf-8
 

import urllib.request
import json
import base64
import sys

def get_access_token():
url = "https://openapi.baidu.com/oauth/2.0/token"
grant_type = "client_credentials"
client_id = "xxxxxxxxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxx"

url = url + "?" + "grant_type=" + grant_type + "&" + "client_id=" + client_id + "&" + "client_secret=" + client_secret

resp = urllib.request.urlopen(url).read()
data = json.loads(resp.decode("utf-8"))
return data["access_token"]


def baidu_asr(data, id, token):
speech_data = base64.b64encode(data).decode("utf-8")
speech_length = len(data)

post_data = {
"format" : "wav",
"rate" : 16000,
"channel" : 1,
"cuid" : id,
"token" : token,
"speech" : speech_data,
"len" : speech_length
}

url = "http://vop.baidu.com/server_api"
json_data = json.dumps(post_data).encode("utf-8")
json_length = len(json_data)
#print(json_data)

req = urllib.request.Request(url, data = json_data)
req.add_header("Content-Type", "application/json")
req.add_header("Content-Length", json_length)

print("asr start request\n")
resp = urllib.request.urlopen(req)
print("asr finish request\n")
resp = resp.read()
resp_data = json.loads(resp.decode("utf-8"))
if resp_data["err_no"] == 0:
return resp_data["result"]
else:
print(resp_data)
return None

def asr_main(filename):
f = open(filename, "rb")
audio_data = f.read()
f.close()

#token = get_access_token()
token = "xxxxxxxxxxxxxxxxxx"
uuid = "xxxx"
resp = baidu_asr(audio_data, uuid, token)
print(resp[0])
return resp[0]

“思考”
这里我使用了百度api store的图灵机器人。其文档见：http://apistore.baidu.com/apiworks/servicedetail/736.html
它的使用非常简单，这里不再赘述，代码如下：

import urllib.request
 
import sys
import json

def robot_main(words):
url = "http://apis.baidu.com/turing/turing/turing?"

key = "879a6cb3afb84dbf4fc84a1df2ab7319"
userid = "1000"

words = urllib.parse.quote(words)
url = url + "key=" + key + "&info=" + words + "&userid=" + userid

req = urllib.request.Request(url)
req.add_header("apikey", "xxxxxxxxxxxxxxxxxxxxxxxxxx")

print("robot start request")
resp = urllib.request.urlopen(req)
print("robot stop request")
content = resp.read()
if content:
data = json.loads(content.decode("utf-8"))
print(data["text"])
return data["text"]
else:
return None

“说”
先需要把文字转换成语音，即语音合成（tts）。然后把声音播放出来。
百度的语音开放平台提供了tts的接口，并可配置男女声、语调、语速、音量。服务器返回mp3格式的音频数据。我们把数据以二进制方式写入文件中。
详见http://yuyin.baidu.com/docs/tts/136
代码如下：

# coding: utf-8
 

import urllib.request
import json
import sys

def baidu_tts_by_post(data, id, token):
post_data = {
"tex" : data,
"lan" : "zh",
"ctp" : 1,
"cuid" : id,
"tok" : token,
}

url = "http://tsn.baidu.com/text2audio"
post_data = urllib.parse.urlencode(post_data).encode('utf-8')
#print(post_data)
req = urllib.request.Request(url, data = post_data)

print("tts start request")
resp = urllib.request.urlopen(req)
print("tts finish request")
resp = resp.read()
return resp

def tts_main(filename, words):
token = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
text = urllib.parse.quote(words)
uuid = "xxxx"
resp = baidu_tts_by_post(text, uuid, token)

f = open("test.mp3", "wb")
f.write(resp)
f.close()

得到音频文件后，可以使用mpg123播放器播放。

mpg123 test.mp3

整合
最后，把这三个部分组合起来。
可以先把python相关的代码整合成main.py，如下：

import asr
 
import tts
import robot

words = asr.asr_main("test.wav")
new_words = robot.robot_main(words)
tts.tts_main("test.mp3", new_words)

再使用脚本，调用相关工具：

#! /bin/bash
arecord -D "plughw:1" -f S16_LE -r 16000 test.wav
python3 main.py
mpg123 test.mp3

好了，现在你可以和机器人对话了。运行脚本，对着麦克风说句话，然后按ctrl-c，机器人就会回你话了。

http://www.bkjia.com/PHPjc/1108027.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/1108027.htmlTechArticle用树莓派实现对话机器人最近用树莓派实现了一个能和人对话的机器人，简要介绍一下。树莓派（Raspberry Pi）是世界上最流行的微型电脑...

推荐阅读

程序员
返回部分视图和消息

如何解决《返回部分视图和消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
来自ajax调用的symfony中的表单验证

如何解决《来自ajax调用的symfony中的表单验证》经验，为你挑选了2个好方法。 ... [详细]
程序员
解释HERE地图实时流量标签

如何解决《解释HERE地图实时流量标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
在函数中使用throw关键字会产生带有gcc的警告

如何解决《在函数中使用throw关键字会产生带有gcc的警告》经验，为你挑选了1个好方法。 ... [详细]
程序员
django I18n javascript_catalog与怪异的反应

如何解决《djangoI18njavascript_catalog与怪异的反应》经验，为你挑选了0个好方法。 ... [详细]
程序员
CSipSimple在应用程序中抛出异常JNI DETECTED ERROR,输入无效修改UTF-8:非法启动字节0x8e

如何解决《CSipSimple在应用程序中抛出异常JNIDETECTEDERROR,输入无效修改UTF-8:非法启动字节0x8e》经验，为你挑选了0个好方法。 ... [详细]
程序员
实体框架不会包含()所有表

如何解决《实体框架不会包含()所有表》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Javascript(Croppie)裁剪图像

如何解决《使用Javascript(Croppie)裁剪图像》经验，为你挑选了1个好方法。 ... [详细]
程序员
CSS链接边框样式不起作用:访问过

如何解决《CSS链接边框样式不起作用:访问过》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何编写/引用PHP可调用函数易于管理我的IDE

如何解决《如何编写/引用PHP可调用函数易于管理我的IDE》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Symfony 2.8生成表单会抛出Twig_Error_Runtime

如何解决《使用Symfony2.8生成表单会抛出Twig_Error_Runtime》经验，为你挑选了2个好方法。 ... [详细]
程序员
我应该用setter创建一个构造函数

如何解决《我应该用setter创建一个构造函数》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Tcl中使用名称模式的tar不起作用

如何解决《在Tcl中使用名称模式的tar不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
问:保存Qt-creator应用程序的SQLite数据库的最佳"路径"在哪里？

如何解决《问:保存Qt-creator应用程序的SQLite数据库的最佳"路径"在哪里？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Nullable初始化为null - 理解源代码

如何解决《Nullable初始化为null-理解源代码》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么是CocoaPods"(未使用)"

如何解决《什么是CocoaPods"(未使用)"》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在BitBucket上创建文件夹？

如何解决《如何在BitBucket上创建文件夹？》经验，为你挑选了2个好方法。 ... [详细]
程序员
限制Log4J中的消息长度

如何解决《限制Log4J中的消息长度》经验，为你挑选了1个好方法。 ... [详细]
程序员
工作日的对象如星期日,星期一,......,星期六

如何解决《工作日的对象如星期日,星期一,,星期六》经验，为你挑选了1个好方法。 ... [详细]
程序员
在javascript中具有特定形状的词云

如何解决《在javascript中具有特定形状的词云》经验，为你挑选了0个好方法。 ... [详细]

保佑欣疼你的芯疼

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章