多轮对话 - Core篇

基于Rasa框架多轮对话设计及实现

前言

  • 此部分基于Rasa框架展开仅以Core为主,对NLU和NLG没有太多涉及。
  • 设计了两场多轮对话并实现:
    一、设计问天气的单场景多轮对话,实现对话能在地点与时间之间灵活切换。
    二、设计一个集天气、景点、美食和住宿的多场景旅游综合多伦对话系统。要求对话机器人准确回答天气、景点、美食和住宿的多场景间相互切换的提问。
  • 环境:Python3.6.6和Rasa1.4.3

一 对话系统概述

当前对话系统主要包括4类:

  • 问答型对话系统
  • 任务型对话系统
  • 闲聊型问答系统
  • 图谱型问答系统
问答型 任务型 闲聊型 图谱型
1. QA bot 1. Task bot 1. Chat bot 1. KBQA bot
2. 单轮对话 2. 多轮对话 2. 多轮对话 2. 基于图谱的推理
3. 上下文无关 3. 针对特定场景(垂直领域) 3. 自然交互(开放领域) 3. 解决特定问题
4. 解决特定问题 4. 不解决问题

二 Rasa基础概要

1、Rasa介绍

Rasa是一个用于对话的开源机器学习框架。首先了解用户想说的内容(NLU),然后根据上下文信息对其进行适当的操作对话(Core)。

2、Rasa核心模块

  • NLU - 自然语言理解
    Rasa是一个用于对话的开源机器学习框架。首先了解用户想说的内容(NLU),然后根据上下文信息对其进行适当的操作对话(Core)。

  • Core - 对话管理
    对话管理(Dialog Management,DM)控制着人机对话的进程,对话管理通过对自然语言理解模块的输出(即意图、槽位、槽位信息)的处理来进行和用户的交互和反应。针对带有明确意图的用户,在对话管理过程中用户不但可以完善或修正自己需求,管理系统也可以在用户需求不够具体的时候明确或澄清用户的需求,以达到最终的任务完成。
    对话管理系统主要包括两部分:状态追踪和对话策略。对话策略通常作为对话管理的输出,如对该场景下缺失槽位的反问策略等。以某公司智能产品介绍系统的多伦对话为示例:

轮次 Bot / 客户 对话内容 行为判别
1 Bot 这里是XX公司,很高兴为您服务! 开场白
2 客户 我想了解贵司有哪些AI产品 意图识别(产品咨询)
3 Bot 好的,您有哪方面的业务需求? 澄清需求,以便填槽
4 客户 需要支持语音识别并自动识别出风险信息 槽填充(语音&信息)
5 Bot 对处理技术有要求吗? 澄清需求
6 客户 最好有大数据处理能力 槽填充(大数据)
7 Bot 好的,咱们XX产品非常符合您的需求! 任务完成,反馈相关产品介绍
  • NLG - 自然语言生成
    基于多伦对话的自然语言生成,通常也采用基于模板、基于语法或模型等。模板与语法主要基于规则的策略,模型可以用如seq2seq等网络生成自然语言。

3、Rasa对话流程图

官方流程图
  • 1.将用户输入的Message传递到Interpreter(NLU???,并将信息打包为一个字典, 该??楦涸鹗侗餗essage中的"意图(intent)“和提取所有"实体”(entity)数据;
  • 2.Rasa Core会将Interpreter提取到的意图和识别传给Tracker对象,保持对话状态(Conversation State);
  • 3/4/5.利用Policy记录Tracker对象的当前状态,并选择执行相应的Action,其中,这个Action是被记录在Track对象中的;
  • 6.将执行Action返回的结果输出,即完成一次人机交互(一轮对话结束)。

4、Rasa主要组件

Rasa主要组件

三 多轮对话管理

对话元素是常见的对话模式,可以使用三种不同的抽象级别来讨论AI助手:

  • 最低级别:意图,实体,操作,词槽位和模板
  • 中层级别:对话元素
  • 最高级别:用户目标(达成)

1、对话管理的核心???/h3>

面向任务的对话系统整体流程由NLU、DST、DPL、NLG這4个主要??樽槌?。

  • NLU(自然语言理解)

  • DST(对话状态追踪)- 理解用户需求

  • DPL(对话策略学习)- 确定系统动作,意图+槽值

  • NLG(自然语言生成)


    对话系统???/div>
  • DST??椋捍娲⒘说鼻暗亩曰白刺ㄒ馔己筒畚?,这一模块的目标是追踪用户需求并判断当前的对话状态。该??橐远嗦侄曰袄贰⒌鼻暗挠没Ф魑淙?,通过总结和推理理解在上下文的环境下用户当前输入自然语言的具体含义。

  • DPL??椋阂脖怀莆曰安呗杂呕╫ptimization),根据当前的对话状态,对话策略决定下一步执行什么系统动作。系统行动与用户意图类似,也由意图和槽位构成。

2、各??槭淙胧涑鑫贝?/h3>

整体流程
输入:用户输入(sentence)
过程:
userAct <-- NLU(sentence)
dialogState <-- DST(userAct, dialogHistory)
systemAct <-- DPL(dialogState)
reply <-- NLG(systemAct)
输出:系统回复(reply)
NLU???/h5>
输入:用户输入(sentence)
过程:
userAct.intent <-- intentRecognizer(sentence)
userAct.slotArray <-- slotFilling(sentence, userAct.intent)
输出:用户动作(userAct)
DST???/h5>
输入:用户动作(uesrAct) & 对话历史(dialogHistory)
过程:
if userAct.intent is not None:
    dialogState.intent <-- userAct.intent
    dialogState.slotArray <-- userAct.slotArray
    checkDefaultSlot(dialogState)
else:
   dialogState.intent <-- getIntent(dialogHistory)
    dialogState.slotArray <--
updateDialogState(userAct.slotArray, dialogHistory)
输出:对话状态(dialogState)
DPL???/h5>
输入:对话状态(dialogState)
过程:
if dialogState.intent == "询问天气":
    if dialogState.slotArray[0] is None:
        systemAct.intent <-- "AskDate"
    elif dialogState.slotArray[1] is None:
        systemAct.intent <-- "AskLocation"
    else:
        systemAct.intent <-- "AskWeather"
        systemAct.slotArray[0] <- getWeather(dialogState.slotArray)
elif dialogState.intent is None:
    systemAct.intent <-- Exception("IntentError")
else:
    OtherService
输出:系统动作(systemAct)
NLG???/h5>
输入:系统动作(systemAct)
过程:
if systemAct.intent == "AskDate":
    reply <-- "请输入时间"
elif systemAct.intent == "AskLocation":
    reply <-- "请输入地点"
elif systemAct.intent == "AnswerWeather":
    reply <-- systemAct.slotArray[0]
elif systemAct.intent == "IntentError":
    reply <-- "抱歉,刚刚没听出,能再说一次吗"
else:
    OthersystemAct
输出:系统回复(reply)

3、Stories - 对话场景

对话的场景流程。人机对话过程中可能出现的故事情节,训练得到人机对话系统所需的对话模型。

  • 场景:用“##”表示
  • 意图:用“*”表示
  • 活动:用“-”表示

4、Domain - 机器人大脑

定义了对话机器人应知道的所有信息,相当于大脑框架,指定了意图intents, 实体entities, 词槽slots以及动作actions。

5、Slots - 词槽

词槽是机器人的记忆,以k-v存储。
词槽类型有:文本、布尔、分类、浮点、列表、只存但未用

6、Actions - 动作

Actions是接下来要执行的操作,包括要返回给用户的信息。有三种定义方法:

1. utter actions - 模板回复
2. utter default - 默认动作

默认的一组动作,无需定义,直接使用。有如下三种方法:

  • action_listen:停止预测,等待用户的输入
  • action_restart:重置整个对话
  • action_default_fallback:撤销最后一条用户信息并返回机器人不理解该消息
3. dstom actions - 自定义动作

自定义动作,是多轮对话关键点,允许执行任何操作并反馈给用户。

  • 在domain.yml文件中定义actions
  • 在endpoint.yml文件中指定webserver的url地址,在指定的webserver中实现它
  • 官方提供python sdk使用户自定义action,需继承Action并重写name和run方法

四 多轮对话设计实现(一)

单场景多伦对话:以询问天气为例,实现对话能在地点与时间之间相互切换。

1、功能分析

1. 分析对话案例(输入输出)
轮次 输入 输出
1 北京明天天气如何? 北京明天的具体天气
2 后天呢 北京后天的具体天气
3 那上海呢 上海后天的具体天气
4 那三亚明天呢 三亚明天的具体天气
- 深圳 | 杭州 | ···呢 某地明天的具体天气
- 今天 | 明天 | 后天呢 某地某时的具体天气
N ··· ···
2. 分析实体类别(槽值)
  • 地址(暂时只考虑中国城市)
  • 时间(暂时只考虑今天/明天/后天)
3. 分析意图类别
  • 意图1:问候语(你好)
  • 意图2:结束语(再见)
  • 意图3:问地点(三亚会下雪吗)
  • 意图4:问时间(明天会很热吗)
  • 意图5:问地点和时间(三亚明天后下雪吗)
4. 分析对话场景
  • [1] 直接询问:一句话中同时包含address + date。一轮实现
  • [2] 直接多次询问:每次询问只含一个意图(此处为两个场景)。两轮实现
  • [3] 先问候再直接询问:第一次问候,第二次同时包含两个意图。两轮实现
  • [4] 结束语
5. 根据意图所采取的动作(Action??榉治觯?/h5>
  • [1] 意图a --> 返回模板“你好,请输入城市和时间”
  • [2] 意图b --> 返回模板“拜拜”
  • [3] 意图c --> 返回模板“什么时候?”
  • [4] 意图d --> 返回模板“哪座城市?”
  • [5] 意图e(以及填槽完成)--> 返回具体城市具体时间的具体天气
6. 训练语料分析
  • 意图1的标注语料(问候语 - 打招呼)
  • 意图2的标注语料(结束语)
  • 意图3的标注语料(地址 - 需标记城市实体词)
  • 意图4的标注语料(时间 - 需标记时间实体词)
  • 意图5的标注语料(地址&时间 - 需标记地址和时间的实体词)

2、功能实现

1. 初始化一个项目

rasa init

2. config.yml 配置文件
  • 指定语言
  • 指定pipeline
language: "zh"

pipeline:
  - name: "nlp_mitie"
    model: "data/total_word_feature_extractor_zh.dat"  // 加载mitie模型
  - name: "tokenizer_jieba"  // 使用jieba分词
  - name: "ner_mitie"  // mitie的命名实体识别
  - name: "ner_synonyms"
  - name: "intent_featurizer_mitie"  // 特征提取
  - name: "intent_classifier_sklearn"  // sklearn的意图分类模型

policies:
  - name: MemoizationPolicy
  - name: KerasPolicy
  - name: MappingPolicy
3. stories.md 场景编写
  • [1] ## address_date 直接询问的场景
  • [2] ## address + date 直接多次询问(先问城市后问时间)
  • [3] ## date + addresss 直接多次询问(先问时间后问地址)
  • [4] ## greet + address_date 先问候再直接询问
  • [5] ## goodbye
## greet
* greet OR weather
  - utter_greet

## goodbye
* goodbye
  - utter_goodbye

## weather 1 - address_date
* address_date{"address": "上海", "date": "明天"}
  - utter_waiting
  - action_report_weather
  - utter_report_weather
* address{"address": "上海"} OR date{"date": "明天"}
  - utter_waiting
  - action_report_weather
  - utter_report_weather

## weather 2 - address + date
* address{"address": "上海"}
  - utter_date
* date{"date": "明天"}
  - utter_waiting
  - action_report_weather
  - utter_report_weather
* address{"address": "上海"} OR date{"date": "明天"}
  - utter_waiting
  - action_report_weather
  - utter_report_weather
  
## weather 3 - data + address
* date{"date": "明天"}
  - utter_address
* address{"address": "上海"}
  - utter_waiting
  - action_report_weather
  - utter_report_weather
* address{"address": "上海"} OR date{"date": "明天"}
  - utter_waiting
  - action_report_weather
  - utter_report_weather
  
## weather 4 - greet_1
* greet_address_date{"address": "上海", "date-time": "明天"}
  - utter_waiting
  - action_report_weather
  - utter_report_weather
* address{"address": "上海"} OR date{"date": "明天"}
  - utter_waiting
  - action_report_weather
  - utter_report_weather
4. domain.yml 对话管理
  • [1] intents: 意图集
  • [2] slots: 填槽集
  • [3] entities: 实体集
  • [4] actions: 执行集
  • [5] templates: 回复模板集
intents:
  - greet
  - address_date
  - address
  - date
  - goodbye
  - waiting

slots:
  address:
    type: text
  date:
    type: text
  matches:
    type: unfeaturized

entities:
  - address
  - date

actions:
  - utter_greet
  - utter_address
  - utter_date
  - action_report_weather
  - utter_report_weather
  - utter_goodbye
  - utter_waiting

templates:
  utter_greet:
  - text: "你好,请输入城市和时间"

  utter_address:
  - text: "哪座城市?"

  utter_date:
  - text: "什么时候?"

  utter_waiting:
  - text: "正在查询中..."

  utter_goodbye:
  - text: "拜拜"

  utter_report_weather:
  - text: "{matches}"
5. actions 动作执行
  • [1] 编写一个天气报告类并继承FormAction类
  • [2]重写name
  • [3]重写submit方法并获取词槽中的address和date实体值,再通过pai接口(知心天气)将其实体值传入,最后将调取结果返回到对应actions的模板template中
  • 将三方(知心天气)接口返回结果生成NLG,返回给用户
import logging

from typing import List
from rasa_core_sdk.forms import FormAction, EntityFormField
from rasa_core_sdk.events import SlotSet
from requests import (
    ConnectionError,
    HTTPError,
    TooManyRedirects,
    Timeout
)
from api import get_weather_by_day


logger = logging.getLogger(__name__)


class ActionReportWeather(FormAction):
    RANDOMIZE = True

    @staticmethod
    def required_fields():
        return [
            EntityFormField("address", "address"),
            EntityFormField("date", "date"),
        ]

    def name(self):
        # type: () -> Text
        return "action_report_weather"

    def submit(self, dispatcher, tracker, domain):
        # type: (Dispatcher, DialogueStateTracker, Domain) -> List[Event]
        address = tracker.get_slot('address')
        date_time = tracker.get_slot('date')

        logger.debug("get address and date: {}|{}".format(address, date_time))

        date_time_number = text_date_to_number_date(date_time)

        if isinstance(date_time_number, str):  # parse date_time failed
            return [SlotSet("matches", "暂不支持查询[{}{}]的天气".format(
                address, date_time))]
        else:
            try:
                weather_data = get_text_weather_date(address,
                                                     date_time,
                                                     date_time_number)
            except:
                return [SlotSet("matches", "暂不支持查询[{}{}]的天气".format(
                    address, date_time))]

            return [SlotSet("matches", "{}".format(weather_data))]
6. 训练语料
  • 按json格式标记出每一句话的意图,若有实体值需标记其值以及起始位置
  • nlu.json文件中如下5类别意图的标注样例:
[
      {
        "intent": "greet",
        "entities": [
        ],
        "text": "你好"
      },
{
        "intent": "goodbye",
        "entities": [
        ],
        "text": "再见"
      },
      {
        "intent": "address",
        "entities": [
          {
            "start": 9,
            "end": 11,
            "value": "香港",
            "entity": "address"
          }
        ],
        "text": "不好意思可以帮我查香港的天气"
      },
      {
        "intent": "address_date",
        "entities": [
          {
            "start": 0,
            "end": 2,
            "value": "今天",
            "entity": "date"
          },
          {
            "start": 2,
            "end": 4,
            "value": "台北",
            "entity": "address"
          }
        ],
        "text": "今天台北天气如何"
      },
      {
        "intent": "date",
        "entities": [
          {
            "start": 0,
            "end": 2,
            "value": "今天",
            "entity": "date"
          }
        ],
        "text": "今天去外边要穿薄毛衣吗"
      }
]
7. 训练
  • rasa train core - 训练Core???/li>
  • rasa train nlu - 训练NLU???/li>
  • rasa train (默认)
[...]
Epoch 100/100
601/601 [==============================] - 0s 191us/sample - loss: 0.0714 - acc: 0.9767
2020-03-07 17:44:05 INFO     rasa.core.policies.keras_policy  - Done fitting keras policy model
2020-03-07 17:44:06 INFO     rasa.core.agent  - Persisted model to 'C:\Users\ppo223\AppData\Local\Temp\tmp0cd3ld64\core'
Core model training completed.
NLU data/configuration did not change. No need to retrain NLU model.
Your Rasa model is trained and saved at 'D:\python\rasa\weather\design1\models\20200307-174406.tar.gz'.
8. 可视化场景流程图

rasa visualize --out htmls\ask_weather_030701.html
(rasa --help 查看命令)

[...]
Processed Story Blocks: 100%|████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 1605.09it/s, # trackers=2]
2020-03-07 17:45:50 INFO     rasa.core.visualize  - Finished graph creation. Saved into file://D:\python\rasa\weather\design1\htmls\ask_weather_030701.html
场景流程图
9. 预测

# 先启动endpoint
python -m rasa_core_sdk.endpoint --actions bot

(start /b python -m rasa_core_sdk.endpoint --actions bot # windows挂在后台)

(weather) D:\python\rasa\weather\Action>INFO:__main__:Starting action endpoint server...
INFO:rasa_core_sdk.executor:Registered function for 'action_report_weather'.
INFO:rasa_core_sdk.executor:Registered function for 'action_report_scenery'.
INFO:rasa_core_sdk.executor:Registered function for 'action_report_food'.
INFO:rasa_core_sdk.executor:Registered function for 'action_report_hotel'.
INFO:rasa_core_sdk.executor:Registered function for 'action_confirm'.
INFO:__main__:Action endpoint is up and running. on ('0.0.0.0', 5055)

# 开始预测
rasa shell

[...]
Your input ->  北京明天天气如何                                                                                                      
正在查询中...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 17:46:56] "POST /webhook HTTP/1.1" 200 583 0.210861

            北京 明天 (2020-03-08) 的天气情况为:白天:多云;夜晚:小雨;气温:12-1 °C

Your input ->  后天呢                                                                                                                
正在查询中...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 17:47:05] "POST /webhook HTTP/1.1" 200 504 0.270544

            北京 后天 (2020-03-09) 的天气情况为:白天:小雨;夜晚:晴;气温:10--1 °C

Your input ->  那上海呢                                                                                                              
正在查询中...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 17:47:13] "POST /webhook HTTP/1.1" 200 512 0.233907

            上海 后天 (2020-03-09) 的天气情况为:白天:小雨;夜晚:小雨;气温:15-9 °C

Your input ->  那三亚明天呢                                                                                                          
正在查询中...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 17:47:26] "POST /webhook HTTP/1.1" 200 584 0.162629

            三亚 明天 (2020-03-08) 的天气情况为:白天:多云;夜晚:多云;气温:30-23 °C

Your input ->  深圳呢                                                                                                                
正在查询中...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 17:47:35] "POST /webhook HTTP/1.1" 200 513 0.199864

            深圳 明天 (2020-03-08) 的天气情况为:白天:多云;夜晚:小雨;气温:28-20 °C

Your input ->  杭州呢                                                                                                                
正在查询中...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 17:47:42] "POST /webhook HTTP/1.1" 200 512 0.188495

            杭州 明天 (2020-03-08) 的天气情况为:白天:小雨;夜晚:大雨;气温:16-9 °C

Your input ->  今天呢                                                                                                                
正在查询中...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 17:47:50] "POST /webhook HTTP/1.1" 200 503 0.191735

            杭州 今天 (2020-03-07) 的天气情况为:白天:阴;夜晚:小雨;气温:17-9 °C

Your input ->  明天呢                                                                                                                
正在查询中...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 17:47:57] "POST /webhook HTTP/1.1" 200 509 0.212674

            杭州 明天 (2020-03-08) 的天气情况为:白天:小雨;夜晚:大雨;气温:16-9 °C

Your input ->  后天呢                                                                                                                
正在查询中...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 17:48:03] "POST /webhook HTTP/1.1" 200 510 0.224308

            杭州 后天 (2020-03-09) 的天气情况为:白天:小雨;夜晚:小雨;气温:17-10 °C

Your input ->  香港明天呢                                                                                                            
正在查询中...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 17:48:15] "POST /webhook HTTP/1.1" 200 584 0.209823

            香港 明天 (2020-03-08) 的天气情况为:白天:多云;夜晚:小雨;气温:27-21 °C

Your input ->  伦敦今天呢                                                                                                            
正在查询中...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 17:48:26] "POST /webhook HTTP/1.1" 200 385 0.196529
暂不支持查询[伦敦今天]的天气
Your input -> 

五 多轮对话设计实现(二)

设计集天气、景点、美食和住宿的多场景旅游综合多伦对话系统。要求对话机器人准确回答天气、景点、美食和住宿多场景间相互切换的提问。

1、功能分析

1. 场景类别
  • 天气
  • 景点
  • 美食
  • 住宿
2. 意图分析
  • 天气类
地址和日期
地址 + 日期
日期 + 地址
问候和地址和日期
问候 + 地址和日期
问候 + 地址 + 日期
问候 + 日期 + 地址    
  • 景点类
景点意图有地址
景点意图无地址 + 地址
  • 美食类
美食意图有地址
美食意图无地址 + 地址
  • 住宿类
住宿意图有地址和日期
住宿意图有地址 + 日期
住宿意图有日期 + 地址
住宿问候意图有地址和日期
问候 + 住宿意图地址和日期
问候 + 住宿意图地址 + 日期
问候 + 住宿意图日期 + 地址
3. 意图转换
1. 天气转天气
    - 保留地址转换时间
    - 保留时间转换地址
2. 切换景点地址
    - 切换地址后回答切换后地址的景点
3. 切换美食地址
    - 切换地址后回答切换后地址的美食
4. 住宿转住宿
    - 保留地址转换时间
    - 保留时间转换地址
4. 场景转换
1. 天气转换景点再转天气
2. 天气转换美食再转天气
3. 天气转换住宿再转天气

4. 景点转换天气再转景点、
5. 景点转换美食再转景点
6. 景点转换住宿再转景点

7. 美食转换天气再转美食
8. 美食转换景点再转美食
9. 美食转换住宿再转美食

10. 住宿转换天气再转住宿
11. 住宿转换景点再转住宿
12. 住宿转换美食再转住宿
3. 场景流程图
4. 预测

# 启动endpoint
python -m rasa_core_sdk.endpoint --actions bot
# 预测
rasa shell

Your input ->  北京后天下雨吗                                                                                                        
[...]
127.0.0.1 - - [2020-03-07 21:58:15] "POST /webhook HTTP/1.1" 200 578 0.656985

            北京 后天 (2020-03-09) 的天气情况为:白天:小雨;夜晚:晴;气温:10--1 °C

Your input ->  南京呢                                                                                                                
小智正在查询[南京后天]的天气...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 21:58:25] "POST /webhook HTTP/1.1" 200 512 0.260754

            南京 后天 (2020-03-09) 的天气情况为:白天:小雨;夜晚:小雨;气温:12-8 °C

Your input ->  明天呢                                                                                                                
小智正在查询[南京明天]的天气...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 21:58:32] "POST /webhook HTTP/1.1" 200 509 0.207639

            南京 明天 (2020-03-08) 的天气情况为:白天:多云;夜晚:小雨;气温:15-8 °C

Your input ->  杭州呢                                                                                                                
小智正在查询[杭州明天]的天气...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 21:58:39] "POST /webhook HTTP/1.1" 200 512 0.208335

            杭州 明天 (2020-03-08) 的天气情况为:白天:小雨;夜晚:大雨;气温:16-9 °C

Your input ->  北京呢                                                                                                                
小智正在查询[北京明天]的天气...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 21:59:01] "POST /webhook HTTP/1.1" 200 512 0.220731

            北京 明天 (2020-03-08) 的天气情况为:白天:多云;夜晚:小雨;气温:12-1 °C

Your input ->  有什么风景                                                                                                            
小智正在查询[北京的景点]...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_scenery'
127.0.0.1 - - [2020-03-07 21:59:11] "POST /webhook HTTP/1.1" 200 299 0.007959
暂不支持[北京]的景点查询
Your input ->  上海呢                                                                                                                
小智正在查询[上海的景点]...
[...]
127.0.0.1 - - [2020-03-07 21:59:23] "POST /webhook HTTP/1.1" 200 375 0.005011
上海的景点有:城隍庙、外滩、东方明珠、朱家角古镇
Your input ->  三亚呢                                                                                                                
小智正在查询[三亚的景点]...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_scenery'
127.0.0.1 - - [2020-03-07 21:59:29] "POST /webhook HTTP/1.1" 200 369 0.006945
三亚的景点有:天涯海角、蝴蝶谷、情人岛、亚龙湾
Your input ->  广州今天下雪吗                                                                                                        
小智正在查询[广州今天]的天气...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 21:59:49] "POST /webhook HTTP/1.1" 200 584 0.380998

            广州 今天 (2020-03-07) 的天气情况为:白天:阵雨;夜晚:阵雨;气温:24-20 °C

Your input ->  明天呢                                                                                                                
小智正在查询[广州明天]的天气...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 22:00:01] "POST /webhook HTTP/1.1" 200 510 0.217212

            广州 明天 (2020-03-08) 的天气情况为:白天:阵雨;夜晚:阵雨;气温:24-20 °C

Your input ->  深圳呢                                                                                                                
小智正在查询[深圳明天]的天气...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 22:00:07] "POST /webhook HTTP/1.1" 200 513 0.215811

            深圳 明天 (2020-03-08) 的天气情况为:白天:多云;夜晚:小雨;气温:28-20 °C

Your input ->  三亚呢                                                                                                                
小智正在查询[三亚明天]的天气...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_weather'
127.0.0.1 - - [2020-03-07 22:00:40] "POST /webhook HTTP/1.1" 200 513 0.213490

            三亚 明天 (2020-03-08) 的天气情况为:白天:多云;夜晚:多云;气温:30-23 °C

Your input ->  我需要预定一间大床房                                                                                                  
小智正在查询[三亚明天]的住宿...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_hotel'
127.0.0.1 - - [2020-03-07 22:00:51] "POST /webhook HTTP/1.1" 200 339 0.007978
三亚明天提供的住宿有:亚特兰蒂斯酒店
Your input ->  苏州呢                                                                                                                
小智正在查询[苏州明天]的住宿...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_hotel'
127.0.0.1 - - [2020-03-07 22:01:10] "POST /webhook HTTP/1.1" 200 309 0.011966
苏州明天提供的住宿有:洲际
Your input ->  有什么风景                                                                                                            
小智正在查询[苏州的景点]...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_scenery'
127.0.0.1 - - [2020-03-07 22:01:34] "POST /webhook HTTP/1.1" 200 351 0.007978
苏州的景点有:寒山寺、拙政园、留园、虎丘
Your input ->  上海呢                                                                                                                
小智正在查询[上海的景点]...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_scenery'
127.0.0.1 - - [2020-03-07 22:01:58] "POST /webhook HTTP/1.1" 200 375 0.016958
上海的景点有:城隍庙、外滩、东方明珠、朱家角古镇
Your input ->  三亚呢                                                                                                                
小智正在查询[三亚的景点]...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_scenery'
127.0.0.1 - - [2020-03-07 22:02:05] "POST /webhook HTTP/1.1" 200 369 0.005984
三亚的景点有:天涯海角、蝴蝶谷、情人岛、亚龙湾
Your input ->  有什么好吃的                                                                                                          
小智正在查询[三亚的美食]...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_food'
127.0.0.1 - - [2020-03-07 22:02:17] "POST /webhook HTTP/1.1" 200 339 0.009944
三亚的美食有:和乐蟹、东山羊、椰子饭
Your input ->  苏州呢                                                                                                                
小智正在查询[苏州的美食]...
[...]
DEBUG:rasa_core_sdk.executor:Successfully ran 'action_report_food'
127.0.0.1 - - [2020-03-07 22:02:35] "POST /webhook HTTP/1.1" 200 345 0.006982
苏州的美食有:苏式蜜饯、叫化鸡、桂花糕
Your input ->  

六 总结

1、业内发展情况

整体来看,聊天机器人经历了从问答机器人到对话机器人的发展,但目前大部分的聊天机器人都属于问答机器人,也就是只能处理一问一答,不能很好地处理对话,或者说不能处理上下文,并不具备真正的人工智能特征。
聊天机器人还处于发展早期阶段,其在未来得到跨越式发展也是非常具有挑战,最大的挑战之一就是如何访问并获取大量的数据。收集数据后,聊天机器人在交互体验更加拟人化,更好理解、预测场景词汇中还有如下挑战:

  • (1)整合语境的挑战:为了生成明智的回复,系统可能需要整合语言语境和物理语境,还可能整合其他类型语境数据如日期/时间/位置/用户信息等。
  • (2)一致人格的挑战
  • (3)意图与多样性挑战
2、对话系统业内难点
  • (1)手工编写的对话策略难以涵盖所有对话场景
  • (2)基于统计的方法和基于神经网络的方法都需要大量数据
  • (3)需要大量的领域知识、对话知识和世界知识来生成有意义的回复语义表征。

在从少量样本中进行训练,或者在无任何样本的情况下进行信息补全,已解决对话系统的“冷启动”问题?;谏疃鹊那炕霸诙曰肮芾砹煊蛑饕挥糜诎镏低吃谑导式换ブ型ü畲蠡惚ê╮eward function)学习在特定状态下采取那种回复,从而不断增强对话模型中的优势策略,削弱负面策略的影响。这样一来,用户会觉得系统越来越人性化、个性化。SeqGAN采用对抗网络实现了离散序列数据的生成模型,解决了GAN难应于自然语言处理领域的问题,并且可以被用来选择最优的奖励函数及其参数。

七 主要参考资料

1.《rasa对外接口和core代码分析第1波》https://zhuanlan.zhihu.com/p/76623359
2.《rasa core源码分析第2波-对话管理》https://zhuanlan.zhihu.com/p/76935986
3.《Rasa使用指南01》https://terrifyzhao.github.io/2018/09/17/Rasa%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%9701.html
4.《Rasa使用指南02》https://terrifyzhao.github.io/2019/02/26/Rasa%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%9702.html
5.《深入理解rasa NLU:part1 - 意图分类》https://zhuanlan.zhihu.com/p/84075497
6.《rasa官网 - 使用自定义组件增强Rasa NLU模型》https://blog.rasa.com/enhancing-rasa-nlu-with-custom-components/
7.《基于RASA的task-orient对话系统解析(一)》https://zhuanlan.zhihu.com/p/75517803
8.《rasa对话系统踩坑记》(一到十)http://08643.cn/p/5d9aa2a444a3

最后编辑于
?著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,128评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,316评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,737评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,283评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,384评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,458评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,467评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,251评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,688评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,980评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,155评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,818评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,492评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,142评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,382评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,020评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,044评论 2 352

推荐阅读更多精彩内容