当前位置：首页 > news >正文

河南网站建设首选公司镇江教育云平台网站建设

news 2026/5/8 6:53:55

河南网站建设首选公司,镇江教育云平台网站建设,外贸公司会计账务处理,安徽中小企业网站建设1 基本概念 1.1 自然语言处理的分类 IR-BOT#xff1a;检索型问答系统 Task-bot#xff1a;任务型对话系统 Chitchat-bot:闲聊系统 1.2 任务型对话Task-Bot:task-oriented bot 这张图展示了一个语音对话系统#xff08;或聊天机器人#xff09;的基本组成部分和它们之间的…1 基本概念 1.1 自然语言处理的分类 IR-BOT检索型问答系统 Task-bot任务型对话系统 Chitchat-bot:闲聊系统 1.2 任务型对话Task-Bot:task-oriented bot 这张图展示了一个语音对话系统或聊天机器人的基本组成部分和它们之间的工作流程。这个系统可以接受语音信号作为输入输出文本响应并且它包括以下几个主要部分 1.2.1 自动语音识别ASR 这个部分的任务是将用户的语音信号转换成文本。在这个例子中ASR将语音信号识别为文本输入“Are there any action movies to see this weekend?” 1.2.2 语言理解SLU 一旦语音转换为文本语言理解部分就开始工作包括三个子任务领域识别Domain Identification确定用户的请求属于哪一个领域或类别例如电影、音乐或天气等。用户意图检测User Intent Detection识别用户的目的或意图例如询问电影信息、预订餐厅等。槽位填充Slot Filling从用户的话中提取具体信息如电影类型、日期、时间等。 1.2.3 语义框架Semantic Frame 这是语言理解的结果它结构化地表达了用户的请求包括动作如请求电影、属性如类型是动作片和时间如这个周末。 1.2.4 对话管理DM 对话管理组件控制对话的流程并决定如何响应用户的输入。它包括两个部分对话状态跟踪DST保持对话的当前状态追踪对话历史和用户提供的信息。对话策略Dialogue Policy基于对话的当前状态和过去的交互决定下一步的最佳动作。 1.2.5 自然语言生成NLG 这个部分根据对话管理系统的输出生成自然语言文本。例如如果系统需要知道用户的位置NLG会生成问题“Where are you located?” 这张图通过展示从语音输入到文本响应的完整流程概述了一个典型的语音对话系统的工作方式。这种系统可以用于各种应用如虚拟助手、客服聊天机器人等。 1.2.6 SLU的深入学习 1.2.6.1 SLU的结构结构化表示自然语言的语言act-slot-value tuples act1(slot1value1,slot2value2,...).act2(slot1value1,......),.... accttype ,slot,value的取值范围已预先定义好 ”您好韩小姐麻烦提供下手机号哦“——request(phone,name韩小姐) 1.2.6.2 实现SLU的技术 1.2.6.2.1 语法分析通过语法以及语法结构分析出客户意图与槽值。 1.2.6.2.2 Semantic tagging eg. HMM,CRF 给句子进行手动标柱槽值进行机器学习训练 1.2.6.2.3 分类的思想使用多个分类器对句子内容进行分类 1.2.6.2.4 深度学习建立神经网络蛋速度慢 1.2.7 DST的深入学习对话状态应该包含持续对话所需要的各种信息 DST问题依据最新的系统和动作更新对话状态 1.2.8 DPO的深入学习系统如何做出反馈动作作为序列决策过程进行优化增强学习 1.2.9 自然语言生成NLG的深入学习基于模版已经为您预定{time}的电影(movie_name) 基于语法规则生成模型方法 1.2.10 其他类型的Task-Bot Microsoft:End-to-End Task-Completion Neural Dialogue Systems 2 Rasa的学习本节介绍如何在Rasa框架下创建聊天机器人。目的是让学生发现和学习如何使用Rasa包在Python环境下创建聊天机器人。 2.1 安装与初始化一个MoodBot 实验室中提到的安装Rasa的命令是 python3 -m pip install rasa --user安装完成后可以通过下面的命令创建一个基于Rasa的MoodBot示例项目 rasa init需要基本的命令帮助例如训练、测试、运行机器人等可以直接输入rasa命令或者参考它的在线文档[Rasa文档](https://rasa.com/docs/rasa/)。特别是关于NLU训练、域domains、配置和动作actions的概念部分这些都是学习如何根据自己的需求定制聊天机器人的有用资源。 2.2 文件分析在你的rasa目录下的文件夹中有三个主要的文件 2.2.1 credentials.yml credentials.yml这个文件包含访问各种社交网络来测试聊天机器人的密钥。这些社交网络可能包括Facebook Messenger、Slack等通过这些密钥你的聊天机器人可以接入并在这些平台上进行交互。 # This file contains the credentials for the voice chat platforms # which your bot is using. # https://rasa.com/docs/rasa/messaging-and-voice-channelsrest: # # you dont need to provide anything here - this channel doesnt # # require any credentials#facebook: # verify: verify # secret: your secret # page-access-token: your page access token#slack: # slack_token: your slack token # slack_channel: the slack channel # slack_signing_secret: your slack signing secret#socketio: # user_message_evt: event name for user message # bot_message_evt: event name for bot messages # session_persistence: true/false#mattermost: # url: https://mattermost instance/api/v4 # token: bot token # webhook_url: callback URL# This entry is needed if you are using Rasa Enterprise. The entry represents credentials # for the Rasa Enterprise channel, i.e. Talk to your bot and Share with guest testers. rasa:url: http://localhost:5002/apiRasa聊天机器人的credentials.yml配置文件该文件用于设置不同通讯平台的认证信息。Rasa可以通过这些信息与各种社交媒体和消息传递平台进行交互比如REST API、Facebook Messenger、Slack、Socket.IO、Mattermost等。这里列出了几个平台的配置示例下面是每个部分的作用 rest: 这是一个简单的REST API不需要特别的认证信息您的机器人可以通过HTTP请求接收和发送消息。 facebook: 如果您想通过Facebook Messenger使您的机器人能够交流您需要填写验证令牌、秘密密钥和页面访问令牌。 slack: 对于Slack集成您需要提供Slack令牌、频道和签名秘密。 socketio: 如果您使用的是Socket.IO您需要定义用户消息和机器人消息的事件名称以及是否持久化会话。 mattermost: 类似于Slack如果您使用Mattermost您需要提供Mattermost实例的URL、机器人令牌和回调URL。最后如果您使用的是Rasa企业版您还需要配置Rasa通道这样您的机器人就可以与Rasa企业版的API进行通信。要激活这些通道您需要取消注释相关部分并填写相应的认证信息。请确保在实际部署机器人时不要将敏感的认证信息泄露到公共代码仓库或不安全的地方。在本地测试时可以使用默认的http://localhost:5002/api路径作为Rasa企业通道的URL。 2.2.2 config.yml 这个配置文件是用于配置和训练一个Rasa聊天机器人的。Rasa是一个开源的机器学习框架用于构建对话式AI和聊天机器人。这个文件包括几个主要部分 # The config recipe. # https://rasa.com/docs/rasa/model-configuration/ recipe: default.v1# The assistant project unique identifier # This default value must be replaced with a unique assistant name within your deployment assistant_id: 20240207-103316-skinny-actuary# Configuration for Rasa NLU. # https://rasa.com/docs/rasa/nlu/components/ language: enpipeline: null # # No configuration for the NLU pipeline was provided. The following default pipeline was used to train your model. # # If youd like to customize it, uncomment and adjust the pipeline. # # See https://rasa.com/docs/rasa/tuning-your-model for more information. # - name: WhitespaceTokenizer # - name: RegexFeaturizer # - name: LexicalSyntacticFeaturizer # - name: CountVectorsFeaturizer # - name: CountVectorsFeaturizer # analyzer: char_wb # min_ngram: 1 # max_ngram: 4 # - name: DIETClassifier # epochs: 100 # constrain_similarities: true # - name: EntitySynonymMapper # - name: ResponseSelector # epochs: 100 # constrain_similarities: true # - name: FallbackClassifier # threshold: 0.3 # ambiguity_threshold: 0.1# Configuration for Rasa Core. # https://rasa.com/docs/rasa/core/policies/ policies: null # # No configuration for policies was provided. The following default policies were used to train your model. # # If youd like to customize them, uncomment and adjust the policies. # # See https://rasa.com/docs/rasa/policies for more information. # - name: MemoizationPolicy # - name: RulePolicy # - name: UnexpecTEDIntentPolicy # max_history: 5 # epochs: 100 # - name: TEDPolicy # max_history: 5 # epochs: 100 # constrain_similarities: truerecipe: default.v1:这指定了Rasa使用的训练配方。default.v1是Rasa提供的默认配方。 assistant_id:20240207-103316-skinny-actuary - 这是聊天机器人项目的唯一标识符。在部署中这个默认值需要替换为一个独一无二的助手名称。 language: en:这指定了机器人用于理解和生成语言的语言代码。这里的en代表英语。 pipeline:这部分用于配置Rasa NLU自然语言理解的处理流水线。这里没有提供具体配置而是使用了Rasa的默认流水线。如果你想自定义流水线可以取消注释并调整下面的配置。这个流水线包括文本的分词、特征提取、意图识别和实体抽取等步骤。 policies:这部分用于配置Rasa Core的决策策略这些策略决定了机器人如何根据用户的输入选择回应。同样这里没有提供具体配置而是使用了默认的策略。如果你想自定义策略可以取消注释并调整下面的配置。这些策略包括对话管理的规则、意图预测的模型等。总之这个配置文件为Rasa聊天机器人的训练提供了基础的设置包括使用的语言、处理流水线和对话策略。你可以根据需要修改这个文件来定制你的聊天机器人。 2.2.3 domain.yml domain.yml 文件是 Rasa 项目中的一个重要文件包含了聊天机器人的所有关键数据。其中包括意图intents、动作actions、动作的响应responses to actions以及在比 Moodbot 更复杂的其他机器人中可能还包括插槽slots和模板templates等内容。 2.2.3.1 意图Intents 意图代表用户消息背后的意图或目标。例如如果用户请求帮助相应的意图可能是 help。 2.2.3.2 动作Actions 动作是机器人的响应或行为。这可以包括发送消息、执行操作或查询外部API等。 2.2.3.3 动作的响应Responses to Actions 这些是机器人在执行动作后将发送给用户的消息或响应。它们可以是简单的文本消息也可以是涉及自定义模板等更复杂的响应。 2.2.3.4 插槽Slots 插槽是机器人需要从用户那里收集的信息片段以完成任务。例如如果机器人正在帮助用户预订航班它可能需要插槽来存储出发城市、目的地城市和出行日期等信息。 2.2.3.5 模板Templates 模板是预定义的响应机器人可以使用它们来生成消息。这些可以包括用于动态内容如插槽值或从用户消息中提取的实体的占位符。 domain.yml文件充当了组织和管理机器人功能的中心枢纽。它有助于定义机器人的行为并指导其与用户的交互。 2.2.4 data/nlu.yml 在这个文件夹里我们找到了与所有意图相对应的句子例如 version: 3.1nlu: - intent: greetexamples: |- hey- hello- hi- hello there- good morning- good evening- moin- hey there- lets go- hey dude- goodmorning- goodevening- good afternoon- intent: goodbyeexamples: |- cu- good by- cee you later- good night- bye- goodbye- have a nice day- see you around- bye bye- see you later- intent: affirmexamples: |- yes- y- indeed- of course- that sounds good- correct- intent: denyexamples: |- no- n- never- I dont think so- dont like that- no way- not really- intent: mood_greatexamples: |- perfect- great- amazing- feeling like a king- wonderful- I am feeling very good- I am great- I am amazing- I am going to save the world- super stoked- extremely good- so so perfect- so good- so perfect- intent: mood_unhappyexamples: |- my day was horrible- I am sad- I dont feel very well- I am disappointed- super sad- Im so sad- sad- very sad- unhappy- not good- not very good- extremly sad- so saad- so sad- intent: bot_challengeexamples: |- are you a bot?- are you a human?- am I talking to a bot?- am I talking to a human?- intent: GetInfo_winlossRecordexamples: |- I need to know the record of [Manchester City](team).- Im wondering what record right now does [West Ham](team) have?- How is [Watford](team) doing?- What is [AFC Bournemouth](team) record right now?- I am looking for information about the soccer team called[Burnley](team).- I want to know the record of [Aston Villa](team).举例说明 nlu: - intent: greetexamples: |- hey- hello- hi- hello there- good morning- good evening- moin- hey there- lets go- hey dude- goodmorning- goodevening- good afternoon 这段代码是一个Rasa NLUNatural Language Understanding的配置文件用于定义意图intent以及它们的示例examples。这个配置文件中定义了一个名为greet的意图该意图用于识别用户打招呼的消息。示例中包括了一些常见的打招呼方式比如hey、hello、hi等等。 - intent: GetInfo_winlossRecordexamples: |- I need to know the record of [Manchester City](team).- Im wondering what record right now does [West Ham](team) have?- How is [Watford](team) doing?- What is [AFC Bournemouth](team) record right now?- I am looking for information about the soccer team called[Burnley](team).- I want to know the record of [Aston Villa](team). 这段代码定义了一个名为GetInfo_winlossRecord的意图用于识别用户想要获取足球球队战绩信息的消息。示例中包括了一些询问特定足球球队战绩的例子每个例子都包含了一个team实体用于指定感兴趣的球队名称。 2.2.5 data/stories.yml 这是 rasa 最具创新性的部分您可以给出可能发生的讨论场景而不是定义一个讨论有限状态自动机。用多个讨论发生的场景来代替有限状态机。例如 version: 3.1stories:- story: happy pathsteps:- intent: greet- action: utter_greet- intent: mood_great- action: utter_happy- story: sad path 1steps:- intent: greet- action: utter_greet- intent: mood_unhappy- action: utter_cheer_up- action: utter_did_that_help- intent: affirm- action: utter_happy- story: sad path 2steps:- intent: greet- action: utter_greet- intent: mood_unhappy- action: utter_cheer_up- action: utter_did_that_help- intent: deny- action: utter_goodbye- story: GetInfo winlossRecordsteps:- intent: GetInfo_winlossRecord- action: action_winlossRecord 举例说明 - story: happy pathsteps:- intent: greet- action: utter_greet- intent: mood_great- action: utter_happy 这段代码定义了一个名为happy path的故事描述了用户的一种顺利的对话路径。故事包括了以下步骤 a.用户发送了一个打招呼的意图greet。 b.系统执行了一个回复动作action输出了一个问候语utter_greet。 c.用户表达了愉快的心情mood_great。 d.系统再次执行了一个回复动作输出了一个愉快的回复utter_happy。这个故事描述了一种典型的对话流程用户首先打招呼然后表达了愉快的心情系统随后作出了相应的回应。我们可以看到被识别的意图然后是行动。我们进入了一个循环识别意图、行动、用户反应、再一次意图如此循环。 2.3 训练与测试我们训练模型使用 rasa train 我们测试模型使用 rasa shell 2.4 闲聊与问答Chitchat and FAQs 可以通过这个链接获得更多帮助https://rasa.com/docs/rasa/chitchat-faqs/ 3. Rasa chatbot多人开发项目 3.1 项目要求 3.1.1 总体要求 a. 使用Rasa开源框架 - 建议但不强制使用Rasa框架来开发聊天机器人。 b. 超越Rasa默认功能 - 应用在学习过程中了解到的技术和原则。 - 至少采用一种基于知识的技术如本体论、逻辑推理、词网、同义词等。 - 至少采用一种基于学习的技术如频率方法、统计机器学习、深度学习等。 - 至少采用一种基于语法的技术如句法分析、正则表达式、词形还原、形态分析等。 3.1.2 5人分工示例 - 一个人负责整体Rasa流水线的设置、组件集成和测试 - 一个人负责对话逻辑、意图、自然语言理解NLU、故事等的设计和实现 - 一个人负责基于知识的组件的设计和实现 - 一个人负责基于学习的组件的设计和实现 - 一个人负责基于语法的组件的设计和实现。 3.1.3 对于知识、学习、语法组件的理解在您的聊天机器人项目中团队成员将根据不同的技术专长分工。这里提到的“基于知识的组件”、“基于学习的组件”和“基于语法的组件”分别指的是 3.1.3.1 基于知识的组件Knowledge-based Component 这指的是利用预先定义的知识体系如本体论、逻辑推理结构、词网、同义词数据库等来增强聊天机器人的理解和响应能力。设计和实现这样的组件涉及到构建一个知识库或使用现有的知识库使得聊天机器人可以参照这些知识来理解用户的意图和提供信息。在Rasa中你可以通过自定义actions和slots来实现基于知识的组件。自定义actions允许你编写Python代码来访问外部知识库或服务比如图数据库、SQL数据库或者其他API从而在对话中使用这些知识。可以使用Rasa的Entity Extraction来识别对话中的关键信息并用这些信息查询知识库从而提供有针对性的回答。通过这种方式你的聊天机器人可以使用逻辑推理和结构化的知识如本体论来处理用户的询问。 3.1.3.2 基于学习的组件Learning-based Component 这涉及到使用机器学习方法来使聊天机器人从数据中学习。这可能包括频率方法、统计学习模型或深度学习模型。这样的组件可能负责识别用户意图、文本分类、情感分析等通常需要大量的数据来训练模型。 Rasa使用机器学习来训练模型理解用户的意图intent recognition和提取实体entity extraction。它支持多种类型的机器学习模型包括预先训练好的模型和你可以自定义训练的模型。这些模型用于处理自然语言理解NLU和对话管理Dialogue Management。 Rasa允许使用自定义的机器学习管道和策略你可以在这里加入深度学习或其他统计机器学习算法。 3.1.3.3 基于语法的组件Grammar-based Component 这指的是使用语言学的方法来解析和生成语言。这可能涉及句法分析分析句子结构、使用正则表达式用于模式匹配、词形还原将词汇还原为基本形式、形态分析分析词汇的形态结构等技术。这样的组件用于提升聊天机器人处理语言的精确性。每个组件都有其在聊天机器人中的独特作用三者合作能够使得机器人更加智能和高效。例如基于知识的组件可以提供准确的专业信息基于学习的组件可以从用户对话中学习并提高对话质量而基于语法的组件可以确保语言的正确性和流畅性。项目要求强调了除了技术实现之外设计理念的重要性。你的聊天机器人需要基于理论知识构建同时还需要注意合规性和道德问题。在项目过程中团队成员之间的协作和分工也是非常重要的。虽然Rasa主要侧重于机器学习方法但你仍然可以使用正则表达式和其他语法分析技术来改善对话流程。例如可以在NLU组件中使用RegexFeaturizer来改善实体识别的性能或者用于识别和验证特定的数据格式如日期和时间。对于词形还原和形态分析可以在数据预处理阶段或通过自定义组件来实现。这可能需要与其他工具或库集成比如Spacy或NLTK。通过结合这些技术你可以创建一个更加强大和灵活的聊天机器人能够理解和回应用户的需求。记住在设计和实现这些组件时确保它们符合你的项目需求和规定的聊天机器人的应用领域。 3.2 有益的建议对于使用Rasa框架进行聊天机器人项目以下是一些有益的建议 3.2.1 使用规则或故事指导对话流程规则Rules: 它们是硬性的限制可以保证聊天机器人的行为是确定的。当你需要确保在某些情况下机器人始终给出特定的响应时使用规则。故事Stories: 它们通过机器学习的方式来约束聊天机器人的行为具有概率性。故事是对话的样本路径通过这些样本路径Rasa的机器学习模型可以学习在不同情况下采取的行动。 3.2.2 使用表单进行槽位填充使用Rasa的表单Forms功能可以更有效地从用户那里逐步收集数据。当你需要多个信息片段才能执行任务或响应时表单可以确保机器人不遗漏任何必要的信息。 3.2.3 更改默认管道考虑使用更强大的NLP管道比如SpacyNLP它使用词向量来理解语言这可以提高实体识别和意图分类的准确性。 3.2.4 使用同义词和词形还原处理变化同义词可以帮助机器人理解不同的词汇表示相同的概念如“aubergine”和“eggplant”。词形还原能够将单词变回其基础形式比如将复数“apples”还原为单数“apple”从而简化处理流程并增加机器人理解不同语言形式的能力。在项目开发过程中这些技巧可以帮助你更好地设计对话流程提高聊天机器人的性能并处理自然语言的复杂性。同时始终记得定期测试你的机器人并根据反馈不断迭代改进。 3.3 代码成果通过API获取足球球队在某赛季的比赛成绩。

查看全文

http://www.hkea.cn/news/14578476/