Skip to content

关于nlu.json数据格式的两点问题。 #84

@YYGe01

Description

@YYGe01

作者您好,关于数据格式有几个疑问,希望能帮忙看下,谢谢!
1、data/nlu/nlu.json 数据中有很大一部分样本存在空格现象,不知道会不会对训练有影响。
如 "喂 请 看下 四月 流量 多少流量"。
chatito_gen_nlu_data代码仓库增强数据集的方式里发现可以取消空格。
如:[greet] [greet?]可以改成[greet][greet?],生成的样本不会有空格。

2、data/nlu/nlu.json 数据中我看定义了很多的From intent。
intent:inform_item
intent:inform_current_phone
intent:inform_other_phone
intent:inform_package
intent:inform_time
我想问的是,这是5个intent,还是只有1个intent呢。
我认为如果这样定义名字训练的时候当作5个不同的intent单独训练了。
另外,我看rasa官方文档里的案例,是把一个intent里所有的样本都放在一起了。examples/formbot

非常感谢作者提供的项目,谢谢!

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions