文本标注

文本标注与其他类型的标注数据集操作流程略有不同,这里着重介绍不同之处。

导入数据

../../_images/import_text.png

图 158 导入文本文件

  1. 单击“导入文本文件”;

  2. 按照页面提示配置参数:

    表 101 导入文本文件参数

    名称

    必填项

    说明

    分隔符

    分隔符将上传文件的内容分隔为单条数据

    文件

  1. 若分隔符选择“无”,则将上传的文件整体视为一条数据,进行导入。否则将按分隔符将文件内容进行切割,导入切割后形成的多条数据;

  2. 导入文本文件后,无需“同步新数据”;

  3. 根据标注数据集的应用场景,单条数据的格式有相应的限制如下:

    表 102 导入文本文件参数

    应用场景

    数据格式要求

    阅读理解

    ${article}t${question1}t${question2}t…

    文本相关性排序

    ${query}t${candidate1}t${candidate2}t…

    文本打分

    ${question}t${answer}

    短文本相似度

    ${query}t${option1}t${option2}

    其他

标注数据

不同应用场景的文本标注,界面和操作略有不同。

单分类、多分类、文本级情感倾向分析

../../_images/text_annotation_classification.png

在右侧类别选项中,选择分类结果。

短文本相似度

../../_images/text_annotation_similarity.png

根据数据中两个文本的相似度,在右侧类别选项中,选择是否相似。

文本实体抽取、目标级情感分析

../../_images/text_annotation_entity.png
  1. 在文本中划取实体段落;

  2. 在下拉菜单中选取实体/情感类别。

文本实体关系抽取

../../_images/text_annotation_entity_relation.png
  1. 在文本中划取实体段落;

  2. 在下拉菜单中选取实体;

  3. 添加实体后,在右侧栏右键单击实体,添加实体间的关系。

阅读理解

../../_images/text_annotation_reading_comprehension.png
  1. 在文本中划取实体段落;

  2. 在下拉菜单中选取问题,实体将作为问题的答案,出现在问题下面;

  3. 一个问题可以有多个实体段落作为答案,答案间可以拖动,调换顺序;

  4. 可以添加自定义的问题,并给出回答;数据中原有的的问题不可以删除。

自然语言生成

../../_images/text_annotation_nlg.png

根据文本,在右侧文本框中写入期望模型生成结果。

文本打分

../../_images/text_annotation_score.png

根据文本中的问题和回答,给出回答的分数。

文本相关性排序

../../_images/text_annotation_relevancy_rank.png

根据选项与文本的相关性,拖动选项,完成排序。

文本评论观点抽取

../../_images/text_annotation_comment_review_extract.png
  1. 在文本中划取评价片段;

  2. 在下拉菜单中选择评价倾向;

  3. 点击右侧评价片段中的评价对象/评价维度/评价观点按钮,可以激活相应的划取工具,在文本中划取文本。