文本标注

文本标注与其他类型的标注数据集操作流程略有不同，这里着重介绍不同之处。

导入数据

../../_images/import_text.png — 图 158 导入文本文件

单击“导入文本文件”；
按照页面提示配置参数：

表 101 导入文本文件参数

名称

必填项

说明

分隔符

是

分隔符将上传文件的内容分隔为单条数据

文件

是

若分隔符选择“无”，则将上传的文件整体视为一条数据，进行导入。否则将按分隔符将文件内容进行切割，导入切割后形成的多条数据;
导入文本文件后，无需“同步新数据”；

根据标注数据集的应用场景，单条数据的格式有相应的限制如下：

表 102 导入文本文件参数
应用场景	数据格式要求
阅读理解	${article}t${question1}t${question2}t…
文本相关性排序	${query}t${candidate1}t${candidate2}t…
文本打分	${question}t${answer}
短文本相似度	${query}t${option1}t${option2}
其他	无

标注数据

不同应用场景的文本标注，界面和操作略有不同。

单分类、多分类、文本级情感倾向分析

../../_images/text_annotation_classification.png

在右侧类别选项中，选择分类结果。

短文本相似度

../../_images/text_annotation_similarity.png

根据数据中两个文本的相似度，在右侧类别选项中，选择是否相似。

文本实体抽取、目标级情感分析

../../_images/text_annotation_entity.png

在文本中划取实体段落；
在下拉菜单中选取实体/情感类别。

文本实体关系抽取

../../_images/text_annotation_entity_relation.png

在文本中划取实体段落；
在下拉菜单中选取实体；
添加实体后，在右侧栏右键单击实体，添加实体间的关系。

阅读理解

../../_images/text_annotation_reading_comprehension.png

在文本中划取实体段落；
在下拉菜单中选取问题，实体将作为问题的答案，出现在问题下面；
一个问题可以有多个实体段落作为答案，答案间可以拖动，调换顺序；
可以添加自定义的问题，并给出回答；数据中原有的的问题不可以删除。

自然语言生成

../../_images/text_annotation_nlg.png

根据文本，在右侧文本框中写入期望模型生成结果。

文本打分

../../_images/text_annotation_score.png

根据文本中的问题和回答，给出回答的分数。

文本相关性排序

../../_images/text_annotation_relevancy_rank.png

根据选项与文本的相关性，拖动选项，完成排序。

文本评论观点抽取

../../_images/text_annotation_comment_review_extract.png

在文本中划取评价片段；
在下拉菜单中选择评价倾向；
点击右侧评价片段中的评价对象/评价维度/评价观点按钮，可以激活相应的划取工具，在文本中划取文本。