文本标注
文本标注与其他类型的标注数据集操作流程略有不同,这里着重介绍不同之处。
导入数据
单击“导入文本文件”;
按照页面提示配置参数:
名称
必填项
说明
分隔符
是
分隔符将上传文件的内容分隔为单条数据
文件
是
若分隔符选择“无”,则将上传的文件整体视为一条数据,进行导入。否则将按分隔符将文件内容进行切割,导入切割后形成的多条数据;
导入文本文件后,无需“同步新数据”;
根据标注数据集的应用场景,单条数据的格式有相应的限制如下:
应用场景
数据格式要求
阅读理解
${article}t${question1}t${question2}t…
文本相关性排序
${query}t${candidate1}t${candidate2}t…
文本打分
${question}t${answer}
短文本相似度
${query}t${option1}t${option2}
其他
无
标注数据
不同应用场景的文本标注,界面和操作略有不同。
单分类、多分类、文本级情感倾向分析
在右侧类别选项中,选择分类结果。
短文本相似度
根据数据中两个文本的相似度,在右侧类别选项中,选择是否相似。
文本实体抽取、目标级情感分析
在文本中划取实体段落;
在下拉菜单中选取实体/情感类别。
文本实体关系抽取
在文本中划取实体段落;
在下拉菜单中选取实体;
添加实体后,在右侧栏右键单击实体,添加实体间的关系。
阅读理解
在文本中划取实体段落;
在下拉菜单中选取问题,实体将作为问题的答案,出现在问题下面;
一个问题可以有多个实体段落作为答案,答案间可以拖动,调换顺序;
可以添加自定义的问题,并给出回答;数据中原有的的问题不可以删除。
自然语言生成
根据文本,在右侧文本框中写入期望模型生成结果。
文本打分
根据文本中的问题和回答,给出回答的分数。
文本相关性排序
根据选项与文本的相关性,拖动选项,完成排序。
文本评论观点抽取
在文本中划取评价片段;
在下拉菜单中选择评价倾向;
点击右侧评价片段中的评价对象/评价维度/评价观点按钮,可以激活相应的划取工具,在文本中划取文本。