BIO标注及其他标注


一、BMES 四位序列标注法

B表示一个词的词首位值,M表示一个词的中间位置,E表示一个词的末尾位置,S表示一个单独的字词。

我/S 是/S 广/B 东/M 人/E (符号标注,‘东’是‘广’和‘人’的中间部分,凑成‘广东人’这个实体)

我/ 是/ 广东人/ (标注上分出来的实体块)

二、BIO 三位标注 (B-begin,I-inside,O-outside)

B-X 代表实体X的开头, I-X代表实体的结尾 O代表不属于任何类型的

三、BIOES (B-begin,I-inside,O-outside,E-end,S-single)

B 表示开始,I表示内部, O表示非实体 ,E实体尾部,S表示改词本身就是一个实体。

NER