BIO标注及其他标注
一、BMES 四位序列标注法
B表示一个词的词首位值,M表示一个词的中间位置,E表示一个词的末尾位置,S表示一个单独的字词。
我/S 是/S 广/B 东/M 人/E (符号标注,‘东’是‘广’和‘人’的中间部分,凑成‘广东人’这个实体)
我/ 是/ 广东人/ (标注上分出来的实体块)
二、BIO 三位标注 (B-begin,I-inside,O-outside)
B-X 代表实体X的开头, I-X代表实体的结尾 O代表不属于任何类型的
三、BIOES (B-begin,I-inside,O-outside,E-end,S-single)
B 表示开始,I表示内部, O表示非实体 ,E实体尾部,S表示改词本身就是一个实体。