利用java加载macbert进行中文拼写纠错
这里利用java加载macbert模型,并进行中文拼写纠错。
项目地址:https://github.com/jiangnanboy/macbert-java-onnx
步骤
1.利用java加载macbert模型,并进行纠错推理。
2.模型从这里 下载。
3.模型转换见这里 。
使用
1.sy/MacBert
String text = "今天新情很好。";
Pair> pair = null;
try {
pair = parseInputText(text);
} catch (Exception e) {
e.printStackTrace();
}
var predString = predCSC(pair);
List> resultList = getErrors(predString, text);
for(Pair result : resultList) {
System.out.println(text + " => " + result.getLeft() + " " + result.getRight());
}
2.result
String text = "今天新情很好。";
tokens -> [[CLS], 今, 天, 新, 情, 很, 好, 。, [SEP]]
今天新情很好。 => 今天心情很好。 新,心,2,3
String text = "你找到你最喜欢的工作,我也很高心。";
tokens -> [[CLS], 你, 找, 到, 你, 最, 喜, 欢, 的, 工, 作, ,, 我, 也, 很, 高, 心, 。, [SEP]]
你找到你最喜欢的工作,我也很高心。 => 你找到你最喜欢的工作,我也很高兴。 心,兴,15,16