CRF评测数据的准备

在CRF++使用过程中,有时需要把真实的结果和预测的结果放在同一个文件里面,当然,CRF++预测的结果就是在一个文件中,两个是通过其他模型生成的预测结果,可能在两个文件中,需要重新写入到一个文件中。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
"""
@Time : 2020/12/2 21:29
@Auth : penghui
"""
import os
from glob import glob
import pandas as pd
import sys


f = open('lstm+crf_fin/fin.txt','r')
lines = f.readlines()
f.close()
f1 = open('lstm+crf_fin/fin_test.txt', 'r')
lines1 = f1.readlines()
f1.close()
file=open('CRF_train_lstm.txt','w',encoding='utf-8')

for line,line1 in zip(lines,lines1):
a = []
aa = line.split('\t')[0] #按逗号分隔符提取
bb = line1.split('\t')[0] # 按逗号分隔符提取
cc = line.split('\t')[1]
dd = line1.split('\t')[1]
#print(password.split()[0])
a=aa.split('\n')[0]+'\t'+cc.split('\n')[0]+'\t'+dd.split()[0]
#print(a)
file.write(str(a)+'\n')

结果如下图所示