Comments (6)
感谢公开!我们在复现en2gu结果时,发现与论文中的结果([email protected])有一些不同(尽管我们使用你们公开的checkpoints和测试集上,测的结果是2.58,可以看到仍然有轻微的不一致),请问这个语言对的测试有什么特殊的处理吗?
Hello, 我们用的是tokenized BLEU
from mrasp.
感谢公开!我们在复现en2gu结果时,发现与论文中的结果([email protected])有一些不同(尽管我们使用你们公开的checkpoints和测试集上,测的结果是2.58,可以看到仍然有轻微的不一致),请问这个语言对的测试有什么特殊的处理吗?
Hello, 我们用的是tokenized BLEU
您好,我这里报的就是tokenized BLEU,其他方向的结果都是比较准确的。另外,想问一下为什么使用你们的模型,直接在官方测试集上测试(使用你们的BPE词典),部分结果也有较大差异呢?
from mrasp.
感谢公开!我们在复现en2gu结果时,发现与论文中的结果([email protected])有一些不同(尽管我们使用你们公开的checkpoints和测试集上,测的结果是2.58,可以看到仍然有轻微的不一致),请问这个语言对的测试有什么特殊的处理吗?
Hello, 我们用的是tokenized BLEU
您好,我这里报的就是tokenized BLEU,其他方向的结果都是比较准确的。另外,想问一下为什么使用你们的模型,直接在官方测试集上测试(使用你们的BPE词典),部分结果也有较大差异呢?
测试的时候使用https://github.com/linzehui/mRASP/blob/master/user_dir/tasks/translation_w_langtok.py这个task了吗
from mrasp.
感谢公开!我们在复现en2gu结果时,发现与论文中的结果([email protected])有一些不同(尽管我们使用你们公开的checkpoints和测试集上,测的结果是2.58,可以看到仍然有轻微的不一致),请问这个语言对的测试有什么特殊的处理吗?
Hello, 我们用的是tokenized BLEU
您好,我这里报的就是tokenized BLEU,其他方向的结果都是比较准确的。另外,想问一下为什么使用你们的模型,直接在官方测试集上测试(使用你们的BPE词典),部分结果也有较大差异呢?
测试的时候使用https://github.com/linzehui/mRASP/blob/master/user_dir/tasks/translation_w_langtok.py这个task了吗
您好,我使用如下脚本处理:
fairseq-generate ${data_path}/bin
--user-dir ${repo_dir}
-s ${SRC}
-t ${TGT}
--skip-invalid-size-inputs-valid-test
--beam 5 --batch-size 16 --max-len-a 0 --max-len-b 256
--path ${model_path}/en2gu_checkpoint.pt
--task translation_w_langtok
--lang-prefix-tok ${TGTK}
--nbest 1 --remove-bpe | tee ${eval_path}/infer.txt
grep ^H ${eval_path}/infer.txt
| sed 's/^H-//'
| sort -V
| cut -f 3
| sed 's/'${TGTK}' //g' \
${eval_path}/infer.sys
grep ^T ${eval_path}/infer.txt
| sed 's/^T-//'
| sort -V
| cut -f 2
| sed 's/'${TGTK}' //g' \
${eval_path}/infer.ref
sacrebleu --tokenize 'none' -s 'none' -w 2 ${eval_path}/infer.ref < ${eval_path}/infer.sys
得到的en2gu的结果似乎只是2.98,有一点点提升,请问和fairseq原始的脚本增加了什么特殊处理吗,附上我之前测试的脚本
fairseq-generate ${data_path}/bin
--path ${model_path}/${SRC}2${TGT}_checkpoint.pt
--gen-subset test
--skip-invalid-size-inputs-valid-test
--nbest 1
--max-len-a ${max_len_a}
--max-len-b ${max_len_b}
--lenpen ${length_penalty} \
-s ${SRC} -t ${TGT} --batch-size 128 --beam 5 --remove-bpe | tee ${eval_path}/infer.txt
谢谢
from mrasp.
我们没有设置-s 'none'
from mrasp.
您好,fairseq-generate ${data_path}/bin 里面的data_path指的是哪个路径? 我这边调试了半天一直出问题
from mrasp.
Related Issues (20)
- 数据预处理一直跑不通
- 关于pre-train的问题,这个阶段只能在单机单卡上运行,单机多卡hang住了
- 代码中的sacrebleu的版本号是多少呀? HOT 2
- 数据集
- 微调英德数据集,执行最后的fine-tine.sh,报错KeyError:0
- 数据集下载问题 HOT 8
- 添加中文,日文分词器之后,无法加载预训练模型 HOT 7
- 请问模型支持跨语言输入吗 HOT 1
- 数据集下载问题 HOT 2
- Fine-tuning mRASP for Ar-En
- 新增vocabulary的格式
- 下载mRASP-PC32-6enc6dec.pt,使用德英数据微调,多头注意力计算报错 HOT 2
- 關於全局變數路徑?
- 预训练模型下载
- 加载模型出错
- Error merging override generation.print_alignment=False HOT 1
- AttributeError: 'MMapIndexedDataset' object has no attribute '_bin_buffer_mmap'
- 请问一下这个文件是如何得来的"dict.{}.txt".format(args.source_lang)
- 抱歉,实在是没有看懂fairseq和shell脚本,请教个问题 HOT 1
- 我将fairseq模型转为transformers模型 HOT 3
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from mrasp.