要約文の評価指標についてのメモ

目次

生成式要約文のモデルに需要がある。

そのモデルの評価指標についてのめも。

結論としてはやはり正解になる文の用意は必要だということ。

そこを省きたいんだけどなぁ?

自動の各種評価指標

  • rouge
    • 正解文との一致度をn-gramで評価
  • bleu
  • meteor
  • BERT score
    • embeddingでcos simを計算
  • 何にせよ正解文は必要になる

人力

多分、ネイティブの人間を雇って、点数をつけていくのだと思う。

最後に

補足情報などあるとコメントしてください。

参考リンク


See also