部分アノテーションの共有

JUMAN++ が解析を誤った部分文字列に対する,部分アノテーションを収集しています. 部分アノテーションを作成した際はページ下部のコメント欄で共有をお願いします. 収集した部分アノテーションは,JUMAN++ 用の学習コーパスとして公開を予定しています.

部分アノテーションのフォーマット

明示的に形態素境界として指定したい箇所にタブ(\t)を挿入することで, 挿入した箇所が必ず形態素境界として解析されます. また,タブに囲まれた範囲は必ず1形態素として解析されます. タブの入力が困難な場合,¥tもしくは\tと入力していただいても構いません.

例: (「実は」の解析を誤って1形態素としてしまう場合)
この\t実\tは発芽しない

部分アノテーションを共有する

連絡先

京都大学大学院情報学研究科 知能情報学専攻 黒橋・河原研究室
nl-resource@nlp.ist.i.kyoto-u.ac.jp