about_me

About me

I'm Kazumasa Omura (大村 和正), currently a 3rd-year Ph.D. student at Kyoto University and a member of Kurohashi-Chu-Murawaki Lab.
My research interests lie in discourse and pragmatics.

education

Education

Ph.D. student [April 1st, 2021 - March 25th, 2024]
Department of Intelligence Science and Technology, Graduate School of Informatics, Kyoto University

Master's degree [April 1st, 2019 - March 23rd, 2021]
Department of Intelligence Science and Technology, Graduate School of Informatics, Kyoto University

Bachelor's degree [April 1st, 2015 - March 26th, 2019]
Department of Electrical and Electronic Engineering, Faculty of Engineering, Kyoto University

High School
General Course of Ishikawa Prefectural Kanazawa Izumigaoka Senior High School

publication

Publication

Journal Paper (Refereed)

大村 和正, 河原 大輔, 黒橋 禎夫
「基本イベントに基づく常識推論データセットの構築と利用」
自然言語処理 Vol.30 No.4, December 2023, pp. 1206-1239
論文賞 (4/38)
[paper]

Conference Papers (Refereed)

Kazumasa Omura, Fei Cheng, and Sadao Kurohashi
"An Empirical Study of Synthetic Data Generation for Implicit Discourse Relation Recognition"
In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Turin, Italy.
(to appear)

Kazumasa Omura, Kei Kubo, Frederic Bergeron, and Sadao Kurohashi
"Toward Game-Based Learning of Japanese Writing for Elementary School Students"
In Proceedings of the 31st International Conference on Computers in Education (ICCE 2023), Shimane, Japan, pp. 655-660
(accepted as a short paper, 14/33)
[proceeding] [website]

Kazumasa Omura and Sadao Kurohashi
"Improving Commonsense Contingent Reasoning by Pseudo-data and its Application to the Related Tasks"
In Proceedings of the 29th International Conference on Computational Linguistics (COLING 2022), October 2022, Gyeongju, Republic of Korea, pp. 812-823
(acceptance rate: 522/1563)
Selected as one of the Outstanding Papers! (11/634) [ss]
[proceeding] [website]

Kazumasa Omura, Daisuke Kawahara, and Sadao Kurohashi
"A Method for Building a Commonsense Inference Dataset based on Basic Events"
In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP 2020), November 2020, Online, pp. 2450–2460
(acceptance rate: 602/2445)
[proceeding] [website]

----------
Nobuhiro Ueda, Kazumasa Omura, Takashi Kodama, Hirokazu Kiyomaru, Yugo Murawaki, Daisuke Kawahara, and Sadao Kurohashi
"KWJA: A Unified Japanese Analyzer Based on Foundation Models"
In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics: System Demonstrations (ACL 2023 Demo), July 2023, Toronto, Canada, pp. 538-548
(acceptance rate: 58/155)
[proceeding]

Akiko Aizawa, Frederic Bergeron, Junjie Chen, Fei Cheng, Katsuhiko Hayashi, Kentaro Inui, Hiroyoshi Ito, Daisuke Kawahara, Masaru Kitsuregawa, Hirokazu Kiyomaru, Masaki Kobayashi, Takashi Kodama, Sadao Kurohashi, Qianying Liu, Masaki Matsubara, Yusuke Miyao, Atsuyuki Morishima, Yugo Murawaki, Kazumasa Omura, Haiyue Song, Eiichiro Sumita, Shinji Suzuki, Ribeka Tanaka, Yu Tanaka, Masashi Toyoda, Nobuhiro Ueda, Honai Ueoka, Masao Utiyama, and Ying Zhong (in alphabetical order)
"A System for Worldwide COVID-19 Information Aggregation"
In Proceedings of the 1st Workshop on NLP for COVID-19 (Part 2) at EMNLP 2020, November 2020, Online
[proceeding] [website]

Hirokazu Kiyomaru, Kazumasa Omura, Yugo Murawaki, Daisuke Kawahara, and Sadao Kurohashi
"Diversity-aware Event Prediction based on a Conditional Variational Autoencoder with Reconstruction"
In Proceedings of the First Workshop on Commonsense Inference in Natural Language Processing (COIN), November 2019, Hong Kong, pp. 113-122
[proceeding]

Misc. (Non-Refereed)

児玉 貴志, 植田 暢大, 大村 和正, 清丸 寛一, 村脇 有吾, 河原 大輔, 黒橋 禎夫
「テキスト生成モデルによる日本語形態素解析」
言語処理学会 第29回年次大会, March 2023, 沖縄
[proceeding]

大村 和正, 白井 穂乃, 石原 祥太郎, 澤 紀彦
「極性と重要度を考慮した決算短信からの業績要因文の抽出」
言語処理学会 第29回年次大会, March 2023, 沖縄
[proceeding]

植田 暢大, 大村 和正, 児玉 貴志, 清丸 寛一, 村脇 有吾, 河原 大輔, 黒橋 禎夫
「KWJA: 汎用言語モデルに基づく日本語解析器」
情報処理学会 第253回自然言語処理研究会, September 2022, 京都
優秀研究賞 (2/20)
[proceeding]

大村 和正, 黒橋 禎夫
「疑似問題による常識推論能力の改善と関連タスクへの効果」
言語処理学会 第28回年次大会, March 2022, Online
[proceeding]

大村 和正, 白井 穂乃, 石原 祥太郎, 澤 紀彦
「決算短信からの業績要因文の抽出に向けた業績発表記事からの訓練データの生成」
言語処理学会 第28回年次大会, March 2022, Online
[proceeding]

大村 和正, 黒橋 禎夫
「テキストからの蓋然的関係知識の獲得と計算機および人間の学習への活用」
京都大学第16回ICTイノベーション, February 2022, Online

大村 和正, 久保 圭, 黒橋 禎夫
「ことばつなぎゲーム:ゲーミフィケーションによる小学生の作文教育」
言語処理学会 第27回年次大会, March 2021, Online
[proceeding] [website] [prototype]

大村 和正
"A Method for Building a Commonsense Inference Dataset based on Basic Events"
自然言語処理 2021年28巻1号, March 2021, pp. 287-291
[article]

大村 和正, 河原 大輔, 黒橋 禎夫
「基本イベントに基づく常識推論データセットの構築」
言語処理学会 第26回年次大会, March 2020, Online
[errata]

miscellaneous

Misc.

日本学術振興会特別研究員 (DC2) (第一次採用内定) [April 1st, 2022 - March 31st, 2024]
情報・AI・データ科学博士人材フェローシップ [April 1st, 2021 - March 31st, 2022]

「人を知る」人工知能講座 2023 TA [September 8th, 2023]
「人を知る」人工知能講座 2022 TA [November 11th-12th, 17th-18th, 2022]
「人を知る」人工知能講座 2021 TA (4-3b 入力誤り訂正 の演習も担当) [October 28th-29th, November 4th-5th, 2021]
「人を知る」人工知能講座 2020 TA [October 29th-30th, November 5th-6th, 2020]
教育研究助成に関するOA [July 1st, 2020 - March 31th, 2021]

KWJAを公開 (固有表現認識・言語素性付与・構文解析を担当) [September 30th, 2022]
「いちまるとはじめよう!ことばむすび」を公開 (バックエンドなどを担当) [January 25th, 2022]
京都大学常識推論データセットを公開 [October 6th, 2020]

2023年 言語処理学会 論文賞 [March 11th, 2024]
COLING 2022 Outstanding Paper Award [October 15th, 2022]
情報処理学会 第253回自然言語処理研究会 優秀研究賞 (共著) [September 30th, 2022]
gold_trophy 京都大学サマーデザインスクール 最優秀賞 [September 2nd, 2022]
silver_trophy 新生ハッカソン 優秀賞(総合) [February 28th, 2020]
gold_trophy Gunosy Summer Internship 2019 1st Place [September 5th, 2019]

TOEIC 850 [March 10th, 2019]

物置

常識推論問題デモ

常識推論問題のデモサイト
(修士の研究)

ことばつなぎゲーム

「いちまるとはじめよう!
ことばむすび」のプロトタイプ

オセロ

盤面と次の一手の組を1000万組
学習させたオセロAI