東京都立大学

自然言語処理研究室

東京都立大学システムデザイン学部情報科学科 (東京都立大学大学院システムデザイン研究科情報科学域)人工知能・自然言語処理分野、自然言語処理研究室(小町研)のウェブサイトです。小町研では、多言語コミュニケーションを支援するために、コンピュータを用いて人間のことばを理解・解析する手法の研究をしています。西東京に自然言語処理の研究開発拠点を作ることを目指しています。

キーワード: 自然言語処理 (機械翻訳、言語学習支援、基盤技術)、機械学習(深層学習、単語分散表現)

今後の予定



ニュース

  • 2022/09/14 The 29th International Conference on Computational Linguistics および関連ワークショップで、以下の発表をします!(1番の研究自体は RA 先での研究成果です)

    1. Mana Ashida and Saku Sugawara (NII). Possible Stories: Evaluating Situated Commonsense Reasoning under Multiple Possible Scenarios. COLING 2022. (long paper)

    2. Seiichiro Kondo and Mamoru Komachi. TMU NMT System with Automatic Post-Editing by Multi-Source Levenshtein Transformer for the Restricted Translation Task of WAT 2022. WAT 2022.

  • 2022/08/31 NLP若手の会 (YANS) 第17回シンポジウムにて下記の発表を行い、2件の発表が受賞しました!

    1. 佐藤郁子平澤寅庄金輝燦岡照晃小町守. 原文に対して補完的な画像はMMTモデルの翻訳精度を向上させるのか. NLP若手の会 (YANS) 第17回シンポジウム. 2022年8月29日.(奨励賞受賞)

    2. 木山朔金輝燦平澤寅庄岡照晃小町守. Causal言語モデルによる機械翻訳. NLP若手の会 (YANS) 第17回シンポジウム. 2022年8月30日.(奨励賞受賞)

    3. 榎本大晟平澤寅庄金輝燦岡照晃小町守. 事前学習を用いる機械翻訳での単語分割同時最適化の検討. NLP若手の会 (YANS) 第17回シンポジウム. 2022年8月30日.

    4. 中島京太郎金輝燦平澤寅庄岡照晃小町守. 訓練データからの文選択手法の機械翻訳における特徴分析 . NLP若手の会 (YANS) 第17回シンポジウム. 2022年8月30日.

  • 2022/05/10 NAACL のワークショップに下記の論文が採択されました!

    1. Xiaomeng Pan, Hongfei Wang, Teruaki Oka and Mamoru Komachi. Zuo Zhuan Ancient Chinese Dataset for Word Sense Disambiguation. NAACL Student Research Workshop (SRW) 2022. (to appear)

    2. Mana Ashida and Mamoru Komachi. Towards Automatic Generation of Messages Countering Online Hate Speech and Microaggressions. The 6th Workshop on Online Abuse and Harms (WOAH) 2022. (to appear)

  • 2022/04/05 13th Edition of Language Resources and Evaluation Conference (LREC 2022) に下記の論文が採択されました!

    1. Hwichan Kim, Sangwhan Moon (Tokyo Institute of Technology), Naoaki Okazaki (Tokyo Institute of Technology) and Mamoru Komachi. Learning How to Translate North Korean through South Korean. 13th Edition of Language Resources and Evaluation Conference (LREC 2022). May, 2022.

    2. Daisuke Suzuki, Yujin Takahashi, Ikumi Yamashita, Taichi Aida, Tosho Hirasawa, Michitaka Nakatsuji, Masato Mita and Mamoru Komachi. Construction of a Quality Estimation Dataset for Automatic Evaluation of Japanese Grammatical Error Correction. 13th Edition of Language Resources and Evaluation Conference (LREC 2022). May, 2022.

    3. Yujin Takahashi, Masahiro Kaneko, Masato Mita and Mamoru Komachi. Proficiency Matters Quality Estimation in Grammatical Error Correction. 13th Edition of Language Resources and Evaluation Conference (LREC 2022). May, 2022.

    4. Keigo Takahashi and Danushka Bollegala (University of Liverpool). Unsupervised Attention-based Sentence-Level Meta-Embeddings from Contextualised Language Models. 13th Edition of Language Resources and Evaluation Conference (LREC 2022). May, 2022.

  • 2022/03/17 言語処理学会第28回年次大会で以下の発表をしました。木山くんは若手奨励賞を受賞しました。おめでとうございます!

  1. 小林正宗(芝浦工大) 高橋悠進, 三田雅人(理研/都立大), 小町守. ニューラル文法誤り訂正システムにおけるリランキングの改善に向けたオラクル分析. 言語処理学会第28回年次大会. 2022年3月15日.

  2. 凌志棟, 相田太一, 金輝燦, 岡照晃, 小林千真, 小町守. 日本語BERTを用いた単語の用例の分野別分析ツールの開発. 言語処理学会第28回年次大会. 2022年3月16日.

  3. 山下郁海, 岡照晃, 小町守, 真鍋章(富士電機), 谷本恒野(富士電機). 日本語T5モデルを用いた障害レポートからの重要箇所抽出. 言語処理学会第28回年次大会. 2022年3月16日.

  4. 小林千真, 山下郁海, 岡照晃, 小町守, 真鍋章(富士電機), 谷本恒野(富士電機). 対照学習による文ベクトルを使用した障害レポートのクラスタリング. 言語処理学会第28回年次大会. 2022年3月16日.

  5. 田村弘人, 平澤寅庄, 金輝燦, 岡照晃, 小町守. 人工データでの事前学習によるニューラル機械翻訳の性能向上. 言語処理学会第28回年次大会. 2022年3月17日.

  6. 近藤明日子(国語研), 相田太一, 小木曽智信(国語研). 近現代雑誌通時コーパスの語彙統計情報の公開. 言語処理学会第28回年次大会. 2022年3月17日.

  7. 木山朔, 上坂奏人, 佐藤郁子, 佐藤京也, 米田悠人, 小山碧海, 三田雅人(理研/都立大), 岡照晃, 小町守. 日本語文法誤り訂正の流暢性評価に向けたデータ作成. 言語処理学会第28回年次大会. 2022年3月17日.

  8. 今藤誠一郎, 上田直生也, 岡照晃, 杉山雅和 (AI Shift), 邊土名朝飛 (AI Shift), 小町守. 事前学習モデルを用いた音声認識結果からの固有表現抽出. 言語処理学会第28回年次大会. 2022年3月17日.

  9. 井上誠一, 小町守, 小木曽智信(国語研), 高村大也(産総研), 持橋大地(統数研). ガウス確率場による単語の意味変化と語義数の同時推定. 言語処理学会第28回年次大会. 2022年3月17日.


  • 2021/12/28 自然言語処理や機械学習に関する著名論文誌に以下の論文が採択されました。

    • Yuting Zhao, Tomoyuki Kajiwara (Ehime University), Mamoru Komachi, Chenhui Chu (Kyoto University). Region-Attentive Multimodal Neural Machine Translation. Neurocomputing. (accepted)

    • Yuting Zhao, Tomoyuki Kajiwara (Ehime University), Mamoru Komachi, Chenhui Chu (Kyoto University). Word-Region Alignment-Guided Multimodal Neural Machine Translation. IEEE/ACM Transactions on Audio, Speech and Language Processing. (accepted)

  • 2021/12/01 情報処理学会自然言語処理研究会にて以下の発表をしました

    • 平尾礼央, 小町守, 岡照晃. 美容品レビューのクリック予測に向けたマルチモーダルデータの利用. 情報処理学会第251回自然言語処理研究会. Vol.2021-NL-251, No.3, pp. 1-7. 2021.

  • 2021/11/07 アジア太平洋地域の自然言語処理の国際会議、PACLIC にて以下の発表をしました。

    • Kazuma Kobayashi, Taichi Aida and Mamoru Komachi. Analyzing Semantic Changes in Japanese Words Using BERT. PACLIC 2021.

    • Taichi Aida, Mamoru Komachi, Toshinobu Ogiso (National Institute for Japanese Language and Linguistics), Hiroya Takamura (National Institute of Advanced Science and Technology), Daichi Mochihashi (The Institute of Statistical Mathematics). A Comprehensive Analysis of PMI-based Models for Measuring Semantic Differences. PACLIC 2021.

    • Hwichan Kim and Mamoru Komachi. Can Monolingual Pre-trained Encoder-Decoder Improve NMT for Distant Language Pairs? PACLIC 2021.

  • 2021/11/06 以下の2本の論文の採録が決まりました。

    • 喜友名朝視顕, 平澤寅庄, 小町守, 小木曽智信(国語研). 事前学習モデルを用いた近代文語文のニューラル機械翻訳. 情報処理学会論文誌, 63巻2号. 2021. (採録決定)

    • 本間広樹, 小町守. 高速な文法誤り訂正機能を持つ日本語ライティング支援システムの構築. 人工知能学会論文誌, 37巻1号. 2021.(採録決定)

  • 2021/10/01 岡照晃さんと三田雅人さんが特任助教として着任しました!