東京都立大学

自然言語処理研究室

東京都立大学システムデザイン学部情報科学科 (東京都立大学大学院システムデザイン研究科情報科学域)人工知能・自然言語処理分野、自然言語処理研究室(小町研)のウェブサイトです。小町研では、多言語コミュニケーションを支援するために、コンピュータを用いて人間のことばを理解・解析する手法の研究をしています。西東京に自然言語処理の研究開発拠点を作ることを目指しています。

キーワード: 自然言語処理 (機械翻訳、言語学習支援、基盤技術)、機械学習(深層学習、単語分散表現)

今後の予定



ニュース

  • 2022/05/10 NAACL のワークショップに下記の論文が採択されました!

    1. Xiaomeng Pan, Hongfei Wang, Teruaki Oka and Mamoru Komachi. Zuo Zhuan Ancient Chinese Dataset for Word Sense Disambiguation. NAACL Student Research Workshop (SRW) 2022. (to appear)

    2. Mana Ashida and Mamoru Komachi. Towards Automatic Generation of Messages Countering Online Hate Speech and Microaggressions. The 6th Workshop on Online Abuse and Harms (WOAH) 2022. (to appear)

  • 2022/04/05 13th Edition of Language Resources and Evaluation Conference (LREC 2022) に下記の論文が採択されました!

    1. Hwichan Kim, Sangwhan Moon (Tokyo Institute of Technology), Naoaki Okazaki (Tokyo Institute of Technology) and Mamoru Komachi. Learning How to Translate North Korean through South Korean. 13th Edition of Language Resources and Evaluation Conference (LREC 2022). May, 2022.

    2. Daisuke Suzuki, Yujin Takahashi, Ikumi Yamashita, Taichi Aida, Tosho Hirasawa, Michitaka Nakatsuji, Masato Mita and Mamoru Komachi. Construction of a Quality Estimation Dataset for Automatic Evaluation of Japanese Grammatical Error Correction. 13th Edition of Language Resources and Evaluation Conference (LREC 2022). May, 2022.

    3. Yujin Takahashi, Masahiro Kaneko, Masato Mita and Mamoru Komachi. Proficiency Matters Quality Estimation in Grammatical Error Correction. 13th Edition of Language Resources and Evaluation Conference (LREC 2022). May, 2022.

    4. Keigo Takahashi and Danushka Bollegala (University of Liverpool). Unsupervised Attention-based Sentence-Level Meta-Embeddings from Contextualised Language Models. 13th Edition of Language Resources and Evaluation Conference (LREC 2022). May, 2022.

  • 2022/03/17 言語処理学会第28回年次大会で以下の発表をしました。木山くんは若手奨励賞を受賞しました。おめでとうございます!

  1. 小林正宗(芝浦工大) 高橋悠進, 三田雅人(理研/都立大), 小町守. ニューラル文法誤り訂正システムにおけるリランキングの改善に向けたオラクル分析. 言語処理学会第28回年次大会. 2022年3月15日.

  2. 凌志棟, 相田太一, 金輝燦, 岡照晃, 小林千真, 小町守. 日本語BERTを用いた単語の用例の分野別分析ツールの開発. 言語処理学会第28回年次大会. 2022年3月16日.

  3. 山下郁海, 岡照晃, 小町守, 真鍋章(富士電機), 谷本恒野(富士電機). 日本語T5モデルを用いた障害レポートからの重要箇所抽出. 言語処理学会第28回年次大会. 2022年3月16日.

  4. 小林千真, 山下郁海, 岡照晃, 小町守, 真鍋章(富士電機), 谷本恒野(富士電機). 対照学習による文ベクトルを使用した障害レポートのクラスタリング. 言語処理学会第28回年次大会. 2022年3月16日.

  5. 田村弘人, 平澤寅庄, 金輝燦, 岡照晃, 小町守. 人工データでの事前学習によるニューラル機械翻訳の性能向上. 言語処理学会第28回年次大会. 2022年3月17日.

  6. 近藤明日子(国語研), 相田太一, 小木曽智信(国語研). 近現代雑誌通時コーパスの語彙統計情報の公開. 言語処理学会第28回年次大会. 2022年3月17日.

  7. 木山朔, 上坂奏人, 佐藤郁子, 佐藤京也, 米田悠人, 小山碧海, 三田雅人(理研/都立大), 岡照晃, 小町守. 日本語文法誤り訂正の流暢性評価に向けたデータ作成. 言語処理学会第28回年次大会. 2022年3月17日.

  8. 今藤誠一郎, 上田直生也, 岡照晃, 杉山雅和 (AI Shift), 邊土名朝飛 (AI Shift), 小町守. 事前学習モデルを用いた音声認識結果からの固有表現抽出. 言語処理学会第28回年次大会. 2022年3月17日.

  9. 井上誠一, 小町守, 小木曽智信(国語研), 高村大也(産総研), 持橋大地(統数研). ガウス確率場による単語の意味変化と語義数の同時推定. 言語処理学会第28回年次大会. 2022年3月17日.


  • 2021/12/28 自然言語処理や機械学習に関する著名論文誌に以下の論文が採択されました。

    • Yuting Zhao, Tomoyuki Kajiwara (Ehime University), Mamoru Komachi, Chenhui Chu (Kyoto University). Region-Attentive Multimodal Neural Machine Translation. Neurocomputing. (accepted)

    • Yuting Zhao, Tomoyuki Kajiwara (Ehime University), Mamoru Komachi, Chenhui Chu (Kyoto University). Word-Region Alignment-Guided Multimodal Neural Machine Translation. IEEE/ACM Transactions on Audio, Speech and Language Processing. (accepted)

  • 2021/12/01 情報処理学会自然言語処理研究会にて以下の発表をしました

    • 平尾礼央, 小町守, 岡照晃. 美容品レビューのクリック予測に向けたマルチモーダルデータの利用. 情報処理学会第251回自然言語処理研究会. Vol.2021-NL-251, No.3, pp. 1-7. 2021.

  • 2021/11/07 アジア太平洋地域の自然言語処理の国際会議、PACLIC にて以下の発表をしました。

    • Kazuma Kobayashi, Taichi Aida and Mamoru Komachi. Analyzing Semantic Changes in Japanese Words Using BERT. PACLIC 2021.

    • Taichi Aida, Mamoru Komachi, Toshinobu Ogiso (National Institute for Japanese Language and Linguistics), Hiroya Takamura (National Institute of Advanced Science and Technology), Daichi Mochihashi (The Institute of Statistical Mathematics). A Comprehensive Analysis of PMI-based Models for Measuring Semantic Differences. PACLIC 2021.

    • Hwichan Kim and Mamoru Komachi. Can Monolingual Pre-trained Encoder-Decoder Improve NMT for Distant Language Pairs? PACLIC 2021.

  • 2021/11/06 以下の2本の論文の採録が決まりました。

    • 喜友名朝視顕, 平澤寅庄, 小町守, 小木曽智信(国語研). 事前学習モデルを用いた近代文語文のニューラル機械翻訳. 情報処理学会論文誌, 63巻2号. 2021. (採録決定)

    • 本間広樹, 小町守. 高速な文法誤り訂正機能を持つ日本語ライティング支援システムの構築. 人工知能学会論文誌, 37巻1号. 2021.(採録決定)

  • 2021/10/01 岡照晃さんと三田雅人さんが特任助教として着任しました!