東京都立大学

自然言語処理研究室

東京都立大学システムデザイン学部情報科学科 (東京都立大学大学院システムデザイン研究科情報科学域)人工知能・自然言語処理分野、自然言語処理研究室(小町研)のウェブサイトです。小町研では、多言語コミュニケーションを支援するために、コンピュータを用いて人間のことばを理解・解析する手法の研究をしています。西東京に自然言語処理の研究開発拠点を作ることを目指しています。

キーワード: 自然言語処理 (機械翻訳、言語学習支援、基盤技術)、機械学習(深層学習、単語分散表現)

今後の予定

    • アジア太平洋地域の自然言語処理の国際会議、PACLIC にて以下の発表をします。

      • Kazuma Kobayashi, Taichi Aida and Mamoru Komachi. Analyzing Semantic Changes in Japanese Words Using BERT. PACLIC 2021.

      • Taichi Aida, Mamoru Komachi, Toshinobu Ogiso (National Institute for Japanese Language and Linguistics), Hiroya Takamura (National Institute of Advanced Science and Technology), Daichi Mochihashi (The Institute of Statistical Mathematics). A Comprehensive Analysis of PMI-based Models for Measuring Semantic Differences. PACLIC 2021.

      • Hwichan Kim and Mamoru Komachi. Can Monolingual Pre-trained Encoder-Decoder Improve NMT for Distant Language Pairs? PACLIC 2021.

ニュース

    • 2021/10/01 岡照晃さんと三田雅人さんが特任助教として着任しました!

    • 2021/08/31 自然言語処理の若手の会のシンポジウム(YANS 2021)にて、以下の発表をしました

      • 蘆田真奈金子正弘平澤寅庄小町守. QAタスクにおけるGPTの性差別的バイアスの評価及びプロンプトを用いたバイアス除去手法の検討. YANS 2021.

      • 小山碧海金子正弘小町守. 学習者データに対する擬似誤り生成を用いた文法誤り訂正モデルの分析. YANS 2021.

      • 上田直生也山下郁海高橋悠進平澤寅庄小町守. 疑似データによるデータ拡張を行った文法誤り検出モデルの未知の誤りパターンに対する性能評価. YANS 2021.

      • 鈴木大祐高橋悠進山下郁海相田太一平澤寅庄小町守. 日本語文法誤り訂正の参照文を用いない自動評価における人手評価への最適化. YANS 2021.

      • 中辻充恭山下郁海高橋悠進平澤寅庄小町守. Prompting を用いた GPT による文法誤り訂正の検討とその分析. YANS 2021.

    • 2021/08/07 自然言語処理のトップカンファレンス ACL の関連ワークショップにて、以下の発表をしました。

      • Seiichi Inoue, Taichi Aida, Mamoru Komachi and Manabu Asai (Soka University). Modeling Text using the Continuous Space Topic Model with Pre-Trained Word Embeddings. ACL-IJCNLP 2021 Student Research Workshop (SRW), pp.138-147. August, 2021.

      • Yuting Zhao, Mamoru Komachi, Tomoyuki Kajiwara (Ehime University) and Chenhui Chu (Kyoto University). TMEKU System for the WAT2021 Multimodal Translation Task. The 8th Workshop on Asian Translation, pp.174-180. August, 2021.

      • Hwichan Kim, Mamoru Komachi. TMU NMT System with Japanese BART for the Patent task of WAT 2021. The 8th Workshop on Asian Translation, pp.133-137. August, 2021.

      • Seiichiro Kondo, Aomi Koyama, Tomoshige Kiyuna, Tosho Hirasawa and Mamoru Komachi. Machine Translation with Pre-specified Target-side Words Using a Semi-autoregressive Model. The 8th Workshop on Asian Translation, pp.68-73. August, 2021.

      • Zhousi Chen, Longtu Zhang, Aizhan Imankulova and Mamoru Komachi. Neural Combinatory Constituency Parsing. In The 17th International Conference on Parsing Technologies (IWPT 2021). August 6, 2021.

    • 2021/06/07 自然言語処理のメジャーカンファレンスの一つの NAACL 2021 と関連ワークショップにて、以下の発表をしました。

      • Seiichiro Kondo, Kengo Hotate, Tosho Hirasawa, Masahiro Kaneko and Mamoru Komachi. Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop, pp. 143-149. June 8, 2021.

      • Aomi Koyama, Kengo Hotate, Masahiro Kaneko and Mamoru Komachi. Comparison of Grammatical Error Correction Using Back-Translation Models. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop, pp. 126-135. June 8, 2021.

      • Rob van der Goot (IT University of Copenhagen), Marija Stepanovic (IT University of Copenhagen), Alan Ramponi (IT University of Copenhagen), Ibrahim Sharaf, Ahmet Üstün (University of Groningen), Aizhan Imankulova, Siti Oryza Khairunnisa, Mamoru Komachi and Barbara Plank (IT University of Copenhagen). From Masked-Language Modeling to Translation: Non-English Auxiliary Tasks Improve Zero-shot Spoken Language Understanding. In Proceedings of the 2021 Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technology (NAACL-HLT 2021), pp. 2479-2497. June 8, 2021.

      • Zhishen Yang (Tokyo Institute of Technology), Tosho Hirasawa, Naoaki Okazaki (Tokyo Institute of Technology), Mamoru Komachi. Do Videos Guide Translations? Evaluation of a Video-Guided Machine Translation dataset. In Proceedings of the Workshop on Visually Grounded Interaction and Language. June 10, 2021.

    • 2021/05/15 自然言語処理のトップカンファレンス、The Joint Conference of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (ACL-IJCNLP 2021) の学生セッションである Student Research Workshop に以下の論文が採択されました。

      • Seiichi Inoue, Taichi Aida, Mamoru Komachi and Manabu Asai (Soka University). Modeling Text using the Continuous Space Topic Model with Pre-Trained Word Embeddings. ACL-IJCNLP 2021 Student Research Workshop (SRW). August, 2021. (accepted)

    • 2021/05/07 自然言語処理のトップカンファレンス、The Joint Conference of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (ACL-IJCNLP 2021) に以下のフルペーパーが Findings として採択されました。

      • Zhousi Chen, Longtu Zhang, Aizhan Imankulova and Mamoru Komachi. Neural Combinatory Constituency Parsing. Findings of ACL-IJCNLP 2021. (accepted)

    • 2021/04/08 NAACL Student Research Workshop 2021 に以下の2件の論文が採択されました。

      • Seiichiro Kondo, Kengo Hotate, Tosho Hirasawa, Masahiro Kaneko and Mamoru Komachi. Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation. NAACL Student Research Workshop (SRW) 2021. June, 2021. (accepted)

      • Aomi Koyama, Kengo Hotate, Masahiro Kaneko and Mamoru Komachi. Comparison of Grammatical Error Correction Using Back-Translation Models. NAACL Student Research Workshop (SRW) 2021. June, 2021. (accepted)

    • 2021/03/19 言語処理学会第27回年次大会にて、以下の発表をしました。

      • Yuting Zhao, Mamoru Komachi, Tomoyuki Kajiwara (Ehime University), Chenhui Chu (Kyoto University). Neural Machine Translation with Semantically Relevant Image Regions. 言語処理学会第27回年次大会. 2021年3月18日.

      • 本間 広樹, 小町 守, 真鍋 章(富士電機), 谷本 恒野(富士電機). BERTモデルを用いた障害レポートに対する重要箇所抽出. 言語処理学会第27回年次大会. 2021年3月16日.

      • 山下 郁海, 小町 守, 真鍋 章(富士電機), 谷本 恒野.(富士電機) 隠れ層補間によるデータ拡張を用いた障害レポート分類. 言語処理学会第27回年次大会. 2021年3月18日.

      • 蘆田 真奈, 平澤 寅庄, 金子 正弘, 小町 守. 日本語 BERT による否定表現認識についての分析. 言語処理学会第27回年次大会. 2021年3月17日.

      • 相田 太一, 小町 守, 小木曽 智信(国語研), 高村 大也(産総研), 持橋 大地(統数研). 通時的な単語の意味変化を捉える単語分散表現の結合学習. 言語処理学会第27回年次大会. 2021年3月17日.

      • 喜友名 朝視顕, 平澤 寅庄, 小町 守, 小木曽 智信(国語研). 事前学習モデルを用いた近代文語文の現代語機械翻訳. 言語処理学会第27回年次大会. 2021年3月16日.

      • 喜友名 朝視顕, 吉村 綾馬, 金子 正弘, 小町 守. マルチタスク学習を用いた系列変換タスクの品質推定. 言語処理学会第27回年次大会. 2021年3月18日.

      • 小山 碧海, 甫立 健悟, 金子 正弘, 小町 守. 文法誤り訂正における複数の逆翻訳モデルを利用した訂正傾向の比較. 言語処理学会第27回年次大会. 2021年3月17日.

      • 今藤 誠一郎, 甫立 健悟, 平澤 寅庄, 金子 正弘, 小町 守. 2 文の連結を用いた機械翻訳におけるデータ拡張. 言語処理学会第27回年次大会. 2021年3月16日.

      • 井上 誠一(創価大), 相田 太一, 浅井 学(創価大), 小町 守. 学習済み単語分散表現を用いた連続空間トピックモデル. 言語処理学会第27回年次大会. 2021年3月17日.

      • 小林 千真(法政大), 相田 太一, 小町 守. BERT を使用した日本語の単語の通時的な意味変化の分析. 言語処理学会第27回年次大会. 2021年3月17日.

      • 高橋悠進, 金子正弘, 小町守. 文法誤り訂正における品質推定モデルに対する習熟度の影響の分析. 言語処理学会第27回年次大会ワークショップ文章の評価と品質推定. 2021年3月19日.

    • 2021/03/14 自然言語処理のメジャー国際会議 North American Chapter of the Association for Computational Linguistics に以下の共同研究の成果が採択されました。

      • Rob van der Goot (IT University of Copenhagen), Marija Stepanovic (IT University of Copenhagen), Alan Ramponi (IT University of Copenhagen), Ibrahim Sharaf, Ahmet Üstün (University of Groningen), Aizhan Imankulova, Siti Oryza Khairunnisa, Mamoru Komachi and Barbara Plank (IT University of Copenhagen). From Masked-Language Modeling to Translation: Non-English Auxiliary Tasks Improve Zero-shot Spoken Language Understanding. 2021 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT 2021). June, 2020. (accepted)

    • 2021/01/23 言語処理学会論文誌「自然言語処理」に文法誤り訂正に関する以下の論文が採択されました。

      • 吉村綾馬, 金子正弘, 梶原智之(愛媛大), 小町守. 文法誤り訂正の参照文を用いない自動評価への最適化. 自然言語処理, 28巻, 2号. 採録決定.

      • 甫立健悟, 金子正弘, 勝又智, 小町守. 文法誤り訂正における訂正度を考慮した多様な訂正文の生成. 自然言語処理, 28巻, 2号. 採録決定.

    • 2021/01/22 以下の公聴会を開催しました。学外から多数の参加、ありがとうございました。

      • 12/23(水)16:00-18:00 金子正弘: Grammatical and Semantic Biases in Representation Learning from Raw Datasets(公聴会は説明・質疑ともに日本語)

      • 01/18(月)12:30-14:30 Aizhan Imankulova: A Study on Exploiting Additional Resources for Low-resource Neural Machine Translation(公聴会の説明は英語、質疑は日本語)

      • 01/22(金)15:30-17:30 Longtu Zhang: Neural Machine Translation Using Sub-Character Level Information(公聴会は説明・質疑ともに英語)

    • 2021/01/12 以下の研究が自然言語処理のメジャー国際会議 EACL に採択されました。

      • Masahiro Kaneko and Danushka Bollegala (University of Liverpool). Debiasing Pre-trained Contextualised Embeddings. The 16th Conference of the European Chapter of the Association for Computational Linguistics (EACL). April, 2021. (accepted)

      • Masahiro Kaneko and Danushka Bollegala (University of Liverpool). Dictionary-based Debiasing of Pre-trained Word Embeddings. The 16th Conference of the European Chapter of the Association for Computational Linguistics (EACL). April, 2021. (accepted)