【第3回月例オンラインセミナー開催概要】
開 催 日:2025年6月23日(月)
時 間:13:30~15:00
講演テーマ:「大規模言語モデルに基づく機械翻訳のための継続事前訓練と選好最適化」
講 師:日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
上席特別研究員 永田 昌明先生
概 要:
10B前後のLLMでも、翻訳に特化してチューンすればGPT-4oに匹敵する翻訳精度を
実現できます。本講演では、そのために重要な「継続事前訓練」と「選好最適化」
について解説します。
特に、従来のBERTでは有効だったファインチューニングがLLMではうまく機能しない
という報告や、ALMAやTowerといった翻訳特化モデル、DPOやCPOといった選好最適化
手法の実例を交えながら、翻訳性能を向上させる技術の進化の過程を紹介します。
ご 略 歴:慶應義塾大学理工学部教授。人工知能学会会長、
1987年4月:日本電信電話株式会社(NTT)に入社。
1989年3月:ATR自動翻訳電話研究所へ出向。
1991年4月~1991年9月:カーネギーメロン大学(CMU)
機械翻訳センターの客員研究員として勤務。
1993年4月:NTTへ復帰。
1999年4月~2000年3月:AT&T研究所の客員研究員として勤務。
2020年から国際会議:Conference on Machine Translation (WMT)の共通タスク
General Machine Translation のオーガナイザとして英日翻訳と日中翻訳を担当。