自然言語処理(Natural Language Processing)
専攻選択・必修開設時期単位数授業形態担 当
情報電子選択2年後2講義高山泰博
【授業の概要】
我々が日常使用する言葉(日本語や英語)は、プログラミング言語(C言語等)の人工言語と対比して、自然言語と呼ばれている。本講義では、自然言語処理の基本的段階である形態素解析、構文解析、意味解析に関する基本事項を学ぶ。また、現代的な統計的言語処理の基礎についても学ぶ。
【学修の進め方】
各自の担当箇所を割当て、輪講形式で授業を進める。輪講で用いたレジュメはコメントを反映して次回の授業までに提出する。輪講形式で授業をすすめるため、事前の予習を確実に受講者が予習しておくことが必須である。
【授業計画】 【授業項目】 【内 容】
1 回 自然言語処理の概要 授業の進め方を説明し、自然言語処理とは何か、自然言語処理の歴史について学ぶ。
2 回 統計的言語処理入門 自然言語の数学的表現方法について学び、naive Bayes法をもとに統計的な言語処理の考え方を習得する。
3 回 言語の統計 言語の統計、統計の取り方、ジップの法則、マルコフ・モデル、シャノンの理論、テキスト間の類似性の検出などについて学ぶ。
4 回 言語の有限オートマトンモデル 言語の基本的概念、単語の性質、有限オートマトン、正規言語、及びオートマトンと言語の関係などについて学ぶ。
5 回 文脈自由型言語 形式文法、文脈自由型句構造言語、その性質、プッシュダウンオートマトン、オートマトンと言語の関係について学ぶ。
6 回 記号論理と言語 記号論理、記号論理式の意味と文の意味について学ぶ。
7 回 形態素と形態素解析(1) 形態素解析とは? 形態素や語の定義などについて学ぶ。
8 回 形態素と形態素解析(2) 形態素解析のアルゴリズムについて学ぶ。
9 回 構文解析(文脈自由文法に基づく構文解析I) 構文解析とは?。自然言語の文法をより自然に表現できるように前終端記号を導入した文脈自由文法を定義し、それに基づく構文解析アルゴリズムについて学ぶ。
10 回 構文解析(文脈自由文法に基づく構文解析II) 文脈自由文法に基づく各種構文解析アルゴリズムについて学ぶ。
11 回 構文解析(文脈自由文法の拡張) 実用規模の自然言語の文法を文脈自由文法として記述することは規則の数が膨大になり、文法の見通しを著しく低下させる。文法の見通しが悪くならないように文脈自由文法を拡張した文法記述法について学ぶ。
12 回 構文解析(構文解析における優先規則) 入力文の構造を一意に決定せず、可能な解に優先順位付けを行ったりして、ある程度の精度で一意の解を求める。そのときの優先順位について学ぶ。
13 回 意味解析 文の意味解析とは何かという問題について学ぶ。意味的あいまい性の解消を選択制限、連想関係に基づく方法について学ぶ。
14 回 自然言語処理の応用システム 自然言語処理技術を用いた応用システムの事例について学ぶ。
15 回 試験 講義で学んだ内容の理解度を問う。
16 回 まとめ 答案の返却、解説を行う。
【到達目標】自然言語処理に関する用語の具体的内容、及びその有効性について、また、各処理段階における基本的な表現法やアルゴリズムについて説明できる。
【徳山高専学習・教育目標】C1【JABEE基準】1(2)d-1
【評価法】試験成績×0.6+課題(レポート)×0.2+発表(レジュメ)×0.2で評価する。

【テキスト】「自然言語処理」 長尾真編、岩波書店
【関連科目】先修科目名:本科:言語処理(5年)