タイトル
     2017 年度   言語文化学部
  
言語処理論B   
時間割コード
411016
担当教員(ローマ字表記)
  佐野 洋 [SANO Hiroshi]
授業開講形態 授業形態 単位数 学期 曜日・時限 実務経験のある教員による授業
    2 秋学期 木2 -
授業題目(和文)   
応用(比較)言語学基礎Ⅱ
 
Title(English)   
Language Processing B
 
授業の目標   
文章表現が表す意味を定量的に把握するための言語分析の基礎と定量分析の技法を学習します。
(1) 言語データ分析の基礎、問題解決とデータ分析(モデルや仮説の立て方と因果関係)が理解できる
(2) 言語データの整理と基礎統計(一次元データ、二次元データの統計的な整理の方法が分かる。基礎統計の手法と簡単なデータ処理手順)がわかる
(3) 問題の定量的な検証方法(語彙の分布や頻度統計、相関関係の妥当性の検証方法)が分かる
(4) ことばの共起とその関係性の分析(語の共起関係の計算方法が理解できる。基礎統計の検索手法の手順)がわかる
(5) ことばの分類(語彙間の関係の強さや類似性の計算方法)が理解できる
 
Goals of the course   
The lecture aims to
* provide an introduction to the field of natural language processing;
* educate students on the matters of linguistic (knowledge-based) and statistical approaches to language processing;
* familiarize students with data analysis methods;
* enable students to use statistical algorithms to help model and understand data;
* give students the technical background of statistical approaches to text processing.
 
授業の概要   
コーパス言語学、社会言語学等で利用されるデータの分析手法を学びます。その内容は、統計の基礎的な項目と形態論や構文論の関係と、問題分析の方法の学習です。
 
Overview of the course   
 
キーワード   
コーパス言語学、応用言語学、基礎統計学
 
Keywords   
Corpus linguistics, Formal linguistics, Quantitative analysis, Qualitative analysis
 
授業の計画   
(1) データ分析の基礎
(2) 一次元データの整理の仕方
(3) 二次元データの整理の仕方
(4) ことばの使用の偏りを計測する
(5) ことばの使用の偏りを日英語で比較する
(6) 文法や定型句とことばの結びつきの強さの定量化
(7) ことばの共起関係を定量化し比較する方法
(8) 共起関係の日英語の差を検討する
(9) ベイズ統計を利用した共起関係の計算方法について
(10) 語彙分類や意味分類とことばの関連性の強さについて
(11) ことばの特徴分類(演習、多変量解析の利用。Webを使ったアクティブラーニング)
(12) ことばの特徴分析(演習、主成分分析の利用)
(13) 文章の特徴分析(演習、文章ジャンルの調査。Webを使ったアクティブラーニング)
(14) 語彙の意味の違いと日英語の差を調べる
(15) まとめ
いずれの項目もことばの分析例を示した上で、具体的な課題を行うことで理解を深めます。
 
Plan   
Contents
* Introduction and Course Overview
* Data collection and studies(single dimension)
* Data collection and studies(multidimension)
* Natural Language and formal language (regular expressions)
* N-grams and language models
* Probabilistic and lexicalized parsing
* Deviation calculation of co-occurrence (two-word sequence)
* Test statistic calculation of co-occurrence (two-word sequence)
* Representing meaning by using formal language
* Semantic analysis
* Applications using statistical approaches (multiple classification analysis) (Active learning: PC Practice)
* Applications using statistical approaches (principal component analysis) (Active learning: PC Practice)
* Applications using statistical approaches (clustering)
* Course wrap up
 
成績評価の方法・基準   
次の得点の累積によって求めます(上限は100点)。
・受講時の積極的な参加(発言の回数)
・課題への取り組み状況(授業内で課す課題の提出状況と内容評価)
 
Grading system for assessment   
Assignments 80%
Participation 20%
 
事前・事後学習【要する時間の目安】   
配布資料には予め目を通し、関心のある点や概念把握が難しい点などを授業中に質問できるように準備しておくこと。
課題の提出期限を守り、指定の記述・時間までに提出すること。
 
Preview/review   
 
履修上の注意   
講義では課題を課します。
 
Notes   
 
教科書  
 
参考書  
 
使用言語  
日本語(J)
 
ページの先頭へ