タイトル
     2017 年度   総合国際学研究科
  
言語教育論   
時間割コード
741D0070
担当教員(ローマ字表記)
  投野 由紀夫 [TONO Yukio]
授業開講形態 授業形態 単位数 学期 曜日・時限 実務経験のある教員による授業
  講義 2 春学期 火6 -
授業題目(和文)   
コーパス言語学における統計利用
 
Title(English)   
Statistical applications in corpus linguistics
 
授業の目標   
コーパス言語学の重要な要素に、言語データの統計処理がある。修士課程では基礎的な統計処理を学んでいるはずだが、コーパス言語学の分野に特に関連するより高度な手法の理解が欠かせない。このモジュールでは主要な多変量解析、因果関係モデル、機械学習の手法の理解を深めることを目標とする。今年度前期は線型モデルをとりあげ、(a) その基本的な理解を統計テキストから得られること、(b) コーパス言語学の実際の論文の中での使用法を理解すること、(c) 統計ソフト R による線型モデルの実際の処理を習得すること、を目標としそれらの達成度を勘案して評価する。
 
Goals of the course   
(1) become familiar with the fundamental concepts of linear modeling and regression analysis
(2) understand how linear modeling and regression analysis are used in corpus linguistics literature
(3) acquire basic skills of performing different types of regression analyses in R
 
授業の概要   
コーパス言語学ではさまざまな統計手法があるが、最近、線型モデル(linear model)の利用事例が大変多くなっている。この講義では、線型モデルの基礎的な概念を統計の入門書から学ぶと同時に、具体的なコーパス言語学分野の論文で線型モデルの使用例を見て、その使い方や解釈の仕方、手法の利点や欠点に関して学び、自分の研究分野に活かせるかどうか検討を加える。
 
Overview of the course   
This module is designed for PhD students in linguistics to acquire various statistical methods for linguistic analysis. This term we will deal with linear modeling and other regression analysis. There is a growing number of research articles in which linear modeling techniques have been applied in various ways. Generalized linear model is a flexible extension of traditional linear model but it is slightly more complicated than the existing one, thus needs careful examination and understanding of how the model is constructed and the results should be interpreted.
 
キーワード   
corpus linguistics, statistics, linear model
 
Keywords   
corpus linguistics, statistics, linear model, regression analysis
 
授業の計画  
No.内容
第1回 統計テキストから学ぶ線型モデルの基礎(1)
第2回 統計テキストから学ぶ線型モデルの基礎(2)
第3回 コーパス言語学の論文から学ぶ線型モデルの適用(1): 単回帰モデル
第4回 コーパス言語学の論文から学ぶ線型モデルの適用(2): 重回帰モデル
第5回 コーパス言語学の論文から学ぶ線型モデルの適用(3): ロジスティック回帰モデル
第6回 コーパス言語学の論文から学ぶ線型モデルの適用(4): ポワソン回帰モデル
第7回 コーパス言語学の論文から学ぶ線型モデルの適用(5): 多項回帰モデル
第8回 実例とR で学ぶ線型モデルの基礎(1): simple linear regression
第9回 実例とR で学ぶ線型モデルの基礎(2): multiple linear regression
第10回 実例とR で学ぶ線型モデルの基礎(3): hierarchical linear regression
第11回 実例とR で学ぶ線型モデルの基礎(4): polynomial regression
第12回 実例とR で学ぶ線型モデルの基礎(5): logistic regression
第13回 実例とR で学ぶ線型モデルの基礎(6): poisson regression
第14回 アクティブ・ラーニング(1): 線型モデルを用いた research design を立ててみる
第15回 アクティブ・ラーニング(2):サンプル・データで R の複数の regression 手法を実行してみる
 
Plan  
No.Content
1 Gentle introduction to linear model (1)
2 Gentle introduction to linear model (2)
3 The use of linear model in corpus linguistics: simple linear regression
4 The use of linear model in corpus linguistics: multiple regression
5 The use of linear model in corpus linguistics: logistic regression
6 The use of linear model in corpus linguistics: poisson regression
7 The use of linear model in corpus linguistics: polynomial regression
8 Performing simple linear regression in R
9 Performing multiple regression in R
10 Performing polynomial regression in R
11 Performing logistic regression in R
12 Performing poisson regression in R
13 Performing hierarchical linear regression in R
14 Active learning (1): Write a research design using linear modeling strategies
15 Active learning (2): Performing regression analysis using R
 
成績評価の方法・基準   
プレゼン 40%:統計テキスト・論文のレポートを分担で行うので、内容を的確に理解し、重要な情報を報告できているか
統計実技 40%:統計ソフト R で実際のモデルの実行を行うので、処理手順を理解し、毎回のコードの実行や解釈などが性格にできているか
アクティブ・ラーニング 20%:2回のそれぞれを 10% とし評価に加える。
 
Grading system for assessment   
Presentation 40%
Stats practicum 40%
Active learning 20%
 
事前・事後学習【要する時間の目安】   
毎回購読するテキストの内容を事前に読んでポイントを把握、質問事項を用意してくること。
事後学習では必ず論文の内容と同じ R コードを後で学ぶので、自分で復習として処理方法を試しておくこと。
 
Preview/review   
- Prepare to read all the articles in advance, summarizing points and questions
- Every time a new analysis technique is introduced, make sure to be able to perform the analysis using R
 
履修上の注意   
統計の基礎知識があることが望ましい。数式に関しては特に数学的知識を過度には求めない。
論文はほとんど英語なのできちんと英語で解釈できる英語力が必須。
R のコードの解説も英語であるので、そちらの解釈もきちんとできるように。
担当する部分のレポーターの役割が重要なので、きちんと予習復習を行うように。
 
Notes   
Prerequisite: basic knowledge about statistics; good English command for reading articles on corpus linguistics and statistics
 
教科書  
教科書1 ISBN 978-3110307283
書名 Statistics for Linguistics with R: A Practical Introduction
著者名 Stefan Th. Gries 出版社 De Gruyter 出版年 2013
備考
 
参考書  
 
使用言語  
未選択()
 
ページの先頭へ