タイトル「2021年度 教育学部シラバス」、フォルダ「2021年度 教育学部シラバス-数学科
シラバスの詳細は以下となります。
ナンバリングは科目コードとは異なります。ご注意ください。
ナンバリングとは
科目コード   60008400 
科目名   自然と数理B  
担当教員   渡辺 純成  
対象学年   1年   クラス   51  
講義室   S302    開講学期   秋学期  
曜日・時限   月1   単位区分   選必  
授業形態   講義   単位数  
受講対象  総合学芸領域:分野C共通 
備考  CA:(C)領域 
ナンバリング   111241 
ねらいと目標 自然言語を扱う言語学と文献学は、いわゆる文系の学問分野とされているが、大量のデータを確率論や統計学などを用いて分析することによって具体的な結果が得られることを述べて、人文学でも数学や情報技術が有効に使えることを示す。 
内容 コーパス言語学・統計的自然言語処理と計量文献学にかかわる話題をいくつか選び、それらの分析で使われる数学的な原理と手法、および、具体的な応用を解説する。 
テキスト 数学、言語学、自然言語処理、計量文献学を横断して解説するので、講義全体を通しての教科書はない。各話題について、配布する講義録に、各分野の教科書を紹介する。自然言語処理については、黒橋禎夫『改訂版  自然言語処理』(放送大学教育振興会)を挙げておこう。 
参考文献 各話題について、配布する講義録で、参考文献を紹介する。興味を持って深く調べたくなったときに参照すれば十分だが、統計学については、所属の理系・文系いかんにかかわらず、身につけておくべきなので、紹介しておく。概要を知りたい学生は、盛山和夫『統計学入門』(ちくま学芸文庫)。これは演習問題が付いていないので、みっちり勉強したい学生は、東京大学教養学部統計学教室編『統計学入門』『人文・社会科学の統計学』(東京大学出版会)がよいだろう。 
成績評価方法 配布する講義録の中で出題する課題について、期末にレポートを提出すること。 
授業スケジュール(展開計画)
内容
1概観と包括的な注意(データサイエンスと人文学との接点、現象の数学的モデルを作るということ)
2確率論速成コース、その1:基本編(集合、可測空間、確率測度とその例、確率変数、平均・分散・期待値、条件付き確率、中心極限定理と大数の法則)
3確率論速成コース、その2:確率過程(確率過程とは?、マルコフ過程、推移確率とその行列表示(行列入門も含む))
4統計学速成コース(量的データと質的データ、統計データの構造と値の種類、度数と比率、要約統計量、母集団と標本)
5言語学速成コース(構造とは、共時論と通時論、音韻論、形態論、統語論、意味論)
6自然言語処理では何をするか(自然言語処理とその目標の概観(音声認識・品詞分類・構文解析・情報検索・機械翻訳など)) 
7コーパスと言語学(コーパスの種類、言語学におけるコーパスの利点、言語学における応用結果、コーパスを作成するときの注意)
8コーパスと自然言語処理 
9定量的な文体分析では何をするか(著訳者推定、成立年代の推定)
10私の動機──満洲(Manju)語資料の言語学と古典学
11n-gram解析──言語学からみたマルコフ過程(n-gram解析とは何か、n-gram解析の応用、n-gram解析の限界)
12共起collocationの分析(共起とは何か、意味論分析での応用)
13機械翻訳(機械翻訳の困難さ、機械翻訳の歴史、ニューラル機械翻訳の原理、ニューラル機械翻訳の問題点)
14満洲語資料の言語学と古典学への応用
15まとめ
授業時間外における学習方法 必要に応じて図書館などで参考書を広く調べること。 
授業のキーワード 言語学、自然言語処理、計量文献学、確率論、統計学 
受講補足(履修制限等)  
学生へのメッセージ この講義における各話題は、それぞれが通年講義の主題となりうるものなので、受講者に対して、すべてを細かく深く理解することを求めてはいない。人文学・理学・工学の各分野を横断するこのようなつながりもある、ということを聞き知っておいて、タコツボに閉じこもらずに、さまざまな学問分野に対して開かれた態度で接することを、若いうちに身につけてほしい。 
実務経験のある教員による科目  
授業実施方法(対面形式/遠隔形式) 対面授業を予定しているが、パンデミックが終息していなければ、遠隔授業で出発する。いずれにせよ、講義録の配布などでWebClassを活用するので、受講者は、WebClassにつねに注意しておくこと。 
その他  
Copyright(C) 2013 NTT DATA KYUSHU Co.,Ltd All rights reserved.