「深層学習」読書会　〜第7章〜¶

2016/07/02 機械学習名古屋第5回勉強会

第7章再帰型ニューラルネット¶

abstract:

RNN（再帰型ニューラルネットワーク）
- 以下のようなデータの特徴をうまく取り扱うNN：
  - データの長さがサンプルごとにまちまち
  - 系列内の要素の並び（＝コンテキスト）に意味がある
- 例：音声・言語・動画
LSTM（長・短期記憶）
- より長期のコンテキストをモデル化可能
CTC（コネクショニスト時系列分類法）
- 入力系列とは長さの異なる系列を推定（出力）

7.1 系列データの分類¶

系列データ：

個々の要素の順序付き集まりデータ

$$ {\bf x}^1, {\bf x}^2, {\bf x}^3, \dots , {\bf x}^T $$

音声・動画・テキストなど
系列の長さ $T$ は、一般に可変
インデックス $t = 1, 2, 3, \dots$ を時刻と呼ぶ（時間とは言ってない）。

RNN（再帰型ニューラルネット）：コンテキストを学習し、分類出来る。

コンテキスト（文脈）：系列内の要素の並び、依存関係

要素の例：

文章中の「単語」
音声信号中の「音素」

7.2 RNNの構造¶

RNN（再帰型ニューラルネット）：

内部に（有向）閉路を持つNNの総称
特徴：
- 情報を一時的に記憶
- 振る舞いを動的に変化

In [3]:

fig_7_3_a

Out[3]:

In [5]:

fig_7_3_b

Out[5]:

In [7]:

fig_7_4

Out[7]:

誤差関数：（順伝播ネットワークと同様）

$$ E({\bf w}) = - \sum_n \sum_t \sum_k d^t_{nk} \log y^t_k({\bf x}_n; {\bf w}) $$

ただし $d^t_n$：$n$ 番目のサンプル ${\bf x}_n$ に対する、時刻 $t$ での目標出力
（$(d^t_{n1}, d^t_{n2}, \dots , d^t_{nk})$ というベクトル）

双方向RNN：
データを順方向逆方向両方の入力で与えるRNNを統合したもの。

データの数が有限ならば有効
オンライン学習には不向き

7.3 順伝播計算¶

《略》

7.4 逆伝播計算¶

《略》

7.5 長・短期記憶（LSTM）¶

7.5.1 RNN の勾配消失問題¶

※イメージ

In [10]:

gradient_vanishing_image()

7.5.2 LSTM の概要¶

LSTM（長・短期記憶）：
RNNの拡張モデル（の1つ）。
RNNの中間層の各ユニットをメモリユニットと呼ぶ要素で置き換えた構造を持つ。

In [12]:

fig_7_7

Out[12]:

TensorFlow には tf.nn.rnn_cell.BasicLSTMCell というクラスが用意されており利用可能。
参照： class tf.nn.rnn_cell.BasicLSTMCell

In [ ]:

cell = tf.nn.rnn_cell.BasicLSTMCell(size, forget_bias=0.5)
(cell_output, new_state) = cell(inputs, old_state)

「深層学習」読書会　〜第7章〜¶

第7章再帰型ニューラルネット¶

7.1 系列データの分類¶

7.2 RNNの構造¶

7.3 順伝播計算¶

7.4 逆伝播計算¶

7.5 長・短期記憶（LSTM）¶

7.5.1 RNN の勾配消失問題¶

7.5.2 LSTM の概要¶

7.5.3 順伝播計算¶

7.5.4 逆伝播計算¶

7.6 入出力間で系列長が異なる場合¶

7.6.1 隠れマルコフモデル¶

7.6.2 コネクショニスト時系列分類法¶

「深層学習」読書会 〜第7章〜¶

第7章 再帰型ニューラルネット¶

7.1 系列データの分類¶

7.2 RNNの構造¶

7.3 順伝播計算¶

7.4 逆伝播計算¶

7.5 長・短期記憶（LSTM）¶

7.5.1 RNN の勾配消失問題¶

7.5.2 LSTM の概要¶

7.5.3 順伝播計算¶

7.5.4 逆伝播計算¶

7.6 入出力間で系列長が異なる場合¶

7.6.1 隠れマルコフモデル¶

7.6.2 コネクショニスト時系列分類法¶

「深層学習」読書会　〜第7章〜¶

第7章再帰型ニューラルネット¶