.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python class BiRNN(nn.Block): def __init__(self, vocab_size, embed_size, num_hiddens, num_layers, **kwargs): super(BiRNN, self).__init__(**kwargs) self.embedding = nn.Embedding(vocab_size, embed_size) # Çift yönlü bir RNN elde etmek için `bidirectional` (çift yönlü) # öğesini True olarak ayarlayın self.encoder = rnn.LSTM(num_hiddens, num_layers=num_layers, bidirectional=True, input_size=embed_size) self.decoder = nn.Dense(2) def forward(self, inputs): # `inputs` şekli (parti boyutu, zaman adımı sayısı)'dır. LSTM, # girdisinin ilk boyutunun zamansal boyut olmasını gerektirdiğinden, # girdi, belirteç temsilleri elde edilmeden önce değiştirilir. Çıktı # şekli (zaman adımı sayısı, iş boyutu, kelime vektör boyutu) embeddings = self.embedding(inputs.T) # Farklı zaman adımlarında son gizli katmanın gizli durumlarını # döndürür. `outputs` şekli # (zaman adımı sayısı, iş boyutu, 2 * gizli birim sayısı)'dır. outputs = self.encoder(embeddings) # Tam bağlı katmanın girdisi olarak ilk ve son zaman adımlarında gizli # durumları bitiştirin. # Şekli (parti boyutu, 4 * gizli birim sayısı)'dır encoding = np.concatenate((outputs[0], outputs[-1]), axis=1) outs = self.decoder(encoding) return outs .. raw:: html

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python class BiRNN(nn.Module): def __init__(self, vocab_size, embed_size, num_hiddens, num_layers, **kwargs): super(BiRNN, self).__init__(**kwargs) self.embedding = nn.Embedding(vocab_size, embed_size) # Çift yönlü bir RNN elde etmek için `bidirectional` (çift yönlü) # öğesini True olarak ayarlayın self.encoder = nn.LSTM(embed_size, num_hiddens, num_layers=num_layers, bidirectional=True) self.decoder = nn.Linear(4 * num_hiddens, 2) def forward(self, inputs): # `inputs` şekli (parti boyutu, zaman adımı sayısı)'dır. LSTM, # girdisinin ilk boyutunun zamansal boyut olmasını gerektirdiğinden, # girdi, belirteç temsilleri elde edilmeden önce değiştirilir. Çıktı # şekli (zaman adımı sayısı, parti boyutu, kelime vektör boyutu) embeddings = self.embedding(inputs.T) self.encoder.flatten_parameters() # Farklı zaman adımlarında son gizli katmanın gizli durumlarını # döndürür. `outputs` şekli # (zaman adımı sayısı, iş boyutu, 2 * gizli birim sayısı)'dır. outputs, _ = self.encoder(embeddings) # Tam bağlı katmanın girdisi olarak ilk ve son zaman adımlarında gizli # durumları bitiştirin. # Şekli (parti boyutu, 4 * gizli birim sayısı)'dır encoding = torch.cat((outputs[0], outputs[-1]), dim=1) outs = self.decoder(encoding) return outs .. raw:: html

.. raw:: html

mxnet pytorch

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python embed_size, num_hiddens, num_layers, devices = 100, 100, 2, d2l.try_all_gpus() net = BiRNN(len(vocab), embed_size, num_hiddens, num_layers) def init_weights(m): if type(m) == nn.Linear: nn.init.xavier_uniform_(m.weight) if type(m) == nn.LSTM: for param in m._flat_weights_names: if "weight" in param: nn.init.xavier_uniform_(m._parameters[param]) net.apply(init_weights); .. raw:: html

.. raw:: html

mxnet pytorch

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python glove_embedding = d2l.TokenEmbedding('glove.6b.100d') .. raw:: html

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python glove_embedding = d2l.TokenEmbedding('glove.6b.100d') .. raw:: html

.. raw:: html

mxnet pytorch

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python embeds = glove_embedding[vocab.idx_to_token] embeds.shape .. raw:: latex \diilbookstyleoutputcell .. parsed-literal:: :class: output (49346, 100) .. raw:: html

.. raw:: html

mxnet pytorch

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python net.embedding.weight.set_data(embeds) net.embedding.collect_params().setattr('grad_req', 'null') .. raw:: html

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python net.embedding.weight.data.copy_(embeds) net.embedding.weight.requires_grad = False .. raw:: html

.. raw:: html

mxnet pytorch

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python lr, num_epochs = 0.01, 5 trainer = gluon.Trainer(net.collect_params(), 'adam', {'learning_rate': lr}) loss = gluon.loss.SoftmaxCrossEntropyLoss() d2l.train_ch13(net, train_iter, test_iter, loss, trainer, num_epochs, devices) .. raw:: latex \diilbookstyleoutputcell .. parsed-literal:: :class: output loss 0.276, train acc 0.885, test acc 0.859 732.3 examples/sec on [gpu(0), gpu(1)] .. figure:: output_sentiment-analysis-rnn_6199ad_57_1.svg .. raw:: html

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python lr, num_epochs = 0.01, 5 trainer = torch.optim.Adam(net.parameters(), lr=lr) loss = nn.CrossEntropyLoss(reduction="none") d2l.train_ch13(net, train_iter, test_iter, loss, trainer, num_epochs, devices) .. raw:: latex \diilbookstyleoutputcell .. parsed-literal:: :class: output loss 0.293, train acc 0.881, test acc 0.854 693.3 examples/sec on [device(type='cuda', index=0), device(type='cuda', index=1)] .. figure:: output_sentiment-analysis-rnn_6199ad_60_1.svg .. raw:: html

.. raw:: html

mxnet pytorch

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python #@save def predict_sentiment(net, vocab, sequence): """Bir metin dizisinin duygusunu tahmin edin.""" sequence = np.array(vocab[sequence.split()], ctx=d2l.try_gpu()) label = np.argmax(net(sequence.reshape(1, -1)), axis=1) return 'positive' if label == 1 else 'negative' .. raw:: html

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python #@save def predict_sentiment(net, vocab, sequence): """Bir metin dizisinin duygusunu tahmin edin.""" sequence = torch.tensor(vocab[sequence.split()], device=d2l.try_gpu()) label = torch.argmax(net(sequence.reshape(1, -1)), dim=1) return 'positive' if label == 1 else 'negative' .. raw:: html

.. raw:: html

mxnet pytorch

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python predict_sentiment(net, vocab, 'this movie is so great') .. raw:: latex \diilbookstyleoutputcell .. parsed-literal:: :class: output 'positive' .. raw:: latex \diilbookstyleinputcell .. code:: python predict_sentiment(net, vocab, 'this movie is so bad') .. raw:: latex \diilbookstyleoutputcell .. parsed-literal:: :class: output 'negative' .. raw:: html

.. raw:: html