やむやむもやむなし

やむやむもやむなし

自然言語処理やエンジニアリングのメモ

2019-01-01から1年間の記事一覧

MLflowをさくっと導入できるdocker-composeを作った

tl;dr docker-composeを叩くだけでさくっと認証付きのMLflowサーバーを立てられるようにしました こちらからどうぞ: ymym3412/mlflow-docker-compose みなさん機械学習の実験をしていますか? 学習に使ったハイパーパラメーターやデータ、Train/Valデータの…

Google Domainsで取得したドメインにCloud DNSでIPを関連つける

備忘的な記事になります。 ちょっと自分用のドメインが必要になったので、Google Domainsでドメイン取得してそれをGCPのCloud DNSを使ってIPの紐付けを行った際の手順を簡単にまとめておきます。 ドメイン取得 今回はGoogle Domainsでドメイン取得を行いまし…

学習済みELMoをAllenNLPで読み込む -りたーんず!-

この記事は自然言語処理アドベントカレンダー 2019の15日目です。 きっかけ AllenNLPとELMoForManyLangs ELMoの変換 1.Char Embedding 2.Char Convolution 3.Highway Net 4.Projection 5.Bi-LSTM config.json AllenNLPでELMoを使った学習 まとめ 謝辞 参考文…

学習済みELMoをAllenNLPで読み込もうとした

Stockmark社が公開している学習済みELMoをAllenNLPで読み込もうとして、ちょっと足りずにできなかった話です。 2019/12/15追記 リベンジしました 学習済みELMoをAllenNLPで読み込む -りたーんず!- ELMoとは ELMoの日本語での解説は多く出ているのでここでは…

Grad-CAMを使ったNLPモデルの判断根拠の可視化

機械学習モデルの解釈性は業務で使う上ではなぜそのような予測を行ったかの判断根拠の可視化として、また学習させたモデルをデバックする際にどんな入力に反応して誤予測を引き起こしてしまったか分析する上で非常に重要な要素です。 画像分野ではGrad-CAMと…

ACL2018を地球で一番読んだ人間になりました

「ACL2018を地球で一番読んだ人間」の実績を解除しました。プラチナトロフィーです。 随分時間がかかってしまいましたがNLPの国際学会「ACL2018」の全論文427本(Short/Long/Student Research Workshop/System Demonstrations)を読んで日本語でまとめました。…

NLP前処理ツール「chariot」とPyTorchで日本語テキスト分類

chakki-worksが発表した自然言語処理の前処理ツール「chariot」をさっそく動かしてみました。 公式サンプルは英語でのコードだったので、せっかくなので日本語のデータを使ってPyTorchの日本語分類モデルの学習を行ってみました。 chariotのgithubはこちら g…

nlpaper.challengeを立ち上げました

自然言語処理の国際学会「ACL」の採択論文を完全読破するNLPコミュニティ「nlpaper.challenge」を立ち上げました。 そして1/19(土)にnlpaper.challenge初のイベントである「NLP/CV交流勉強会」を開催してきました。 NLP/CV交流勉強会_nlpaperchallengeの紹介…