文章内で偶然5・7・5・7・7になっている個所を見つける「偶然短歌」というものを最近Twitterで知った。書籍化もされているらしい。
これ自分の文章とかでやってみたい、と思ったものの
Mecabやらpythonが必要で簡単に使えるやつがなかったので、サクッとウェブアプリを作ってみました。
入力した文章から偶然短歌や川柳・俳句になっている部分を抽出するWebアプリです
...
以下技術メモ。
kuromoji.js というライブラリを使っていて、
独自辞書を作成する処理がうまく動かず悩んだが、以下3点で対応できた。
- 11以下のバージョンのnodeを使用する
- なんか最新版だとコアダンプして上手くいかなかったので
gitリポジトリの 0.05 のTag からcloneしたデータで実行する - 以下のようにメモリ指定を増やして実行する
$ node --max-old-space-size=4096 `which gulp` build-dict
なお、mecab-ipadic-NEologd という巨大辞書を導入してみたものの
Webアプリ形式だと辞書が重いわ処理が重いわでまったく実用的じゃなかったので、結局kuromoji.jsのデフォルト辞書を使っています。
(それでもちょっと重い…)