Daiさんの画像認識Linebot「文字起こし君」を参考に、文字起こしbotを作って運用してみた

こんにちは。株式会社コルウスの山口(@wataruguchi)です。

弊社では、自社内の業務支援ツールを日々開発しています。割合的には”自動化ツール”をメインを作っています。

自動化ツールとは、文字通り「何かしらのタスク自動化」をしてくれるツールです。毎日30分かかっていた作業が、ツールでわずか1秒以下で完了できるようになったりするので、自動化ツールはかなり重宝します。

今回は、僕の尊敬するプログラマーのDaiさん(@never_be_a_pm)がご自身のNoteで公開していたAIプログラムを参考に、自社利用目的で「文字起こし」Linebotを開発しましたので、そちらについて書いて行こうと思います!

Daiさんの「文字起こし君」について

「文字起こし君」の機能ついては、下ツイートが全てを物語っているように思います。機能としては、Linebotに画像を送るだけで、その画像の中にあるテキストを文字起こししてくれる優れものツールです。

「文字起こし」と聞くと、OCRを思い浮かべるかたもいらっしゃると思います。僕もOCR関連のアプリなのだろうなと考えていました。

OCRとは画像の中から文字を見つけ出して、文字データに変換する技術です。ScanSnapなどのスキャナーやテキスト解析をするアプリケーション(PDF解析とか)で利用されたりしますね。

それで、「文字起こし君」を知った時は「ひゃあ、このOCR部分をDaiさんが開発したのか、そりゃヤベーすげえ、僕なんか真似できそうにないぞ」と悶絶していたのですが、実はこのアプリは「マッシュアップ」という開発手法を採用していて、作り手側で実装する部分は「受け皿」であったり、「コネクション」の部分だけだったりします。

仕組みを簡単に書くと、「Lineから送られた画像データをGoogleの画像解析APIに渡して、結果をLine側に返す」といったシンプルなものです。

上の画像は、DaiさんのNoteから引用させて頂きました。仕組みとしては、こんな感じです。

所感としては、「作るだけなら、プログラム開発未経験でも可能」と思います。作り方については、DaiさんのNote譲りますが、エラーや上手くいかない部分をググって自分で解決できるスキルさえあれば多分できます。

もし、エラーなどで悩むようなら僕のTwitterにでもメッセージください。(Daiさんご本人に聞くのが早いと思いますが 笑)。

LineのMessage API、Google Apps Script、Google Cloud Vision APIを学ぶ絶好の機会になるでしょう。僕も「文字起こし」を作ってから、Message APIを使ったLinebotを幾つか作れるようになりました。

そういった意味でも「文字起こし」は学習のコスパがとても良いアプリだと思います。

Daiさん、Noteで作り方を公開してくださり、ありがとうございます!

「文字起こし」をどんなことに使っているか

僕は仕事柄、Web記事を書くことが多いので主に記事制作のために使っています。とくに書評をする際に大変役立っています。雑誌や文庫本の一部を引用したりですね。

また、今現在「文字起こし」のヘビーユーザとなっているのは、大学に通う学生の友人達です。彼らにこのbotの存在を説明すると「何それ超便利じゃん! 使わせて!」ということで、しばらく前から利用してくれているようです。

そんな彼らから「英文の和訳機能を付けて欲しい!」とリクエストが届いており、時間がある時にその機能を付けられるか試してみようと考えています。マッシュアップとAPIで、色々なことができますよ!

1点だけ運用する上での注意点、気付きも書いておきます。

「文字起こし君」はGoogleドキュメントにログ出力しているのですが、これを放っておくとログサイズが結構膨大になってドライブ容量の逼迫に繋がります。

なので、ログファイルの定期的なサイズ監視をした方が良いかと思います!

「文字起こしbot」を作って欲しい人いたら作ります

需要あるか分かりませんが、一応書いておきます。

文字起こしの作り方は、前述したDaiさんのNoteにありますし、機能だけ利用するなら以下QRコードから本家の「文字起こし君」を友達追加するだけでOKです。

しかし、セキュリティの観点で「ログデータが保管されるのは困る」など気にされる方やNoteを見たけど自分では作れなかった!という方もいるでしょう。また、非エンジニアの方(パソコンが苦手など)に作り方を教えたところ、プログラムを読むところからハードルが高く、作るのはとても無理だと意見を貰いました。

なので、もしWebライターさんや学生さんで「自分だけの文字起こしbot」が欲しいという方がいれば僕のTwitterにメッセージください。費用応相談の上、制作致します。

とはいえ、普通に使う分には上記のQRコードから友達追加して使うだけで十分です。

「文字起こし」とても便利なので、ぜひ業務効率化にお役立てください!