どうもこんばんわ
せっかく続いた晴れ日和もまた曇り空に覆われてしまいました。
小雨も不定期に降るので洗濯物が外に干せませんし、
部屋干しは部屋中湿気っぽくなるので好きではありません。
子供の頃から夏という季節は好きで
地元の夏祭りや花火大会に友達と遊びに出かけたり
市民プールで友達と水泳競争や水遊びなどをよくしました。
しかし梅雨だけは社会人になった今でも慣れません(汗)
OCR
憂鬱に浸っててもしょうがないので本日も学習を進めます。
Kindleで購入した書籍が仕様上ハイライトやコピペができないため
今後の学習が手打ちでしか進めなくなりましたが
何としてでもコーディングを効率化したい私はふと思いました。
「何らかのアプリでコピペできるようにならないのか」
iPhoneのiOSアプリにGoogle翻訳という
単語を入力すると翻訳したい言語に翻訳してくれる
便利なアプリがありますが
カメラモードにすると画面に映っている単語を
翻訳したい言語に翻訳して映っている単語を
翻訳した単語に変換してくれるという
大変ユニークで便利な機能があります。
このiOSアプリの存在を知っていた私は推察しました。
「Google翻訳のカメラモードのように
画面の文字が読み取れるアプリがあるのなら
その機能を応用したテキスト書き起こしアプリがあるのでは?」
ネットの検索サイトにてMac OS向けで画像ファイルから
テキスト書き起こしアプリはないのか調べていくと
次のことがわかりました。
前途のGoogle翻訳のカメラモードのような技術のことを
「OCR」と呼ばれており光学的文字認識を意味してます。
光学的文字認識とはデジタルカメラやプリンタのスキャナーなどで
手書きや印刷された文字を読み取り、
コンピュータなどで利用できる文字データに変換する技術のことであります。
ちなみに「OCR」とはOptical Character Recognition/Readerの略称でなります。
そのOCRが無償でしかもダウンロード不要で利用できるサイトがあります。
Online OCR
この「Online OCR」ではテキストを抽出したいPDFやJPEGなどの画像ファイルを
アップロードすることでMicrosoft Wordのdocxファイルやtxtファイルに出力することができます。
また無料会員登録することで様々な制限が無くなり
さらに高機能なOCRとして活用することができるようになります。
今回は「スラスラわかるHTML&CSSのきほん 第2版」の116ページにある
ソースコードをテキスト化したいと思います。
「Online OCR」にアクセスしたらページ中央に入力画面がありますので
次の手順からアップロード作業を進めていきます。
1.左にある「Select file…」をクリックするとテキストを抽出したい画像ファイルを選択します。
2.画像ファイルを選択したら抽出したい言語を選択します。
本書籍は日本語で書かれているので「JAPANESE」にします。
3.抽出したい言語を選択したら出力したいファイル形式を選択します。
今回はコピペしやすいようにtxtファイルで出力したいので
「Text Plain(txt)」を選択します。
選択したら右にある「CONVERT」をクリックします。
4.抽出が完了すると下にファイルのダウンロード先と
抽出されたテキストが表示されます。
これで画像ファイルから文字を読み込みテキスト化する処理が完了しました。
では実際にダウンロードしてファイルを開いてみると…
何か怖い文章になって出力されてしまいました。
おそらくソースコード以外の文章を含めた画像にしたために
周りの文字列や記号なども認識されて抽出されたと思われます。
では気を取り直して
今度はソースコードの箇所だけトリミングして
再度「Online OCR」にかけてみたいと思います。
結果はご覧の通り
前回よりも改善はされているものの
「/」がカタカナの「ノ」として認識されてたり
インデントもうまく反映されていません(汗)
どうやら画像ファイルにある文字の書式が一風変わったものの場合だと
うまく認識してもらえないようです。
このサイトではあまり書籍などの画像からソースコードの抽出は避けた方がいいみたいです。
今回紹介したサイト以外にもOCRが利用できるところもまだあるので
今度使い勝手のいいものを探してみたいと思います。
ここまで読んでいただきありがとうございます。
次回の記事の更新をお楽しみに。