画像文字をテキスト化してみた。ついでに検証も。

2022年1月11日

HTMLコーディング作業の本質は、文字原稿をwebで閲覧できるようにすることです。
テキスト原稿があって初めて成り立つ作業です。

ところがたまにテキスト原稿が「画像」の場合があります。
少量であれば手入力しなおしで十分ですが、大量にある場合なかなかの大変さです。

そこで、このご時世。画像からテキスト化する方法について調べてみました。

今回の内容

1. やりたいこと
2. Google Keepサービスを使う
3. Google Keepの使い方
4. 疑問：テキスト化精度はどのくらいか？
- 4.1. 実験する画像文字
5. １．Illustratorで「オフィス用に保存」した画像
6. 2.JPEG画像の場合
- 6.1. 変換した結果がこちらです。
7. gif画像でも試してみました
- 7.1. 変換した結果がこちらです。
8. 一応PNG画像でも試してみました。
- 8.1. 変換した結果がこちらです。
9. 4種類の画像文字変換比較

やりたいこと

画像に書かれている文字をテキスト化する。

今回はこれだけです。
困ったらググる。
鉄則です。

答えはすぐ見つかりました。

Google Keepサービスを使う

ググるとOCR系のソフトやアプリはいろいろありましたが、手軽なところでGoogle Keepというサービスがあることを見つけました。

メモ目的のサービスですが、画像文字を読み取ってテキスト化する機能もあります。
なにより、Googleなので、たのGoogleサービス同様無料で使えます。

この手軽さがよいと思いGoogle Keepを使って、画像文字のテキスト化をやってみました。

Google Keepの使い方

１．Google Keepにアクセス

まずはGoogle Keepにアクセスします。
Googleアカウントを持っていればすぐ使えます。

アクセスすると、以下の画面が表示されます。

２．画像文字を投稿する

次にテキスト化したい文字画像を「メモを入力」欄にドロップします。
（画像アイコンをクリックして、ダイレクト画像選択もできます。）

3．テキスト化を実行する

画像を読み込んだら、メニューから「画像のテキストを抽出」を選択し実行します。
※注意点として画像を読み込んでいる最中は、テキスト化処理ができません。

4．画像の下にテキスト化された文字が表示されます。

テキスト抽出実行後、画像のすぐ下にテキストが表示されます。
スクロールして下に下がると見えます。

使い方は、1回試せばすぐ慣れるレベルです。
しかし、ここで疑問がわきました。

疑問：テキスト化精度はどのくらいか？

画像文字を読み取るということは「識字精度」が重要になります。
例えば人間であっても小さすぎる文字は読めません。
機械ならばなおさらなのではないかと思いました。

そこで、次の画像文字でちゃんと読み取れるか実験してみました。

実験する画像文字

フォントの大きさ別に文字画像を作りました。
また特殊文字（はしご髙）が認識できるかについてもためしてみました。

１．Illustratorで「オフィス用に保存」した画像

上記の画像はIllustratorで、オフィス用に保存した画像です。
比較的きれいに出力されています。

これを読み取ってテキスト化したものがこちらです。

36pt 高い薔薇
24pt 高い薔薇
21pt 高い薔薇
18pt 高い薔薇
14pt 髙い薔薇
12pt 髙い薔薇
10pt 高い薔薇
8pt 高い薔薇
6pt高い薔薇

一応、6ptの文字まで変換されました。
ただ、はしご「髙」が普通の「高」になっています。
14pt、12ptははしご「髙」になっちますが、それより大きい文字が誤変換されました。

2.JPEG画像の場合

JPEG画像で出力した以下の画像でもテストしてみました。
解像度は72で一応Illustratorでweb最高画質出力しました。

こうやって見るとちょっと画像が粗い感じがします。
テキスト変換したら、以下のようになりました。

■JPEG画像

変換した結果がこちらです。

36pt 高い薔薇
24pt 高い薔薇
21pt 高い薔薇
18pt 高い薔薇
14pt 高い薔薇
12pt 高い薔薇
10pt 高い
pt 高い
高い

10ポイント以下から、読み取りがうまくできなくなりました。
また、はしご「髙」はすべてノーマル「高」に誤変換されました。
薔薇に関しては、不明文字と判断されたようです。

gif画像でも試してみました

Jpegはぼやけやすいので明暗がはっきり出るgif画像でも試してみました。

gif画像

変換した結果がこちらです。

36pt 高い薔薇
24pt 高い薔薇
21pt 高い薔薇
18pt 高い薔薇
14pt 高い薔薇
12pt 高い薔薇
10pt 高い
8pt高い
高い

Jpeg画像の場合と同じ結果になりました。
やはり文字が小さくなると、誤変換率が高くなります。

一応PNG画像でも試してみました。

なんとなく結果は見えますが、もっとも画質の良いPNG画像でもためしてみました。

PNG画像

変換した結果がこちらです。

36pt 高い薔薇
24pt 高い薔薇
21pt 高い薔薇
18pt 高い薔薇
14pt 高い薔薇
12pt 高い薔薇
10pt 高い
8pt高い
高い

3つの画像の中では一番画質がよいはずなのですが、結果は他の画像と同じでした。
やはりweb用に保存した画像では、誤変換率が高いようです。

4種類の画像文字変換比較

ある程度の変換はできますが、以下の特徴があることがわかりました。

特殊文字は誤変換されやすい
10pt以下の文字は読み取れない可能性が高い

今回、実際にある程度長い文章を変換して使ってみたのですが、一部誤変換されていました。
その際に一つ一つ誤変換を直してゆくのですが、どこが誤変換されたかわからないため、修正箇所を探すのに苦労しました。

確かに1から手入力するよりかは効率がよいですが、それでも誤変換対応もそれなりに必要でした。

本記事がお役に立てば幸いです。

アプリ,備忘録ぐーぐるさん,文字起こし

Posted by OBATA

新着記事

Thumbnail of new posts 065

2025年7月1日 : PHP

さくらサーバーでＰＨＰのエラーログを出力する

PHPで開発をすると、原因不明のエラーが発生することがあります。例えば500 I ...

Thumbnail of new posts 039

2025年6月24日 : 私の体験・考察・雑記

アナリティクス計測にcookie同意ツールを盛り込んだらアナリティクスの意味がなくなったお話

サイトの運営状況を測定するツールとして、Googleのアナリティクスがあります。 ...

Thumbnail of new posts 107

2025年6月17日 : CSS

cssで中央ぞろえしたboxを左へ200pxずらしてみた

近年HTML5、CSS3によりweb構築技術が急速に発達しています。そのため、一 ...

Thumbnail of new posts 078

2025年6月10日 : CSS

cssで横幅指定時にpadding指定をするとはみ出る現象に対処。

ホームページを作る際にまず最初に覚えるべき基本的なこととして、マージン（間隔）と ...

Thumbnail of new posts 143

2025年6月3日 : 私の体験・考察・雑記

Microsoft Authenticatorに「authenticatorによるオートフィルは2025年7月に終了します。」と表示された件について調べてみた

私はMicrosoft Authenticatorを二段階認証に使用しています。 ...

Thumbnail of new posts 152

2025年5月27日 : CSS

cssで中央寄せだけどテキストは左揃えにする

横書きの場合、テキストは左揃えにします。短いテキストの場合は中央揃えにするケース ...

Thumbnail of new posts 173

2025年5月20日 : HTML

スマホでinputタグの入力を数字入力モードにする

ホームページ制作で入力フォームは、お問い合わせフォーム、管理画面などでよく使用し ...

Thumbnail of new posts 013

2025年5月13日 : CSS

liタグの黒丸の色だけを変えてみた

ul、liタグはweb制作業者であれば、よく利用するタグではないでしょうか?親子 ...

Thumbnail of new posts 075

2025年4月29日 : CSS

display: flexで、高さを統一しているときに、特定要素のみ高さをフリーにする

ホームページ制作をしていると、2列構成や3列構成にすることもしばしばあります。以 ...

Thumbnail of new posts 153

2025年4月22日 : PHP

さくらサーバーで特定フォルダだけPHPバージョンを変更する

PHPのバージョンは、思いのほか頻繁に上がります。ただ上がるだけならばよいのです ...