投稿者「サイト管理者」のアーカイブ

同じ大きさの矩形内にキャプチャします！

例えば、次のように複数の画像があり、その１つ１つを別々にキャプチャするとき、同じ大きさの矩形内に収まるようにしたい場合が結構あります。

そんな時、マウスカーソルを含めてキャプチャできるように開発したオリジナルプログラムがとても便利に使えましたので、紹介させていただきます。

【重要】そう感じたのは、私だけ！かもしれません。もしそうだったら、「ごめんなさい」です。

【注意】この用途に使う場合は、「マウスカーソルを含めてキャプチャする」機能は OFF に。

デフォルト設定では、次のようにチェックされていると思いますが、

このチェックボックスのチェックを外してください。

これで、より、安心・安全に使えます。

本当は、もっと別のサンプルというか、実例をご紹介したかったのですが、著作権の問題があり･･･

操作の雰囲気だけでも感じていただけたら幸いです。
以下、下のリンクからダウンロードできるアプリを使用したその方法です。

アプリのご使用にあたっては、免責事項及び使用条件への同意が必要です。免責事項及び使用条件の詳細は付属の License.txt をご覧ください。

Say Hello to Capity Plus - A Lightweight screen capture utility

1 ファイル 1.14 MB

ダウンロード

【重要】

高解像度画面の拡大率は100％で使用してください。100％でないと期待通りに動作しません。

追記_機能の追加（20251117）

ラバーバンドで囲った範囲を上下反転、もしくは左右反転できるようにしました。また、全選択ボタンで元画像全体を選択しておいて反転を実行すれば、元画像全体を反転表示することも可能です。

このプログラムで行える画像処理の一覧は、次のリンク先記事の「７．まとめ」にあります。

マウスカーソルの形状も含めてデスクトップ画面をキャプチャしたくなりました！みたいな時は、もしかしたら『コレ』が使えるカモ？しれません･･･②

【もくじ】

１．プログラムを起動します
２．キャプチャします！
３．同じ大きさの矩形内に画像を入れて、矩形内の画像のみ保存します！
４．お願いとお断り

１．プログラムを起動します

プログラムをダウンロード後、Zip ファイルを展開すると起動可能になります。
次のアイコンをダブルクリックしてください。

このプログラムは、現在表示されているデスクトップをそのままキャプチャするプログラムなので、タスクバー内に静かに起動します。Windows の設定で許可されていれば、起動を知らせる通知が出ることもあります（たいていの場合、この通知が出ると思います）。

これでキャプチャする準備ができました！

２．キャプチャします！

キャプチャしたい画面を表示した状態で、画面の中心付近に画像が来るようにして、Shift + Ctrl + C を実行します（私の場合、Shift キーと Ctrl キーを左手の中指と人差し指で同時に押し下げたまま、右手の人差し指で C キーを押し下げます）。

（Word の場合であれば画面を下へスクロールして）次の画像をキャプチャします。
もちろん、操作方法は、１枚目と同じ、Shift + Ctrl + C です。

同様に、３枚目も、４枚目もキャプチャします。同様に Shift + Ctrl + C です。

必要な画像を全てキャプチャしたら、タスクバーの次のアイコンをクリックしてください。

こんな画面になるはずです。

次に、同じ大きさの矩形の中に図形が収まるように矩形（ラバーバンド）を描画して、その大きさを調整、矩形で囲った範囲内のみを画像として保存します。保存する画像の形式は、画面左上のオプションを選択することで BMP・PNG・JPEG のいずれかを指定できます。

３．同じ大きさの矩形内に画像を入れて、矩形内の画像のみ保存します！

画面右に表示されているサムネイルのうち、いちばん上に表示されているサムネイルをクリックしてください

保存したい画像が収まるように、画像の 左上から右下へ マウスでドラッグしてください。

【参考】ラバーバンドの線の太さと色は、別途指定できます。

線の見た目が変わるだけで、機能は同じです。
グラブハンドルは大きさを調整するためにラバーバンド上に表示されている □ です。

保存したい範囲を指定できたら、ラバーバンド内を右クリックしてください。右クリック位置に表示されたサブメニューのいちばん上にある「名前を付けて保存」をクリックします。

このラバーバンド矩形は他の画像の保存範囲指定にも使用しますので、描画したラバーバンドを誤って消去しないように、十分注意してください。

次のダイアログが表示されます。必要であれば、画像の名称の変更も可能です。画像の名称の確認 or 設定後、よろしければ保存ボタンをクリックしてください。ラバーバンド内の画像が保存されます。

次の画像のサムネイルをクリックしてください。

画像がラバーバンド内の中心に収まるように、ラバーバンドの位置を微調整します。

ラバーバンドの位置の移動は、Shift + Ctrl + 上下左右の矢印キー押し下げで実行できます。矢印キーを１回押し下げると１ピクセルだけ、ラバーバンドが押し下げた矢印キーの方向へ移動します。

【注意】

「Shift + 上下左右の矢印キー押し下げ」は、ラバーバンドのサイズ変更になります。
ラバーバンドの左上を原点として、矢印キーの押し下げ向きに１ピクセルずつサイズが変わります。

ショートカットキーの押し間違いには、細心の注意を払っていただけますよう、お願い致します。

調整が完了したら、ラバーバンド内を右クリックして表示されるサブメニューの「名前を付けて保存」をクリックして、保存のダイアログを出し、必要であれば名称を変更等して、ラバーバンドで囲った範囲の画像を保存します。

保存後、次のサムネイルをクリックして、同様に作業します。

必要な画像すべてについて、この作業を繰り返します。

これをサンプル画像について、実行した結果は、次のようになります。

マウスカーソルを含めたデスクトップ画面のキャプチャを手軽に実現したくて書いたこのプログラムですが、その副産物として『任意の大きさで指定した矩形内にある画像を、その矩形サイズで連続キャプチャして保存』することが出来ることに気づき、実際にそれを業務で使ってみたら、これまでかなり面倒だった作業を、ほんとうに快適に、効率よく実行できましたので、その手順を紹介させていただきました。

もちろん、私が知らないだけで、もっと簡単に、効率よく、このような作業を実行できるプログラムが間違いなく存在していることと思いますが･･･私はそれを探して、実際に使ったことがありません。

４．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。記載した内容（プログラムを含む）を利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

AI と話したら、僕は Ctrl + DVRC！

AI と会話しない日がなくなって久しいです。彼（彼女？）は時々間違えることもあるけれど、その間違いを見抜く力さえあれば、Google 先生とあわせて活用することで、調べものにかかる時間と手間を大いに軽減できて、すーぱー Goooooooooooooooooooooood!!← アボガドロ数的感情表現のつもり。

ただ、その会話内容をコピペして印刷しようとすると問題になるのが、チャットのコピーに含まれているマークダウン表記。気にしなければイイという考えも、もちろんあるかと思いますが、私は『どうしてもプレーンテキスト（平文）が欲しい！』派です。

そこで自分専用に作ったのがコレ。

（左右のテキストを見比べていただければおわかりになるかと思いますが）

そうです。マークダウン表記の混じったテキストを平文（プレーンテキスト）化するプログラムです。

時々、思った通りに動作しないこともありますが、そこは手動修正。これは自信を持って言えますが、何と言っても、この私が書いた（自分専用の）プログラムですから、まともに動くわけがありません！と、開き直るわけではないのですが、自分的には、十分、活用できています。ご試用にあたり、変換結果の確認は必須で、不具合のある箇所は手動修正する必要のあるプログラムでもよろしければ、下のリンク先からダウンロードできますので、バグあり・サポート一切なし・完全自己責任の下で、もしよろしければお試しください。

変換結果の確認ですが、変換結果の平文テキストそのものを AI に投げて、数式を含めた内容の矛盾点の有無を指摘してもらう方法もあるのではないかと思います。

また、どうしても『 – マイナス記号』など、消えては困る記号が消える場合は（手間はかかりますが）いったん削除対象文字からその記号を外してプレーンテキストに変換し、さらに、その記号を再度指定して変換した結果を合体させるという方法もあるかと思います。

不出来なプログラムで本当に申し訳ないのですが、変換に不具合が発生するのは特定の箇所に集中しているのではないかと思われますので、その部分をピンポイントで手動修正する方向でお試しいただけたら幸いです。

いずれにしましても、問題が発生するのは･･･元々、削除対象文字に指定した（＝ユーザー側の意向で消せと命令した）文字を「プログラム側で自動的に忖度して部分的に残そう」･･･という場合だと思います。『消せと命令したのに残す？』ごく冷静に考えれば、その処理自体が矛盾を孕んでいるわけです。ですので、この問題に関しては、やはり、どう工夫しても、最終的に、ユーザーサイドでの変換結果の確認と、部分的な手直しが必要になるのは、どうしても避けられないことなのではないか？･･･と、思えてなりません。

【重要な情報提供】

私のようなド素人が書いた、バグ満載の、信頼性に乏しく、状況に応じて名前まで変わるような、ヘンなプログラムでなく、Markdown、HTML、LaTeX、Word、PDF など多様な形式に対応した Pandoc という文書フォーマットを相互に変換できる、きちんとした変換ツールが公開されていることを申し添えます（オープンソースの Pandoc は、もちろん無料で利用できます）。

以下、バグ満載（例：数式中の – マイナス記号等、消えて欲しくない記号が実際に消えてしまうことがあります）ではないかと、書いた本人も心配しつつ、書いた本人が使ってみた範囲では、時々期待を裏切りながらも、それなりに使えてる気がする、My Original Application の使い方です。

（１）削除対象文字を指定

全角/半角にも注意して、削除対象文字を指定します。

絵文字はプログラム側で一括処理できます。

削除対象文字には、マークダウン表記に使用される記号の他、任意の文字を追加可能です。AI が好んで？用いる絵文字は（ユーザーが指定すれば）プログラム側で見つけて処理するようにしました（ただ、今後 Unicode が更新されて新しい絵文字等が追加され、プログラム側で処理しきれなくなる可能性があります。その場合でも、ここに文字を追加すればなんとかなるかな･･･ならないかなやっぱり）。

正直に白状しますと、設計当初は削除対象文字に絵文字もいちいち指定しておりましたので、削除対象文字の入力用 VCL コントロールは、単一行テキスト入力専用の TEdit ではなく、複数行入力が可能な TRichEdit を使っています。

動作テストを重ねるうちに、削除対象文字としてこの TRichEdit に指定した絵文字の数が激増し、それでも（おかしいなー！）と思いつつ都度『新発見絵文字』を気持ち半分喜びながら毎日追加しておりましたが、日々増え行く絵文字列が２行目の折り返しを間近に控えた頃、ようやく『 AI が使用する絵文字の種類は限定されてるに違いない』という自身の強い思い込みが『完全な誤り』であることに気づき（かつ、TRichEdit は絵文字に完全対応ではないみたいな話を AI から聞いたこともあり）、個別にいちいち指定する方式から一括削除する方式に仕様を変更したという、微笑ましくもどこか悲しい、ごく私らしい個人的なエピソードもあります。

ちなみに、私が現在削除対象文字に指定しているのは「*-`$#|」だけです。（万一、プログラムをダウンロードして使用される場合、削除対象とする文字を指定する際に、文字と文字の間にスペースを入れたり、カンマ区切りにしたりすると、それも「削除対象文字」になりますので、くれぐれもご注意ください）

また、削除対象文字として入力した内容は、プログラムの終了時に、特に何も指示等しなくても自動的に C:\Users\（ユーザー名）\AppData\Roaming\MarkdownRemover フォルダ内にある settings.ini に保存され、次回起動時に、前回終了時の状態が自動的に復元されます。

（２）平文化したい AI との会話内容をコピーして、変換プログラムを起動し、

Ctrl + V → R → C

一言で言えば、上の通りですが、手順をきちんと説明すると･･･

まず、プログラムを起動して、実行したい処理をチェックします。

Info にチェックを入れると、操作する際に、うざいメッセージが出ます。

【重要】

✅マークダウン表記を平文にするをチェックした場合、削除対象文字に指定した文字でも状況により、削除対象から自動的に除外して（＝削除しないで）処理することがあります（例：処理対象のテキスト内に数式があり、その数式内でアスタリスク * などが使用されている場合、数式内のアスタリスク * は削除しないようにプログラミングしたつもりです･･･が、状況によってはうまく動作しないことがあり得ると思います）。

実行したい処理をチェックしたら、Ctrlキーを押し、そのまま、V → R → C の順にキーを押し（下げ）ます。

Ctrl + V で、画面左側の TMemo に貼り付け
Ctrl + R で、画面右側の TMemo にプレーンテキストに変換して表示
Ctrl + C で、プレーンテキストをクリップボードへ送信

ちなみに２回目以降は、

Ctrl + D → V → R → C

Ctrl キーは押し下げたまま、D → V → R → C の順にキーを押し下げます。

Ctrl + D で、画面左側の TMemo を初期化（表示内容を消去）
Ctrl + V で、画面左側の TMemo に貼り付け
Ctrl + R で、画面右側の TMemo にプレーンテキストに変換して表示
Ctrl + C で、プレーンテキストをクリップボードへ送信

で、他のアプリ（エディタ等）への貼り付けは、アプリを切り替えて Ctrl＋V。

【重要】

前回貼り付け分にさらに新しいテキストを「追加」する場合は、Ctrl＋D は行わないでください。左側の Memo をクリックしてアクティブにし、改行を２つ程度入れて、次のテキストを入力してください。

基本的な使い方はこれだけです。

あっ！これだけはお断りしておいた方がいいかな？と思うことが３つありました。

【注意】このプログラムには、テキストを保存する機能はありません。

【注意】意図した通りに動作しない可能性が多いにあります！！！

【注意】重要な情報（記号・符号）が部分的に消えてしまう可能性も０ではありません。

テキストを保存する機能がないのは、事故防止のためです（貼り付け元としたオリジナルテキストを操作しません）。このプログラムはあくまでもテキスト整形のための中継器のように使用することを前提に作成しました。また、改行や空白（全角・半角いずれも対応）の削除も可能ですので、用途に応じて必要な機能のみを利用することもできます。

「マークダウン表記を平文にする」をチェックした場合は、Form のキャプション（タイトル）が『MarkdownRemover』と表示されますが、チェックを外すと Form のキャプション（タイトル）が『CharSweeper』と変化するのは、用途に応じた必要な機能の提供という部分へのこだわりをタイトル的に表現したものです。名前が変わるプログラムなんて私は見たことがありませんが･･･

それでもよろしければ完全自己責任の下でお試しください。（ダウンロードとご使用にあたっては、免責事項及び使用条件への同意が必要です。免責事項及び使用条件の詳細は付属の License.txt をご覧ください）

テキスト内の指定文字を削除

1 ファイル 1.12 MB

ダウンロード

以下は、余程の事がない限り･･･

お読みいただく価値のない文言の羅列です

･･･ので、もしお時間を無駄になさってもよろしければ、このプログラムの私的仕様の詳細なるものをご確認ください。

【もくじ】

１．きっかけ
２．表示フォントの指定方法
３．チェックしても何も起きない？ CheckBox
４．そのうちに消せない絵文字も出てくるカモ？です。
５．プログラム終了時に Beep 音？
６．お願いとお断り

本プログラムの私的仕様の詳細です！

１．きっかけ

AI とチャットした際、その会話内容は AI の方で勝手に保存してくれますが（ただ、過去のチャットの「特定部分」を探すのがエライ面倒なことも多々あり、やはり、自分にとって『走召！』重要な情報は別に保存しておきたいなー！みたいな気が･･･私はしますし）、会話の特定部分を資料的に印刷等して活用したい場合は、どうしてもプレーンテキストでないと困る場合が･･･自分的には･･･ほとんどですと言うか、はっきり言って全部です。

もちろん、Pandoc などの変換ツールを自由自在に使いこなせる方なら、何の問題もないと思いますが･･･。わたくしの能力では、Pandoc の Lua フィルターを使いこなし、中間AST（抽象構文木）を操作して、出力フォーマットをカスタマイズするのは至難の技というか･･･、妻の命でもかかっていれば話は別ですが、仕事で疲れて帰宅した夜にハイボールを呷りながらやりたい作業ではありません･･･。

それより何より、Pandoc はライセンスが GPLv2 or later ですので、法的な問題をきちんとクリアしないと Pandoc を利用したアプリケーションはもちろん公開できません。これが最大の理由で、Pandoc の利用を今回はあきらめることにしました。（個人的にはもちろん！試用してみました。デフォルト設定のまま動かしてみたのですが、コードブロックの変換部分で、インデントの処理に独自ルールが適用されるようで、変換結果のプログラミングコードをコピペする際にちょっと困るかもと思いましたが、その他は期待通りに動作しました）

自分的には、できるだけ制約の「ない」状態で、アプリケーションを公開したい･･･というのがほんとうの気持ちですので、ある制約の中に自分自身がが組み込まれてしまうことに、どうしても抵抗を感じてしまうのです。ただ、それは私個人の思いであって、GPLv2の目指すところはもちろん尊重しますし、その規約に賛同する方々の思いに水を差すようなこともしたくありません。

ですので、My プログラムのマークダウン表記の平文化処理のアルゴリズムは完全オリジナルで作成しました。これが（使って下さる方が万一いて下さったと仮定した場合）、私の想定外のシーンでは、期待に反する平文化処理を実行してしまう可能性を十分に秘めているアルゴリズムだと思う所以です。

ともあれ、このプログラムを書きたいと思った『きっかけ』は AI とのチャット記録の保存です。自分的な理想形でそれを実現したいと思ったとき、初めてマークダウン表記のプレーンテキスト化という目的が私の中に生まれました。

ほんとうに、「きっかけ」とは不思議なものです。ものごとの始まりには必ず何らかの「きっかけ」があって、すべての物語はその「きっかけ」から始まります。もし、AI との会話を「プレーンテキスト化して記録したい」と思わなければ、このプログラムは生まれませんでした。私はいつでも、その「きっかけ」を探し続けているのように思えてなりません。ドキドキ・わくわくするような、まだ世界のどこにもないプログラムが書きたくなる、私だけの『きっかけ』を･･･。*(^_^)*♪

話が横道にそれました。もとへ。

目的の実現にあたり、マークダウン表記に使用される記号を文章中から取り除くのはもちろんですが、そうした結果生まれた空白や改行の処理も問題となり･･･つまり、プログラム文ではない行については、行頭にスペースがあれば削除しますが、それがプログラム文である場合、コードブロック部分のインデントはそのまま残したい･･･と思ったり。

最初はあれやこれやと ~~無駄な抵抗~~ 無駄に工夫（＝無駄な苦労）して、各種プログラムの予約語があればそこはイジらない･･･みたいな楽しい ♪ ことをしてたんですが、やがてコードブロック表記を利用すれば、この問題は「さらっとクリア」できることに気づきます。

さんざん^３くらいまわり道してから気づくのが、私の王道パターンですので、今回はさんざん^２のまわり道くらいで気づいたので、まぁよしとして･･･

次に、問題になったのは、「数式」や「普通文」の中に削除対象として指定した文字がある場合です。例えば、次のように削除対象文字を指定した場合ですが･･･

*-`$#|

処理の対象とする行に「数式があるか／ないか or 数式を含むか／含まないか」をプログラム的に見分けなければいけません。で、その判定結果が True （＝数式がある）であればイジらない、False であればイジる（＝削除対象文字を探して削除する）ことにしました。

で、数式の存在を確認する方法を調べて見ると、マークダウン表記では、 $...$ （インラインで文中に数式を挿入）や $$...$$ （独立した行にブロック形式で数式を表示）するようなので、まずは文章中のドル記号（ $ ）で囲まれた部分を数式と見なし、そこに削除対象文字があっても無視するよう設定。

さらにドル記号（ $ ）の前後がバッククォート（`）で囲まれたインラインコード^※形式になっていたり、数式をドル記号（ $ ）で囲まず、単にバッククォート（`）のみで囲まれていることも実際にあるようなので、バッククォート（`）もフラグとして利用することにしました。

※インラインコード：プログラムのコードやコマンド、記号などを文章中でそのまま表示させたい場合に用いる。表示上は、等幅フォント（monospace）でレンダリングされ、強調や整形の影響を受けなくなる。

さらにさらに、ドル記号やバッククォートで『囲まれていない数式』があった場合（それが実際にあるのかどうかは未確認ですが）困ったことになりますので、次のように任意の行内に数式が含まれるか、どうかを判定する関数を作成･･･

  //行内に数式が含まれるか、どうかを判定
  //関数名は ContainsMathLikePattern とした方がイイかな･･･とも。
  function ContainsMathExpression(const S: string): Boolean;
  const
    //数式らしいパターンを探す
    Pattern = '(\d+\s*[\+\-\*/\^=]\s*\d+)|([a-zA-Z]+\s*\([\d\w\s\+\-\*/\^=]*\))|([\+\-\*/\^=]{1,})';
  begin
    Result := TRegEx.IsMatch(S, Pattern);
  end;

実際にテストしてみました！

削除対象として「*」を指定していますが、それが数式中にある場合は、とりあえず消えていないようです。

結果ですが（あくまでも私がテストした範囲に限っての話ですが）なんとか期待通りに動作しているようです。

でも、本当に数式中の演算子が消えずにちゃんと残るか？今でも心配です。万一、このプログラムをダウンロードしてお使いになる場合は、完全自己責任でお願いします。「数式中の演算子が絶対に消えません」という保証は一切できませんので、変換後の結果を必ず確認する必要があることにくれぐれもご留意いただけますよう、お願い申し上げます m(__)m

数式に限らず、このプログラムを用いて重要な文言を含むテキストを変換する場合は、変換後のテキストの内容をすみずみまで十分ご確認いただけますよう、伏してお願い申し上げます。

２．表示フォントの指定方法

好きなフォントを指定できます。個人的には「プログラムコードが読みやすい」Consolas がおすすめです！

「フォント」ボタンをクリックします。

フォント名、スタイル、サイズ等を指定できます。指定したら OK ボタンをクリックしてください。

上の条件で設定した、実際の画面です。

AI とのチャット内容をブログで公開することについて、AI に質問してみた結果を変換しました！

３．チェックしても何も起きない？ CheckBox

この記事の冒頭で「私的仕様」と書きましたが、例えば、次の CheckBox チェック時の扱いがその一例です。「日付を挿入」にチェックを入れても、表示されている平文のどこにも日付は入りませんし、同様に「空行を詰める」をチェックしても、やはり表示されている平文化テキストの改行箇所は一切変更されません。

この CheckBox の処理の対象は、クリップボードに送信したプレーンテキストです！

このような仕様にした理由は２つあります。

１つめは、処理前のテキストと処理後のテキストを見比べて比較する場合、「✅スクロールの同期」の CheckBox にチェックが入っていれば、Memo の上下・左右のスクロールが連動します。処理後のプレーンテキストの改行部分を削除すると、左右の Memo の内容の比較が（改行位置が異なりますので）大変面倒なことになります。

２つめは、プレーンテキスト化したテキストを他のエディター等に貼り付けた際に、（私的に不要と感じる）改行が自動的に削除されていて欲しいことと、これまた極めて私的な理由で、プレーンテキストの末尾に１行改行して（西暦年月日）を自動的に挿入（追加）したかったからです。

ちなみに私は愛用の階層化テキストエディター（←この言い方が好きなので、こう書きますが、世間一般には「アウトラインプロセッサー」と呼称するようです）にノード分類して、次のように、その時々で実際に役立った Delphi のコードを記録・保存し、必要に応じて参照しています。

～～～階層化テキストエディターのとあるノード～～～

実際に使用したコード（＝最終的に使ったコード）

以下、参考資料——————————————————

Web 上の情報源や、AI との会話内容等

（西暦年月日）

その実際の画面が、こちら

この階層化テキストエディターに、プレーンテキストをコピペした後の処理が必要最小限になるよう、「日付を挿入」＆「改行を詰める」処理をクリップボードへのデータ送信時に行いたかったわけです。

ちなみに「改行を詰める」を✅した場合ですが、１行改行はそのまま、２行連続して改行があった場合は１行のみの改行へ変換、３行以上連続して改行が続いた場合は２行連続した改行に変換する仕様としてあります（ユーザーによる設定の変更はできません）。

日付は最終行に次のように挿入されます。

私の、この玉石混合状態（玉が３割程度か？）のプログラミング Tips は、もう 20 年近く書き溜めていますので、気づけば膨大な量となりました。その時々で仕事上の課題を解決するためのプログラムを主に作成してきましたので、ある意味では、これまでの生き方の記録と言っても過言ではありません。最近は AI に訊けば些細なことから、超絶！難しいことまで、懇切丁寧な解答が得られるので参照する機会はずいぶんと減りましたが、日付を見ると（あぁ、あの頃はこんなことやってたんだ･･･）みたいな記憶がよみがえって、うれしいと言うか、なつかしいと言うか、よく生きてきたなー！みたいな感じがして･･･。年月日という、わずか１行にも満たない記録ですが、遠い未来で見返した際にそれがあることによって生まれる、何とも言えない懐かしい感覚が好きなのです。

2017年頃からは、いろいろ事情があって Python に触れる（＝ Python でプログラムを書く）機会がずいぶんと多くなりましたので、Python 用のプログラミング Tips もあることはあるのですが、こちらはなぜか、単なる記録集で、Delphi のそれとは異なり、過去の記録を参照して今日に役立てることはほとんどありません。

どちらかと言えば、Python でプログラムを書く場合は、その時々の課題解決専用のものを書いて、The END となることが「ほとんど」だからでしょうか･･･？

４．そのうちに消せない絵文字も出てくるカモ？です。

Unicode Consortium は毎年新しい絵文字を提案・承認しているそうで、2025年末には Emoji 17.0 に167種類が追加予定とのこと。さらに Apple の「Genmoji」など、生成AIによる絵文字生成も登場し、標準外の絵文字が個人レベルで作れる時代に突入しているようです。

プログラムでは、削除対象として検索する絵文字の範囲を次のように指定していますので、将来的には自動削除の対象にならない絵文字が出現する可能性があるように思います。気がつけばもちろんバージョンアップしますが、最悪の場合、削除対象文字列に『消えない絵文字をコピペ』すれば、確実に消せます。

    //削除対象として検索する絵文字の範囲
    if not (
      (code >= $1F600) and (code <= $1F64F) or // 顔文字
      (code >= $1F300) and (code <= $1F5FF) or // 天気・場所・物
      (code >= $1F680) and (code <= $1F6FF) or // 乗り物・地図
      (code >= $2600)  and (code <= $26FF)  or // 記号
      (code >= $2700)  and (code <= $27BF)  or // その他記号
      (code >= $FE00)  and (code <= $FE0F)  or // 表示スタイル
      (code >= $1F900) and (code <= $1F9FF) or // 拡張絵文字
      (code >= $1FA70) and (code <= $1FAFF)    // Emoji 13以降
    ) then

2025年10月末現在での確認事項となりますが、「絵文字を除去」のチェックボックスをチェックすることで（特に個別に指定しなくても）上記アルゴリズムが適用される範囲内の絵文字は一括除去が可能です。

５．プログラム終了時に Beep 音？

原因の解明ができていないのですが、このプログラムの終了時に「ポーン」という Beep 音^※が鳴ることがあります（私の PC では時々発生します）。

※ 正しくは「システム通知音」（System Notification Sound）と言うようです。

このプログラムでは、開始時に音量設定が０でなければ自動消音し、終了時に開始時の音量設定を復元しています。なぜ、そのようにしたかというと、周囲に人がいるような環境では Beep 音が鳴らない方がよいと思ったからです。「入力ミス」などがあった際にユーザーに対して注意喚起するような目的で使われるこの音ですが、一人で PC を使用していてもメッセージが表示された際などに鳴ると結構（私は）気になります。

ですので、プログラムを公開する前に、プログラム終了時になぜBeep 音が「鳴ることがある」のか、しっかり解明しようと思っていたのですが、それが出来ませんでした。

これには、実は深い事情がありまして、この問題（？）に気づきました当日の午前４時頃、プログラムを様々に操作してみて、いったい何をどうすると音が鳴るのか？それを確認しよう！と、思っていた矢先のことでありました。

クークー眠っていると思っていた、いっしょに暮らしている、すーぱーたのしい女性が、いきなり目覚めて騒ぎはじめ、『わたしの Word の仕事文書の罫線枠を直せ』と。仰りまして･･･

なんでも、「10分間も苦労したのに思い通りにならない」とのことで。

（それはアンタが、Word の正しい使い方を知らないだけ）で、と、心底、海より深く、思いつつも。

世界全人類の平和と、彼女の心の平安は『イコール』であると☆信じて疑わない☆私的には

元より断る理由など、露ほどもございませんので。

･･･と、言うか、断ったりしたら、それはもう、ほんとにたいへんなコトに･･･。

最愛の彼女に心からご満足いただけますよう、（表面的仕草としては）心を込めたふりを装いつつ、

『うん、この罫線指定ねー。奥にあるから。ほんと、わかりにくいよねー』

『うん。まるで、わかんない』

（ソレハ　アンタ　ガ　ムチャ　で　気が短い　カラ☆ でしょ？）･･･と、思いつつ

『でもね、今は AI に丁寧に訊けば、すごくやさしく教えてくれるよー！！』って。

そう、言いながら、彼女の PC の Word 文書の罫線をちゃちゃっと修正したのですが･･･

当の、彼女は･･･

『うん、もちろん、そう、思ったんだけど。』

『うちには、解説だけじゃなくってー。全部やってくれる AI がいる からー☆ 』って。

とー　とー　オレ、AI に　なっちまった（もしかして、格上げ？）。

たしか、つい、この前までは･･･

『クルマ、いつもキレイねーって、職場で言われるの。』

（それは、よかったねー！）

『ドロんこになったクルマ　キレイに洗ってくれる　洗ヒグマが　うちに･･･』と、確か。

オレ、クマだったはずなんだけど･･･ってか、オレ、AI じゃないんだけど、みたいな。

それで、心が、折れまして･･･

もぉ朝だし、まぁいいかー☆　みたいな。

しかし、いったい、どこをどう走ると『あんなに』クルマを汚せるのか？

それは未だに謎ですが･･･

彼女曰く『駐車場に吹く風が犯人』とのことで･･･

見ればクルマの後部ガラスは、細かな塵や埃で今日も真っ白に･･･

彼女のクルマが『洗ってー☆ 』と、
私に語り掛けてくる気が･･･してならない朝でございます。

このプログラム、もっと良くしたいのは山々ですが。

やっぱり、今、私にも出来る
いちばんよいことをしようと思いました！

彼女のクルマ、
洗ってきまーす☆

６．お願いとお断り

Delphi のコードだけは、インデント等がきちんと維持されるか／どうか等検証する変換テストを（私に出来る範囲で）実行しましたが、その他のプログラミング言語については未検証のまま、プログラムを公開しておりますことを申し添えます。

純粋に992ｍを僕は登る

９月末、連続５日間の休暇が取れる･･･そう知った僕は、きみに会いに行く決心をした。
そう、40 年前に、きみと見た　なつかしい風景に、会いたくて。

今、どうしても･･･会いたくて。

太平洋側の海岸沿いの街からクルマで５時間30分
きみは輝ける空の下、碧く、静かに佇んでた。

関越トンネルを抜けて見た越後湯沢の風景は、土砂降りの二乗くらいの雨の中に霞んでた。
フルワイパーにしても、前なんか、まるで見えない。

幸い、平日で交通量が少なかったので減速し、安心して走れる速度をキープする。
後続車がいたらビビリな僕は、無理しても速度を維持しただろうけれど。

バックミラーにも、ドアミラーにも、後続車は写らない。

（よかった･･･）

長岡へ近づくに連れ、雲は高くなり、所々に切れ間も見えた。
左手側の北陸道方面の空は、さらに明るい。

40 年前に後にして以来、３日間といたことのない場所。
そこを「ふるさと」と呼ぶ資格なんて、僕にはあるのだろうか･･･

母さん･･･

ずっと、心配ばかりかけた、けど･･･
ごめんね。

僕は、どうしても、あの頂に立ちたいんだ。
理由は言葉にしなくても、母さんは知ってるはずさ。

言い出したらきかない子だから･･･って、
いつも、そう言って、でもいちばんに、僕を信じてくれた、母さん。

もし、そこに「リアルな」プーさんがいても･･･
僕は、頑張って、逃げる、から。

必ず、元気で、帰るからね。
母さん･･･

スタートは海抜０ｍ

きみに再び登ると、そう、決心した時から僕は決めていたんだ。
スタートは、海抜０ｍ。

それだけは、絶対に譲れない。

日本海の「水」に触れて、そこから垂直方向へ 992 m、
水平方向での移動距離は概算 6.7km くらいか？

そこに、君の頂きがある。

2025年10月３日、午前６時。

「きをつけていきなせ」

母さんは、いつも通りの笑顔と、言葉で、僕を送り出してくれた。

僕的な予定では、きみの頂きにあるはずの避難小屋に泊まって、
ふるさとの街の夜景を、じっくり見たかったのだけれど、
母さんの顔を見たら、さすがにそれは言い出せなかった。

僕のいちばんの目的は、きみの頂きに立つこと。
ふるさとの街の夜景を見るのは、その先の未来でもかまわない。

だから、僕は母さんに約束した。
米山駅発16時48分の電車に乗って、必ず、帰るからね。と･･･

海岸通りの無料駐車場にクルマを停めた。

時刻は午前６時15分。柏崎駅までここから１kmちょっと。
歩いて駅へ。

真水は 1.5 L ザックに用意したけれど、それとは別にペットボトル飲料を何本か持ちたい。
駐車場から駅までにコンビニか、自販機があるだろう･･･そう思いつつ歩くが、それがない。

どうしようかと悩みつつ、駅に到着してしまった。

駅のコンビニで、おにぎり１個と、ペットボトル飲料を購入。
兼非常用食料として太平洋側から持参した「乾きもの」系のごく軽量な食べ物と合わせて２日分。
これで日帰り予定の食料に心配はない。

米山駅までの切符を購入。運賃は 240 円。
米山駅は無人駅と聞いたので現金を券売機に投入する。

Suica にチャージしたお金があっても、僕のふるさとでは、それはまだ忘れるべきことのようだ。

券売機を前にして、たまらなく、うれしい気持ちがしたのは、なぜだろう･･･

普段使いではない、登山用に愛用している時計を、見る。

40 年前、おそらく、これに近い時間。
僕は、この駅から、同じように、この電車に乗車した･･･はずだ。

なつかしい、ともだちといっしょに。

でも、なぜ、だろう。
どうしても、その時のことを、思い出せない。

なぜ、なんだろう･･･

あぁ電車が、動き、始めた･･･

鯨波、青海川、笠島･･･なつかしい駅名をアナウンスする声が聞こえる。
車掌さん、乗車中のみなさんにとっての日常は、今日の僕にとっては特別な時間だ。

ただ、特別な時間でありながら、米山駅の風景を、僕はどうしても思い出せなかった。

駅の風景すら、思い出せないままの僕を乗せて･･･
やがて電車は、記憶にない、でも、なつかしいはずの駅へ着いた。

きみの真横（西側）？へ来た。
かすかに、きみの横顔が見えた。

山を登りに来た。それは、間違いのない事実だが。

でも、僕は、海を目指す。
スタートは、海抜０ｍ。
そう、決めていたから。

振り返れば、波静かな･･･ふるさとの海が･･･

夏の海の思い出は、必ず夕陽で終わってる。
水平線の向こうに沈む太陽を、僕は何度、数えたかな･･･

感傷に浸りながら、左右を見回して、海への道を探す。
もとより僕は、米山駅付近の海岸へ通じる道を知らない。

（ほぼ海岸にある駅だ。海なんて、すぐ、行けるだろう･･･）

そう思っていた自分の考えの甘さにすぐ気づき、取りあえず、唖然とする。

（海岸線に沿って線路があるってコトは、踏切を渡らないと、海へは絶対に行けない！）

でも、米山駅の左右、どっちを見ても、見渡す限り、およそ踏切なんて、『ない！』

叢に一箇所、「強行突破用の小径？」に見える「何モノかの踏み分け跡」があったが。

もちろん、そんなところは、通れても、通れない。

現在時刻は７時30分。

登山口のある大平集落までは、米山駅から約 4.2 km。徒歩で約１時間。
午前９時に登山を開始するなら、あと 30 分以内に大平へ向かわねばならない。

復路を思うと、ここから海まで、行って 15 分がリミット。

海に向かって考える。右か、左か。

わからん。

でも、人家は海に向かって右側の方が、圧倒的に多そうだ。
ってコトは、僕の実家もそうだけど、人々の生活は海に密着してるはずだから、
海に向かって右側の集落のどこかに、海岸の砂浜へ通じる道が「必ず」ある、はず。

そう信じて、駅から海に向かって右手側の集落へと続く国道８号線沿いの道をひたすら歩く。
５分もしないうちに汗が流れ落ちる。

なんでだ？着てるのは F社製の速乾 Tシャツ１枚だけだぞ。

今日は10月３日、まだ午前７時30分、秋分はもう10日も前に過ぎただろ？
どうして、こんなに暑いんだ？

記憶は時を駆けて･･･遠い過去へ

でも、あの時も暑かったよな･･･

やっぱり、40年前の４月１日、僕はオンボロのチャリンコに乗って･･･
この道を･･･国道８号線を、京都へ、その先へ
延べ 1000 km の道を夢中で駆ける旅に出たんだ･･･

若かった夢のせいかもしれないけれど。
あの時も、僕は冷たい風の中、汗が流れるのを感じてた･･･

そう思った途端、時は過去から現在に舞い戻る。
そうだ。40 年経っても、僕は、何にも･･･変わってないじゃないか･･･

うん、やっぱり僕は、僕でしか、ないんだ。
歩き方は、変わらない。

違う。変えられないんだ。
歩き方も･･･何もかも、全部。
僕は･･･初めから、僕で、最後まで、僕でいるしか、ないから。

それを確かめたくて、今日、ここに来た。
ちがうかい？

そう思いつつ、きっと、あるはずの標識を探す。
それは･･･

『米山海水浴場 → 』

あった！この表示を待ってたんだ。
重いザックを背負って、気持ちだけは駆けるように急ぐ。

見えた。集落の外れで、道が「線路の上を越してる！」
集落の外れは「海食崖」で、トンネルがあり、その手前で、
道はトンネルの上を越して、小さな海水浴場へと続いていた･･･

法的な基準は違っていても構わない。
僕の海抜０ｍは、ここなんだ。

どうしても、ここから、始めたかったんだ。
きみへの旅の始点。

それが、ここさ。

僕は、きみの頂きへ、行く。
きみは、おそらく、誰をも待たず、また、誰をも追わないだろう。

でも、人は、誰かを待ち、誰かを追い、時にはそれに疲れ、俯いて、
そして、僕のように、きみの頂きを目指すこともあるだろう。

僕は、知っている。
きみは、黙して、何も言わない。

救いなど、ないのだ。

きみも、知っている。
救いなど、ないことを。

ならば、きみの頂で
せめて共有しようじゃないか。

きみが 1500 万年間見てきたであろう風景を･･･

大平への道

予想以上に時間をロスしたが、大平登山口午前９時の予定には何とか間に合いそうだ。
ただ、ここから大平までの道が皆目わからない。
道は覚えていないが、Google Map という、40 年前にはなかった Secret Weapon も、今はある。
それに頼らなくても、米山駅の近くには、大平登山口への道を案内する標識があった。

あそこまで戻れば、なんとかなる、はずだ。

かつて、ここを歩いたことは、もちろん記憶にない。が、40 年前、８号線も、北陸道も、すでに存在していたのは間違いない事実。ただ、なんとなくあの頃は、国道８号線を横断していたような･･･かすかな記憶があるような気がするが、それは思い違いか･･･？

案内標識の矢印方向を見ると･･･

（ガード下なんて、通ったか？）
記憶にない風景には、やはり違和感を感じてしまう･･･

迷っている場合ではない。
９時までには大平登山口へ行かねばならない。案内標識を信じてガード下をくぐる。

その先に見えた道は･･･

ここを、何度、歩いたんだろう。
少なくとも何往復かはしていると思うのだが、断片的な記憶しかない。
はっきり、覚えているのは、正直１度、それも往路だけだ。

あの時、歩きながらチーズの話をしてくれた人は、確か、高校の体育の先生だったはずだ。
お名前も、お顔も、もう、思い出せないが･･･確か、黒縁の眼鏡をかけていたような･･･

唯一、間違いないと思えるのは、年齢だ。
あの時、先生は、今の僕とそう変わらない年齢だったんじゃないか？

いや、もっと、若かったかもしれない。
僕の思い込みも、多分にありそうだからな･･･

今でも、お元気でいらっしゃるだろうか･･･

その想いをきっかけに、まるで、泉が湧き出だすように、僕の中に記憶がよみがえる･･･

そうだ、思い出した。高校２年の２月10日も、僕はここを歩いたはずだ。
あいつとふたりで頂きを目指した日、僕は間違いなくこの道を歩いている。

雪庇とクレバスと、吹雪の中、やっとたどり着いた雪に埋もれた山頂の避難小屋、
寒かった吹雪の夜、朝、強風の中でバリバリに凍った手袋等の断片的な記憶。
その中に下山後の復路の起点、大平付近？と思しき風景が残っている。
記憶は断片的でも、あの時、米山駅－大平間を歩いて往復したのは間違いない事実だ。

だから、記憶に残る回数で言えば、僕がこの道を歩くのは３回目ということか。

実際には、何度、歩いたのだろう･･･その数倍はあると思うのだが。
確かめる術もなく、今さら、確かめたところで何かがよみがえるわけでもないが･･･

40 年の歳月は、こんなにも過去を風化させてしまうものなのか。
あらためて、過ぎ去った日々の事どもを思う。

山頂方向には、うすい雲があるが、海側はよく晴れている。
予報では、今日は上空に薄雲の広がりやすい晴れだと言っていたが、雲はどちらへ動く？

振り返れば･･･、ずいぶんと遠く、下の方に海が見える。
もう 100ｍくらい登ったかな？

時計で高度を確認。
当てになるような、ならないような･･･

まだ、大平へ着かない。
少し、遅れている？

トレッキングポールにぶら下げた『クマよけの鈴』の音が盛大に響く。

だんだん、明るくなってきた。

時間的には、もう大平へ到着してもいい頃だ。
そう思いつつ、コーナーを曲がると･･･何軒か、家屋が見えた。

時刻は、午前 9 時 7 分 58 秒、予定より若干遅れている。

ここで、想像もしていなかったモノを発見！

自販機の脇には･･･

2025年 10 月現在、大平の米山登山口駐車場は改修工事中で使用できないという事前に得ていた情報の通り、上の画像のすぐ右側では重機を入れての工事が進められていました。ヒザまで泥に浸かって、作業している皆さんに頭を下げて先へ進みます･･･

この「舗装されてる道」、記憶にあるカモ！
そう感じつつ、先へ進むと、

こんな感じの斜面の小径を、ちょっと登ったら、また道幅の広い林道に出て

案内標識があった！

そうだ。なんとなく･･･ここは覚えてる！
左へ行けば林道。標識の右側（写真では正面）の小径が登山道だ。

昨日の激しかった雷雨の名残りか、道はかなりぬかるんでいるようだ。
今日行くのは、木の根っこと、泥んこの道？

森林限界より上の世界が好きな僕は、ちょっとため息。
でも、それは想定内。

林道の方が歩きやすい？のかもしれないが、ここはもちろん「登山道」方向へ。

なんせ 40 年振りの道。この先のことを考え、念のため地図も確認。

「偏差値 25 m」とあるから、誤差の範囲内なのだろう。
大丈夫。これならひとりでも道に迷うことはなさそうだ。

行くぞ！

輝かな風景

いつものトレッキングポールに助けてもらい、一歩一歩、確実に大地を踏みしめて登って行く。
おぼろげながらも記憶にある通り、やはり、この山の登りはきつい。

実際、平均しての傾斜角はどれくらいになるのだろう？

今日は、純粋に海水に触れてからスタートしているから、登りの標高差は米山の高さそのもの、最新のデータでは 992.5 m だ。で、水平方向の移動距離は、出発地点の米山海岸から米山山頂まで、3500 ～ 4000 ｍ程度のようだ（米山海岸は、おおよそ北緯 37.32 度、東経 138.52 度付近、米山山頂は、北緯 37.2895 度、東経 138.4839 度。地図上で両地点を結ぶ直線を測定すると、約 3.7 km前後の水平距離になる。実際には、斜面を登るために移動距離はより長くなり、登山ルート全体では約 5.5 〜 6.0 kmほどか？）。これを元に平均傾斜角を求めると、14 ～ 15.8 度くらいになる。これは登山道や坂道として快適な歩行の限界とされる 6 ～ 10 度をはるかに上回る値だ。

てか、計算するまでもなく、この登攀は、当たり前に、苦しい。それが、真実。
トレッキングポールなしでは、到底、僕には登れない。

はぁはぁはぁ

ふと気づけば、登山道一面に大量の栗が落ちている･･･

あわわ･･･

必死で歩く速度を上げようとするが、足が前に出ない。
恐怖心もあるが、登りが急傾斜すぎて、既に、体力の限界なのだ。
それでも、よろめくように、必死に前に出る。

今にも藪からクマが栗を、いや僕を、食べに現れそうな気がして、たまらない気持ちになる。
しかし、登りが･･･僕には急すぎる･･･これ以上は、マジ、ムリ。

はぁはぁはぁ　きつーい。

心臓が口から飛び出しそうだ。

やばい。こんなハイペースでは絶対に参ってしまう。

少し、休まなければ･･･

そう思って、振り返ったら･･･

心象風景と、現実風景のあまりの違いに、

心象風景のクマのことは忘れ、我に返って、しばし、現実の風景を見つめる。

さっきまで、あそこにいたんだよなー

なのに、もう、ここまでこれた。

あと残り、２／３くらいかな？

タオルはもう、吸水力の限界。でも、替えのタオルは持ってこなかった。大失敗。

ザックのハーネスに付けたペットボトル飲料の残りも、あとほんの少ししかない･･･

（大平の自販機で２本買ってきてほんとによかった！ただ、むちゃ、重たいケド）

そう思いつつ、ペットボトルに残った飲料を心置きなく飲み干して、替えのボトルをザックのポケットから出し、空になったボトルと交換する。これでペットボトル飲料は残りあと３本、水は昼食用に 500 mL、予備の水筒に１L残っている。ここまで発汗がすごいと、飲料水は、その重さより、やはり量が優先する。もちろん、山頂から 15 分ほど下ったところに水場があることは今でも記憶にある。が、たとえ、それを覚えていても、今、ここにある水が愛しい。ヒトには水に対する言葉にできない欲求があることを、僕は山に来るたびに感じてしまう。

（そうだ。熱中症対策もしておこう･･･）

持参した･･･と言うか、正確には、前回の山行の残りの塩あめをザックのポケットから取り出して、口に含み塩分もチャージする。ここで熱中症になったら助けてくれる人は誰もいない。クマの件も含めて、ここでのことはすべて「自己責任」。それがきみと僕との絶対に守らねばならない約束だ。

それにしても、発汗がひどい。夏の山行以来、運動していなかったこともあるが、この時期にしては気温が高すぎるんじゃないか？

このすぐ先、標高 650 m 付近に「二ノ字」という少し開けた場所があったはずだ。

そこで少し長めに休憩しよう。

そう思いつつ、登山道を見上げる･･･

そう、『見上げ』る。

なんだか、おかしな表現だが、この場合、そう表現するのが最適なのだ。

40 年前は、このような階段は、なかった気がする･･･
作って下さった方に、心から感謝。

階段を上る際、通常は右足と左足を交互に前に出す。でも、ここではそれが出来ない。階段一段分の幅が広いこともあるが、それより何より、かなりの急登による疲労の蓄積のためだ。ヒザはガクガク、大腿はヒクヒク、どちらにも「ちから」というものが感じられない。基礎体力の衰えををあらためて実感。

毎日、ウォーキングしていた頃のふくらはぎのハリが、今はない･･･

（仕事でも登らなければならないんだ。運動しなきゃ！）

ただ･･･その思いを、今、暮らしている街まで、持ち帰れるか・どうか、それが問題だ。

そんなとりとめもないことを思いつつ、整備された階段を上り続ける。

はぁはぁはぁ　太腿の筋肉が限界だ。

「二ノ字」は･･･まだか？

一歩、足を踏み出す度に、その思いだけを噛みしめる･･･

何度、何回、その思いを繰り返したことか。

フッと視界が開けたと思ったら、そこが「二ノ字」だった。

かつてここが「二つの集落＝字（あざ）」の境界だったので「「二ノ字」と呼ばれるようになったとのこと。

米山（米山駅から往復）
URL：https://www.yamareco.com/modules/yamareco/detail-719251.html より引用

ここの標高は、約 650 m 。
山頂が 992.5 m なので、およそ全体の 2/3 を登ったことになる。

ここからは、きみのてっぺんが見えた。
手をのばせば届きそうとは言わないが、もうすぐそこだ。

きみのてっぺんを見つめて呼吸すること、しばし。

さっきまで、肩で息をしていたことがウソのよう･･･

きみに、本気で会いたくなった時から

こんなきみの姿に、会えるとずっと信じてたんだ･･･

僕は、なぜ、きみに会いたくなったんだろう･･･

僕は、どうして、ここへ、来たんだろう･･･

きみのてっぺんに向かったまま、僕自身に、問いかける･･･

きみを見つめている僕は･･･

40 年前の僕と･･･どれほど変わったのだろう？

きみは、変わってなかったね。

うん。僕も変われなかったんだ。

それを、確かめに、ここへ来た。

変わらないきみに会えたら、決して変わらないものもあるんだと･･･

もしかしたら、そう思えるんじゃないかって、僕は思ったのかもしれない。

僕の周囲では、瞬く間に変わってしまうことの方が、あまりにも多すぎた･･･から。

では、変わらなかったものって、何？

それを、きみに、問いたくて。

そして、分かち合いたくて･･･

「二ノ字」の真ん中にある岩に預けていた僕のザックのハーネスを握る。汗を吸い込んだハーネスは風に吹かれて驚くほど冷たい。日帰りなので、それほど重たいわけではないが･･･この冷たさは格別だ。

うん。じゅうぶん、休息した。

歩く気力がよみがえってきた。

ザックの左ハーネスを左手で持ち上げ、僕の左肩に通して体を時計回りに回転させる。
続けて右手をザックの右ハーネスに通し、軽くジャンプしてザックのフィット感を確かめる。

見上げれば、きみと同じく、僕も･･･

今、輝かな空の下。

陽の当らないところを歩むことが多い僕には、もったいないくらいの明るさだ。

７１１米峰

あぁもしかして、あの場所は･･･

12 歳の時に見た、生涯、忘れないであろう風景が見えた場所？

はるかに妙高山（2,454m）火打山（2,462m）と焼山（2,400m）を望む

間違いない。きっと、ここだ。

12 歳だった僕は、あの日、ここから妙高山と火打山と焼山を見た。

そして、その向こう側には、さらに高く、真白な雪を被った北アルプスの山々が見えたんだ。

きみより高い山を見たことがなかった僕にとって、きみの向こう側に、きみより高い山があることは想像を絶する驚きだった。

純粋に、憧れた。

登ってみたいと、心から思った。

そうだ。あの日、息をのんで、見つめていた風景だ。

新潟県柏崎市周辺では、12歳（小学校高学年）になると、地域の大人とともに米山に登るという風習がかつてあった。
登山を通じて自然の厳しさや美しさを体験し、地域の信仰や歴史に触れる良い機会でもあったようだ。

やがて、高校生になった僕は、これが原体験となって、迷うことなく山岳部へ入部した。

その名前からわかる通り、ここの標高は 711 m

米山海岸で高度 0 ｍに設定した高度計の示度は、真の標高より 16 ｍほど低い。これは、上空にあった薄雲がとれてきた（＝気圧が上がり、天候が良くなった）ためか？

地形図は、ここから先はしばらくハイキングコースのような道が続くことを示している。

でも、確かこのあたりに、急勾配の斜面をトラバースする、ちょっと危険な場所があった･･･はずだ。

traverse（横断する、横切る）：登山で使われる場合は、「急斜面や崖のような場所で、上下ではなく横方向に移動すること」を意味する。

あの急斜面は、どこだろう？

ブナ林とガンバレ岩

７１１米峰を過ぎてからは、ハイキングコースとまでは行かないけれど、少し下るような場所もあって、中盤、中休み的な道を進む。しかし、稜線の上のような両側が切り立った崖になっている箇所もあり、体力的には楽でも、気は抜けない。万一、滑落したら、助けてくれる人はいないのだ。携帯電話の電波も先ほど調べたら、僕のは圏外だった。

（集中！集中！！）

しばし、慎重に進むと見えてきたのは･･･

あぁブナ林だ･･･

高度 700 ｍから 800 ｍ付近にかけて、見事なブナ林が広がっているのも昔のままだ。

あのころは、ブナの根を掴んでよじのぼっていたような記憶もあるのだが･･･

傾斜もまたきつくなってきた。肩で息をしながら、ブナ林を上へ、上へ、進む。

そして、またひとつ、なつかしいものに出会えた･･･

あぁガンバレ岩だ！

昔は、こんなに、くっきり・はっきり描かれていなかった･･･？ような覚えがあるし、手前にはハシゴはまだなくて、木の根っこを掴んで、服をドロで汚しながら這い上がった？ような気がするのだが、気のせいだろうか･･･

ちょっと待って･･･　

急斜面のトラバースはどこへ行った？

たしか、ガンバレ岩の手前だった気がするが･･･

もしかして、危ないから、ルートが変更されたんだろうか･･･

もし、そうだとしてもまったく気づかなかった！

･･･ってか、さっき稜線みたいだなって思いながら通過したところがあったけど、両側が切り立った崖のように感じたぞ。むかしはあんな場所はなかった気がする･･･。もしかして、あれが新しいルートだったのかな？

尸羅場？　高校生だった当時の記憶にはない場所だ。

なんと読むのだろう？　そして、なにをした場所なんだろう？

木の枝に付けられた表示によれば、尸羅場とは「ここより先は女人禁制（女性の登山禁止）とされていたかつての結界」なのだそうだ。奥にはお地蔵さんもいらっしゃっる･･･かつて、ここまで、大切に、大切に担ぎ上げた方がいたのだ。この事実ひとつを見ても、昔の人々の山への思い（信仰）が伝わってくる。一礼して通過する。

水場

40年前、登山で水を運ぶ（入れる）モノと言えば、間違いなくそれは「ポリタンク」だった気がする。正確には、本体がポリエチレン（PE）製でキャップがポリプロピレン（PP）製の水容器だが･･･特に多く使われたのは耐衝撃性・耐薬品性に優れる高密度ポリエチレン（HDPE）で、今思えば、なんとも言えない、鼻につく匂いがした。

元より、高校時代の僕は、そんな匂いなど気にするわけもなく、注ぎ口付きのポリタンクこそ、山岳部の必需品と信じて疑うことすらなかった。もちろん、匂いはそのまま山旅の記憶になった。

PET 素材やポリカーボネート製の水容器が主流となった現代では、「水容器素材の匂い」など考えられないことなのかもしれないが、当時は匂いはしても「水容器」＝「ポリタンク」であったのだ。

そのポリタンクを抱えて、山頂と往復したのが、この「水場」だった･･･。

高校時代の僕は「装備」担当で、山での調理・給食を担当する「食糧：エッセン（なんでドイツ語を使っていたのか、当時も、もちろん今も、よくわからない）」係ではなかったが、それでもみんなのポリタンクを集めて、この水場へ、水汲みに来たことがあったように思う。

それが、山頂まで時間にして 15 分ほどの･･･ここだった。

水場まで、下りてみたい気持ちがしなかったと言えば、それはウソになる･･･、が。

クマも喉が渇いたら、水を飲むだろうし、もちろん、山の中では水探しも一苦労だろうし、ならば、いつも水にありつけるヒトの水場を覚えて利用することもあるかもだし（実際あるそうです）、そうなると水場は、クマさんと鉢合わせする可能性「大」なりで･･･、とにかく、クマだけには会いたくない･･･

それに今、飲み切れないほど、水、持ってるし･･･

しばし、休憩を兼ねて水場へ続く道を眺め、水場行きは断念。ここは、登頂を優先することに。

時刻は 11 時 48 分、目標に設定した 12 時が迫ってきた。

７１１米峰を越えてからは、久しぶりの運動に多少は身体が慣れたのか、登り始めほどの苦しさは感じなくなった。それでも、汗水たらす状況に変わりはないが、足はしっかり前に出る。

山頂まであと「５分」の案内石もあった。最初に見た時は、脳が文字の縦横変換に失敗し、「意味不明」であったが、横を通過する際に、意味をようやく理解。

正直、ここから先は、もう、無我夢中･･･

忘れたいことを、全部、忘れて。

なぜ、僕は、ここへ、来たのか？

なぜ、僕は、ここへ来たいと思ったのか？

なぜ、僕は、ここへ、来なければならなかったのか？

いちばん　考えたくない

生きている理由のようなもの　すら

忘れて。

はぁ　はぁ　はぁ

いちばん　そらに　ちかい　ばしょ　へ

ぼくは　ゆくんだ。

あぁ　４０年を経て拝む　薬師如来さま。

薬師如来さまの背後には･･･

変わらない　ふるさと　の　まち　が　見えた。

僕は、あまりにも有名な、ある会話を、思い出した。

登山家ジョージ・マロリーは、1923年3月18日付のニューヨーク・タイムズのインタビューで、記者から発せられたこの問いに対し、次のように答えたという。

うん。Malloryさん、

僕も　こころから　そう思えた。

マウスカーソルの形状も含めてデスクトップ画面をキャプチャしたくなりました！みたいな時は、もしかしたら『コレ』が使えるカモ？しれません･･･②

“Say Hello to Capity Plus.” A Lightweight screen capture utility

上の図のように、マウスカーソルの形状も含めてキャプチャできます！
範囲の選択には、矩形に加え、正方形／楕円／正円も使えるようになりました！

画像編集に際し、自分が欲しいと思う必要最低限の機能のみを実装したプログラムを前回アップロードし、その紹介記事で次のように書きましたが･･･

『このアプリは本格的な画像編集に使用するための素材、もしくは、操作方法の解説を作成するために必要な情報画像（部分的な切り抜き画像）を簡単に作成したいという目的を実現するために開発しました。ですので「現在、表示されている画面の全部、もしくは一部を、必要であればマウスカーソルの形状を含めた画像データとして取得する」ことしかできません。保存した画像データを再度読み込んで表示したり、キャプチャした画像を加工する（例えば、ぼかす・モザイクをかけるといったような）機能はありません。ただし、画像の指定範囲を「ぼかす・モザイクをかける」機能は、後日、追加できたら、追加したいと考えています。』

今回、「ぼかす・モザイクをかける」といった機能に加え、既存の画像ファイルを読み込んで表示したり、アルファチャンネルを用いた透明化処理を PNG 形式の画像処理に追加するといった、自分では使わないかな？と思う機能も搭載した新しいバージョンができましたので紹介させていただきます。

【もくじ】

０．基本的な使い方と名称について（前回の記事 Plus α）
（１）起動方法
（２）キャプチャ方法
（３）操作パネルの位置の変更
（４）ラバーバンド形状
（５）処理一覧
　・名称について
１．追加機能①「開く」
２．追加機能②「円形選択と保存・送信を可能に」
３．追加機能③「ぼかし処理」
４．追加機能④「モザイク処理」
５．追加機能⑤「白色化処理」
６．プログラムのダウンロード
７．まとめ
８．お願いとお断り

０．基本的な使い方と名称について

（１）起動方法

このアイコンをダブルクリックして起動します。

現在表示されているデスクトップ画面（の一部）をキャプチャするのが、このプログラムの主たる目的なので、メイン画面は起動時には表示されません。

起動時の画面
トースト通知（Toast Notification）の表示は Windows の設定により、出ない場合もあります。

元々、このプログラムを作ろうと思ったいちばんの理由は、『マウスカーソルの形状を含めて画面をキャプチャする必要が生じ、探した範囲では手軽に使えるアプリが見つからなかったので、それなら自分で書こうと思った』ことです。なので、この機能をいちばん最初に実装しました。

チェックボックスをチェックすればカーソルも含めて画面をキャプチャできます。

（２）キャプチャ方法

ショートカットキー「Shift＋Ctrl＋C」で現在表示されている画面全体をキャプチャできます（画面を指定してキャプチャすることはできません）。キャプチャした画像は「静かに」プログラムのメイン画面へと送られ（表示され）ます。その際、メッセージ等は何も表示されません。

キャプチャ後、タスクバーにあるオレンジ色のアイコンをクリックすると、メイン画面が表示されます。

もちろん、自分自身のキャプチャも可能です。
画面右側にキャプチャした画像のサムネイルが表示されます。（画面はリリース時のもの）

（３）操作パネルの位置の変更

上の図に示したように、操作パネルは「メイン画面の上部／下部」いずれかへの配置を選択できるようにしました。

画面上部に操作パネルを表示する場合です。
（設定は即適用＆自動的に保存され、次回起動時に適用されます）

（４）ラバーバンド形状

ラバーバンドの形は、円形も選択できるようにしました。Shiftキーを押しながらドラッグすることで、矩形を選択している場合は「四角形 → 正方形」、円形を選択している場合は「楕円 → 正円」へとラバーバンドの形状が変化します。なお、いったん、四角形（長方形）や楕円のラバーバンドを描画し、その後、ラバーバンドのグラブハンドルをクリックしてリサイズする場合も、Shiftキーを押しながら操作すると、ラバーバンドの形状は「四角形 → 正方形」or 「楕円 → 正円」へ変化します。

ラバーバンドの線については、太さと色を指定できます。プログラムは、終了時の設定を自動的に記録し、次回起動時は前回終了時の設定を読み込んで（＝復元して）起動します。

色は、TColorBox のデフォルトの設定色３種類から選べます。

上記３種類にチェックがある場合、
2つ上の図の TColorBox には184色が選択可能な Item として設定されました。

（５）処理一覧

あとは、「画像をそのまま保存」したり、「矩形／正方形／楕円／正円のいずれかのラバーバンドでさらにキャプチャしたい範囲を選択して、選択範囲内で右クリックすると表示されるメニューから選択できる処理を選んで実行する」ことが可能です。

このような解説画面を『とにかく簡単に』作りたくて作ったのが Capity です！

処理可能な画像数は、正直、自分でもよくわかりません。お使いの PC 環境（搭載しているメモリの大きさ等）により変化するものと思われます。保存するファイルの名称は、もちろん任意の名称を付けることも可能ですが、デフォルト設定では「 Screenshot_20251005_032342.png 」のように Screenshot_ に続けて西暦年月日時分秒が自動的に付くので、これまでファイルとして保存する際に面倒に感じていた「名前を付ける」作業から完全に解放されました。作った自分で言うのもナンですが、すごく便利です！！

・名称について

Capity という名称は、こちらも前回の記事で、『 AI に相談して決めた！』と書きましたが、その際 AI が示してくれたのが次の内容です。

・発音が柔らかく親しみやすい。技術系にも一般向けにも通用する響き。
・Capture + Simplicity / Utility / Clarity などの抽象的な価値を含められる造語。
・「City（都市）」や「Clarity（明快さ）」にも近い響きがあり、好ましい印象を与える。
・「キャプチャの能力（Capacity）」を連想させることもでき、機能性の高さを暗示。
・ロゴ・UI・ドメイン名・SNS ハンドルなどにも使いやすく、拡張性が高い。

それがほんとうか、どうかは使ってくださった方のお気持ち次第ではありますが･･･自分的には、この AI が示してくれた内容を具現化したプログラムになるよう、精一杯努力したつもり･･･です。

もちろん「特許情報プラットフォーム J-Plat Pat」で、特許・実用新案、意匠、商標の各権利について過去に、この名称での申請・登録のないことは確認済みです。（2025年10月5日現在）

１．追加機能①「開く」

最初は既存の画像を開く処理は不要と考え、実装していませんでしたが、簡単に実装できますし、「ない」よりは「ある」方がいいかと思い直して実装しました。ただ、あくまでもこのプログラムは、「現在表示されている画面を簡単にキャプチャする」ことが主な目的なので、ボタンの位置は深く考えずにほとんどおまけ程度に実装しましたので、ボタン自体の使い勝手はよくないと思います･･･。

ボタンクリックで TOpenDialog が表示されます。

ファイルを開く場合の Path の設定は、TOpenDialog の機能まかせ（＝Windows まかせ）です。前回使用したフォルダが記憶されていれば、そのフォルダが自動的に選択されます。

表示したい画像を選択して、「開く」をクリックしてください。

表示された画像に対して、必要な処理を適用してください。

２．追加機能②「円形選択と保存・送信を可能に」

範囲を選択するのに使うラバーバンドは、矩形に加え、円形の形状をしたものも使えるようにしました。さらに Shift キーを押しながらドラッグすることにより、正方形や正円も描画できます。

（１）円形選択時の保存処理

画像の保存について解説します。ラバーバンドの形状が矩形・円形のいずれであっても、画像の保存形式は BMP ・ PNG ・ JPEG から選んで１種類を指定できます。

デフォルト設定は PNG 形式ですが、ここでは JPEG 形式を選択しています。

キャプチャした画像の一部をラバーバンドで範囲選択し、選択した範囲内の任意の位置を右クリックすると次のようなサブメニューが表示されます。ここでは、まず、保存の処理から順に説明します。

ラバーバンド内を右クリックした際に表示されるメニューのコマンドは、
すべてラバーバンド内の画像のみに適用されます。

ラバーバンドが円形の場合、画像の保存時には注意が必要です。ラバーバンドの枠の内部の画像のみ保存対象とするのは、画像の形式によらず共通ですが、BMPとJPEG形式で保存する場合、枠外部分の透明化処理は行われず、枠外の部分は「白に塗りつぶされ」て保存されます。

保存された画像（例：BMP形式の場合）です。

保存された画像（例：JPEG形式の場合）です。

PNG 形式で保存する場合、次のメッセージが表示されます。用途に応じてラバーバンドの枠外の部分を「透明化する」もしくは「白く塗りつぶす」いずれかの処理を選択できます。

PNG 形式かつ「透明化あり」で保存した画像をフォトで見た場合です。

同じ形式で「透明化なし・枠外を白く塗りつぶして保存」した場合の画像をフォトで見ると･･･

PNG 形式かつ「透明化あり」で保存した画像をパワーポイントに挿入してみました！

同じ画像をWordに挿入してみました。

このように、PNG 形式かつ「透明化あり」で保存した画像は、「挿入」することで透明化処理が適用された状態で再利用できます。

（２）円形選択時のクリップボードへの送信

次に、クリップボードへの送信について説明します。

ラバーバンド内を右クリックして表示されるメニューから
「クリップボードへ送る」をクリックしてください。

ラバーバンドの枠が円形指定で、さらに範囲選択した部分を PNG 形式でクリップボードへ送信する場合、次のメッセージが表示されます。

「はい」を選んだ場合、例えば古いお絵描きソフトで背景色「黒」の画像を新規に作成しておいて、そこに円形（楕円）選択した範囲をクリップボードへ送信して（クリップボード経由で）貼り付けてみました。なお、このような場合には「背景色を透過色として貼り付ける（と同等の機能を利用して実行する）」必要があります。

思い出せないくらい、ながーい間愛用しているお絵描きソフトに
「背景色を透過色として」貼り付けてみました。

こちらが貼り付けた結果です。

背景が白の画像を円形で範囲選択して、背景が白の画像にクリップボード経由で貼り付けると困ったことになりますので、注意してください。

BMP や JPEG 形式を選択してクリップボードへ送信した場合は、次のメッセージが表示されます。

BMP 形式を選択し、表示されたメッセージの「はい」を選択して、クリップボードへ送信したデータを Word に貼り付けてみました。

この円形のラバーバンドに関する処理は、矩形時のそれにくらべると、要した時間は３倍以上かかっていると思います。とにかくない袖にタオルと雑巾を付け足して作った袖を振り回し、なんでもいいや、とにかくすーぱー頑張って作成しましたが、自分自身がこの円形のラバーバンドを使用する機会は今回限りであるような気が･･･。どこかで、どなたさまかのお役に立ってほしいと切に祈ります。

３．追加機能③「ぼかし処理」

ほんとうのことを言うと、円形のラバーバンドよりこちらを先に作成したのですが、どうしても実装したかった機能のひとつがこの「ぼかし処理」です。より低速になるのはわかりきっていましたが、搭載するならボックスブラーではなく、ガウシアンブラーと決めていました。

理由はただひとつ。少しくらい遅くても、「美しさ」を優先したかったのです。

ぼかす元画像です。

Box ぼかしを適用した画像です。

レベルは 10 まで指定できます。

ガウスぼかしを適用した画像です。

文字にもガウスぼかしをかけてみました。レベルは５です。

ガウスぼかしとボックスぼかしのコードのセットです。ガウスぼかしのコードの下に、ボックスぼかしのコードがあります。Boxぼかしに変更するときは、ガウスぼかしの変数はそのまま、var 宣言部の count 変数だけコメントアウトを解除してください。コード部分は、ガウスぼかしのコードをすべてコメント化して、Box ぼかしのコメントアウトを解除してください。

procedure TForm1.HandleGaussianBlur(Sender: TObject; const SelRectOnParent: TRect);
var
  //ガウスぼかし
  bmpSrc, bmpTemp: TBitmap;
  x, y, dx, dy, i, j: Integer;
  //固定小数点演算のため Int64 を使用 (合計値が非常に大きくなるため)
  r, g, b: Int64;
  radius: Integer;
  //カーネルを固定小数点値 (Int32) の配列として定義し直す
  kernel: array of Int32;
  pSrc, pTemp: PByteArray;
  blurLevel: Integer;
  selRectLocal: TRect;

  cx, cy, rx, ry: Double;
  IsEllipse: Boolean;

  //Box ぼかし
  //count: integer;  //Box ぼかしをかける場合はここのコメントアウトを解除する

  //ガウスカーネル生成関数（固定小数点対応版）
  function CreateGaussianKernel(radius: Integer; var kernel: array of Int32): Double;
  var
    k: array of Double; //一時的に浮動小数点カーネルを作成
    sigma, sum: Double;
    i: Integer;
  begin
      //浮動小数点カーネルの計算
      SetLength(k, radius * 2 + 1);
    sigma := radius / 2.0;
    sum := 0.0;
    for i := -radius to radius do
    begin
      k[i + radius] := Exp(-Sqr(i) / (2 * Sqr(sigma)));
      sum := sum + k[i + radius];
    end;

    //正規化と固定小数点へのスケーリング
    for i := 0 to High(k) do
      //正規化して SCALE_VALUE を乗算し、整数に丸める
      kernel[i] := Round((k[i] / sum) * SCALE_VALUE);
    Result := sigma;
  end;

  function IsInsideEllipse(x, y: Integer): Boolean;
  var
    dx, dy: Double;
  begin
    dx := (x - cx) / rx;
    dy := (y - cy) / ry;
    Result := (dx * dx + dy * dy) <= 1.0;
  end;

begin

  //ガウスぼかし
  if not Assigned(imgPreview.Picture.Graphic) then Exit;

  PushUndo;

  selRectLocal.TopLeft :=
    imgPreview.ScreenToClient(plImage1.Parent.ClientToScreen(SelRectOnParent.TopLeft));
  selRectLocal.BottomRight :=
    imgPreview.ScreenToClient(plImage1.Parent.ClientToScreen(SelRectOnParent.BottomRight));

  Screen.Cursor := crHourGlass;

  bmpSrc := TBitmap.Create;
  try
    bmpSrc.PixelFormat := pf24bit;
    bmpSrc.SetSize(imgPreview.Picture.Width, imgPreview.Picture.Height);
    bmpSrc.Canvas.Draw(0, 0, imgPreview.Picture.Graphic);

    bmpTemp := TBitmap.Create;
    try
      bmpTemp.PixelFormat := pf24bit;
      bmpTemp.SetSize(bmpSrc.Width, bmpSrc.Height);

      blurLevel := TrackBar1.Position;
      radius := EnsureRange(blurLevel, 1, 10);
      SetLength(kernel, radius * 2 + 1);
      CreateGaussianKernel(radius, kernel);

      IsEllipse := (RadioGroup1.ItemIndex = 1);
      if IsEllipse then
      begin
        cx := (selRectLocal.Left + selRectLocal.Right) / 2;
        cy := (selRectLocal.Top + selRectLocal.Bottom) / 2;
        rx := (selRectLocal.Right - selRectLocal.Left) / 2;
        ry := (selRectLocal.Bottom - selRectLocal.Top) / 2;
      end;

      // 横方向ブラー
      for y := selRectLocal.Top to selRectLocal.Bottom - 1 do
      begin
        pSrc := bmpSrc.ScanLine[y];
        pTemp := bmpTemp.ScanLine[y];
        for x := selRectLocal.Left to selRectLocal.Right - 1 do
        begin
          if IsEllipse and not IsInsideEllipse(x, y) then
          begin
            pTemp[x * 3 + 2] := pSrc[x * 3 + 2];
            pTemp[x * 3 + 1] := pSrc[x * 3 + 1];
            pTemp[x * 3 + 0] := pSrc[x * 3 + 0];
            Continue;
          end;

          r := 0; g := 0; b := 0;
          for dx := -radius to radius do
          begin
            i := EnsureRange(x + dx, 0, bmpSrc.Width - 1);
            r := r + Int64(pSrc[i * 3 + 2]) * kernel[dx + radius];
            g := g + Int64(pSrc[i * 3 + 1]) * kernel[dx + radius];
            b := b + Int64(pSrc[i * 3 + 0]) * kernel[dx + radius];
          end;
          pTemp[x * 3 + 2] := Byte(r shr SCALE_SHIFT);
          pTemp[x * 3 + 1] := Byte(g shr SCALE_SHIFT);
          pTemp[x * 3 + 0] := Byte(b shr SCALE_SHIFT);
        end;
      end;

      // 縦方向ブラー
      for x := selRectLocal.Left to selRectLocal.Right - 1 do
      begin
        for y := selRectLocal.Top to selRectLocal.Bottom - 1 do
        begin
          if IsEllipse and not IsInsideEllipse(x, y) then
            Continue;

          r := 0; g := 0; b := 0;
          for dy := -radius to radius do
          begin
            j := EnsureRange(y + dy, 0, bmpSrc.Height - 1);
            pTemp := bmpTemp.ScanLine[j];
            r := r + Int64(pTemp[x * 3 + 2]) * kernel[dy + radius];
            g := g + Int64(pTemp[x * 3 + 1]) * kernel[dy + radius];
            b := b + Int64(pTemp[x * 3 + 0]) * kernel[dy + radius];
          end;
          pSrc := bmpSrc.ScanLine[y];
          pSrc[x * 3 + 2] := Byte(r shr SCALE_SHIFT);
          pSrc[x * 3 + 1] := Byte(g shr SCALE_SHIFT);
          pSrc[x * 3 + 0] := Byte(b shr SCALE_SHIFT);
        end;
      end;

      imgPreview.Canvas.CopyRect(selRectLocal, bmpSrc.Canvas, selRectLocal);

    finally
      bmpTemp.Free;
    end;
  finally
    bmpSrc.Free;
    Screen.Cursor := crDefault;
  end;


  //BoxBlurを試す場合は、上のガウスぼかしのコードをすべてコメントアウトする
  //BoxBlur
  {
  if not Assigned(imgPreview.Picture.Graphic) then Exit;

  PushUndo;

  selRectLocal.TopLeft :=
    imgPreview.ScreenToClient(plImage1.Parent.ClientToScreen(SelRectOnParent.TopLeft));
  selRectLocal.BottomRight :=
    imgPreview.ScreenToClient(plImage1.Parent.ClientToScreen(SelRectOnParent.BottomRight));

  Screen.Cursor := crHourGlass;

  bmpSrc := TBitmap.Create;
  try
    bmpSrc.PixelFormat := pf24bit;
    bmpSrc.SetSize(imgPreview.Picture.Width, imgPreview.Picture.Height);
    bmpSrc.Canvas.Draw(0, 0, imgPreview.Picture.Graphic);

    bmpTemp := TBitmap.Create;
    try
      bmpTemp.PixelFormat := pf24bit;
      bmpTemp.SetSize(bmpSrc.Width, bmpSrc.Height);

      blurLevel := TrackBar1.Position;
      radius := EnsureRange(blurLevel, 1, 10);

      IsEllipse := (RadioGroup1.ItemIndex = 1);
      if IsEllipse then
      begin
        cx := (selRectLocal.Left + selRectLocal.Right) / 2;
        cy := (selRectLocal.Top + selRectLocal.Bottom) / 2;
        rx := (selRectLocal.Right - selRectLocal.Left) / 2;
        ry := (selRectLocal.Bottom - selRectLocal.Top) / 2;
      end;

      // 横方向ボックスぼかし
      for y := selRectLocal.Top to selRectLocal.Bottom - 1 do
      begin
        pSrc := bmpSrc.ScanLine[y];
        pTemp := bmpTemp.ScanLine[y];
        for x := selRectLocal.Left to selRectLocal.Right - 1 do
        begin
          if IsEllipse and not IsInsideEllipse(x, y) then
          begin
            pTemp[x * 3 + 2] := pSrc[x * 3 + 2];
            pTemp[x * 3 + 1] := pSrc[x * 3 + 1];
            pTemp[x * 3 + 0] := pSrc[x * 3 + 0];
            Continue;
          end;

          r := 0; g := 0; b := 0;
          count := 0;
          for dx := -radius to radius do
          begin
            i := EnsureRange(x + dx, 0, bmpSrc.Width - 1);
            r := r + pSrc[i * 3 + 2];
            g := g + pSrc[i * 3 + 1];
            b := b + pSrc[i * 3 + 0];
            Inc(count);
          end;
          pTemp[x * 3 + 2] := Byte(r div count);
          pTemp[x * 3 + 1] := Byte(g div count);
          pTemp[x * 3 + 0] := Byte(b div count);
        end;
      end;

      // 縦方向ボックスぼかし
      for x := selRectLocal.Left to selRectLocal.Right - 1 do
      begin
        for y := selRectLocal.Top to selRectLocal.Bottom - 1 do
        begin
          if IsEllipse and not IsInsideEllipse(x, y) then
            Continue;

          r := 0; g := 0; b := 0;
          count := 0;
          for dy := -radius to radius do
          begin
            j := EnsureRange(y + dy, 0, bmpSrc.Height - 1);
            pTemp := bmpTemp.ScanLine[j];
            r := r + pTemp[x * 3 + 2];
            g := g + pTemp[x * 3 + 1];
            b := b + pTemp[x * 3 + 0];
            Inc(count);
          end;
          pSrc := bmpSrc.ScanLine[y];
          pSrc[x * 3 + 2] := Byte(r div count);
          pSrc[x * 3 + 1] := Byte(g div count);
          pSrc[x * 3 + 0] := Byte(b div count);
        end;
      end;

      imgPreview.Canvas.CopyRect(selRectLocal, bmpSrc.Canvas, selRectLocal);

    finally
      bmpTemp.Free;
    end;
  finally
    bmpSrc.Free;
    Screen.Cursor := crDefault;
  end;
  }
end;

４．追加機能④「モザイク処理」

もうひとつ、出来たら実装したかったのが指定範囲に「モザイクをかける」処理です。文字情報を隠す用途であれば、強くぼかし処理する（or 重ね掛けする）だけで十分な気もしましたが、私には「ぼかす」＋「モザイクをかける」の二手間を１セットにして文字情報を隠したい場合に画像を処理するクセがあり（このブログの過去記事を見ていただければ理解していただけると思います）、今回も２つで１セットのような気がして･･･。

モザイク処理する元画像です。

とりあえず、レベル５を設定して･･･

レベルは10まであります。

モザイク処理してみた結果です。ボックスぼかしみたいですね。なのでボックスぼかしは実装しませんでした。

文字をモザイク処理してみました。レベルは５です。

モザイクをかける処理のコードです。ご参考まで。

procedure TForm1.HandlePixelation(Sender: TObject; const SelRectOnParent: TRect);
var
  selRectLocal: TRect;
  bmpSrc: TBitmap;
  startX, startY: Integer;
  dx, dy: Integer;
  blockSize: Integer;
  r, g, b, count: Integer;
  pLineRead, pLineWrite: PByteArray;
  BlockWidth, BlockHeight: Integer;
  cx, cy, rx, ry: Double;
  IsEllipse: Boolean;

  function IsInsideEllipse(x, y: Integer): Boolean;
  var
    dx, dy: Double;
  begin
    dx := (x - cx) / rx;
    dy := (y - cy) / ry;
    Result := (dx * dx + dy * dy) <= 1.0;
  end;

begin

  if not Assigned(imgPreview.Picture.Graphic) then Exit;

  PushUndo;

  selRectLocal.TopLeft :=
    imgPreview.ScreenToClient(plImage1.Parent.ClientToScreen(SelRectOnParent.TopLeft));
  selRectLocal.BottomRight :=
    imgPreview.ScreenToClient(plImage1.Parent.ClientToScreen(SelRectOnParent.BottomRight));

  bmpSrc := TBitmap.Create;
  Screen.Cursor := crHourGlass;

  try
    bmpSrc.PixelFormat := pf24bit;
    bmpSrc.SetSize(imgPreview.Picture.Width, imgPreview.Picture.Height);
    bmpSrc.Canvas.Draw(0, 0, imgPreview.Picture.Graphic);

    blockSize := EnsureRange(TrackBar2.Position, 2, 50);

    IsEllipse := (RadioGroup1.ItemIndex = 1);
    if IsEllipse then
    begin
      cx := (selRectLocal.Left + selRectLocal.Right) / 2;
      cy := (selRectLocal.Top + selRectLocal.Bottom) / 2;
      rx := (selRectLocal.Right - selRectLocal.Left) / 2;
      ry := (selRectLocal.Bottom - selRectLocal.Top) / 2;
    end;

    startY := selRectLocal.Top;
    while startY < selRectLocal.Bottom do
    begin
      startX := selRectLocal.Left;
      while startX < selRectLocal.Right do
      begin
        r := 0; g := 0; b := 0; count := 0;

        BlockWidth := blockSize;
        if startX + BlockWidth > selRectLocal.Right then
          BlockWidth := selRectLocal.Right - startX;

        BlockHeight := blockSize;
        if startY + BlockHeight > selRectLocal.Bottom then
          BlockHeight := selRectLocal.Bottom - startY;

        //平均色の計算（楕円内のみ）
        for dy := 0 to BlockHeight - 1 do
        begin
          pLineRead := PByteArray(bmpSrc.ScanLine[startY + dy]);
          for dx := 0 to BlockWidth - 1 do
          begin
            if IsEllipse and not IsInsideEllipse(startX + dx, startY + dy) then
              Continue;

            r := r + pLineRead[(startX + dx) * 3 + 2];
            g := g + pLineRead[(startX + dx) * 3 + 1];
            b := b + pLineRead[(startX + dx) * 3 + 0];
            Inc(count);
          end;
        end;

        if count > 0 then
        begin
          r := r div count;
          g := g div count;
          b := b div count;
        end;

        //平均色の適用（楕円内のみ）
        for dy := 0 to BlockHeight - 1 do
        begin
          pLineWrite := PByteArray(bmpSrc.ScanLine[startY + dy]);
          for dx := 0 to BlockWidth - 1 do
          begin
            if IsEllipse and not IsInsideEllipse(startX + dx, startY + dy) then
              Continue;

            pLineWrite[(startX + dx) * 3 + 2] := r;
            pLineWrite[(startX + dx) * 3 + 1] := g;
            pLineWrite[(startX + dx) * 3 + 0] := b;
          end;
        end;

        Inc(startX, blockSize);
      end;
      Inc(startY, blockSize);
    end;

    imgPreview.Canvas.CopyRect(selRectLocal, bmpSrc.Canvas, selRectLocal);

  finally
    bmpSrc.Free;
    Screen.Cursor := crDefault;
  end;

end;

ガウスぼかし + モザイク処理の結果です。レベルはどちらも５です。

５．追加機能⑤「白色化処理」

つい、（不要なのに）マウスの形状を含めてキャプチャしちゃった！みたいな場合、役に立つかも･･･と考え、実装しました。私の場合、背景色は「白」であることが多いので、単に指定範囲を「白で塗りつぶす」処理です。

マウスカーソル部分を範囲選択して右クリック、メニューの「白色化」をクリックします。

不要なカーソルは消えました☆

【追記_20251006】

ぼかし加工やモザイク処理を行った画像データが保存できない不具合を修正しました。この修正に合わせて、ぼかし加工やモザイク処理、及び白色化等、画像データを加工した場合は、任意の段階で「保存」ではなく、メモリ上の表示用データに「反映」する機能を追加しました。具体的には、次の通りです。

次の図のように画像の一部を加工します。例：白色化

この状態で、画面右のサムネイルをクリックすると、画像に設定した変更内容はすべて破棄され、加工前の画像が表示（復元）されます。加工状態がサムネイルに反映されていない状態でのサムネイル・クリックは、「一気に元に戻す処理になる」とお考えください。

メモリ上の画像データの更新は「反映（英語表記は Apply）」ボタンをクリックすることで実行できます。

ちいさなボタンですが･･･

このボタンをクリックすることで、メモリ上の画像データが、メイン画面に表示されている加工した状態の画像データに更新されます。

このようにメモリ上のデータの更新処理をユーザー側に委ねることで、Undo / Redo の履歴操作とサムネイル更新が完全に分離され、処理の整合性が保たれるようにしました。

初期バージョンで作者の保存機能に関する確認作業が至らなかったため、ご迷惑をおかけした皆さまに、こころからお詫び申し上げます。誠に申し訳ありませんでした。

現在、未発見の不具合が見つかりました場合は、こちらで報告し、速やかに修正版を掲載いたしますので、万一、お使いいただける場合は、修正版のアップロードの有無にご注意いただけましたら幸いです。

【追記_20251007】

自分で使っていて（そのために作ったプログラムですが）、画面のキャプチャだけでなく、クリップボードに画像データがある場合、それをショートカットキー（ Ctrl + V ）で貼り付けて、さらに加工等できたらいいなぁ･･･と思いましたので、本日即、実装しました。

ショートカットキーを利用して、このプログラムのメイン画面に貼り付け可能な画像形式は、BMP、PNG、JPEG、GIF、TIFF に加え、画像の読み込みに必要な外部ライブラリが導入されていれば、HEIC や WebP にも対応可能と思われます。※ すべての画像形式について、その読み込みの可否に関する動作検証は行っておりません。もし、クリップボードにあるデータが、このプログラムで読み込めない画像データであった場合には、その旨を伝えるメッセージが表示されます。

また、乱暴な言い方で申し訳ないのですが、プログラムのバージョン管理は、まったく考えておりませんでしたので、この下のダウンロードリンクからダウンロードできるものが最新版です。

このプログラムは EXE ファイル１つで単体動作します（プログラム終了時の VCL コントロールの諸設定は C:\Users\ユーザー名\AppData\Roaming\Capity\settings.ini に保存されますが、この ini ファイルはなくてもプログラムは動作します）。また、レジストリは一切汚しておりませんので、 EXE ファイルを上書きすれば、プログラムの更新作業は完了します。

【追記_20251009】

自分で使っていて欲しいと思った機能をさらに追加しました。それは、矢印キーによるラバーバンドの移動と、形状の微調整です。以下、具体的な操作方法です。

移動方法：ラバーバンドが選択（Visible）されている状態で、Shiftキー + Ctrlキー + 各矢印キー押し下げで、現在の幅と高さを保ったまま、押し下げた矢印キーの方向に１ピクセルずつ移動できます。

形状の微調整：Shiftキー + 右向き矢印キーで幅を１ピクセルずつ増加、Shiftキー + 左向き矢印キーで幅を１ピクセルずつ減少、Shiftキー + 上向き矢印キーで高さを１ピクセルずつ減少、Shiftキー + 下向き矢印キーで高さを１ピクセルずつ増加させることができます。

【追記_2025_1012-1025】

さらに複数の機能を追加しました。追加した機能は、次の通りです。

（１）起動時に自動消音

操作時の Beep 音が気になるので、起動時に自動消音するようにしました。

（２）グレイスケール／セピア色の画像に変換

表示されている画像を、Grayscale もしくは Sepia いずれかの画像へ変換できるようにしました。

・グレースケールに変換

・セピアに変換

Sepia を指定した場合は、その強度を 0.1 ～ 1.0 の範囲で設定できます。

強度「1.0」で変換した例です。

（３）背景色の切り替え

表示する画像に応じて、背景色を「白／黒」のいずれかに指定できるようにしました。背景が「白」の画像を表示する際は、背景色に「黒」を指定すると画像境界が明確になります。

背景色が「白」だと、画像の境界がわからない場合があります。

背景色を「黒」に切り替えました。画像の境界が明瞭になり、範囲選択しやすくなります。

なお、背景色の設定は、他の設定同様、終了時の設定が自動的に保存され、次回起動時は前回終了時の設定が復元された状態で起動します。

（４）回転

操作パネルの「回転」部分に任意の値を指定して「▶」ボタンをクリックしてください。正の値で時計回り（右回り）、負の値で反時計回り（左回り）に表示されている画像が回転します。

回転元画像です。

回転角度は、時計回りに３°を指定

「▶」ボタンクリックで回転が行われます。

メモリ上のデータに反映するか・どうかの確認が行われます。「はい」で反映され、「いいえ」で「取り消し処理（UnDo）」が実行されます。

（５）拡大と縮小

拡大と縮小処理を行います。100.00 %が等倍で、それより小さい値を指定すれば縮小、大きな値を指定すれば拡大されます。

縮小率 50 %を指定

うっすらと、図の周囲に灰色の線が描画されますが、ご容赦ください。

回転と同様に、メモリ上のデータに反映するか・どうかの確認が行われます。「はい」で反映され、「いいえ」で「取り消し処理（UnDo）」が実行されます。

（７）枠線

枠線部分はそのままですが、色は色名の表示をカットし、選択できる色数も減らしました。

（８）グラブハンドルの非表示

ラバーバンドのみ描画する状態も選択できるようにしました。工夫次第で次のような色枠で囲んだ画像を作成することもできます。

（９）表示している画像全体を選択可能にしました。クリアボタンクリックで選択を解除できます。

その他 20251025 のアップデートでは、ラバーバンド内を右クリックすると表示されるサブメニューの項目の Enabled を設定可能とし、起動直後は「取り消し」処理が選べないようにしました。

【追記_2025_1109】

次の不具合を修正しました。

（１）グラブハンドルの表示のON・OFFがチェックボックスの状態と矛盾しないように修正

ラバーバンドが表示されていない状態で、グラブハンドルの表示のチェックボックスのチェックをOFFにした場合、グラブハンドルの表示のON・OFFがチェックボックスの状態の反転してしまう不具合を修正しました。具体的には、ラバーバンドが表示されたら、チェックボックスの操作を可とすることでチェックボックスのチェック状態とグラブハンドルの表示状態の整合性が保たれるようにしました。

（２）サブメニュー表示時にスクロールバーが消える不具合を修正

ラバーバンドを表示した状態で、ラバーバンド内を右クリックしてサブメニューを表示するとスクロールバーが消える不具合を修正しました。

（３）サムネイル表示位置の不具合を修正

画面右に表示されるサムネイルの表示に「隙間が空く・重ねて表示される」等の不具合が発生することがありました。サムネイルが常に正しく表示されるよう、必要な修正を加えました。

ご迷惑をおかけしましたことを、心からお詫び申し上げます。もしかしたら、まだ未発見の不具合が他にもあるかもしれません。発見次第速やかに修正し、こちらで報告させていただきます。

６．プログラムのダウンロード

今回の記事で紹介した PC の画面キャプチャを実行するプログラム Capity Plus 一式を以下からダウンロードできます。なお、ダウンロードとご使用にあたっては、免責事項及び使用条件への同意が必要です。免責事項及び使用条件の詳細は付属の License.txt をご覧ください。

Say Hello to Capity Plus - A Lightweight screen capture utility

1 ファイル 1.14 MB

ダウンロード

なお、プログラムの初回起動時には、Windows Defender SmartScreen による警告画面が表示されます。この警告画面に関する詳細は、当 Blog の次の過去記事をご参照ください。

マウスだけで操作可能な画面の拡大表示ツール “KindLens” のご紹介

７．まとめ

初期バージョンに追加した機能のまとめです。

（１）既存の画像も開けるようになりました。
（２）ラバーバンドの形状に円形（ Drag : 楕円／Shft & Drag : 正円）を追加しました。
（３）操作パネルの位置を上 or 下に設定できるようにしました。
（４）クリップボードへの送信機能を円形対応にバージョンアップしました。
（５）指定範囲に「ガウスぼかし」をかけることができるようになりました。
（６）指定範囲を「モザイク処理」できるようになりました。
（７）指定範囲を「白色化」できるようになりました。
（８）終了時設定を C:\Users\ユーザー名\AppData\Roaming\Capity\settings.ini に自動保存。
（９）ショートカットキー（ Ctrl + V ）でクリップボードにある画像データを貼り付け。
（10）画像の加工内容をメモリ上の画像データに反映する機能を追加。
（11）起動時にボリュームが０より大きい場合は、自動消音（終了時に自動復元）。
（12）グレイスケール／セピア色の画像への変換機能を追加。
（13）背景色の切り替えが可能になりました（白と黒のいずれかを指定）。
（14）画像の回転（時計回り・反時計回り）
（15）画像の拡大と縮小

機能の追加（20251019）

（16）グラブハンドルの表示／非表示の切り替えが可能になりました。

機能の追加（20251025）

（17）表示している画像全体を選択・選択解除

全体として、「操作パネル」では「現在、表示されている画像全体の加工・設定」を行い、画像上をマウスでドラッグすることで描画される「ラバーバンドの内側」を右クリックすると表示されるサブメニューのコマンド群は、「ラバーバンドで指定した範囲内のみを加工・設定」するものとお考えいただけましたら幸いです。

（18）不具合を修正（20251109）

グラブハンドルの表示／非表示の切り替えがチェックボックスのチェック状態と反転する問題、右クリックメニュー表示時にスクロールバーが非表示になる問題、サムネイル表示位置の問題それぞれについてプログラムに必要な修正を加えました。

機能の追加（20251116）

（19）ショートカットキー（ Ctrl + C ）でラバーバンドで囲った範囲をクリップボードへ送信。

なんでこの機能を最初から準備しなかったのか、自分でもよくわからないのですが、遅ればせながら次のコードを FormKeyDown 手続きに追加しました。

  //Ctrl+Cで選択範囲をクリップボードへ送る
  if plImage1.Visible then
  begin
    //Ctrl + C（Shiftを含まない）のみ許可
    if (Key = Ord('C')) and (ssCtrl in Shift) and not (ssShift in Shift) then
    begin
      //plResizeImage の「クリップボードへ送る」を実行
      if Assigned(plImage1.MenuClipboardRef) then
      begin
        plImage1.MenuClipboardRef.Click;
      end;
      //ショートカットキーを他に伝播させない
      Key := 0;
    end;
  end;

これで Ctrl + C で、ラバーバンドで囲んだ範囲を、クリップボードへ画像データとして送信できるようになりました。

機能の追加（20251117）

(20) ラバーバンドで囲った範囲を「上下反転」、「左右反転」できるようにしました。

例えば、次のような画像データに対して･･･

軸の目盛りの数値部分はそのまま、グラフの部分だけをラバーバンドで選択し、その選択した範囲内の任意の位置を右クリックして表示されるサブメニューから「上下反転」を選べば･･･

グラフの部分だけ、上下反転できます。

同様に、元のデータに対して左右反転を選べば･･･

それをさらに上下反転させることももちろん可能です。

具体的な利用例としては、例えばテストの選択問題の選択肢とする数種類のグラフを、元データとする数値の入力なしで上記のように簡単に作成できます。

また、表示されている画像データ全体を「上下反転」もしくは「左右反転」したい場合は、メニューにある「全選択」ボタンをクリック（画像全体を範囲指定）してから、画像上の任意の位置を右クリックしてサブメニューを出し、「上下反転」もしくは「左右反転」を実行してください。

なお、この「上下反転」及び「左右反転」の処理は、GDI+を使用して書きましたので、画像が大きくても高速に動作すると思います（私の環境で実行した限りですが、期待通りに動きました）。

機能の追加（20251123）

グレイスケールとセピアへの変換に加え、ネガティブイメージも作成できるようにしました。仕事をする上でその必要性が生じましたので、早速、新機能として追加しました。アルゴリズムには ScanLine を使用しましたので、それなりに高速動作すると思います。また、32bit画像（pf32bit）対応済みです。

【重要】
元に戻す（ Ctrl + Z ）際には、表示されている画像の状態をメモリ上のデータに「反映」させるか・どうかを問うメッセージは表示されません。これは「どこまで元に戻すのか？」の判定を自動で実行（判断）することが不可能なためです。ですので、どのタイミングで処理を「確定」させるかは、ユーザーサイドにお任せする仕様としてあります。もちろん、処理を「反映」させても元に戻す処理はある程度効きますが、画像への加工内容をメモリ上のデータに「反映」させるタイミングはあくまでもユーザーサイドでの判断に委ねる仕様ですので、この点につきましては十分ご留意ください。

また、画像を多量に扱うプログラムの場合は、メモリリークが心配ですので、プロジェクト・ソースの CapityPlus.dpr ファイルに以下のように” ReportMemoryLeaksOnShutdown := True ”を設定して、プログラムの終了後、もし、メモリリークがあればその状況を表示するようにして（あくまでも、私がテストした範囲内に限ってのことではありますが）プログラムが正常終了した際にメモリリークが発生しないことを確認済みです。

program CapityPlus;
uses
  Vcl.Forms,
  Unit1 in 'Unit1.pas' {Form1};

{$R *.res}

begin
  ReportMemoryLeaksOnShutdown := True;
  Application.Initialize;
  Application.MainFormOnTaskbar := True;
  Application.CreateForm(TForm1, Form1);
  Application.Run;
end.

８．お願いとお断り

作者が気がついた限りの範囲ではありますが、動作検証を行い、発生したエラー等の不具合は誠心誠意取り除いたつもりですが、まだまだ未発見のバグは必ずあると思います。もともと、このブログの記事を書くために開発したプログラムなので、今後も使用する中で発見できた不具合は、可能な限り速やかに修正して、こちらの記事で追加報告させていただきます。上記ダウンロードリンクからダウンロードできる版が最新版です。実行ファイル（ exe ）は単体で動作しますので、バージョンアップは旧版を削除して新版にするか、単に新版を旧版に上書きするだけで完了します。

マウスカーソルの形状も含めてデスクトップ画面をキャプチャしたくなりました！みたいな時は、もしかしたら『コレ』が使えるカモ？しれません･･･

【追記_20251005】

ここで紹介している画面キャプチャプログラムに新しい機能を追加した Capity Plus を公開しました。新しいプログラムは以下のリンク先からダウンロードできます。

マウスカーソルの形状も含めてデスクトップ画面をキャプチャしたくなりました！みたいな時は、もしかしたら『コレ』が使えるカモ？しれません･･･②

（以下、2025年9月27日に掲載した記事です）

ほとんど、自分専用のプログラムですが、夢見た通りのモノができました！ *(^_^)*♪

起動時に出てくるのはこれだけです！
（ OS 側の設定によっては、表示されないこともあるようです）

過去記事で、怖れ多くも『マウスカーソルの形状も含めて画面のハードコピーを取るプログラムを自分で書いてしまいました。後日、機会がありましたら、この Blog でご紹介したいと思います。』と、ご案内しましたアプリケーションもどきです。

私が試した限りですが、期待通りに動作している気がします･･･。

【推奨動作環境】

業務用PCの 1366 × 768 、拡大率 100 ％のモニターで制作・動作確認を行っています。高 DPI 環境下で拡大率 150 %や 200 %の設定では意図した通りに画面をキャプチャできません（Windows がアプリに対してスケーリングされた論理座標を提供するため、キャプチャ結果がズレたり、キャプチャサイズが異なったりします）。ですので、このアプリについては、画面の拡大率 100 %での使用を強く推奨させていただきます。

【もくじ】

１．手作りの『それ』が必要になった理由
２．使い方
３．☆ここではまりました☆
４．ダウンロードはこちらから
５．お願いとお断り

１．手作りの『それ』が必要になった理由

前回、『解答欄（矩形）検出器を改良しました！』の記事を書いた際、どうしても必要になったのがマウスカーソルの形状を含めて画面をキャプチャできるプログラムです。

AI に「マウスカーソルの形状を含めて画面をキャプチャするいちばんかんたんな方法は？」と尋ねてみると Windows 標準搭載の「拡大鏡」を使えばいいよ ♪･･･とのご回答を頂戴したのですが、試して３秒後には、

（思ったのと、ちがう）

そう感じて画面を閉じてしまいました。

他に、いつも愛用している「 Lightscreen 」という画面キャプチャユーティリティも AI から紹介されましたが、こちらはもう、ほんとうに素晴らしいソフトウェアで、この Blog に掲載した画像もほぼ全部、LightScreen でキャプチャしたものと言っていいくらいです。

ただ、残念ながら、今回の目的である『簡単に』マウスカーソルの形状を含めてキャプチャするという目的の実現に関しては、『タイマーの設定が必要』等の部分で、この目的の実現に関する部分に限っての話ですが、LightScreen は（ベスト・オブ・ベストの選択肢とは言えないかな･･･）って、思ってしまいました。

いつも、お世話になってるのに、こんなコメントしかできなくて、ほんとうにごめんなさい。

それからこれは、僕の PC で起きてしまったことなので、書かせていただきますが、僕のような素人には何が原因なのか･･･さっぱりわからないのですが、何らかの設定変更のあと？でしょうか･･･タイトルバーが以前よりすごく大きく（逆に文字はほとんど読み取れないくらい小さく）表示されるようになることが（時として）あり、さらにこうなった時は、タイトルバー部分をクリックしてアクティブにして、画面上の位置を変えようとドラッグしても微動だにしないという不思議な現象に遭遇･･･たしか、以前はそんなことは、なかった･･･ような気がするのですが･･･

その際は、次のように操作してコトなきを得ましたが･･･。

（ただ、この方法でも「動かない」こともありました･･･）

左上のアイコンを右クリックすると表示される
サブメニューの移動をクリックしてタイトルバー部分を
ドラッグすると移動できたり・できなかったり･･･

あと、表示されるタイトルバーも文字も、なぜかすごく大きい。
（逆にアプリの文字は、ものすごく小さい）

この状態で、マウスカーソルの形状を含めて画面キャプチャする機能を試そうと思ったのですが、今度は、設定？画面の文字が小さすぎて読めません･･･。

いったい何が原因でこうなったのか、それがわかりません。
私の使い方が間違っていると思うのですが、その間違いがわかりません。

exe を右クリックして、プロパティを表示し、「高 DPI 設定の変更」も試しましたが、効果がありません。これにはどう対応していいのか、まったく手も足も出ず、ほんとうに困ってしまいました。

【これは Windows 側の問題ではないかと？】

Lightscreen の名誉のために追記します。この Lightscreen の見た目の問題ですが OS を再起動したら元の姿に戻りました。再起動前に自分がナニをやったのか、よくよく考えてみると、解像度の変更を数回繰り返したように思います。もしかしたら、そのへんに何か、原因があったのかもしれません。

拝啓　Lightscreen 様

ご心配をおかけしましたこと、心より深くお詫び申し上げます。
どうか、これまで通り、仲よくしてください！！

いずれにしても、ここまで来てしまった以上、他人様に頼って問題を解決しようという、

甘え切った姿勢に
問題の真の原因がある

のは、火を見るよりも明らかです。それならば、取るべき道はただ一つ。

そう、自前で･･･
なんとかするしか、
ありません。

･･･

そうです。自前でなんとかするしか、ないのですが･･･

なんか、最近、そんなコトばっかり で･･･

それって、やっぱり･･･

前から、ちょっとは、思ってたケド。

僕は能力が低くて、適応力がなくて、ノロくて、グズだから、

もっとアリテーに言えば、ク〇ク〇パーだから

みんなが使ってる、一般的なアプリにすら馴染めないんだ。T_T

僕はやっぱりダメなんだ･･･。

ダメ人間なんだ！！

ひー（心の声）

でも、いいんだ。

僕には Delphi がいてくれる。

そう･･･いつも Delphi がいてくれる。

Delphi があれば、なんにも心配なんかない。

汎用のアプリなんか使えなくても、自力で自分専用のを作るカラ☆

Delphi だけがトモダチさぁ♪

（この変わり身の早さだけが身上です）

こうして深い悲しみを、無上のよろこびに変えるべく、「その気になればマウスカーソルの形状も含めて画面キャプチャが可能なプログラム作り」がはじまりました。

あぁアプリの名前、なんにしよー☆ みたいな･･･

みんなは、思ったように使えるアプリがないとき、いったいどーしてるのかなー？みたいな･･･

２．使い方

マウスのカーソルを含めてPCの画面をキャプチャする核心部分のコードは次の通りです。参考資料として、「ホットスポット」に対する考慮がないため、IDE のエディタ上などでカーソルが I ビームとなった状態でPC画面をキャプチャすると、マウスカーソルの位置がズレるコード（ Version_01 ）もコメント化した状態で載せています。試用される場合、コメント化してある下記 Version_01 のコードは、期待通りに動作しないコードであることに、どうかご注意ください。

また、キャプチャした画像のスクロールに関しても（画像関連のプログラムを書くときは、いつもこれが問題になるのですが）、なめらかにスクロールできるように処理を追加しています。Windows11の設定がデフォルト設定のままであれば、マウスのホイールを回転させれば上下方向にスクロール、Shift キーを押しながら、マウスのホイールを回転させれば、左右方向にスクロールします。

procedure TForm1.CaptureDesktop(ABitmap: TBitmap; IncludeCursor: Boolean);
var
  DC: HDC;
  R: TRect;
  CursorInfo: TCursorInfo;
  Pt: TPoint;
  //マウスのカーソル位置を正しくキャプチャするために追加
  IconInfo: TIconInfo;
begin

  //Version_01（マウスカーソルの位置がずれる）
  {
  if not Assigned(ABitmap) then Exit;
  R := Rect(0, 0,
    GetSystemMetrics(SM_CXSCREEN),
    GetSystemMetrics(SM_CYSCREEN));
  DC := GetDC(0);
  try
    ABitmap.PixelFormat := pf24bit;
    ABitmap.Width := R.Right;
    ABitmap.Height := R.Bottom;
    BitBlt(ABitmap.Canvas.Handle, 0, 0, R.Right, R.Bottom,
           DC, 0, 0, SRCCOPY);
    if IncludeCursor then
    begin
      CursorInfo.cbSize := SizeOf(CursorInfo);
      if GetCursorInfo(CursorInfo) and (CursorInfo.Flags = CURSOR_SHOWING) then
      begin
        GetCursorPos(Pt);
        DrawIcon(ABitmap.Canvas.Handle, Pt.X, Pt.Y, CursorInfo.hCursor);
      end;
    end;
  finally
    ReleaseDC(0, DC);
  end;
  }

  //上のコードを実行するとキャプチャした画像の「マウスカーソルの位置がずれる」
  //これは（ Delphiの？ ）スクリーンキャプチャでよく起きる現象のようだ

  //【問題の原因】

  //GetCursorPos(Pt);
  //DrawIcon(ABitmap.Canvas.Handle, Pt.X, Pt.Y, CursorInfo.hCursor);

  //「カーソルのホットスポット（実際のクリック位置）」を考慮せずに
  //アイコンの左上を (Pt.X, Pt.Y) に描画している。

  //マウスカーソルは単なるアイコンではなく、
  //「ホットスポット」という基準点（通常は左上から数ピクセルずれた位置）が存在する。

  //Delphi のコードではその補正をしていないため、
  //キャプチャしたカーソルが右下に数ピクセルずれてしまう。

  //特に Delphi IDE のエディタ上では I ビームカーソルなど、
  //ホットスポットが左上から大きくずれているものを使うので、ズレが目立つ。

  //一方 GUI デザイン画面では標準の矢印カーソル（ホットスポットが左上 0,0 のもの）
  //が使われるのでズレが目立たない。

  //【修正方法】

  //GetIconInfo を使い、カーソルのホットスポットを考慮して描画位置を補正する。
  }

  //スクロールに関する問題の解決方法
  //1. AutoScroll := True （デフォルト）でスクロールバーは自動表示される
  //2. 手続き内で ScrollBox1.HorzScrollBar.Visible := False を設定
  //3. 以降、スクロールバーが表示されなくなる（領域を超えても）
  //いったん Visible を False にすると
  //Delphi が「このスクロールバーは使わない」と判断してしまい、
  //AutoScroll の制御対象から外れてしまう。

  ScrlPreview.AutoScroll:= True;
  ScrlPreview.HorzScrollBar.Visible := True;
  ScrlPreview.VertScrollBar.Visible := True;
  //ScrlPreview.Realign; // ← 状況によってはこれも必要？

  //Version_02（マウスカーソルの位置も正しく取得できる）
  if not Assigned(ABitmap) then Exit;

  R := Rect(0, 0,
    GetSystemMetrics(SM_CXSCREEN),
    GetSystemMetrics(SM_CYSCREEN));

  DC := GetDC(0);
  try
    ABitmap.PixelFormat := pf24bit;
    ABitmap.Width := R.Right;
    ABitmap.Height := R.Bottom;
    BitBlt(ABitmap.Canvas.Handle, 0, 0, R.Right, R.Bottom,
           DC, 0, 0, SRCCOPY);

    if IncludeCursor then
    begin
      CursorInfo.cbSize := SizeOf(CursorInfo);
      if GetCursorInfo(CursorInfo) and (CursorInfo.Flags = CURSOR_SHOWING) then
      begin
        GetCursorPos(Pt);
        if GetIconInfo(CursorInfo.hCursor, IconInfo) then
        try
          //ホットスポットを考慮してカーソルを描画
          DrawIcon(ABitmap.Canvas.Handle,
            Pt.X - Integer(IconInfo.xHotspot),
            Pt.Y - Integer(IconInfo.yHotspot),
            CursorInfo.hCursor);
        finally
          if IconInfo.hbmMask <> 0 then DeleteObject(IconInfo.hbmMask);
          if IconInfo.hbmColor <> 0 then DeleteObject(IconInfo.hbmColor);
        end;
      end;
    end;
  finally
    ReleaseDC(0, DC);
  end;
end;

プログラムの名称は、AI に相談したら即 ” Capity ” がいいよ☆との提案がありまして、それに決めました。なお、この ” Capity ” という名称は、特許情報プラットフォーム「 J-PlatPat 」のキーワード検索で「特許・実用新案、意匠、商標」の四法について過去の登録・申請の有無を調査し、2025年9月27日現在、この名称に該当する登録・申請が０件であることを確認済みです。

Capity – Lightweight Screen Capture Tool

【使い方】

上記コードを核心部分に据えて、（作者が）最低限必要と思われるアレやコレを GUI として付け足して、完成した気がする Capity.exe をダブルクリックして起動すると･･･

画面右下に操作方法の案内（トースト通知：Toast Notification？）だけを表示して、プログラム本体は非表示状態（タスクバーには表示されます）で起動します。

プログラム本体を表示するには、タスクバーの Capity （読めないかもしれません！）アイコンをクリックしてください。

タスクバーの Capity アイコンをクリックすると本体が表示されます。

プログラム本体を表示（起動時の画面をこのアプリでキャプチャしました）
なお、メイン画面の画像は、右下隅へスクロールした状態を取得（キャプチャ）しています。

マウスのカーソルの形状を含めて PC の画面をキャプチャする設定であった場合には、起動時に画面右下の通知領域に次の案内が表示されます。ただし、高DPI環境では、ヒントの位置がずれて表示されないことがあるようです。ところで、この表示の名称は「トースト通知」でいいのでしょうか？

上記案内にある通り、Shift + Ctrl + C （これは Shift キーと Ctrl キーと C キーを同時に押すことを意味します → 実際の操作では、左手でキーボード左下にある Shift キーと Ctrl キーを同時に押しつつ、右手で C キーを押します）のキー操作で現在表示されている PC 画面が、マウスのカーソルの形状も含めてキャプチャされます。

マウスのカーソルの形状を含めずに PC の画面をキャプチャする設定であった場合には、起動時に次の確認画面が表示されます。

「はい」・「いいえ」どちらを選択しても、画面右下の通知領域に上記案内を出して、プログラム本体は非表示（タスクバーには表示）で起動します。

「はい」を選んだ場合は、IncludeCursor という名前のチェックボックスにチェックが入ります。このチェックボックスの状態（チェックの有無）やその他の VCL コントロールの選択（設定）状態は、プログラム終了時に自動的に保存され、次回はこの自動保存された設定に基づいて起動します。

・設定の保存先フォルダ：C:\Users\ユーザー名\AppData\Roaming\Capity
・設定の保存ファイル：settings.dat

「EN」のチェックを外すと各 VCL コントロールのキャプションは日本語表記になります。

日本語表記の状態です。

あとは、キャプチャしたい画面を最前面に表示して、Shift + Ctrl + C のショートカットキーで PC 画面をキャプチャしてください。上の画像にある「キャプチャ」ボタンをクリックした場合は、このアプリの作業画面がキャプチャされます。

「キャプチャ」ボタンをクリックするか、アプリを最小化して Shift + Ctrl + C する度に、新しいキャプチャデータが作られます。新しくつくられたキャプチャデータ（画像）は、アプリの右側にサムネイル表示されます。このサムネイル表示を左クリックすると、そのキャプチャデータがアクティブになり、メイン画面に表示されます。右クリックすると削除の可否を問うメッセージが表示されます。キャプチャしたデータを保存していない場合は、削除されたデータを復活させることはできません。

このアプリは本格的な画像編集に使用するための素材、もしくは、操作方法の解説を作成するために必要な情報画像（部分的な切り抜き画像）を簡単に作成したいという目的を実現するために開発しました。ですので「現在、表示されている画面の全部、もしくは一部を、必要であればマウスカーソルの形状を含めた画像データとして取得する」ことしかできません。保存した画像データを再度読み込んで表示したり、キャプチャした画像を加工する（例えば、ぼかす・モザイクをかけるといったような）機能はありません。ただし、画像の指定範囲を「ぼかす・モザイクをかける」機能は、後日、追加できたら、追加したいと考えています。

また、範囲を指定してキャプチャする機能はありませんが、アプリ側でキャプチャした画像上に矩形を描画し、この矩形で囲んだ範囲を任意の名称を付けて保存したり、クリップボードへ送信することができます（方法は後述）。※ このアプリで、本当に実現したかった機能は、この機能です！

キャプチャした画像上に描く矩形の枠線の太さと色は変更可能です。アプリは終了時の設定内容を自動的に記憶しますので、次回起動時は前回終了時の設定を復元して起動します。矩形で囲った範囲内部を右クリックすると表示されるサブメニューから、その範囲のみを「名前を付けて保存」したり、「クリップボードへ送信」したりすることができますが、その際、保存したり、送信されるのは、矩形下の指定した範囲のみです。矩形そのものは保存・送信されません。

何らかの理由で矩形も含めて保存・送信したい場合は、「矩形が表示された状態そのものをキャプチャ」して、その矩形全体を囲むように範囲を指定（範囲選択後も、矩形の上下左右と四隅に表示されるグラブハンドルをドラッグして選択範囲の微調整が可能です）し、保存・送信を行ってください。

なお、アプリの仕様として、単に画面をキャプチャしただけでは画像データとして保存されません。画像データとして利用したい場合は、必ず保存の作業を行ってください。保存していないキャプチャデータはアプリ終了時に自動的に破棄されますので、この点には十分ご注意ください。

キャプチャした画面を画像データとして保存する方法は３つあります。

（１）ショートカットキー（ Shift + Ctrl + S ）で保存。
（２）アプリ本体の「Save」ボタンをクリックして保存。
（３）アプリ本体で範囲を指定して保存。

（１）ショートカットキー（ Shift + Ctrl + S ）で保存

まず、（１）のショートカットキーによる保存は、最後に Shift + Ctrl + C を行ったデータに対して有効です。画像データの保存先 Path は、デフォルト設定はデスクトップですが、アプリを起動後、ユーザーが保存先を任意の場所に変更した場合は、ユーザーが選んだ任意の場所となります（アプリは終了時にデータの保存先 Path を記録して終了、次回起動時はその Path の存在を確認し、Path が存在すればそこを、存在しなければユーザーが新しく指定した任意のフォルダ（もしくはデスクトップ）を画像データの保存先として自動選択します）。

ショートカットキー（ Shift + Ctrl + S ）で保存した場合は、SaveDialog は表示されません。ショートカットキー押し下げと同時に上記指定フォルダに保存後、次のメッセージが表示されます。

画像ファイルの名称は「Screenshot_西暦年月日_時分秒」＋「.拡張子」となります。
（SaveDialog 使用時は、任意の名称に変更可能です）

画像データの保存形式は、デフォルト「PNG」形式です。アプリ本体側で 予め指定 すれば「BMP」や「JPEG」形式で保存することもできます。先ほどの Path と同様、アプリは終了時に指定されていた画像ファイルの保存形式を記憶しますので、次回は前回終了時の保存形式が自動的に選択された状態で起動します。

（２）アプリ本体の「Save」ボタンをクリックして保存

２つ目の保存方法が、アプリ本体の「Save」ボタンをクリックして保存する方法です。初めて起動した際には、保存形式はデフォルトで PNG 形式になっていると思いますが、PNG 形式の他に BMP や JPEG でも保存可能です。ですので、アプリの「Save」ボタンを利用する保存の流れとしては、タスクバーのアプリをクリック → 画像の保存形式を指定 → 画像の保存（ Save ボタンをクリック）が基本です。

キャプチャした画像の保存形式を指定した後、「Save」ボタンをクリックしてください。

即時保存のショートカットキー（ Shift + Ctrl + S ）を使わず、タスクバーに待機していたアプリのアイコンをクリックしてプログラムの本体を表示し、画面右下の「Save」ボタンをクリックする（２）の場合は、（１）の場合とは異なり、「名前を付けて保存」のダイアログが表示されます。必要に応じて保存場所・ファイル名を変更し、「保存」ボタンをクリックすれば、キャプチャした画像をそのまま、任意に指定したディレクトリ（フォルダ）に保存できます。

キャプチャした画像ファイルの保存先とファイル名は Windows 側の機能を利用して変更が可能です。
必要に応じてダイアログを操作し、「任意の場所・任意の名称」に変更してください。

（３）アプリ本体で範囲を指定して保存

キャプチャした画像の一部を範囲指定して保存する方法です。例えば、操作方法の案内で「最小化ボタンをクリックしてください」という趣旨を解説する際に使用したい画像を作成するには、次のように操作します。

まず、マウスのカーソルを最小化ボタンに乗せて（最小化ボタンをポイントして）、画面全体をキャプチャ（ Shift + Ctrl + C ）して、必要な範囲を矩形で範囲指定します。範囲指定は、必ず、指定したい範囲の左上から右下へドラッグする形で行ってください（右下から左上へドラッグする操作は無効となります）。

矩形で囲んだ範囲の内部へマウスのカーソルを移動させる（矩形内部をポイントする）と、マウスのカーソルの形状が上下・左右の矢印（ SizeAll ・「全方向サイズ変更カーソル」or「移動カーソル」に変化します（この状態で範囲そのものを移動させることもできますが、移動はあまりスムースではありません）。この状態でマウスを右クリックするとサブメニューが表示されます。

機能を追加して、上記リンク先で公開している Capity Plus では、ショートカットキー（ Shift + Ctrl + 矢印キー）で選択範囲の移動が可能です。ちなみに選択範囲の微調整は Shift + 矢印キーに割り当ててあります。自分で使ってみた感想ですが、１ピクセル単位での制御が可能ですので、とても便利に使えています！

指定範囲をそのまま無加工で使用する場合は「名前を付けて保存」、画像編集ソフトでさらに加工して使いたい場合は「クリップボードへ送る」を選んでください。

この解説そのものも、このアプリで作成しましたが、キャプチャした画像をさらにキャプチャするので、なんだか、すごく混乱しました。解説の解説を作るって、難しいです･･･

【終了方法】

アプリを終了するには、操作画面右下隅にある「Close」or「終了」ボタンをクリックしてください。確認メッセージが表示されます。

３．☆ここではまりました☆

「こんなのカンタンさぁ・すぐ出来るー」みたいな軽いノリで始めたこのアプリの制作でしたが、思わぬ落とし穴にはまり、３日間ほど停滞しました。それは何かというと、範囲を指定する矩形を描画した後の、矩形のリサイズ時の挙動の制御です。

矩形の新規描画の際には、キャプチャした画像上の任意の位置をドラッグするわけですが、この時、ドラッグした範囲が画像の右や下、または右下隅までくると、次の画像のようにドラッグそのものが自動的に停止します。

新規に矩形を描画する際は、画像の端までドラッグしたら、もうそれ以上ドラッグできません。

ところが、この範囲の選択後、矩形の上下左右と四隅に表示されるグラブハンドルをクリックして（掴んで）リサイズしようとすると、選択範囲（上の画像の赤い点線部分：業界用語では「ラバーバンド」と言うようです）が画像の幅・高さを超えて右へ・下へ、大きくずれて描画されてしまうのです。

範囲選択後、矩形をリサイズしようとするとキャプチャした画像の範囲をオーバーしてしまう･･･

上の例はわかりやすさのため、画面の右下隅で新規矩形描画時にカーソルが自動停止した後、さらに右下側へリサイズするという、現実にはあり得ない設定で説明しましたが、実際の場面では、キャプチャした画像の右下方向を範囲選択して切り抜きたいとき、この現象が発生するわけです。

この選択範囲が画像の端をはるかにオーバーした状態で「名前を付けて保存」・「クリップボードへ送信」しても、保存・送信されるのは余計な余白のない（取得したかった）画像データのみなので、『問題がない』と言えば『問題ない』のですが、気分がよくないです。

プログラム的には、キャプチャした画像は imgPreview という名前の TImage に表示し、さらにその上に plImage1という名前の TImage を乗せ、これをラバーバンドとして利用しています。ですので、手続きは、imgPreview の MouseDown 、MouseMove 、MouseUp と、plImage1 の MouseDown 、MouseMove 、MouseUp があるわけです。

plImage1 は、Mr.XRAY さんが公開していらっしゃる plResizeImage.pas を利用させていただき、作成したものです。改変可能とのことでしたので、元の plResizeImage.pas に必要な機能を追加して使わせていただきました。素晴らしいプログラムを公開してくださっている Mr.XRAY さんに心より厚く御礼申し上げます。ほんとうに、ありがとうございました。

157_移動リサイズ可能な TImage ラバーバンドとグラブハンドル

さて、どうやってこの問題を解決したか？ですが･･･

私は、当初、imgPreview 上での動作なので、imgPreview の MouseDown 、MouseMove 、MouseUp の各手続きに必要な制御を記述すればイイとハナから思い込み（しかも、その思い込みが原因で、これまでにもさんざん苦労して、痛い思いを味わい続けてきたことすら完全に忘れ）、手を変え、品を変え、コードを変えて、imgPreview の MouseDown 、MouseMove 、MouseUp の各手続きに、ドラッグ操作が imgPreview の右下隅で自動停止するコードを書き続けたわけですが、どんなにコードを尽くしても、上の画像で示した画像の境界を超えてラバーバンドが描画される現象を改善することが出来ず、つまり、ラバーバンドは画像の端の先々まで伸び続けるという、またまた、この「他に誰一人として悩まないこと」で、さんざんに悩み、まるまる２日間をこの問題の解決に費やしました。今思えば、見方によっては、それは途方もなく無駄で無意味な時間であったわけですが･･･。この悩んでいる状態を経験したくてプログラムを書いているように思えてならないフシもあり、そうなるともう、これは救いようがありません･･･

ともあれ、七転八倒し続けた挙句、（オレは根本的に間違えているのではなかろうか？）と、ようやくそこに思いが至りました。時にして遅すぎですが、これが悩み続けて３日目のことです。

で、気づいた根本的な間違いとはナニか？というと、確実に呼ばれていると思い込んでいた上記イベントは実は呼ばれていないんじゃないか？という至極（「非常に」・「とても」の上位語として、強調の意味を持ちます）当然のことなのですが、３日めにしてようやくというか、やっとそこに思いが至ったわけです。

一緒に暮らしているヒトに『悔い改めましたか？』とよく問われる私ですが、どんなに悔い改めても同じような誤りをひたすら繰り返すのは、懲りてないと言うか、何と言うか、やっぱり、バカなんじゃないかと･･･、今に始まったことではありませんが、そう思えてなりません。

神さま
ボクには信じることと
思い込むことの違いが
よくわかりません。

信じるものは救われると
聞きましたが、
思い込むものは
救われないのでしょうか？

父からは、いつか･･･
『大丈夫。天国の黒板にはあなたの名前が書いてある。』と

ものすごいことを聞きましたが、
あっ。いえ、その･･･
決して「ついでに」という訳ではありませんが、
それもほんとうでしょうか？

そのように悩みつつ、書いたコードがコレです。

  {$IFDEF DEBUG}
  OutputDebugString('imgPreviewMouseDown called');
  {$ENDIF}

実際の画面上では、こう見えます。（この文字のうすさが、なんかステキで･･･ ♪）

本来ならば、コレをいちばん最初に確認すべきだったのですが、後悔と反省の狭間で目を瞬きながら「いつ・どのイベントが呼ばれているのか」確かめて見ると･･･矩形のリサイズ時に呼ばれているのは、

当たり前ですが、（本人は、そのような手続きを書いたことすら忘れていた ）plImageResized 手続きでありました！

しばし、唖然としましたが、わかってしまえばコトはカンタンです。

procedure TForm1.plImage1Resized(Sender: TObject; ARect: TRect; ALeft, ATop,
  AWidth, AHeight: Integer);
var
  ･･･ 省略 ･･･
  clipRect: TRect;
  topLeft, bottomRight: TPoint;
begin

  {$IFDEF DEBUG}
  OutputDebugString('plImageResized called');
  {$ENDIF}

  ･･･ 省略 ･･･

  //マウスのカーソルの移動範囲を制限

  //imgPreview のクライアント領域をスクリーン座標に変換してカーソルの移動を制限
  clipRect := imgPreview.ClientRect;
  topLeft := imgPreview.ClientToScreen(Point(clipRect.Left, clipRect.Top));
  bottomRight := imgPreview.ClientToScreen(Point(clipRect.Right, clipRect.Bottom));

  clipRect.Left := topLeft.X;
  clipRect.Top := topLeft.Y;
  clipRect.Right := bottomRight.X;
  clipRect.Bottom := bottomRight.Y;

  // カーソル移動範囲を制限
  ClipCursor(@clipRect);

end;

で、このままだと、マウスのカーソルは imgPreview の外へ出れなくなってしまうので、plImage1 の MouseUp 手続きで ClipCursor に nil を代入してカーソルの移動制限を解除します。

procedure TForm1.plImage1MouseUp(Sender: TObject; Button: TMouseButton;
  Shift: TShiftState; X, Y: Integer);
var
  screenPt: TPoint;
  localPt: TPoint;
begin

  //フラグをリセット
  DragFlag := False;
  MoveFlag := False;

  //ドロップ後の plImage1 のスクリーン座標を取得
  screenPt := plImage1.ClientToScreen(Point(0, 0));

  //imgPreview のローカル座標に変換
  localPt := imgPreview.ScreenToClient(screenPt);

  //キャプチャ範囲を更新
  rbX := localPt.X;
  rbY := localPt.Y;
  rbW := plImage1.Width;
  rbH := plImage1.Height;

  //カーソルの移動制限を解除
  ClipCursor(nil);

end;

これでリサイズ時でも、キャプチャした画像の端でカーソルが停止するようになったはずです。そしてこれは思い込みではないはずです。

結果を信じながら、キャプチャした画像上を範囲選択します。

神さまに祈りながら、グラブハンドルをクリックして（掴んで）右下隅の方へドラッグし（引っ張り）ます。はたして結果は如何に･･･

やった！やった！！

これでようやく
夢が全部叶いました！

４．ダウンロードはこちらから

今回の記事で紹介した PC の画面キャプチャを実行するプログラム一式を以下からダウンロードできます。なお、ダウンロードとご使用にあたっては、免責事項及び使用条件への同意が必要です。免責事項及び使用条件の詳細は付属の License.txt をご覧ください。

【注意！】
ここで公開しているのは、私的に必要であった最小限の機能のみを搭載した初期バージョンです。
（新機能を追加し、不具合を改善した新しいバージョンがこちらにあります。下記リンクからダウンロードできる旧バージョンは、新しいバージョンに向かってソフトウェアがどのように進化したか、確認するためのものとお考えください。万一、試用される場合は、新しいバージョンで改善した不具合を含んだままのプログラムであることに十分ご注意の上、自己責任の下でお試しくださいますよう、お願い申し上げます）

Capity - Lightweight Screen Capture Tool

1 ファイル 1.11 MB

ダウンロード

マウスだけで操作可能な画面の拡大表示ツール “KindLens” のご紹介

【追記_20251109】

新しいバージョンのプログラムの修正に合わせ、初期バージョンのサムネイル表示部分の不具合も修正しました。

５．お願いとお断り

解答欄（矩形）検出器を改良しました！

この Blog の過去記事で紹介している手書き答案の採点補助プログラム AC_Reader では、スキャナーでスキャンして Jpeg 形式で保存した試験の解答用紙画像から、解答欄の座標を取得するプログラムを外部的に呼び出して利用しています。

この解答欄の座標を取得するプログラムは、OpenCV の矩形検出機能を使って、その目的を実現しているのですが（掲載しておいてこんなことを言うのもナンですが）、必ずしも意図した通りに動かない場合がありました。

今回、その「いつか直そうと思っていた部分を手直し」して、前よりは少しは意図した通りに動くかな？みたいなプログラムが出来た気がするので、「デジタル採点 All in One」なる大それた名前を付けて世に出してしまったプログラム集のバージョンアップ版として公開させていただきます。

プログラムの名前も、よりわかりやすいものに変更（ AnswerAreaLocator.exe ）しました（が、単体での使用は事故防止のため非推奨です）。あくまでも AC_Reader.exe から呼び出しての動作が基本ですが、たぶん、以前のモノより、期待通りに動作するものと思われます。万一にでも、バージョンアップしてくれないかなーと思われていた方が「もし、いてくださったら」のお話ではありますが･･･

今回の記事では、そのバージョンアップ内容（正しくは不具合のお詫びとその修正内容）をご紹介させていただきます。

【もくじ】

１．GUIが使いやすくなりました！
２．画像の傾きに強くなりました！
３．ほぼ採点する順番に解答欄を検出できるようになりました！
４．マウスのアイコンがデフォルト状態に戻るようになりました！
５．必要なフォルダがない場合には警告を表示するようになりました！
６．常に最大化して実行する設定にしてやっぱりやめました！
７．最大化から非最大化した際に画面中央にフォームを表示します！
８．ダウンロードのご案内
９．まとめ
10．お願いとお断り

１．GUIが使いやすくなりました！

以前のユーザーインターフェイスは、次のようなものでした。

「画像の傾きを補正する機能を重視」した結果、操作方法がわかりにくい設計となっておりました。

新しいプログラムのユーザーインターフェイスです。基本的に、左から右へ操作していただければ作業がスムースに進むように改良しました。

画像の傾きの補正機能は残しましたが、使用しなくても動作するように修正しました。

スキャナーでスキャンした画像のすべてが、目視状態で明らかに傾いて（左右いずれかの方向に回転して）いる場合がありますので、画像の回転を行って、傾きを補正する機能は残しましたが、機能の実装方法そのものを見直し、負の数で左へ回転／正の数で右へ回転、Prev ボタンで効果を確認、UnDo ボタンでやり直し、実行ボタンで全画像に修正を適用というように簡略化しました。

また、矩形検出「する／しない」の境界を決める閾値も、以前は面積を利用するようにしていましたが、新しいプログラムでは、検出限界とする幅もしくは高さをピクセル単位で指定できるように変更しました。使っていただければ、お分かりいただけると思うのですが、例えば以下のような場合、自動的に小さな矩形を最初から無視しますので、より解答欄の矩形だけを検出する方向に進化できたのではないかと思います。

矩形検出を実行した段階で設問番号の「１」を囲む矩形は検出対象から自動的に外されます。

また、これは以前と同じですが、「６文字で答えよ」と文字数を指定して解答させたい場合は、検出したい矩形の外枠を実線で、内部を点線として予め解答欄を作成（描画）しておくことで、後から手動で範囲指定をやり直さなくとも、取得したい解答欄そのものを自動的に取得できます。

点線は、目視で線がつながっていないことが確認できれば大丈夫（検出されません！）。

ちなみに、点線は、誰もが使っているであろう「あのソフトウェア」で描いたものです。上の図の点線は、下の赤枠内の点線を利用して描画しました。

それから、間違っていたらごめんなさい。赤枠の１つ上の細かな（？）点線は、要注意の線です。私の見間違いかもしれませんが、以前、この線を利用する中で「とても不思議な現象に出会った」ことがあり、それ以来、この線は簡易的な利用にとどめ、本格的な何か（色を変えたりみたいな）には利用しないようにしています。詳しくは書きませんが、いろいろワケありの線のようです･･･

また、GUI で、ブロックと表現している部分の考え方ですが、これは採点する順番に解答欄座標を並べることができるように、解答用紙を幾つかのブロックに分けて、そのブロック内で横書き答案であれば「左 → 右」かつ「上 → 下」へ、国語で使われる縦書き答案であれば「上 → 下」かつ「右 → 左」へ、解答欄の座標を検出します。

２．画像の傾きに強くなりました！

以前のバージョンで、最も対応困難であったのが「スキャンした画像の傾き」です。

以前の勤務先で使用していた複合機では、気になるほどスキャンした画像が傾くことなどなかったのですが、今の勤務先で使用している複合機のスキャナーは（同じメーカーさんの同じ型番の製品ですが）、スキャンすると画像がことごとく右肩上がりになるこの固体特有のクセがあり、サービスマンの方に修正を依頼しても「これはちょっと難しいですね･･･」と断られてしまった経緯もあって、自分では紙送りローラーのクリーニングくらいしかできませんので、たいへん困っておりました。

もちろん、傾きと言っても、わずか 0.1° 程度の傾きですので、私以外に誰一人、問題にする人なんていませんが･･･

私はものすごく気になるのです！

なぜか？というと･･･私の神経が細やかとか、そんな問題ではなく、どちらかと言えば、私は神経が少し足りないんじゃないかと思うことの方が多いくらいです･･･。その証拠に『点くのが遅い蛍光灯のようなお子さんですね！』と小学校時代、担任の先生から言われたと母親が語っておりましたし、私はその時、多分言葉の意味そのものが理解できず、おそらく褒められたに違いないと勘違いして、むしろ、喜んでいたのではないか？とも思います。ヽ(=´▽`=)ﾉ

とにかく、これまでの矩形検出プログラムで解答欄矩形の座標を検出して、採点する順番になるように並び替える際、横書き答案であれば「 Y 座標の値が小さいものから順に、左から右へ並べ替える」アルゴリズムを採用しているため、解答用紙の画像が左へ傾いていると、座標原点 0,0 が左上であるため、右側の解答欄ほど Y 座標の値が小さくなり、検出した座標を並び替える際に「上から下へ」の順番はなんとか守れても、「左から右へ」が「右から左へ」と、「一部の解答欄座標の並びが逆転」してしまうわけです。

この修正が大変な手間で･･･

（ AC_Reader を使ってくださる方のお手伝いをする際に、いつも、そう感じ･･･）

ほんとうに、申し訳なく･･･

私自身の心情など、この際、極めて、どうだっていいコト･･･では、ありますが･･･

私といっしょに暮らしているヒトは、とてもやさしくて、かわいい、イイひとなのですが、極々稀に、ブチ切れると、ながーい間、沈黙した挙句･･･私は、完全に悪くないと思えてならないときでも･･･

おまえが、わるい。

必ず、そう言います。

控えめに「そうなの？」と尋ねることにしているのですが、返事は決まって

だって、そうじゃん！

この言葉を聞いた時の心境が、まさに、この場合のそれで･･･。みなさんに、どうにかして、ご理解いただきたい私自身の偽りのない心情なのです･･･

ほんとうに、良かれと信じて、精一杯、その時の自分にある、全身全霊の、すべての力を使って書いた･･･と、そう信じて疑わないプログラム。･･･なのですが･･･

それは･･･悪気なんて全然なく、きみのために良かれと思ってやったこと･･･

でも、そのプログラムには、不具合があった･･･。

でも、きみは、なぜか、怒っている･･･。

悪いのは･･･。

そう、ほんとうに、精一杯、がんばって、「書いたのは間違いない」んだけど･･･。

そう、ほんとうに、きみとケ〇カなんて、したくなかった･･･。

だけど･･･　だから･･･

間違ったのは僕なんです。
みんな僕が悪いんです。

一緒に暮らしているヒトと、ケ〇カするといつも、そんな気持ちになります。

で、そんな時、「今日の晩御飯、なぁに？」って彼女に尋ねると･･･

へびとカエル

彼女は、必ずそう答えるのです･･･　実際に、それが出てきたことは幸いにしてありませんが。

そのように悪いのは私だと理解していますので、以前のプログラムでは、解答欄座標を検出する前に、全画像を傾きがなくなる方向に回転させて、傾きを修正してから解答欄矩形の座標を検出するように手順を工夫していたのです。それは、それで「ない」知恵を絞って考えた自分的には限界とも思える方法だったのですが、この修正を行っても 100 ％スムースに作業できるとは到底思えず、（あのプログラム、検出して並び変えた結果の一部は必ず修正が必要な状態なのではなかろうか･･･ある程度はちゃんと動くと思うんだけど･･･、ちょっとでも傾きがあると･･･うーん、困ったぁ）と、思い出す度に同じ思いが込み上げてきて、日々、後悔と、反省と、絶大なる心配とを、交互に繰り返しておりました。

いつか、なんとかしなければ･･･

そう思いながらも、よい方法が思いつかず、更新が先延ばしになってしまいました。お使いいただけた皆さまに、伏してお詫び申し上げます。ほんとうに、すみませんでした。

今回の更新では、正直に言いますと当初、得られた解答欄矩形の座標から、水平方向の直線を複数本検出して、その傾きの平均値を計算し、全自動で画像の傾きを修正する方向でプログラムの修正作業を進めたのです･･･が、残念ながら、現在の私の力では、自分自身が満足できる結果を出すことは出来ませんでした。

そこで、全自動での修正を断念し、画像の傾きを補正する部分と解答欄矩形を検出する部分、両方のアルゴリズムを（自分の力の及ぶ限りの範囲ではありますが）全面的に見直すことにしました。

そこで思いついたのが、横並びの解答欄を「行」のように見なし、Y 方向に「多少のマージン」を設定することで、検出した解答欄座標を理想通りに並べ替えて表示できるのではないかということです。さらに、これが出来れば、解答用紙画像の多少の傾きなど問題ではなくなるはずです。この考えを基にしてスクリプトを書き替えること２度、３度、ようやく思った通りに解答欄矩形の座標を並べ替えて出力できるようになりました。少なくても、私のテストした範囲では、採点する順番で解答欄座標の並び替え出力に成功するようになった･･･と思えるプログラムに改良することが出来ました☆

もちろん、国語の試験で利用される縦書き答案についても、縦並びの解答欄を「列」のように見なし、やはり「多少のマージン」を設定することで、画像が少しくらい傾いていても基本「右から左」かつ「上から下」へという順番で検出した解答欄座標を並べ替えて表示できるように、こちらもプログラムを修正できました。

以下は、Delphi に埋め込んで使用している「横書き答案の解答欄座標を検出して、採点順に並べ替える」 Python Script です（ダウンロードしていただいた Zip ファイルのサイズが大きいのも、展開に時間がかかるのも、Python 用の OpenCV をバックグラウンドで動作させているためです）。

  import cv2
  import numpy as np

  def imread_unicode(path):
      with open(path, "rb") as f:
          data = f.read()
      img_array = np.frombuffer(data, np.uint8)
      return cv2.imdecode(img_array, cv2.IMREAD_COLOR)

  def deskew_image(gray):
      edges = cv2.Canny(gray, 50, 150, apertureSize=3)
      lines = cv2.HoughLines(edges, 1, np.pi / 180, 150)
      if lines is None:
          return gray
      horizontal_angles = []
      for rho, theta in lines[:, 0]:
          angle_deg = (theta * 180 / np.pi)
          if (angle_deg < 10) or (angle_deg > 170):
              adjusted_angle = angle_deg if angle_deg < 90 else angle_deg - 180
              horizontal_angles.append(adjusted_angle)
      if len(horizontal_angles) < 5:
          return gray
      mean_angle = np.mean(horizontal_angles)
      if abs(mean_angle) < 0.3:
          return gray
      (h, w) = gray.shape
      center = (w // 2, h // 2)
      M = cv2.getRotationMatrix2D(center, mean_angle, 1.0)
      rotated = cv2.warpAffine(gray, M, (w, h), flags=cv2.INTER_LINEAR, borderValue=255)
      return rotated

  def detect_inner_boxes(image_path):
      img_color = imread_unicode(image_path)
      if img_color is None:
          raise FileNotFoundError(f"画像が見つかりません: {image_path}")
      img_gray = cv2.cvtColor(img_color, cv2.COLOR_BGR2GRAY)
      thresh = cv2.adaptiveThreshold(
          img_gray, 255,
          cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
          cv2.THRESH_BINARY_INV,
          15, 10
      )
      contours, _ = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
      boxes = []
      for cnt in contours:
          x, y, w, h = cv2.boundingRect(cnt)
          if w > ' + cmbThreshold.Text + ' and h > ' + cmbThreshold.Text + ':
              boxes.append((x, y, w, h))
      inner_boxes = []
      for i, box in enumerate(boxes):
          x1, y1, w1, h1 = box
          rect1 = (x1, y1, x1 + w1, y1 + h1)
          contains_other = False
          for j, other in enumerate(boxes):
              if i == j:
                  continue
              x2, y2, w2, h2 = other
              rect2 = (x2, y2, x2 + w2, y2 + h2)
              if rect1[0] <= rect2[0] and rect1[1] <= rect2[1] and rect1[2] >= rect2[2] and rect1[3] >= rect2[3]:
                  contains_other = True
                  break
          if not contains_other:
              inner_boxes.append(box)

      if not inner_boxes:
          return []
      y_tolerance = max(5, int(np.median([h for (_,_,_,h) in inner_boxes]) * 0.5))
      inner_boxes.sort(key=lambda b: b[1])
      sorted_boxes = []
      current_row = []
      current_y = None
      for b in inner_boxes:
          x, y, w, h = b
          if current_y is None:
              current_y = y
              current_row.append(b)
          elif abs(y - current_y) <= y_tolerance:
              current_row.append(b)
          else:
              current_row.sort(key=lambda b: b[0])
              sorted_boxes.extend(current_row)
              current_row = [b]
              current_y = y
      if current_row:
          current_row.sort(key=lambda b: b[0])
          sorted_boxes.extend(current_row)
      inner_boxes = sorted_boxes
    
      for idx, (x, y, w, h) in enumerate(inner_boxes, start=1):
          var1.Value = str(x) + "," + str(y) + "," + str(x + w) + "," + str(y + h)
      return inner_boxes

  if __name__ == "__main__":
      image_path = r"' + 'CutImage0' + IntToStr(i) + '.jpg' + '"
      boxes = detect_inner_boxes(image_path)

横書き答案で、ブロックの指定が２以上である場合がありますので、この処理を for ループの中に埋め込んでいます。また、この横書きでブロックの指定が２以上である答案の場合には、２ブロック目に検出した座標の値のｘ座標を一律補正するような処理も Delphi 側で必要ですが、核心部分はなんと言っても、上のスクリプトです。思えば、ここに至るまで、はや幾年月･･･

横書き用が出来てしまえば、あとはそれを縦書き用に書き換えるだけです。「縦書き答案用のスクリプト」は次の通りです。

  import cv2
  import numpy as np

  def imread_unicode(path):
      with open(path, "rb") as f:
          data = f.read()
      img_array = np.frombuffer(data, np.uint8)
      return cv2.imdecode(img_array, cv2.IMREAD_COLOR)

  def detect_inner_boxes(image_path):
      img_color = imread_unicode(image_path)
      if img_color is None:
          raise FileNotFoundError(f"画像が見つかりません: {image_path}")
      img_gray = cv2.cvtColor(img_color, cv2.COLOR_BGR2GRAY)
      thresh = cv2.adaptiveThreshold(
          img_gray, 255,
          cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
          cv2.THRESH_BINARY_INV,
          15, 10
      )

      contours, _ = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

      boxes = []
      for cnt in contours:
          x, y, w, h = cv2.boundingRect(cnt)
          if w > ' + cmbThreshold.Text + ' and h > ' + cmbThreshold.Text + ':
              boxes.append((x, y, w, h))

      inner_boxes = []
      for i, box in enumerate(boxes):
          x1, y1, w1, h1 = box
          rect1 = (x1, y1, x1 + w1, y1 + h1)
          contains_other = False
          for j, other in enumerate(boxes):
              if i == j:
                  continue
              x2, y2, w2, h2 = other
              rect2 = (x2, y2, x2 + w2, y2 + h2)
              if rect1[0] <= rect2[0] and rect1[1] <= rect2[1] and rect1[2] >= rect2[2] and rect1[3] >= rect2[3]:
                  contains_other = True
                  break
          if not contains_other:
              inner_boxes.append(box)

      if not inner_boxes:
          return []
      x_tolerance = max(5, int(np.median([w for (_,_,w,_) in inner_boxes]) * 0.5))
      inner_boxes.sort(key=lambda b: b[0], reverse=True)
      sorted_boxes = []
      current_col = []
      current_x = None
      for b in inner_boxes:
          x, y, w, h = b
          if current_x is None:
              current_x = x
              current_col.append(b)
          elif abs(x - current_x) <= x_tolerance:
              current_col.append(b)
          else:
              current_col.sort(key=lambda b: b[1])
              sorted_boxes.extend(current_col)
              current_col = [b]
              current_x = x
      if current_col:
          current_col.sort(key=lambda b: b[1])
          sorted_boxes.extend(current_col)
      inner_boxes = sorted_boxes

      for (x, y, w, h) in inner_boxes:
          var1.Value = str(x) + "," + str(y) + "," + str(x + w) + "," + str(y + h)

      return inner_boxes

  if __name__ == "__main__":
      image_path = r"CutImage01.jpg"
      detect_inner_boxes(image_path)

こちらについては「横書き答案」とは異なり、私が想定した範囲では「現状」ブロックに分割しての処理の必要性が感じられませんでしたので、Loop での処理は考慮しておりません。

３．ほぼ採点する順番に解答欄を検出できるようになりました！

極端な例として（いくらなんでも、これはないと思いますが）-1.00° ほど故意に画像を傾けて実験してみました。

「回転」に負の数を指定すると画像は左へ回転します。

左へ -1.00° 故意に回転させた画像に対して、解答欄座標の検出を行ってみた結果です。画像がどういう状態であろうと、傾きがあろうと、なかろうと、それに関係なく、プログラムが解答欄矩形の座標を左から右へ、そして上から下へ認識してくれたなら、夢はほんとうになります。

この夢は･･･

他の誰かが、既に実現した夢でもかまいません。私にとっては、まだ、成し遂げていない夢ですから。たとえ、だれひとり、この夢の成就を待っていてくれる人など、いなくても･･･

人の夢と書いて、「儚い」と読むそうですが、これほど、私の思いに重なる言葉はありません･･･。

僕の書いた･･･　プログラムは、僕の夢の結晶。

だから･･･人の夢の結晶が、たとえ「儚い」ものであっても･･･

うん。「儚い」ものでしか、なくても･･･

そこに込めた様々な願いと祈りは･･･

僕にとっての「ほんとう」です。

だから僕は、心から、それをいとしくおもいます。

プログラムは修正なしで、「解答欄エ」よりY座標が大きい「解答欄ア」を最初の座標に選んでいます。
設問番号「１」部分の矩形は、閾値の設定により検出対象外となっています。
この場合の座標原点は、左上が（0,0）です。

これだけの傾きがあっても、今回修正したプログラムは、ようやく長い間この胸に思い描き続けた夢の通りに動いてくれるようになりました。今回、全自動での補正（修正）処理は実現できませんでしたが、自分的には、この結果から見て･･･おそらく、今後、手動での傾きの補正処理はほぼ不要になるのではないか？と考えます。この実験結果より、「My 解答欄矩形の検出プログラムは、これまで内在していた不具合を一掃できるレベルに到達できた」と判断していいかも･･･と、ようやく思えた次第です。

ものすごく、遠いむかしに、断層を解析し、それを形成した応力場を描くプログラムを書いたことがあります。その際に非常に苦しんだのが PC の座標設定と、中学・高校以来慣れ親しんだ数学的な座標設定の相違でした。

当初、私は「座標原点は数学で学んだのと同じ X 軸と Y 軸の交点の位置にある」というように思い込んで、先人の書いたコードを読んでいましたので･･･

（座標原点は、いったい、どこなんだ？）

と、大混乱。ようやく「座標原点は左上にある」と理解してからも、なお･･･

（原点を移動して、解析図を描画するためには、ナニを、どう修正すればいい？）

あの時、大いに悩んだ経験が今回大いに役立ちました☆

ただ･･･、余弦定理の力を初めて知って、私に魂が震えるような感動の経験を与えてくれた･･･

あの断層解析プログラムは、
まだ１度も使っていません☆

が。

まぁ、作るのが楽しかった ♪ から、全然、自分的には「いい」のでありますが･･･

今後、断層解析の科学論文、書くことも、あり得ないし･･･

今はただ･･･青春を「理科」に賭けた思い出だけが、懐かしい。

*(^_^)* ♪

４．マウスのアイコンがデフォルト状態に戻るようになりました！

「当たり前のことじゃないか？なにバカなことを言ってるんだ」

そう言われても仕方がないことなので、こちらについても心からお詫びするしかないのですが･･･

実は、これも前から気になっていたことなのですが･･･、これまでのプログラムでは解答欄矩形の座標を取得後、時々、マウスのカーソルの形状が「上下左右の四方を向いた矢印」になり、デフォルトの「左斜め上を向いた白い矢印」に戻らなくなってしまう現象が、時々発生しておりました。

もちろん、ずっと気にはしていたのですが、でも、「何とかしなきゃ」と思いながらも、気づけばこちらも放置したままになってしまいました。理由は２つあって、１つはカーソルの形状が変化するだけで機能的な部分には（実用上何も）問題が生じなかった（つまり、見た目だけの問題であると認識していた）こと、２つめはそもそも「どこをどうしたら直せるのか」それがよくわからなかった･･･というのが私の中での、ほんとうです。

こんな不出来なプログラムを、耐え難きを･･･堪えて、それでもお使い下さった皆さま、ほんとうに、ありがとうございます。この件につきましても、ここであらためて、こころからお詫び申し上げます。重ね重ねではありますが、誠に、誠に申し訳ありませんでした。

今回の見直しにあたって、ようやく本気で「このままではいけない！」と思い、まず、その原因を探るところから修正作業を始めることにしました。まず、「いつ・どこで・何をするとカーソルの形状が変化したまま、元に戻らなくなるのか」それを明らかにする必要があります。私は、問題を再現すべくプログラムを様々に操作してみました。なかなか思った通りに問題が再現できず、ちょっと時間がかかりましたが、ようやく（変な言い方ですが）思った通りに問題を再現することが出来るようになりました。明らかになった問題発生に至るまでの操作は、次の通りです。

解答欄矩形の座標を取得すると表示されるラバーバンドの中をポイントすると、マウスカーソルの形状が次のように変化します。

この上下左右の四方を向いた矢印から成るカーソルは、
「サイズ変更カーソル」（Resize Cursor）という名前のようです。

この状態で、下向きの矢印キーを押し下げると TMemo 内のカーソルが次の座標に移動し、それに合わせてラバーバンドの位置が次の解答欄矩形上に移動します。

TMemo にフォーカスがあり、カーソルは２行目に移動します。
プログラムは２行目の座標を読み取り、その位置に赤い矩形を表示します。

この時、困ったことが起きます。ラバーバンドの外に出たらデフォルト状態に戻るはずのマウスカーソルの形状変化が起きず、その形状は「サイズ変更カーソル状態のまま」になってしまいます。下図はその状態をハードコピーしたものです。

ただし、機能的には何の問題もなく、このままの状態でボタンクリック等、通常通りの操作が可能です。このことが、この問題への対応がここまで遅れた原因の１つとなりました。

ここで、マウスカーソルをもう一度ラバーバンド内に戻してあげると、マウスカーソルの形状はデフォルトの白い矢印に戻るのですが、いちいちそんな操作はやってられません。

この後、マウスカーソルをラバーバンド内から再度外に出します。カーソルの形状はデフォルト状態のままですが、再度、ラバーバンド内にカーソルを戻すとその形状は「サイズ変更」状態に変化し、ラバーバンドの外へ出すとデフォルト状態に戻ります。つまり、カーソルを動かすのではなく、カーソルを固定したまま、ラバーバンドの方を動かすと問題が発生することがわかりました。

詳しい原因はまだわかりませんが、とにかく、問題の核心部分がマウスカーソルの形状の制御にあることは明らかですので、次にそれがどのように実現されているのか、確認してみることにしました。

ラバーバンドを表示する部分のプログラムは、Mr.XRAYさんの TplResizeImage クラス（コンポーネント）を使わせていただき、Pen の太さと色を私が追加で指定しています。

この TplResizeImage.pas を開いて、じっくり読んでみます。すると、マウスの形状の制御は FSelected という Bool 型の変数で行われていて、これが True のとき、形状がサイズ変更カーソル（crSizeAll）になり、False のとき、デフォルト（crDefault）になることがわかりました。以下、その制御部分の抜粋です。

  TplResizeImage = class(TImage)
  private
    FSelected        : Boolean;

  ･･･

      if FSelected then begin
        Screen.Cursor := crSizeAll;
      end else begin
        Screen.Cursor := crDefault;
      end;

で、次の手続きで、マウスがコントロールから離れたらカーソルの形状をデフォルトに戻す設定になっていることもわかりました。

//=============================================================================
//  TplResizeImageクラス
//  CM_MOUSELEAVEメッセージ処理
//  マウスがコントロールから離れたらカーソルの形をデフォルトに戻す
//=============================================================================
procedure TplResizeImage.CMMouseleave(var Message: TMessage);
begin
  inherited;
  if not FSelected then exit;
  Screen.Cursor := crDefault;
  FResizeState  := irsNone;
end;

これより「マウスがコントロールから離れた」ことが確認できないところから問題が起きているのではないかと、ようやく、問題の原因らしきものが見えてきました。

どうしたらいいか、ひたすら考えます。すると、コメント文の中に次の一文が･･･

  //SetBoundsを実行すると，Resizeメソッドが自動実行される
  SetBounds(ALeft, ATop, Width, Height);

で、その Resize 部分を読んでみると･･･

procedure TplResizeImage.Resize;
var
  ALeft        : Integer;
  ･･･
begin
  ･･･
  SetBounds(ALeft, ATop, AWidth, AHeight);
  ･･･
end;

解答欄矩形の幅や高さが変わった場合は、必ず Resize が呼ばれます。そこで、ここに保険のような感じで、マウスのカーソルを元に戻す処理を追加しました。

//=============================================================================
//  TplResizeImageクラス
//  TImageのResizeメソッド
//  リサイズが発生すると自動的に呼ばれる
//=============================================================================
procedure TplResizeImage.Resize;
var
  ALeft        : Integer;
  ･･･ 省略 ･･･
begin
  ･･･ 省略 ･･･

  //サイズ変更後も必ずカーソルを戻す
  Screen.Cursor := crDefault;

  inherited Resize;
end;

これで解答欄矩形の幅や高さが変わった場合には、Resize 手続きが呼ばれ、マウスカーソルの形状が必ずデフォルト状態に戻ります。ただ、問題は幅や高さが変わらない場合です。幅や高さが変わらない解答欄は実際たくさんありますから、ここは手抜きをせず絶対にきちんと対応しなくてはなりません。

ただ、上に示したように Resize 手続きの中で SetBounds しているので、Resize 手続きは座標を入れ替える度に必ず呼ばれるような気もするのですが、より確実な方法を設定しておきたいと思い、カーソルの移動に使用している矢印キーの OnKeyDown イベントが使えないかと考えました。

考えました･･･が･･･、よくよくコードを見ると、

TplResizeImage = class(TImage)

KeyDown は TWinControl 由来のイベントですが、TplResizeImage は TImage（ = TGraphicControl ）で親が違います。結論だけ言えば、 TImage はフォーカスを受け取れません。したがって KeyDown イベントは書いても無駄です･･･

と、ここで･･･

それなら、逆に、Form の方で KeyDown イベントを拾えばいいのではないか？と、ようやく気づき、

procedure TForm1.FormKeyDown(Sender: TObject; var Key: Word;
  Shift: TShiftState);
begin
  if Key in [VK_LEFT, VK_RIGHT, VK_UP, VK_DOWN] then
    Screen.Cursor := crDefault;
end;

さらに、より確実に動作するよう OnKeyUp イベントにも同じ処理を記述します。

procedure TForm1.FormKeyUp(Sender: TObject; var Key: Word; Shift: TShiftState);
begin
  if Key in [VK_LEFT, VK_RIGHT, VK_UP, VK_DOWN] then
    Screen.Cursor := crDefault;
end;

で、Form が他のコントロールより先にキーボードイベントを取得できるように FormCreate 手続きで、KeyPreview: = True を設定しておきます。

procedure TForm1.FormCreate(Sender: TObject);
begin
  KeyPreview:=True;
end;

これで完璧かと思いましたが、Application.OnMessage を使ってグローバルに押されたキーを監視し、矢印キーが押された場合にはマウスのカーソルをデフォルトに戻す処理も追加しておくことにしました。こちらは構造的な意味でも、保守性を高める意味でも Form のメンバーとして記述します。こうしておけば、何年か経って今日の作業内容を完全に忘れてしまった場合でも、Private 宣言部分を参照すれば、何を設定したのかがわかり、メンテナンスしやすいコードにすることができます。

私は、そのような意味から、手続きだけでなく関数も Form のメンバーとして記述するようにしています。むかしは何でもかんでも Form のメンバーにしていたのですが、この Blog を書くようになってから、他から呼び出す必要のない手続きや関数は、「ネストされた手続き（Nested Procedure）」または「ネストされた関数（Nested Function）」として記述することも多くなりました。コードを読むのと、（ Blog の記事用に）コピペするのが楽だからというのが、その主な理由です。

type
  TForm1 = class(TForm)
    ...
  private
    //Application.OnMessage を使ったグローバルキー監視
    procedure AppMessageHandler(var Msg: TMsg; var Handled: Boolean);
  end;

で、Shift + Ctrl + C で手続きを作成し、実装します。

procedure TForm1.AppMessageHandler(var Msg: TMsg; var Handled: Boolean);
begin
  case Msg.message of
    WM_KEYDOWN, WM_KEYUP:
      case Msg.wParam of
        VK_LEFT, VK_RIGHT, VK_UP, VK_DOWN:
          Screen.Cursor := crDefault;
      end;
  end;
end;

最後に、FormCreate で登録しました。

procedure TForm1.FormCreate(Sender: TObject);
begin
  Application.OnMessage := AppMessageHandler;
end;

これで Form がアクティブ（フォーカスがある）な時も、非アクティブ（フォーカスがない）な時も、常にマウスのカーソルをリセットできるようになったはずです。

実行して確認しました！

下向きの矢印キーを押し下げます。ラバーバンドは次の解答欄へ移動します。マウスカーソルの位置はそのままですが、その形状は･･･

余談ですが、このマウスカーソルの形状も含めて画面のハードコピーを取るのはどうしたらいいものかと、今回、少し悩んでしまいました。Windows11の機能のみで行うなら、拡大鏡を固定（？）にして PrintScreen を実行すれば出来るみたいなことを AI が言ってましたが、せっかく Delphi があるんだし、ヒマもあったので、マウスカーソルの形状も含めて画面のハードコピーを取るプログラムを自分で書いてしまいました。後日、機会がありましたら、この Blog でご紹介したいと思います。

５．必要なフォルダがない場合には警告を表示するようになりました！

この解答欄矩形の座標検出プログラムは、ユーザー目線で見ると、ただ１枚の画像だけを扱うプログラムのように見えると思うのですが、実はそうではありません。

画像の傾きを補正して解答欄矩形の座標を取得する機能を追加した段階で、傾きの補正を行った場合には、すべての画像に対して傾き補正を行って上書き保存する処理がどうしても必要になり、採点作業に必要な全画像を処理できるように（１つ前のバージョンで）プログラムを修正しました。

詳しく説明すると、手書き答案の採点補助プログラム（ AC_Reader ）側では、採点前の真っ新な解答用紙画像と、採点データ（採点記号や得点等）を書き込んだ採点済み解答用紙画像の２種類の画像を使用していますので、傾き補正を行った場合は、両方の画像データを補正して上書き保存する必要が生じるわけです。

今回、全面的にプログラムの見直しを行ったわけですが、その中で、あろうことか、採点済み解答用紙画像を保存しておくフォルダ（フォルダ名： MarkedAnswerSheet ）が必ず存在しているという前提でコードを書いていることが判明しました。

もちろん、AC_Reader 側で（正規の･･･というか、私が決めた流れで）画像変換を行って、AC_Reader からこの解答欄矩形の座標を検出するプログラムを呼び出して作業を行う場合は何の問題も生じませんが、単にスキャンした画像を１枚だけ保存した任意のフォルダを指定して、このプログラムを直接単体で実行した場合、採点済み解答用紙画像を保存するフォルダがそもそもありませんから、最初に行う解答用紙画像の選択段階で「確実にエラーが発生」します。

このエラー（というか、正しくは不幸な事故）を防止するために、修正する前のバージョンでも、このプログラムを単体で起動した場合にはパスワードの入力を求めるように設定して、事故を防止する方策としていたわけですが、今回の見直し作業の中で、テスト用の解答用紙画像を作成し、種々の確認作業を行ったところ、作った本人が採点済み解答用紙画像を保存するフォルダの準備を失念してしまい、初めて内在していたこの欠陥に気づいた次第です。

どぉしてこんなにバカなのか･･･

そこで次のように、採点済み解答用紙画像を保存するフォルダがなかった場合には警告を表示するようにプログラムを修正しました。

  //読み込むデータのあるフォルダへのPathを取得して表示
  SrcPath:=ExtractFilePath(imgPath)+'MarkedAnswerSheet';

  //フォルダの存在を確認 -> ない場合は警告してExitする
  if not System.SysUtils.DirectoryExists(SrcPath) then
  begin

    strMsg:='動作に必要なフォルダがありません！'+#13#10+
      'AC_Readerで「画像変換」を行ってから、再度実行してください。'+#13#10+#13#10+
      '処理を中止します。';
    Application.MessageBox(PChar(strMsg), PChar('エラー'), MB_ICONERROR);

    ･･･ 省略 ･･･
    Image1.Picture.Assign(nil);
    Exit;
  end;

５．の記事を書いた真意ですが、このプログラムを単体で起動するとパスワード入力を求められますので、「フリーソフトと言いながら、ふざけんな！」と気分を悪くされた方も、もしかしたらいらっしゃるかもしれないと思い、なぜ、パスワード入力が必要なのか、その本当の理由を記した次第です。

６．常に最大化して実行する設定にしてやっぱりやめました！

解答欄矩形を示すラバーバンドの位置を解答欄上に正しく表示するには、画面は常に最大化して表示する必要があります（最大化表示していないと解答欄矩形とラバーバンドがずれて表示されます）。

こちらの問題も修正しようかとも思いましたが、このプログラムを実行する場合、画面は最大化して作業するのが最も効率がよく、何か他の画面と並べて作業する必要性もないので、Form は常に最大化して表示する設定とし、通常 Form の右上にある最大化及び最小化ボタンは表示しないようにプログラムを変更しました。

また、通常の場合、最大化状態で Form のタイトルバーをクリックしてアクティブにし、そのままタイトルバーをドラッグ＆ドロップすると Window 内の任意の位置へ、設計時の大きさになった Form を移動できますが、上記の理由から、この時やはりラバーバンド位置が解答欄矩形からズレます。これを防止するため、Form のタイトルバーをクリックしてドラッグ＆ドロップする機能は無効化しました。

この Form の設定に使用したコードは、以下の通りです。

  private
    //最初に１回だけ設定を実行するための確認フラグ
    F_FormActivated: Boolean;

    //タイトルバーは残したまま「最大化解除できない」ように設定
    procedure WMSysCommand(var Msg: TWMSysCommand); message WM_SYSCOMMAND;
    procedure WMNCLButtonDown(var Msg: TWMNCLButtonDown); message WM_NCLBUTTONDOWN;

procedure TForm1.FormCreate(Sender: TObject);
begin

  //Formの最大化ボタン及びドラッグ＆ドロップを制御（禁止）する
  F_FormActivated := False;
  //最大化して表示する
  Form1.WindowState := wsMaximized;
  //ここで実行するとFormがタスクバーを覆い隠してしまう -> FormActiveで実行する
  //BorderIcons := [biSystemMenu, biMinimize];

end;

procedure TForm1.FormActivate(Sender: TObject);
begin
  if not F_FormActivated then
  begin
    BorderIcons := [biSystemMenu];
    F_FormActivated := True;
  end;
end;

procedure TForm1.WMNCLButtonDown(var Msg: TWMNCLButtonDown);
begin
  if Msg.HitTest = HTCAPTION then
    Exit; // タイトルバーをドラッグしても動かせない
  inherited;
end;

procedure TForm1.WMSysCommand(var Msg: TWMSysCommand);
begin
  // 「元に戻す」「サイズ変更」を禁止
  if (Msg.CmdType = SC_RESTORE) or (Msg.CmdType = SC_SIZE) then
  begin
    Exit;
  end;
  inherited;
end;

･･･と、ここまで修正（？）したのですが。

ちょっと待て！
おまえ、逃げてない？

･･･みたいな声が聴こえた気がして。(｡>__<｡)

「このプログラムを実行する場合、画面は最大化して作業するのが最も効率がよく、何か他の画面と並べて作業する必要性もない」

それって、言い訳じゃない？

なので、上のような現実逃避的「逃げの一手」みたいな卑怯な方法を取らず、やっぱり、ここも

ちゃんとする！

ことにしました。

取りあえず、上で行った設定を全部解除して･･･

画面を最大化せずに、プログラムを実行してみます。これまで、そのようなことをしたことがなかった（してみようとも思わなかった）ので、こんな欠陥が内在していることに、やはり気づかなかったのです。画面を非最大化した状態で、このプログラムを実行されました皆々さまには、大変なご迷惑をお掛けしたことと思います。こちらにつきましても、心より、こころよりお詫び申し上げます。

１つ前のバージョンを「非最大化」して実行すると･･･（後ろは Delphi の IDE です）

そこで最大化した場合でも、非最大化した場合でも、ラバーバンドが同じ位置に描画されるようにコードを修正しました。次がその修正したつもりのコードです。

procedure TForm1.Memo2Click(Sender: TObject);
var
  i:integer;
  p1,p2:TPoint;

  function RemoveToken(var s:string;delimiter:string):string;
  var
    p:Integer;
  begin
    p:=Pos(delimiter,s);
    if p=0 then Result:=s
    else Result:=Copy(s,1,p-1);
    s:=Copy(s,Length(Result)+Length(delimiter)+1,Length(s));
  end;

  function GetTokenIndex(s:string;delimiter:string;index:Integer):string;
  var
    i:Integer;
  begin
    Result:='';
    for i:=0 to index do
      Result:=RemoveToken(s,delimiter);
  end;

begin

  if not EditTF then
  begin

    //座標を取得
    i:=Memo2.Perform(EM_LINEFROMCHAR, Memo2.SelStart, 0);

    //エラー対策
    if Memo2.Lines[i]='' then Exit;

    x1:=StrToInt(GetTokenIndex(Memo2.Lines[i],',',0));
    y1:=StrToInt(GetTokenIndex(Memo2.Lines[i],',',1));
    x2:=StrToInt(GetTokenIndex(Memo2.Lines[i],',',2));
    y2:=StrToInt(GetTokenIndex(Memo2.Lines[i],',',3));

    if Assigned(plImage1) then begin
      FreeAndNil(plImage1);
    end;

    //コンポーネントを生成し，イベントを定義し，位置を指定して画像を表示
    plImage1:= TplResizeImage.Create(Self);
    plImage1.Parent:= ScrollBox1;
    plImage1.TransEvent:= True;

    //画像内座標
    p1 := Point(x1, y1);
    p2 := Point(x2, y2);
    //クライアント座標 -> スクリーン座標（Image1基準）
    p1 := Image1.ClientToScreen(p1);
    p2 := Image1.ClientToScreen(p2);
    //スクリーン座標 -> フォームのクライアント座標（Form基準）
    p1 := Form1.ScreenToClient(p1);
    p2 := Form1.ScreenToClient(p2);
    //ラバーバンドの座標を設定（フォームのクライアント座標で配置）
    plImage1.SetBounds(p1.X, p1.Y, p2.X - p1.X, p2.Y - p1.Y);

    //SelectedプロパティをTrueにするとラバーバンドとグラブハンドルが表示される
    plImage1.Selected := True;
    plImage1.BringToFront;

  end;

end;

上記コードを実行してみた結果です。最初に画面を最大化して表示した場合･･･

続けて、非最大化（ Window 右上の「最大化ボタン」をクリック）した場合です。最大化ボタンを押して非最大化するというのも、なんともおかしな表現ですが、再度、このボタンをクリックすれば最大化されるので、やはりこれは最大化ボタンでいいのかな？

やはり微妙にズレてはいますが、位置的には先ほどと同じところに描画されています。
なので、半歩前進というところでしょうか？
背景は Delphi の IDE です。

この微妙なズレは、なぜ生じたのでしょうか？　コードを追いかけてみます。

（１）OpenCV の矩形検出機能で読み取った解答欄矩形の座標を TMemo から読み込む。
（２）座標をカンマで切り分けて変数に代入。
（３）Image1.ClientToScreen(　) で、TImage の画像内座標をスクリーン座標に変換。
（４）Form1.ScreenToClient(　) で、スクリーン座標をフォームのクライアント座標に変換。
（５）plImage1.SetBounds(　)で、ラバーバンドの描画位置を指定。
（６）plImage1.Selected := True で、ラバーバンドを描画。

どこにもおかしなところはない気がします。OpenCV が正しく読み取って保存したはずの解答欄矩形の座標の数値が間違っているとは到底思えませんし･･･

何が原因かと言えば、SetBounds 関数に渡した値がズレの原因であることは間違いありません。

SetBounds 関数に渡した値がズレの原因･･･

では、SetBounds 関数は、何の座標系に基づいてラバーバンドを表示しているのか･･･というと、座標系をフォームのクライアント座標に変換して渡しているから、フォームのクライアント座標で描画･･･した結果･･･ それがちょっとズレてしまう･･･

･･･ってコトは、もしかして、僕は･･･変換すべき座標系を間違えて･･･渡して･･･る？

    //コンポーネントを生成し，イベントを定義し，位置を指定して画像を表示
    plImage1:= TplResizeImage.Create(Self);
    plImage1.Parent:= ScrollBox1;
    plImage1.TransEvent:= True;

あ”！

そうだ！解答用紙の画像はデカいから絶対にスクロールが必要で･･･

スクロールの設定でも、いつか、さんざん悩んだけれど。

plImage1 の親は、Form1 じゃなくて･･･

ScrollBox1 ･･･

plImage1 を Image1 の上に重ねて表示したいわけだから、この場合、plImage1.Parent := Image1; とするのが最も自然･･･なんだけれど、Image1 は TGraphicControl なので、子コントロールを持てないから、plImage1 の親は Image1 の親、つまり、ScrollBox1 にしてたんだ･･･。

だから、ラバーバンド（ plImage1 ）は ScrollBox の座標系で描画しないといけない･･･

ここまでわかれば、もう、必要ない気がするけど、念のため、確認。

    //親を確認
    ShowMessage(plImage1.Parent.Name);

表示されたのは･･･（当たり前ですが）

これでズレた原因がはっきりしました。ScrollBox のクライアント座標でラバーバンドを描画すれば、先ほどの微妙なズレは解消されるはずです。

    p1 := Point(x1, y1);
    p2 := Point(x2, y2);
    // クライアント座標 -> スクリーン座標（Image1基準）
    p1 := Image1.ClientToScreen(p1);
    p2 := Image1.ClientToScreen(p2);
    // スクリーン座標 -> plImage1 の親（ScrollBox1）のクライアント座標に変換
    p1 := plImage1.Parent.ScreenToClient(p1);
    p2 := plImage1.Parent.ScreenToClient(p2);
    // ラバーバンド表示（親のクライアント座標系で配置）
    plImage1.SetBounds(p1.X, p1.Y, p2.X - p1.X, p2.Y - p1.Y);

コードを修正して、実行してみました。最初に、全画面表示の場合です。

続いて、非全画面表示の場合です。

たったひとつ、だけ･･･ですが、今回も、よくなれた気がします！

７．最大化から非最大化した際に画面中央にフォームを表示します！

上の６．の記事を書いている時に、もうひとつ気になることが出来てしまいました。それは何かというと、最大化状態から非最大化した際に、Form の右側が画面の外にはみ出した状態で表示されてしまうことです。

「最大化」ボタンはちらっと見えていますが、「閉じる」ボタンは完全に見えません･･･

詳しいことはわかりませんが、この表示位置は私の方で何かした覚えがありませんので、おそらく OS 側で決めているのではないか･･･と思うのですが、やはり、これは何とかしたいところです。

私は普段は「1366×768」サイズに設定したモニターを使ってプログラムを書いています。職場ではもっと高解像度のモニターを与えられていますが、もともと大きさ的に限界のあるノート PC のモニターに必要以上の解像度設定は不要だと思います。若い方ならいざ知らず、年寄りには小さな画面＆高解像度のモニター環境は厳しすぎる気がします。

ちなみに、このプログラムを書くために使用している Panasonic CF-QV は「2880×1920」の解像度が「推奨」設定されています。この高解像度モニターを「1366×768」という「低」解像度に落として使う私は、何か、もったいないコトをしているのでしょうか？

Word や Excel の使用が主、つまりビジネス用途である場合、コストパフォーマンス的にも、バッテリー効率の面から見ても、文字サイズや視認性の点でも、「普通に使いやすい・無理してない」という感覚的な面からも、汎用モニターにおける最適な画面解像度はやはり「1366×768」であると私的には思えてなりませんので、あくまでも独断ですが、私はこのサイズで収まるように GUI を作成しています。

ですので、この解答欄矩形の座標を検出するプログラムも、設計時の Form の幅は･･･

Windows がその気になれば、ギリ！幅1366 ピクセルの画面内に収めて、全体が見えるように表示できるはずなのですが、現実には右側が切れて表示されてしまいます。

自分でなんとかするしか、なさそうです。

で、どうしたか、というと･･･

  private
    { Private 宣言 }

    //「最大化->元に戻す」で画面の中央に表示
    FPrevWindowState: TWindowState;  //Window の状態を取得する
    procedure AdjustFormPosition;  //Form の表示位置を設定

グローバル変数と手続きをひとつずつ宣言して、Shift + Ctrl + C で手続きを実装。

で、通常状態に戻ったときに Form を中央に表示する AdjustFormPosition 手続きは･･･

procedure TForm1.AdjustFormPosition;
var
  WorkArea: TRect;
begin
  //フォームが属しているモニタのワークエリアを取得（マルチモニタ対応）
  WorkArea := Monitor.WorkareaRect;

  //横方向の調整
  if Width < (WorkArea.Right - WorkArea.Left) then
    Left := WorkArea.Left + ((WorkArea.Right - WorkArea.Left) - Width) div 2
  else
    //はみ出す場合は左端に寄せる
    Left := WorkArea.Left;

  //縦方向の調整
  if Height < (WorkArea.Bottom - WorkArea.Top) then
    Top := WorkArea.Top + ((WorkArea.Bottom - WorkArea.Top) - Height) div 2
  else
    //はみ出す場合は上端に寄せる
    Top := WorkArea.Top;

end;

FormCreate 時に、Form の状態を取得しておきます。

procedure TForm1.FormCreate(Sender: TObject);
begin
  //「最大化->元に戻す」で画面の中央に表示
  FPrevWindowState := WindowState;

あとは、Form の OnResize イベントで、前回が最大化で、今回が通常状態なら、Form を中央に表示する処理を行うように設定。

procedure TForm1.FormResize(Sender: TObject);
var
  //for 高さの調整
  MemoHight, btnHight:integer;
begin
  //VCLの高さを調整
  ･･･ 省略 ･･･

  //「最大化->元に戻す」で画面の中央に表示
  //ユーザーが普通にフォームをドラッグして幅や高さを変えた場合を除外
  if (FPrevWindowState = wsMaximized) and (WindowState = wsNormal) then
    AdjustFormPosition;
  FPrevWindowState := WindowState;  //最新の状態を保存
end;

実行して、非最大化時の動作を確認します。

できたー☆

予定した（と言うか、気がついた）修正作業は、全部、無事完了しました！

どなた様も、お待ちになってないことと思いますが･･･

８．ダウンロードのご案内

今回、全面的に不具合を修正しました、この「解答欄矩形の座標を検出するプログラム」と、先日この Blog でご紹介した「自動採点機能みたいなモノを搭載した手書き答案の採点補助プログラム（こちらも様々に内在していた不具合を修正し、Version 3.1.0 としました）」及び「マークシートリーダー」、「採点結果通知表並びに成績一覧表作成プログラム」他を１つにまとめた zip ファイルを下記リンク先からダウンロードすることができます。

使用方法につきましては、下記リンク先の過去記事をご参照ください。

デジタル採点 All in One !

高解像度ディスプレイで、プログラムを実行される場合は、次のリンク先の記事の内容も必要に応じてご参照ください。

高解像度画面で使いやすくするには？

解答欄矩形の座標を検出するプログラムの操作方法の詳しい解説は（旧版用ですが基本的な操作方法はほとんど同じです）次のリンク先記事をご参照ください。

無料で使える手書き答案採点補助プログラム

９．まとめ

あらためて今回の記事の内容を振り返り、これほど多くの不具合が内在していたことに気づかないまま、解答欄矩形の座標検出プログラムを掲載してしまっていたことを、心より深くお詫び申し上げます。

今回の見直しによって多くの問題点を洗い出し、修正することができましたが、もしかすると、まだ発見できていない不具合が残っている可能性も否定できません。

今後、不具合が判明した際には、速やかにこのブログ上でご報告し、修正済みのプログラムが整い次第、あらためてご案内させていただく所存です。今後とも何卒よろしくお願いいたします。

１０．お願いとお断り

高解像度画面で使いやすくするには？

元々、物理的な大きさに制約のあるノートPCなどでは、モニターの解像度が高くなればなるほど、文字は小さくなり、少なくとも私にとっては「使いやすい」とは言い難い環境になります。

高解像度画面での表示例（2880×1920）
私には、文字が小さすぎて詠めません！

この Blog の過去記事で紹介しているデジタル採点関連のアプリケーションは、横1366 × 縦 768 のディスプレイ解像度での利用を前提に開発しておりますので、高解像度環境で使用される場合には、以下の方法で GUI が適切な大きさで表示されるよう、高 DPI 設定を変更してからお使いいただけますよう、お願い申し上げます。

【もくじ】

１．高 DPI 設定の変更方法その１（exe のプロパティを表示）
２．高 DPI 設定の変更方法その２（高DPI設定を変更）
３．高 DPI 設定の変更方法その３（アプリケーションを起動して確認）
４．補足（ DPI 非依存の設計でも発生する問題と対応方法）
５．お願いとお断り

１．高 DPI 設定の変更方法その１（exe のプロパティを表示）

拡張子が exe の実行形式ファイルを右クリックすると表示されるサブメニューから、プロパティを選んでクリックしてください。

お使いの PC の設定によっては、ファイルの拡張子が表示されない場合もあると思います。その場合は、エクスプローラーの画面上部にある「表示」をクリックすると表示されるサブメニューのいちばん下にある「表示」をクリック（ or ポイント）し、横に表示されるサブメニューの「ファイル名拡張子」をクリックしてチェックマークを付けると拡張子が表示されます。

青い枠内をクリックすると図のように「大きい縮小版を使って項目を表示」する設定になります。

２．高 DPI 設定の変更方法その２（高DPI設定を変更）

プロパティの画面が表示されたら、上部のタブの左から２番目にある「互換性」タブをクリックし、表示された画面の「設定」グループにある「高 DPI 設定の変更」ボタンをクリックします。

「〇〇〇.exe の高 DPI 設定」というタイトルの画面が表示されたら、画面下部の「高 DPI スケール設定の上書き」グループの「高い DPI スケールの動作を上書きします。」のチェックボックスをクリックしてチェックし、さらに、その下の「拡大縮小の実行元:」のコンボボックスの選択肢から「システム」をクリックして選択してください。

画面は、次の状態になります。「OK」ボタンをクリックしてください。

元の画面が表示されますので、

「適用」ボタンをクリックしてから、
「OK」ボタンをクリックしてください。

３．高 DPI 設定の変更方法その３（アプリケーションを起動して確認）

高 DPI 設定の変更がアプリケーションに適用されたことを、実際にアプリケーションを起動して確認してください。

高解像度画面（ 2880 × 1920 ）で、「高 DPI 設定の変更」を行った場合の表示例。
「高 DPI 設定の変更」を行わない場合には読めなかった文字が読めるようになりました！

解像度 1366 × 768 での表示例です。上の高解像度での表示に比べ、縦・横とも狭くなっていますが、表示内容は同じです。

AC_Reader は、解像度 1366 × 768 での使用を前提に開発＆動作確認を行っています。

４．補足（ DPI 非依存の設計でも発生する問題と対応方法）

この解説を書いていて、初めて気がついたのですが、Form の Scaled プロパティを False に設定し、さらに、アプリケーション全体がDPIスケーリングを無視する（ DPI 非依存の設計となる）ように .dpr ファイルを開き^※１、Application.Initialize の前に SetProcessDPIAware 関数呼び出し^※２を記述して、実行形式ファイル（ exe ）を作成した場合でも、画面表示方法の設定によっては表示の一部が読めなくなる等の問題が発生することがわかりました。

※１ Delphi IDE の「プロジェクト」メニューから「ソースの表示」を選択すると編集可能になります。
※２ uses に Winapi.Windows が必要なので追加します。

SetProcessDPIAware 関数とは？

Windowsでは、画面の解像度や物理サイズに応じて、UIを自動的に拡大・縮小する「DPIスケーリング」が行われます。
SetProcessDPIAware 関数は、Windows APIの関数で、「このアプリケーションはDPIスケーリングを自分で管理するから、OS側で勝手に拡大・縮小しないでください」と宣言するために使用します。

Delphiでアプリケーション設計時に Form の Scaled プロパティを False に設定していても（デフォルト設定はなぜか True になっているため）、OSがスケーリングを行うと、「ボタンやラベルの位置がズレる・アイコンがぼやける・マウス座標が合わない・描画が乱れる（特に Panel や Canvas）」といった問題が発生します。

SetProcessDPIAware 関数を使うことで、Windowsはスケーリングを一切行わなくなりますので、アプリケーションの描画はピクセル単位で正確に行われるようになり、Delphi側で設計した通りのサイズ・位置・座標が保たれます。

･･･と、思っていたのですが実際にはそうでもないようです（私の知識不足による間違いかもしれません）。

以下、上記の内容を加えた .dpr ファイルです。

program AC_Reader;

{$R *.dres}

uses
  {$IFDEF EurekaLog}
  {$ENDIF EurekaLog}
  Vcl.Forms,
  Unit03_JPEGConvert in 'Unit03_JPEGConvert.pas' {FormConvert},
  Vcl.Themes,
  Vcl.Styles,
  Winapi.Windows,  //SetProcessDPIAware を使うために追加
  UnitSplash in 'UnitSplash.pas' {SplashForm},
  UnitCollaboration in 'UnitCollaboration.pas' {FormCollaboration},
  UnitNoExcel in 'UnitNoExcel.pas' {frmNoExcel};

{$R *.res}

begin
  SetProcessDPIAware;  //DPIスケーリングを自分で管理する（ DPI非依存の設計にする）
  Application.Initialize;
  Application.MainFormOnTaskbar := True;
  Application.CreateForm(TFormCollaboration, FormCollaboration);
  Application.Run;
end.

上の内容でコンパイルして作成したアプリケーションを、実際に高解像度画面（ 2880 × 1920 ）で実行して確認すると･･･（「高 DPI 設定の変更」なし・「ディスプレイの拡大縮小」は 100 ％とした場合です）

画面全体では･･･

文字が小さすぎて、私には読めませんが「表示が乱れている」ことは、なんとなくわかります･･･

右上部分を拡大すると･･･

アプリケーション設計時に Form の Scaled プロパティを False に設定し、SetProcessDPIAware 関数を dpr ファイルに記述しても、実行時の設定が「高 DPI 設定の変更」なし・ディスプレイの拡大縮小 100 ％であった場合に生じるこの問題への正しい対応方法はまったくわかりません（正直に言って、この解像度で GUI を再作成するしかないのではないか？と思いました）。現在、私にある知識と技術で対応可能な限界が見えたように思います。

ただ、この記事でご紹介した上記１～３の手順で「高 DPI 設定の変更」を行って、「高い DPI スケールの動作を上書きします。」のチェックボックスをチェックし、さらに「拡大縮小の実行元:」で「システム」を設定すれば、解像度（ 1366 × 768 ）で設計した通りの画面が表示されるようになりました（下図）。ですので、これがこの問題への「正しい対応方法（？）」なのかもしれません。

高解像度画面（ 2880 × 1920 ）で、「高 DPI 設定の変更」を行った場合の表示例

画面の右側部分を拡大すると･･･

以上の理由から、高解像度モニター（ 2880 × 1920 など）を使用して、当 Blog の過去記事でご紹介したアプリケーションを実行される場合には、大変お手数をおかけし、恐縮ですが、アプリケーションを実行される前に、この記事でご紹介した「高 DPI 設定の変更」を必ず行っていただけますよう、お願い申し上げます。

５．お願いとお断り

PDFファイルの向きを変更したい！

複合機のスキャナーで A3 縦型の原稿をスキャンすると、A3 横置きの PDF ファイルとして出力･･･つまり、縦型原稿は「横向きに回転された状態でデータ化」されます。

A3 縦置き原稿をそのまま（横向きにしないで）スキャンできる（一般ピーポーが使用できる）複合機は、僕が知る限り、多分ないんじゃないか･･･と思います。表示した際の見た目を A3 縦置きにしたい場合は、後で回転させれば事が足りるわけで、A3 縦でも横でもスキャンできるスキャナーは、普通に考えて、その必要性が感じられません。

ただ、その「回転のひと手間」が問題となる場合を除いては･･･

この PDF ファイルを「そのまま印刷して利用する」のであれば、もちろん何も問題など生じませんが、紙媒体でなく、そのまま電子データとして、例えば、重い障害のある方が iPad の Goodnotes で読み込んで利用するような場合、正しい方向に戻す（＝回転させる）ひと手間が（その方から見れば余計に）必要です。

たかが「ひと手間」ですが、この「ひと手間」が「ある」と「ない」とでは、当該 PDF ファイルを受け取った方の「気持ち」は大きく違ってくるのではないでしょうか？

しかも、それが毎回のことになると･･･

そのような観点から、手軽に PDF ファイルの向きを変換して、その状態を保存できるプログラムがないかと探してみたのですが、Web 上にデータをアップロードする必要があったり、例えその問題はクリアできても通信環境によっては、変換に「ちょっと我慢できないくらいの時間」を要したり、はたまたローカル環境 Only で作業できたとしても「単に向きを変換」するだけの工程の手順が、正直、とても使いにくいと感じてしまったり･･･、

「ただ向きを変える」それだけのことで、探し当てたどの方法を使っても、こんなにイライラするのであれば、（自分の知識と技術だけで PDF ファイルの向きを変更するプログラムなど、間違っても書けるわけがありませんので）サードパーティー製（？）ソフトウェアを使わせていただいて PDF ファイルを好きな向きに変更して保存できるプログラムを、自分で書けばいいのではないか？と思った次第です。

幸いなことに、僕の隣には Delphi がいてくれます。無料で使える Python 環境でも、この目標は実現できるともちろん感じましたが、こと GUI を用いて、誰に対しても優しいプログラムを書くなら、やっぱり Delphi です。それより、何より、エラーが出ないプログラム書くなら、絶対 Delphi です。

そんな理由から、PDF ファイルの向きの変換に特化したプログラムを書くことにしました！

【もくじ】

１．PDFtk Server
２．GUI を設計
３．ShellExecute で回転を実行
４．Path の表示方法を改良
５．CreateProcess で回転を実行
６．回転の実際
７．プログラムのダウンロード
８．お願いとお断り

１．PDFtk Server

自分の技術では PDF ファイルの内容をどうこうすることは到底できません。中身がどうなっているのかも、以前、ちょっとだけ勉強したことはあるのですが、今は全部忘れました。でも、他人様のお作りになられたとても良い Tool がたくさん公開されています。PDF ファイル操作のユーティリティは多数ありますが、あれこれダウンロードして実際に試用させていただき、今回は PDFtk Server を使わせていただくことにしました。

この PDFtk Server ですが、プラットフォームは、Windows、macOS、Linux に対応しており、PDF ファイルのマージ・分割・回転・その他、幅広い PDF 操作をコマンドラインで実行できるユーティリティであるとのこと。

この「コマンドラインで実行」する部分を「 GUI 」から実行できるように、Delphi の力を借りて、インターフェイスを作ります。ただ、問題はライセンスです。

PDFtk Server のライセンスは、GNU GPL バージョン2 なので、非商用の個人利用であれば無償で使用可能です。ただし、GPLの下では自分のソフトウェアに PDFtk Server を同梱して、そのソフトウェアを配布する場合には、ソースコードの公開義務などが適用されますので、今回作成するソフトウェアでは PDFtk Server が動作に必要なことを明示して、利用者の責任で PDFtk Server のダウンロードをしていただき、プログラムの動作に必要な環境の整備を行ってもらう形をとりたいと思います。

２．GUI と Path の表示

Delphi の VCL を使えば、（慣れも必要ですが）ほんの数分で次のようなグラフィカル・ユーザー・インターフェイス（GUI）の作成が可能です（図は、プログラム実行時のものです）。

デフォルトでは、Form は最大化して表示されるようにしましたので、手動で幅と高さを変更しました。

操作方法は、回転させたい PDF ファイルを選択して、回転方向を選ぶ（オプションボタンをクリックする）だけです。回転を実行するボタンをクリックしなくても、回転方向を選んだだけで即回転が実行される機能を実現するチェックボックスも用意しました。

【注意】このプログラムは、ページを指定しての回転は実行することができません。

当初、回転した状態のプレビューを表示するような方向性も考えたのですが、たった３パターンの回転しかありませんし、ファイルの保存にもそれほど時間はかからない（何百ページもあるような PDF 文書はそもそも想定外で動作確認しておりませんので、それが必要な場合は利用者様各自の責任で検証作業を行っていただき、その結果に応じました運用をお願い申し上げます）ので、やや乱暴かもしれませんが、プログラムはオプションボタンをクリックするごとに回転を実行し、ファイルを固有の名称で（上書き）保存してしまう仕様としました。

責任逃れというわけではありませんが、処理が継続中であることを示すため、回転処理の手続き実行中は、マウスカーソルが待機状態になるよう try 文を入れてあります。

※ このプログラムでは、諸般の事情から try 文の中で待機状態を設定しています。

procedure TForm1.Button2Click(Sender: TObject);
begin
  //カーソルを待機状態に変更
  Screen.Cursor := crHourGlass;
  try 
    //処理を実行
    ･･･
  finally
    //カーソルを元の状態に変更
    Screen.Cursor := crDefault;
  end;
end;

オプションボタンをクリックした際の手続きは･･･

procedure TForm1.RadioGroup1Click(Sender: TObject);
begin
  Button2.Enabled:=True;
  if CheckBox1.Checked then
  begin
    Button2.Click;
  end;
end;

「回転実行」ボタン（＝Button2）をクリックしたことにしてしまっています。

３．ShellExecute で回転を実行

で、最初に書いた PDF ファイルの回転手続きは･･･

  private
    { Private 宣言 }
    strSrcPDFName, strDstPDFName:string;
    PDFTK_PATH:string;
    //長いPath文字列の途中部分を省略して表示（どのコントロールでも使える汎用版に書き直したコード）
    function FitPathWithMiddleEllipsis(const FilePath: string; AFont: TFont; MaxWidth: Integer): string;

procedure TForm1.Button2Click(Sender: TObject);
var
  InputFile, OutputFile, RotateArg, strCommandLine: string;
begin

  PDFTK_PATH := ExtractFilePath(Application.ExeName)+'pdftk.exe';

  if not FileExists(PDFTK_PATH) then
  begin
    StatusBar1.SimpleText := 'pdftk.exe が見つかりません';
    Exit;
  end;

  InputFile := strSrcPDFName;
  if not FileExists(InputFile) then
  begin
    StatusBar1.SimpleText := 'PDFファイルが存在しません';
    Exit;
  end;

  case RadioGroup1.ItemIndex of
    0: RotateArg := 'west';  // 270°
    1: RotateArg := 'south'; // 180°
    2: RotateArg := 'east';  // 90°
  else
    StatusBar1.SimpleText := '回転方向を選択してください';
    Exit;
  end;

  //OutputFile := strDstPDFName;
  OutputFile := ChangeFileExt(strDstPDFName, '') + '_'+RotateArg+'.pdf';
  strDstPDFName:= OutputFile;

  //コマンド生成
  strCommandLine := Format('"%s" "%s" cat 1-end%s output "%s"', [
    PDFTK_PATH, InputFile, RotateArg, OutputFile
  ]);

  //実行（ダブルクオートでコマンド全体を囲む）
  if ShellExecute(0, 'open', 'cmd.exe', PChar('/C "' + Command + '"'), nil, SW_HIDE) <= 32 then
  begin
    StatusBar1.SimpleText := 'pdftk の実行に失敗しました';
  end else begin
    //長いPath文字列の途中を省略して表示（Create時にStatusBar1.SimplePanel:=True;あり）
    StatusBar1.SimpleText := FitPathWithMiddleEllipsis(
      OutputFile, StatusBar1.Font, StatusBar1.ClientWidth);

    //Application.ProcessMessages;
    Sleep(500); // 0.5秒待機
    //プレビューにPDFを表示（WebBrowser経由）
    WebBrowser1.Navigate('file:///' + StringReplace(OutputFile, '\', '/', [rfReplaceAll]));
  end;
end;

0.5 秒ほど待機時間を入れて、プレビューが失敗しないようにしています。なので、ちょっと処理が重たい感じにはなっちゃってますが、自分的には許容範囲かと･･･。

４．Path の表示方法を改良

この手続きの中で「長い文字列の途中を省略して表示」する FitPathWithMiddleEllipsis 関数を使っていますが、これは前回の記事でご紹介したものをさらに改良したものです。

前回の記事で使った FitPathWithMiddleEllipsis 関数は、TEdit と TLabel のみに対応したものでしたが、今回は StatusBar1 の SimpleText に Path 文字列を表示したかったので、次のように設計を変更し、汎用性を高めた新しい FitPathWithMiddleEllipsis 関数を使いました。

どのように汎用性を高めたかと言うと、つまり、やりたいことは「コントロールの表示幅に合わせた省略文字列を作る」ことだけ！なので、必要なのは「表示フォントと表示幅」です。そのため引数で指定するのは TControl ではなく、（「表示したい文字列」に加え）「Canvas.Font」と「最大幅（ピクセル）」にして、これを（関数側で用意した Canvas へ）渡すようにすれば、コントロール種別への依存をなくせます。こうすればどんな UI コントロールにもこの関数を適用できます。

前回、この関数は単一の手続き内から呼び出せる形式としましたが、今回は複数の手続きから呼び出して利用できるよう、Form のメンバーとして作成しました。

  private
    { Private 宣言 }
    ･･･
    //長いPath文字列の途中部分を省略して表示（どのコントロールでも使える汎用版」に書き直したコード）
    function FitPathWithMiddleEllipsis(const FilePath: string; AFont: TFont; MaxWidth: Integer): string;

関数を Private 部に宣言して、Shift+Ctrl+Cを押して、次の内容を記述します。

function TForm1.FitPathWithMiddleEllipsis(const FilePath: string; AFont: TFont;
  MaxWidth: Integer): string;
var
  Bitmap: TBitmap;
  Canvas: TCanvas;
  Ellipsis: string;
  DirPart, FilePart, DrivePart: string;
  Parts: TArray<string>;
  i, LeftCount, RightCount: Integer;
  TestPath: string;

  function MeasureTextWidth(const S: string): Integer;
  begin
    Result := Canvas.TextWidth(S);
  end;
begin
  Bitmap := TBitmap.Create;
  try
    Canvas := Bitmap.Canvas;
    Canvas.Font.Assign(AFont);

    Ellipsis := '...'+PathDelim;

    //全部入る場合
    if MeasureTextWidth(FilePath) <= MaxWidth then
      Exit(FilePath);

    //ファイル部分とディレクトリ部分を分離
    FilePart := ExtractFileName(FilePath);
    DirPart  := ExtractFilePath(FilePath);
    DrivePart := ExtractFileDrive(FilePath);

    //パスのディレクトリ部分を分解（ドライブ部分は除外）
    Parts := DirPart.Substring(Length(DrivePart) + 1).Split([PathDelim], TStringSplitOptions.ExcludeEmpty);

    //初期状態は全部表示
    TestPath := IncludeTrailingPathDelimiter(DirPart) + FilePart;

    //左右を削っていくアプローチ
    LeftCount := 0; //先頭から残すディレクトリ数
    RightCount := Length(Parts); //後ろから残すディレクトリ数

    while (LeftCount < Length(Parts)) and (MeasureTextWidth(TestPath) > MaxWidth) do
    begin
      Inc(LeftCount);
      TestPath := DrivePart + PathDelim;

      if LeftCount > 0 then
        TestPath := TestPath + Parts[0] + PathDelim;

      if LeftCount < Length(Parts) then
        TestPath := TestPath + Ellipsis;

      if RightCount > 0 then
      begin
        for i := Length(Parts) - RightCount to High(Parts) do
          if i >= 0 then
            TestPath := TestPath + Parts[i] + PathDelim;
      end;

      TestPath := TestPath + FilePart;
      Dec(RightCount);
      if RightCount < 0 then RightCount := 0;
    end;

    //収まる長さで返す
    Result := TestPath;

    //それでも収まらなければ中央省略だけで返す
    if MeasureTextWidth(Result) > MaxWidth then
    begin
      Result := Copy(FilePath, 1, 1) + '...' + Copy(FilePath, Length(FilePath), 1);
    end;

  finally
    Bitmap.Free;
  end;
end;

で、TEdit に表示したい場合は･･･

Edit1.Text:= FitPathWithMiddleEllipsis(strSrcPDFName, Edit1.Font, Edit1.ClientWidth);

TStatusBar に表示したい場合は･･･

StatusBar1.SimpleText := FitPathWithMiddleEllipsis(
      strDstPDFName, StatusBar1.Font, StatusBar1.ClientWidth);

ちなみに、ここで使っている TStatusBar は、次のように FormCreate 手続きで SimplePanel := True に設定しています。

procedure TForm1.FormCreate(Sender: TObject);
begin
  StatusBar1.SimplePanel := True;
  //Formを最大化して表示(幅も最大化される)
  Form1.WindowState:=wsMaximized;
end;

SimplePanel := True としていない場合は･･･（この場合の動作は未確認です！）

StatusBar1.SimpleText := 
  FitPathWithMiddleEllipsis(strDstPDFName, StatusBar1.Font, StatusBar1.Panels[0].Width);

･･･でしょうか？

さらに（今回のプログラムでは使用していませんが）TLabel に表示したい場合は･･･

Label1.Caption := FitPathWithMiddleEllipsis(strDstPDFName, Label1.Font, Label1.Width);

この関数に「表示したい文字列」と「コントロールのFont」と「コントロールの幅」を引数として渡してあげれば（余程コントロールの幅が狭くならない限り）末尾のファイル名と拡張子が見えるように Path の途中を省略する形で、長い Path 文字列を表示してくれます。

実行してみました！

長い Path が途中 … と省略され、末尾のファイル名と拡張子部分は表示されています。

コントロールが異なると、パスの区切り文字の表記が￥マークと \（バックスラッシュ）になるのは、それぞれのコントールの Font の違いによるものと思われます･･･。

５．CreateProcess で回転を実行

プログラムの設計当初、PDF ファイルの回転処理は先に記載した通り ShellExecute で実行していたのですが、プログラムの動作検証を行った際、200ページ以上ある PDF ファイルを回転元ファイルに指定したら、回転に失敗してしまいました。

ShellExecute では、何が起きて回転に失敗してしまったのかが皆目わかりませんので、原因を究明すべく、回転処理の実行（ PDFtk Server の呼び出しと実行部分）を CreateProcess に変更し、エラーが発生した場合はメッセージを PDFtk Server から取得して表示できるよう、次のようにプログラムを修正しました。

  private
    { Private 宣言 }
    //PDFtkでコマンドを実行
    function RunPdftk(const ExePath, Params: string; out OutputStr: string): Boolean;

procedure TForm1.Button2Click(Sender: TObject);
var
  InputFile, OutputFile, RotateArg: string;
  Params, Msg:string;
  strMsg: string;
begin

  //カーソルを待機状態に変更
  Screen.Cursor:=crHourGlass;

  //CreateProcessで実行

  try
    PDFTK_PATH := ExtractFilePath(Application.ExeName) + 'pdftk.exe';

    if not FileExists(PDFTK_PATH) then
    begin
      StatusBar1.SimpleText := 'pdftk.exe が見つかりません';
      Exit;
    end;

    InputFile := strSrcPDFName;
    if not FileExists(InputFile) then
    begin
      StatusBar1.SimpleText := 'PDFファイルが存在しません';
      Exit;
    end;

    case RadioGroup1.ItemIndex of
      0: RotateArg := 'west';  // 270°
      1: RotateArg := 'south'; // 180°
      2: RotateArg := 'east';  // 90°
    else
      StatusBar1.SimpleText := '回転方向を選択してください';
      Exit;
    end;

    OutputFile := ChangeFileExt(strDstPDFName, '') + '_' + RotateArg + '.pdf';
    strDstPDFName := OutputFile;

    //end%sが正しい（end %sとしないこと:半角スペースは不要）
    Params := Format('"%s" cat 1-end%s output "%s"', [
      InputFile, RotateArg, OutputFile
    ]);

    if RunPdftk(PDFTK_PATH, Params, Msg) then
    begin
      StatusBar1.SimpleText := FitPathWithMiddleEllipsis(
        OutputFile, StatusBar1.Font, StatusBar1.ClientWidth);

      if Msg.Trim <> '' then
      begin
        //ShowMessage('pdftk 出力: ' + Msg);
        //コピーできるメッセージを表示する
        strMsg:= 'pdftk 出力: ' + Msg + #13#10 + #13#10 +
        '"Copied to clipboard"';
        //Clipboard.AsText := strMsg;  // クリップボードにコピー
        Clipboard.AsText := Msg;
        //ShowMonospaceMessage(strMsg);
        //ShowMessage(strMsg);
        Application.MessageBox(PChar(strMsg), PChar('エラー'), MB_ICONERROR);
      end;

      Sleep(500);
      WebBrowser1.Navigate('file:///' + StringReplace(OutputFile, '\', '/', [rfReplaceAll]));
    end
    else
    begin
      StatusBar1.SimpleText := 'pdftk の実行に失敗しました';
      if Msg.Trim <> '' then
        ShowMessage('エラー詳細: ' + Msg);
    end;
  finally
    //名前を元に戻しておく！
    strSrcPDFName := OpenDialog1.FileName;
    strDstPDFName := StringReplace(strSrcPDFName, 'SrcPDF', 'DstPDF', [rfReplaceAll, rfIgnoreCase]);
    Screen.Cursor := crDefault;
  end;

end;

function TForm1.RunPdftk(const ExePath, Params: string;
  out OutputStr: string): Boolean;
var
  SI: TStartupInfo;
  PI: TProcessInformation;
  SA: TSecurityAttributes;
  StdOutRead, StdOutWrite: THandle;
  Buffer: array[0..1023] of Byte;
  BytesRead: DWORD;
  OutputBytes: TBytes;
  CmdLine: string;
begin
  //Result := False;
  OutputStr := '';

  if not FileExists(ExePath) then
    raise Exception.CreateFmt('実行ファイルが見つかりません: %s', [ExePath]);

  ZeroMemory(@SA, SizeOf(SA));
  SA.nLength := SizeOf(SA);
  SA.bInheritHandle := True;

  if not CreatePipe(StdOutRead, StdOutWrite, @SA, 0) then
    RaiseLastOSError;
  try
    try
      SetHandleInformation(StdOutRead, HANDLE_FLAG_INHERIT, 0);

      ZeroMemory(@SI, SizeOf(SI));
      SI.cb := SizeOf(SI);
      SI.dwFlags := STARTF_USESHOWWINDOW or STARTF_USESTDHANDLES;
      SI.wShowWindow := SW_HIDE;
      SI.hStdOutput := StdOutWrite;
      SI.hStdError := StdOutWrite;

      ZeroMemory(@PI, SizeOf(PI));

      CmdLine := Format('"%s" %s', [ExePath, Params]);

      if not CreateProcess(
        nil, PChar(CmdLine), nil, nil, True,
        CREATE_NO_WINDOW, nil, nil, SI, PI) then
        RaiseLastOSError;

      CloseHandle(StdOutWrite);

      SetLength(OutputBytes, 0);
      repeat
        if not ReadFile(StdOutRead, Buffer, SizeOf(Buffer), BytesRead, nil) then
          Break;
        if BytesRead > 0 then
        begin
          //W1024 符号付型と符号無し型の演算による、オペランドの拡張」と警告される
          //SetLength(OutputBytes, Length(OutputBytes) + BytesRead);
          //対策１:BytesRead を明示的に Integer にキャストする
          SetLength(OutputBytes, Length(OutputBytes) + Integer(BytesRead));
          //対策２:Length を NativeInt にキャストする（より安全か？）
          //SetLength(OutputBytes, NativeInt(Length(OutputBytes)) + NativeInt(BytesRead));

          //W1024 符号付型と符号無し型の演算による、オペランドの拡張」と警告される
          //Move(Buffer[0], OutputBytes[Length(OutputBytes) - BytesRead], BytesRead);
          //対策１:BytesRead を明示的に Integer にキャストする
          Move(Buffer[0], OutputBytes[Length(OutputBytes) - Integer(BytesRead)], BytesRead);
        end;
      until BytesRead = 0;

      WaitForSingleObject(PI.hProcess, INFINITE);
      CloseHandle(PI.hProcess);
      CloseHandle(PI.hThread);

      if Length(OutputBytes) > 0 then
        OutputStr := TEncoding.UTF8.GetString(OutputBytes);

      Result := True;

    except
      on E: Exception do
      begin
        OutputStr := E.Message;
        Result := False;
      end;
    end;
  finally
    CloseHandle(StdOutRead);
  end;
end;

PDFtk Server の実行は、RunPdftk 関数側で行っています。

こうして CreateProcess での PDFtk Server の呼び出しに実行方法を変更し、何か問題が発生した場合には PDFtk Server 側からのエラーメッセージを取得して表示するようにできました。早速、先ほど回転に失敗した巨大な PDF ファイルを再度指定して、回転を実行してみました。

【わかったことその①】

１つめは、問題の発生というより、正しくは、エラーの「真」の原因です。

ぎぎぎ

（効果音的歯軋り）

僕は、ただ、PDF を回転させようと･･･思っただけ･･･なのですが、さんざん･･･ほんとに散々苦労してたどり着いた真実は･･･

想像を遥かに絶するものでありました。

回転対象の PDF ファイルには、なんとパスワードが設定･･･されていて当然でした。

･･･と言うのも、もっともな理由があります。

正直に言うと、PDF ファイルを回転させるという今回のプログラムの動作検証に際し、手近に巨大な PDF ファイルが「なかった」ので、Web から簡単に入手できる巨大 PDF ファイルはないか？と考え、思いをめぐらしたところ、すぐに思いついたのが「もう10年以上愛用しているプリンターの取扱説明書」でありました･･･ので、さっそく愛用の〇〇〇社製プリンターの取扱説明書を Web から笑顔でダウンロード（何回目かなー？）して、この回転実験に使ったまではよかったのですが･･･、10年も使ったんだから許してもらえるだろうとわけのわかんないことを言い訳に、ラクしようとしたバチが当たったようです（思いついた時は･･･実に！いい思いつきだと思ったのですが）。やはり、その動機が不純すぎました。

でも･･･よく考えればこの「オーナーパスワード設定」があるのは当然です。取扱説明書、『なんでもできますー！！』みたいに勝手に書き換えられたら、それこそたいへんなコトになりますから･･･。

いやはや、これはもう･･･

手の出しようがないエラーでした！！

ま、原因がわかれば、わからないよりイイです（T_T）

ほとんど、七転八倒＋四苦八苦＆いつも四面楚歌ばかり聞こえる人生（＝ほぼ被害妄想）ですが、その中で学んだ最重要事項『転んでもタダでは起きるな』を、ここでもまた実践するのみです。

ぐやぐや　なんじをいかんせん･･･

よくよく考えれば･･･（よくよく考えなくても･･･）

【わかったことその②】

今回はタマタマ「手の出しようがないエラー」だったからよかった ♪ ものの、これが「手の出しようがある」エラーだった場合、OK をクリックする前に、エラーメッセージを暗記するか、「文字列」として写し取る（＝メモする）必要があります。しかし、紙等に写し取るのは（自分的には）激しく面倒ですし、それより何より、このエラーメッセージはドラッグ等して、そのままクリップボードへコピーすることが、ShowMessage 関数の仕様上、出来ません！！

ちなみに、暗記はさらに無理です。

（そうだ。そのままコピペできたら･･･）

それこそ、全プログラマーの悲願です。

そう･･･

The universal wish of programmers.

それはまた･･･

The ultimate goal of all programmers.

そして、それこそは･･･

Every programmer’s long-cherished dream !

まさに、それを実現するべき時こそ、『今』です。

で、つくったのがコレ！

TMemo を Form に置いて Align := alClient としているだけですが･･･

もちろん、OK その他のボタンは、見渡すかぎり、どこにもありません。が･･･ボタンがないかわりに･･･

Delphi すごぉーイ！

（ GUI が作れる全言語で、問題なく作成可能と思われますが･･･）

OK ボタン~~なんて、どうせあってもただクリックするだけなんですから、そ~~の代替機能は Form 右上の「閉じる」ボタンにおまかせして、それよりエラーの原因テキストのコピペが出来れば、この際よしとしようではありませんか、皆さん！

僕は、もちろん「よし」としました☆

次が、その「エラーの原因メッセージをコピーできるようにする」コードです（表示する Form の幅と高さも自動で調整して表示するようにしてありますが、必要に応じて手動でさらに調整することも可能です）。

  private
    { Private 宣言 }
    strSrcPDFName, strDstPDFName:string;
    PDFTK_PATH:string;
    //PDFにオーナーパスワードがかかっているか調べる関数
    function IsOwnerPasswordRequired(const PdfPath, PdftkPath: string; out Output: string): Boolean;

procedure TForm1.Button1Click(Sender: TObject);
var
  OwnerPwdNeeded: Boolean;
  strMsg: string;
  strOutPut: string;

  //コピー可能なエラーメッセージを表示
  procedure ShowMonospaceMessage(const Msg: string);
  var
    Form: TForm;
    Memo: TMemo;
    CharWidth, CharHeight, MaxLineLength, LinesCount, I: Integer;
    MarginWidth, MarginHeight: Integer;
    Canvas: TCanvas;
  begin
    Form := TForm.Create(nil);
    try
      Form.Caption := 'The Real Truth Behind The Error!';
      Form.Position := poScreenCenter;

      Memo := TMemo.Create(Form);
      Memo.Parent := Form;
      Memo.Align := alClient;
      Memo.Lines.Text := Msg;
      Memo.ReadOnly := True;
      Memo.Font.Name := 'Consolas';
      Memo.Font.Size := 10;

      Form.HandleNeeded;
      Canvas := Form.Canvas;
      Canvas.Font.Assign(Memo.Font);

      CharWidth := Canvas.TextWidth('M');
      CharHeight := Canvas.TextHeight('M');

      MaxLineLength := 0;
      for I := 0 to Memo.Lines.Count - 1 do
        if Length(Memo.Lines[I]) > MaxLineLength then
          MaxLineLength := Length(Memo.Lines[I]);

      LinesCount := Memo.Lines.Count;

      //必要に応じて手動で Form の幅と高さを調整
      MarginWidth := 100;
      MarginHeight := 40;

      Form.ClientWidth := CharWidth * MaxLineLength + 10;
      Form.ClientHeight := CharHeight * LinesCount + 10;

      Form.Width := Form.ClientWidth + MarginWidth;
      Form.Height := Form.ClientHeight + MarginHeight;

      Form.ShowModal;
    finally
      Form.Free;
    end;
  end;

begin

  //ここで待機状態にしてもカーソルがすぐ元に戻ってしまう。
  //Screen.Cursor := crHourGlass;

  try
    ･･･ イロイロ設定 ･･･
    if OpenDialog1.Execute then
    begin
      ･･･ イロイロ設定 ･･･
      Screen.Cursor := crHourGlass;
      Application.ProcessMessages;
      try
        OwnerPwdNeeded := IsOwnerPasswordRequired(strSrcPDFName, PDFTK_PATH, strOutPut);
        if OwnerPwdNeeded then
        begin
          Screen.Cursor := crDefault;  // 必ず戻す
          strMsg := 'このPDFにはオーナーパスワードが設定されています。' + sLineBreak +
            strOutPut + sLineBreak +
            '処理を中止します。';
          ShowMonospaceMessage(strMsg);
          Exit;
        end;
      except
        on E: Exception do
        begin
          Screen.Cursor := crDefault;  // 必ず戻す
          strMsg := 'エラー: ' + E.Message;
          ShowMonospaceMessage(strMsg);
          Exit;
        end;
      end;
      ･･･ イロイロ設定 ･･･
    end;

  finally
    Screen.Cursor := crDefault;
  end;
end;

function TForm1.IsOwnerPasswordRequired(const PdfPath, PdftkPath: string; out Output: string): Boolean;
var
  CmdLine: string;
begin
  Result := False;

  if not FileExists(PdfPath) then
    raise Exception.Create('PDFファイルが存在しません。');

  if not FileExists(PdftkPath) then
    raise Exception.Create('pdftk.exeが見つかりません。');

  //pdftkのdump_dataコマンドでPDF情報を取得
  CmdLine := Format('"%s" "%s" dump_data', [PdftkPath, PdfPath]);

  if RunCommandAndGetOutput(CmdLine, Output) then
  begin
    //オーナーパスワードが必要ならエラーメッセージに含まれることが多い
    if Pos('OWNER PASSWORD REQUIRED', UpperCase(Output)) > 0 then
      Result := True;
  end
  else
    raise Exception.Create('pdftkの実行に失敗しました。');
end;

まぁ、イロイロありましたが、エラーメッセージだけはコピペできるようになりました☆

てか、ここでふと思ったのですが、
何もそこまでしなくても、Clipboard.AsText を使って、単に

uses
  Vcl.Clipbrd;

  strMsg := 'このPDFにはオーナーパスワードが設定されています。' + sLineBreak +
    strOutPut + sLineBreak +
    'クリップボードにエラーの内容を送信して、処理を中止します。';
  Clipboard.AsText:= strMsg;        // クリップボードにコピー
  ShowMessage(strMsg);
  Exit;

･･･としておいて、これを実行すれば、

「OK」をクリックして、メモ帳に貼り付けてみました。

より、短く･･･

Clipboard.AsText := strOutPut;

なら･･･

Delphi 12 Athens 以降では、 MessageDlg 関数で「警告」と「エラー」以外のアイコンが表示されなくなってしまいました。この Blog の過去記事にも書きましたが、これは Microsoft 社の UI ガイドライン変更に準拠した仕様変更によるものらしいのですが、ある日、突然、それまでずっと使い続けてきた MessageDlg 関数から「 i 」などのアイコンが消えてしまったあの時の衝撃、何か大切なものを失ったような、たまらない寂寥感が胸に広がったことを今も MessageDlg という文字を見る度に思い出します。

別に Microsoft 様の UI ガイドライン変更に反旗を翻すというような大それた意図はなく、ただメッセージにアイコンを表示したくてたまらなかった僕は必死で MessageDlg 関数の代替手段を探し、Application.MessageBox 関数がまだ生きていることを知って狂喜乱舞したのでした。･･･なので、最終的には、やっぱりいちばんのお気に入り Application.MessageBox 関数で･･･

  strMsg := 'このPDFにはオーナーパスワードが設定されています。' + sLineBreak +
    strOutPut + sLineBreak +
    'クリップボードにエラーの内容を送信して、処理を中止します。';
  Clipboard.AsText := strOutPut;
  Application.MessageBox(PChar(strMsg), PChar('エラー'), MB_ICONERROR);

だから、これが、僕の本当の理想かな？

･･･

最終的にと言いながら、独自性にこだわって、それでもやっぱり TMemo も「コピー」ボタンも必要なんだという場合には･･･

    { Private 宣言 }
    strMsg: string;
    procedure GetErrorMessage(Sender: TObject);

implementation

uses
  Vcl.Clipbrd;

{$R *.dfm}

procedure TForm1.Button2Click(Sender: TObject);
var
  dlg: TForm;
  btnCopy, btnClose: TButton;
  memoMsg: TMemo;
begin

  //エラーメッセージ
  strMsg := 'Error: Failed to open PDF file:' + sLineBreak +
            'C:\Users\XXX\Win32\Release\SrcPDF\TEST.PDF' + sLineBreak +
            'OWNER PASSWORD REQUIRED, but not given (or incorrect)' + sLineBreak +
            'Done.  Input errors, so no output created.';

  dlg := TForm.Create(nil);
  try
    dlg.Caption := 'メッセージ';
    dlg.Width := 400;
    dlg.Height := 240;
    dlg.Position := poScreenCenter;

    memoMsg := TMemo.Create(dlg);
    memoMsg.Parent := dlg;
    memoMsg.Left := 20;
    memoMsg.Top := 20;
    memoMsg.Width := dlg.ClientWidth - 40;
    memoMsg.Height := 120;
    memoMsg.ReadOnly := True;
    memoMsg.ScrollBars := ssVertical;
    memoMsg.Lines.Text := strMsg;

    btnCopy := TButton.Create(dlg);
    btnCopy.Parent := dlg;
    btnCopy.Caption := 'コピー';
    btnCopy.Left := 80;
    btnCopy.Top := 160;
    btnCopy.OnClick := GetErrorMessage;

    btnClose := TButton.Create(dlg);
    btnClose.Parent := dlg;
    btnClose.Caption := '閉じる';
    btnClose.Left := 200;
    btnClose.Top := 160;
    btnClose.ModalResult := mrClose;

    dlg.ShowModal;
  finally
    dlg.Free;
  end;
end;

procedure TForm1.GetErrorMessage(Sender: TObject);
begin
  Clipboard.AsText := strMsg;
end;

上のようにすれば･･･

やっぱりアイコンがないと･･･という場合は、さらに

uses
  Vcl.Clipbrd, Vcl.ExtCtrls;

procedure TForm1.Button3Click(Sender: TObject);
var
  dlg: TForm;
  btnCopy, btnClose: TButton;
  memoMsg: TMemo;
  imgIcon: TImage;
begin
  strMsg := 'Error: Failed to open PDF file:' + sLineBreak +
            'C:\Users\XXX\Win32\Release\SrcPDF\TEST.PDF' + sLineBreak +
            'OWNER PASSWORD REQUIRED, but not given (or incorrect)' + sLineBreak +
            'Done.  Input errors, so no output created.';

  dlg := TForm.Create(nil);
  try
    dlg.Caption := 'エラー';
    dlg.Width := 420;
    dlg.Height := 260;
    dlg.Position := poScreenCenter;

    //アイコン追加
    imgIcon := TImage.Create(dlg);
    imgIcon.Parent := dlg;
    imgIcon.Left := 20;
    imgIcon.Top := 20;
    imgIcon.Width := 32;
    imgIcon.Height := 32;
    imgIcon.Picture.Icon.Handle := LoadIcon(0, IDI_ERROR); // Windows標準エラーアイコン

    //メモ表示
    memoMsg := TMemo.Create(dlg);
    memoMsg.Parent := dlg;
    memoMsg.Left := imgIcon.Left + imgIcon.Width + 10;
    memoMsg.Top := 20;
    memoMsg.Width := dlg.ClientWidth - imgIcon.Width - 50;
    memoMsg.Height := 120;
    memoMsg.ReadOnly := True;
    memoMsg.ScrollBars := ssVertical;
    memoMsg.Lines.Text := strMsg;

    //コピーボタン
    btnCopy := TButton.Create(dlg);
    btnCopy.Parent := dlg;
    btnCopy.Caption := 'コピー';
    btnCopy.Left := 80;
    btnCopy.Top := 160;
    btnCopy.OnClick := GetErrorMessage;

    //閉じるボタン
    btnClose := TButton.Create(dlg);
    btnClose.Parent := dlg;
    btnClose.Caption := '閉じる';
    btnClose.Left := 200;
    btnClose.Top := 160;
    btnClose.ModalResult := mrClose;

    dlg.ShowModal;
  finally
    dlg.Free;
  end;
end;

上のコードを実行すれば･･･

なんだか、記事の内容が本来意図した方向とずいぶん逸れてしまいました。なので、このへんで元に戻ります。

６．回転の実際

はるか上の方で、すでに示していますが、実際に PDF の回転を行った様子です。
結論から言えば、「ただ、コレがしたかった･･･だけ」なのですが、今回もまた、なんか凄くたくさんのことに出会った気がします･･･。

最初に、左へ回転した場合です。

次に、上下反転です。

最後に、右へ回転した場合です。

連続して回転させることは、このプログラムでは考えておりません。･･･と言うか、このプログラムの仕様上、その必要性がありません。また、元の PDF ファイルは、これまたプログラムの仕様上、無加工で Src フォルダに残っていますので、「元に戻す」処理も、このプログラムには、もちろんありません。

７．プログラムのダウンロード

あくまでも自分用に作ったものですが、PDFtk Server 関連のファイルを除いたプログラム一式を以下からダウンロードできます。なお、ダウンロードとご使用にあたっては、免責事項及び使用条件への同意が必要です。免責事項及び使用条件の詳細は付属の License.txt 及び Readme.txt をご覧ください。

また、動作には PDFtk Server が必要です。

PDFtk Server のダウンロードサイト :https://www.pdflabs.com/tools/pdftk-server/

上記 Web サイトより、ダウンロードした pdftk_server-2.02-win-setup.exe をダブルクリックして起動すると、デフォルト設定では C:\Program Files (x86)\PDFtk Server にインストールが行われます。

PDFtk Server の利用にあたり、動作やライセンス内容についての詳細は、必ず公式サイトおよびライセンス文書をご確認ください。

インストール後、C:\Program Files (x86)\PDFtk Server\bin にある pdftk.exe を PDF_Rotator.exe があるPDF_Rotator フォルダ内へコピーしてください。

【プログラムが正常動作するために必要なフォルダ構成です】

PDF_Rotator\
　├ DstPDF
　├ SrcPDF
　├ PDF_Rotator.exe
　├ pdftk.exe
　├ License.txt
　└ Readme.txt

PDF_Rotator フォルダは、下記リンク先からダウンロードできる PDF_Rotator.zip を展開すると生成されます。

回転させたい PDF ファイルは必ず SrcPDF フォルダ内に準備してください。なお、プログラムは起動時に SrcPDF フォルダ及び DstPDF フォルダの有無を調査し、それらが存在しない場合は exe と同じ階層に自動的に SrcPDF フォルダ及び DstPDF フォルダを生成します。予めご承知おきください。

PDF_Rotator.exe をダブルクリックして起動後、回転させたい PDF ファイルを選択し、回転方向を指定してください。デフォルト設定では、回転方向の指定と同時に PDF ファイルの回転と保存が行われます。回転後の PDF ファイルは、左へ回転した場合は「元のファイル名_west.pdf」、上下反転した場合は「元のファイル名_south.pdf」、右へ回転した場合は「元のファイル名_east.pdf」のように北を上とした場合の方角が付加されて DstPDF フォルダ内に保存されます。

PDFファイルの回転ユーティリティ

1 ファイル 1.05 MB

ダウンロード

マウスだけで操作可能な画面の拡大表示ツール “KindLens” のご紹介

８．お願いとお断り

また、pdftk.exe 他、PDFtk Server 関連のファイルを同梱した状態での PDF_Rotator.exe の再配布を禁じます。PDF_Rotator.exe を再配布される場合は、PDFtk Server 関連のファイルはすべて削除し、PDF_Rotator.zip に添付した License.txt 及び Readme.txt を必ず添付してください。

MTSファイルをMP4に変換したい！

仕事で SD カードに保存した MTS ファイルを扱う機会が増えました。使い終わったら不要なファイルは即消去しますが、後日再び利用するものは、わりと自由に使える NAS に MTS 形式のままコピー（＝保存）していた･･･のですが、さすがに数が増えてくると（このままでいいのかなー）みたいな気が。

ファイルサイズが 10 GB を超えてくると、SD カードから NAS へコピーするにしても時間がかかるし、再利用する際に使うのはノート PC なので、ファイル容量に見合うほど高画質でなくても構わないはずですし、それより何より、休日、何もすることがなくてヒマ なので、MTS 形式の動画ファイルをより容量の小さい MP4 形式に変換するプログラムを書いてみることにしました。

てか、何よりも、ほんとはずっと、前から、やってみたかった･･･こと。なので･･･ *(^_^)*♪

動作には別途 FFmpeg.exe が必要です。
（ FFmpeg.exe は MTStoMP4.zip に同梱しておりません）

【もくじ】

１．MTS って何？
２．MP4 に変換
３．動作確認用のコード
４．プログレスバーも表示
５．文字列の一部を省略（…）して表示
６．プログラムのダウンロード
７．まとめ
８．お願いとお断り

１．MTS って何？

まずは、ここから勉強します。

ソニー・パナソニックが共同開発した高画質動画を効率よく記録するための仕様がAVCHD（Advanced Video Codec High Definition）で、この方式で記録された動画ファイルの実体が MTS ファイルなんだそうです。

MTS は、MPEG Transport Stream の略で、主にビデオカメラで録画した高画質動画を保存するためのファイルとして利用されており、このファイルの映像部分で使用される圧縮方式（コーデック）が高画質かつ高圧縮の H.264 であるとのこと。

一言で言うと、MTS は、H.264で圧縮された動画を保存する「入れ物（ファイル形式）」のひとつで、映像の他に音声や字幕などの情報も一緒に保存されているファイルコンテナ。

ファイルコンテナと言えば思い浮かぶのは、JR の貨物列車です。

MTS や MP4 の詳しい仕組みについては、まったくわかりませんが、貨物列車に様々な色や形のコンテナが積載されているように、映像や音声を各ファイルそれぞれの方法で乗っけていることだけは理解できます。その載せ方の工夫次第で、貨物の重さや列車の長さが変わってくるということなのでしょう。

２．MP4 に変換

もちろん、わざわざ自分でプログラムなんて書かなくても、MTS ファイルを MP4 ファイルに変換する方法はいくらでもあります。有名なところでは、無料で使える「HandBrake」がありますし、さらに身近なところでは、Windows10 / 11のフォトでも変換できるようです。^※

^※ 僕は HandBrake は実際に使ったことがありますが、フォトでの変換は試したことがありません。

今回やってみたかったのは、これまた有名な「 FFmpeg 」（動画処理のツール）を使ったファイルコンテナの変換プログラムの作成です。前にも書きましたが、どうせヒマだし、FFmpeg は以前にもいろんなところで使ったことがあって、「期待通りに動作した記憶しかない」ので、今回もきっとうまく行く♪と思えたことと、それより何より Delphi で「なんかしてないと落ち着かない」のです（＝これはきっと、僕の心の病です）。

３．動作確認用のコード

最初の一歩は、FFmpeg のダウンロードと準備。

ダウンロードサイト : https://ffmpeg.org/download.html

上記リンク先の「Get packages & executable files」にある Windows のマーク上をポイント（or クリック）すると表示される「Windows builds from gyan.dev」のリンク先ページからダウンロードすればよいのですが、いろいろな FFmpeg があって迷いました。

まず、「git master builds」と「release builds」いずれを選択すればいいのか？

今回の使用目的は、最新の機能のテストとか、そんなんじゃなくて、とにかく安定して動作するバージョンが欲しいので、「release builds」の方を選択。

で、latest release を見ると、選択肢が４つ。

・ffmpeg-release-essentials.7z
・ffmpeg-release-essentials.zip
・ffmpeg-release-full.7z
・ffmpeg-release-full-shared.7z

Essentials は、Win7 以降の OS に対応した最小限の機能のみを搭載した軽量な FFmpeg で、Full は全機能搭載のWin10 以降用、Full Shared は、Full の DLL 版とのこと。

ここで重要になってくるのがライセンスです。

FFmpeg は、ビルド種別によりそのライセンスが異なります。最もライセンス的に無難な選択は、LGPL v2.1+ が適用される「Release Essentials Build（LGPLビルド）」だと思います。

LGPL v2.1+は、「 FFmpeg を改変せずにそのまま使い、アプリとは動的リンク（ exe を呼び出す方式）で接続（＝ユーザーが FFmpeg を差し替えられるように設定）し、FFmpeg のライセンス表記を Readme.txt 等に表示」すれば商用利用も可能で、クローズドソースでも OK というライセンス形態なので、今回作成したいプログラムでは、勉強を兼ね、公開に耐えうる仕様とするため「ffmpeg-release-essentials.zip」をダウンロードして、アプリケーションの exe と同じ場所にffmpeg という名前のフォルダを作成し、zip ファイルを展開した内容を一式コピペして、プログラムから FFmpeg.exe を直接呼び出して利用したいと思います。

具体的なフォルダとファイルの構成（位置関係）は、次の通りです。

MTStoMP4\
　├ Dst
　├ FFmpeg\bin\ffmpeg.exe
　├ Src
　├ Readme.txt
　└ MTStoMP4.exe

早速、次の GUI を Delphi で作成しました。

実際には「変換実行」ボタンをクリックするとプログレスバーを表示して変換作業の進捗状況を可視化する予定なのですが、そこに行きつく前に FFmpeg の動画変換機能を使えるようにならないといけません。なので、取り敢えず、「テスト」ボタンを準備し、そのクリックイベントの中で、コマンドプロンプトを表示して変換の動作確認を行えるようなテスト用のプログラムを書いてみます。

まず、変換元のファイルを選択する部分（ファイル選択ボタンをクリックした場合）の手続きの作成から始めました。

Form 上に TOpenDialog をひとつ準備して、次のコードを書きます。変換元の MTS 形式の動画ファイルは、exe と同じ場所に Src という名前のフォルダを作成して、そこに保存しておく前提です。また、変換先のファイルは、こちらも exe と同じ場所に Dst という名前のフォルダを作成し、そちらへ拡張子に mp4 を指定して書き出すよう、予め、変換先ファイルパスとして準備（ Label のキャプションとして表示）しておきます。このように設定したのは、FFmpeg は変換先ファイルの拡張子を見て自動的に出力フォーマットを判別する仕様だからです。

procedure TForm1.Button1Click(Sender: TObject);
begin
  OpenDialog1.Filter := '動画ファイル (*.MTS;*.mp4;*.avi;*.mkv)|*.MTS;*.mp4;*.avi;*.mkv|すべてのファイル (*.*)|*.*';
  OpenDialog1.Title := '動画ファイルを選択してください';
  OpenDialog1.InitialDir:=ExtractFilePath(Application.ExeName)+'Src';
  if OpenDialog1.Execute then
  begin
    Edit1.Text:=OpenDialog1.FileName;
    Label1.Caption:=ExtractFilePath(Application.ExeName)+
      'Dst\'+ChangeFileExt(ExtractFileName(OpenDialog1.FileName), '')+'.mp4';
  end;
end;

上記コードの動作を確認します。実行時の画面は次の通りです。

思った通りに動作しました☆
まぁ、ここはそんなに難しいところではありませんが、「幸先よし」と感じます。

ただ、ちょっと気になったのが変換元ファイルの Path 文字列が長くて TEdit からはみ出している部分です。ここは後からなんとかしたいと思います。

変換に際して指定できるパラメータは３つです。

１つめが CRF 値です。CRF は Constant Rate Factor の略で、これは動画の品質を一定に保ちつつ、ファイルサイズを自動的に調整するために設定するパラメータで、0 ～ 51 までの数値で指定します。数値が小さいほど高画質ですがファイルサイズも大きくなり、数値が大きいほど低画質になりますがファイルサイズは小さくなります。デフォルトで使用する値は 23 のようです。

２つめがプリセット指定で、これは FFmpeg の H.264（ libx264 ）エンコーダーで使われる「圧縮処理の速度と効率のバランス」を設定するパラメータです。エンコードの速度（＝処理時間）と圧縮効率（＝ファイルサイズ）のトレードオフを制御します。

ultrafast → superfast → veryfast → faster → fast → medium（デフォルト） → slow → slower → veryslow → placebo の 10 段階の設定が可能で、より右側のパラメータほど処理速度が増加し、ファイルサイズは小さくなります（逆に言えば、左側のパラメータほど処理速度が速く、ファイルサイズは大きくなります）。すべてを試すヒマはないので、取りあえず medium で動作確認することにします。

３つめが AudioBitrate で、これは１秒あたりの音声のデータ量を指定する値です。もちろん、値が大きいほど音質が良くなりますが、ファイルサイズも大きくなります。単位は kbps（キロビット毎秒）です。

で、様々な問題点をクリアしながら最終的に完成したのが次のコードです。動作状況の確認が目的なので、ShellExecute 関数の引数には /K を指定してコマンドプロンプトが自動で閉じないようにしています。また、上記３つのパラメータはわかりやすさを優先し、コード内で直接「値」を指定しています。

procedure TForm1.ButtonXClick(Sender: TObject);
var
  FFmpegPath, Command: string;
  AudioBitrate, VideoCRF: Integer;
  strPreset: string;
  InputFile, OutputFile: string;
begin
  //明示的にエスケープ（'ffmpeg\bin\ffmpeg.exe' の中の \b が「バックスペース」として扱われる危険を排除）
  FFmpegPath :=
    IncludeTrailingPathDelimiter(ExtractFilePath(Application.ExeName)) + 'ffmpeg\\bin\\ffmpeg.exe';

  //もしくは PathDelim を使う
  //FFmpegPath := IncludeTrailingPathDelimiter(ExtractFilePath(Application.ExeName))
  //            + 'ffmpeg' + PathDelim + 'bin' + PathDelim + 'ffmpeg.exe';

  //ファイルパスを安全な形式（8.3形式）で取得
  InputFile := ExtractShortPathName(Edit1.Text);
  //ExtractShortPathName関数は存在しないファイルを指定すると空文字列を返すことに注意する。
  //変換先の mp4形式の動画ファイルはプログラムの実行後に生成され、実行時には存在しない！
  OutputFile := Label1.Caption;

  //CRF（0～51）
  VideoCRF := 23;

  //プリセット（ultrafast, superfast, medium, slow, veryslow など）
  strPreset := 'slow';

  //数値の変数（単位はkbps）
  AudioBitrate := 192;

  //-ac 2 を追加して、5.1ch → 2ch ステレオ に変換して出力
  //5.1ch（サラウンド）をうまく処理できない場合があるようです。
  //この場合、変換された mp4ファイルが無音になってしまいます（ハマりました）。
  Command := Format(
    '"%s" -i "%s" -map 0:v -map 0:a -vcodec libx264 -acodec aac -ac 2 -b:a %dk -crf %d -preset %s -y "%s"',
    [FFmpegPath, InputFile, AudioBitrate, VideoCRF, strPreset, OutputFile]
  );

  //コマンドはダブルクォートで囲む（コマンド全体を1つの文字列として渡す）
  ShellExecute(0, 'open', 'cmd.exe', PChar('/K "' + Command + '"'), nil, SW_SHOWNORMAL);

end;

特に、最後の ShellExecute 関数で、Command 部分をダブルクォートで囲む処理を忘れると･･･

原因がわかってしまえば（なぁーんだ）みたいな問題ですが、（私は）なかなか原因がわからなくて、解決までにちょっと時間を要しました。Command 部分をダブルクォートで囲むのを忘れてもコンパイルは通るので、ここはコーディング上の要注意部分です。

また、実行パスに全角文字が含まれている場合でも動作することを確認しましたが、より安定した動作を実現するためには CreateProcess を使って直接実行した方が良いはずです。なので、本番の処理では CreateProcess を使う方法をとることにします（加えて、FFmpeg の処理の進捗状況をプログレスバーに表示する処理も実装しなければいけません）。

CreateProcess を使った場合の、単なる動作確認用コードは、次の通りです。

procedure TForm1.ButtonXXClick(Sender: TObject);
var
  FFmpegPath, CmdLine, InputFile, OutputFile: string;
  AudioBitrate, VideoCRF: Integer;
  strPreset: string;
  StartInfo: TStartupInfo;
  ProcInfo: TProcessInformation;
begin
  //明示的にエスケープ（'ffmpeg\bin\ffmpeg.exe' の中の \b が「バックスペース」として扱われる危険を排除）
  FFmpegPath := IncludeTrailingPathDelimiter(ExtractFilePath(Application.ExeName)) + 'ffmpeg\\bin\\ffmpeg.exe';

  //入力・出力ファイル
  InputFile := ExtractShortPathName(Edit1.Text);
  OutputFile := Label1.Caption;

  if (InputFile = '') or (OutputFile = '') then
  begin
    ShowMessage('入力または出力ファイルのパスが無効です');
    Edit1.SetFocus;
    Exit;
  end;

  //エンコード設定
  VideoCRF := 23;
  strPreset := 'slow';
  AudioBitrate := 192;

  //コマンドライン
  CmdLine := Format(
    '"%s" -i "%s" -map 0:v -map 0:a -vcodec libx264 -acodec aac -ac 2 -b:a %dk -crf %d -preset %s -y "%s"',
    [FFmpegPath, InputFile, AudioBitrate, VideoCRF, strPreset, OutputFile]
  );

  ZeroMemory(@StartInfo, SizeOf(StartInfo));
  StartInfo.cb := SizeOf(StartInfo);
  StartInfo.dwFlags := STARTF_USESHOWWINDOW;
  StartInfo.wShowWindow := SW_SHOW;  // 非表示にするなら SW_HIDE

  ZeroMemory(@ProcInfo, SizeOf(ProcInfo));

  if not CreateProcess(
    nil,               //アプリケーション名（CmdLine 内に含まれるので nil）
    PChar(CmdLine),    //コマンドライン（実行ファイルと引数を含む）
    nil, nil,          //セキュリティ属性
    False,             //ハンドル継承
    CREATE_NEW_CONSOLE,  //新しいコンソールで実行
    nil,               //環境変数
    nil,               //カレントディレクトリ
    StartInfo,         //スタートアップ情報
    ProcInfo           //プロセス情報（プロセスIDなど）
  ) then
  begin
    ShowMessage('CreateProcess に失敗しました: ' + SysErrorMessage(GetLastError));
    Exit;
  end;

  //処理の終了まで待ってから後始末＆その他の処理を実行する場合は有効化する
  //ただし、有効化すると、タイトルバーに「応答なし」と表示されるなど動作が重くなる気が。
  //FFmpegに処理を渡すだけなら待機不要とした方が軽快動作？
  //WaitForSingleObject(ProcInfo.hProcess, INFINITE);

  //後始末
  CloseHandle(ProcInfo.hProcess);
  CloseHandle(ProcInfo.hThread);
end;

【ご注意願います】

もくじの「５．文字列の一部を省略（…）して表示」の処理を実行（設定）した場合は、Edit1.Text や Label1.Caption の値を参照せず、グローバル変数に保存した省略のない Path 文字列を参照するようにコードを修正する必要があります（参考コードは後述）。どうか、ご注意ください。

４．プログレスバーも表示

FFmpegは実行中に、標準出力（stdout）や標準エラー（stderr）にログを出力するので、このログを利用して処理の進捗状況（フレーム数、時間、速度など）等を取得することが可能です。

なので、Delphi で CreateProcess を利用して FFmpeg を起動する際に、標準出力・標準エラーをパイプで受け取るように設定すれば、ログをリアルタイムで取得でき、これに基づいてプログレスバーで処理の進捗状況を表示することができます。

PC に詳しい方なら次のような画面が表示され、より詳細な変換処理の進捗状況が見えた方が安心かもしれませんが、この背景が真っ黒な画面にあまり馴染みのない方にとっては、この画面よりもプログレスバーに進捗状況が表示されるという、より単純な GUI による表示の方が安心できるのではないでしょうか？（私は、本質的に難しいことが苦手なので、そのように感じてしまいます）

CreateProcess でファイルコンテナの変換を実行中
（StartInfo.wShowWindow := SW_SHOW;）

なので、動作確認後は StartupInfo.wShowWindow := SW_HIDE を指定し、コマンドプロンプト画面は非表示に設定、その代わりにプログレスバーを表示して、変換処理の進捗状況を表示します。

（変換処理の進捗状況を表示する方法は後述）

StatusBar に ProgressBar を埋め込む方法もありますが･･･
それはスペース的に余裕のない場合のお話。

今回の場合、「終了」ボタンと「変換実行」ボタンの間が空いていますので、ProgressBar はここに設置することにします。

さて、問題は進捗状況を表示する機能の実装です。

調べて見ると、FFmpeg は進行状況（Duration: …, time=…など）を標準エラー（stderr）に出力する仕様のようでした。この進行状況の出力先が標準エラー（stderr）となっている理由は、 FFmpeg は「標準出力（stdout）」を、エンコード結果（映像などのバイナリ）をパイプ出力する用途にも使うため、ここにログを混ぜると混乱が生じる恐れがあり、ログ類は意図的にすべて stderr に分離して出力する仕様となっているとのことでした。

また、デフォルト設定のままログを出力すると多くの情報が入り混じって流れてくるので、経過時間等の取得したい情報が探しにくくなってしまいます。

そこで、出力されるログを行単位で処理し、進捗状況を表示するためのキーワードを正確に検出できるようにしました。

具体的には、FFmpeg に渡すコマンドラインの中で -progress pipe:1 を指定して意図的にログ出力が標準出力（ stdout ）へ為されるようにして、ここに key=value 形式で送られてくるログ出力中の「out_time=」という文字列を探して経過時間の情報を得ています。

上記内容を実装する具体的手順です。

まず、パラメータ設定を含めて FFmpeg に渡すコマンドラインを作成する部分です。

  FFmpegPath:=IncludeTrailingPathDelimiter(ExtractFilePath(Application.ExeName)) + 'ffmpeg\\bin\\ffmpeg.exe';

  //CRF（0～51）
  //VideoCRF:= 23;
  VideoCRF:=StrToInt(ComboBox1.Text);

  //プリセット
  //strPreset:= 'slow';
  strPreset:= ComboBox2.Text;

  //音声の処理
  //AudioBitrate:= 192;
  AudioBitrate:= StrToInt(ComboBox3.Text);

  //-ac 2 を追加して、5.1ch → 2ch ステレオ に変換して標準出力（stdout）に出力
  //InputFile, OutputFile はこの手続きを呼び出す際に指定
  CmdLine:= Format(
    '"%s" -i "%s" -map 0:v -map 0:a -vcodec libx264 -acodec aac -ac 2 -b:a %dk -crf %d -preset %s -y -progress pipe:1 "%s"',
    [FFmpegPath, InputFile, AudioBitrate, VideoCRF, strPreset, OutputFile]
  );

動作状況を確実に確認するため、Form に TMemo を１つ追加して、この TMemo にログ出力内容を表示してみます。次は、そのテストを行った際の画像です。

ここで記録されたログの最初の方に MTS ファイルの再生（録画）時間が出力されています。実際に取得したログを下に示します。Duration 部分が再生（録画）時間です。

Input #0, mpegts, from 'C:\Users\XXX\Win32\Release\Src\SampleDoga.mts':  Duration: 00:18:58.21, start: 2165.015522, bitrate: 15843 kb/s

この再生（録画）時間の出力と out_time の値を利用して、プログレスバーに進捗状況を表示します。以下、プログレスバーに進捗状況を表示する部分のコードです。

  LogBuffer := '';
  DurationInSec := 0;

  repeat
    FillChar(Buffer, SizeOf(Buffer), 0);
    if ReadFile(StdOutRead, Buffer, SizeOf(Buffer) - 1, BytesRead, nil) and (BytesRead > 0) then
    begin
      LogBuffer := LogBuffer + string(Copy(Buffer, 0, BytesRead));

      //改行で分割して処理
      Lines := LogBuffer.Split([#10, #13], TStringSplitOptions.ExcludeEmpty);
      if Length(Lines) > 0 then
      begin
        for i := 0 to High(Lines) - 1 do
        begin
          Line := Trim(Lines[i]);

          //ログ出力内容を確認
          Memo1.Lines.Add(Line);

          if (DurationInSec = 0) and (Pos('Duration:', Line) > 0) then
          begin
            TotalDurationStr := Copy(Line, Pos('Duration:', Line) + 9, 12);
            DurationInSec := TimeStringToSeconds(Trim(TotalDurationStr));
          end;

          if Pos('out_time=', Line) > 0 then
          begin
            TimeStr := Copy(Line, Pos('out_time=', Line) + 9, 11);
            CurrentTimeInSec := TimeStringToSeconds(Trim(TimeStr));

            if DurationInSec > 0 then
            begin
              ProgressBar.Position := Min(100, Round((CurrentTimeInSec / DurationInSec) * 100));
              Application.ProcessMessages;
            end;
          end;
        end;
        LogBuffer := Lines[High(Lines)];
      end;
    end;
  until WaitForSingleObject(ProcessInfo.hProcess, 10) = WAIT_OBJECT_0;

上記コード内で、「時刻文字列を秒数に変換」する TimeStringToSeconds 関数を呼び出していますが、この関数は以下のように、別に準備しておきます。

  function TimeStringToSeconds(const TimeStr: string): Double;
  var
    h, m, s: Integer;
    secFrac: Double;
    Parts: TArray<string>;
  begin
    Result := 0;
    Parts := TimeStr.Split([':']);
    if Length(Parts) < 3 then Exit;

    h := StrToIntDef(Parts[0], 0);
    m := StrToIntDef(Parts[1], 0);
    s := Trunc(StrToFloatDef(Parts[2], 0));
    secFrac := Frac(StrToFloatDef(Parts[2], 0));

    Result := h * 3600 + m * 60 + s + secFrac;
  end;

「変換実行」ボタンをクリックした際の手続き全体のコードです。

procedure TForm1.ButtonXClick(Sender: TObject);

  function TimeStringToSeconds(const TimeStr: string): Double;
  var
    h, m, s: Integer;
    secFrac: Double;
    Parts: TArray<string>;
  begin
    Result := 0;
    Parts := TimeStr.Split([':']);
    if Length(Parts) < 3 then Exit;

    h := StrToIntDef(Parts[0], 0);
    m := StrToIntDef(Parts[1], 0);
    s := Trunc(StrToFloatDef(Parts[2], 0));
    secFrac := Frac(StrToFloatDef(Parts[2], 0));

    Result := h * 3600 + m * 60 + s + secFrac;
  end;

  procedure RunFFmpegWithProgressBar(const InputFile, OutputFile: string; ProgressBar: TProgressBar);
  var
    SecurityAttr: TSecurityAttributes;
    StdOutRead, StdOutWrite: THandle;
    StartupInfo: TStartupInfo;
    ProcessInfo: TProcessInformation;
    Buffer: array[0..1023] of AnsiChar;
    LogBuffer: string;
    Lines: TArray<string>;
    Line: string;
    BytesRead: DWORD;
    DurationInSec, CurrentTimeInSec: Double;
    CmdLine: string;
    TotalDurationStr, TimeStr: string;
    FFmpegPath: string;
    AudioBitrate, VideoCRF: Integer;
    strPreset: string;
    i: Integer;
  begin

    //初期化
    ProgressBar.Min := 0;
    ProgressBar.Max := 100;
    ProgressBar.Position := 0;

    //パイプの準備
    SecurityAttr.nLength := SizeOf(SecurityAttr);
    SecurityAttr.bInheritHandle := True;
    SecurityAttr.lpSecurityDescriptor := nil;

    if not CreatePipe(StdOutRead, StdOutWrite, @SecurityAttr, 0) then
      RaiseLastOSError;

    ZeroMemory(@StartupInfo, SizeOf(StartupInfo));
    StartupInfo.cb := SizeOf(StartupInfo);
    StartupInfo.hStdError := StdOutWrite;
    StartupInfo.hStdOutput := StdOutWrite;
    StartupInfo.dwFlags := STARTF_USESTDHANDLES or STARTF_USESHOWWINDOW;
    StartupInfo.wShowWindow := SW_HIDE;

    //Pathを設定
    FFmpegPath:=IncludeTrailingPathDelimiter(ExtractFilePath(Application.ExeName)) + 'ffmpeg\\bin\\ffmpeg.exe';

    //各パラメータの設定（値は参考）

    //VideoCRF:= 23;
    VideoCRF:=StrToInt(ComboBox1.Text);

    //プリセット（例: ultrafast, superfast, medium, slow, veryslow など）
    //strPreset:= 'slow';
    strPreset:= ComboBox2.Text;

    //AudioBitrate:= 192;
    AudioBitrate:= StrToInt(ComboBox3.Text);

    //-ac 2 を追加して、5.1ch → 2ch ステレオ に変換して出力（My環境ではこうしないと無音になる！）
    CmdLine:= Format(
      '"%s" -i "%s" -map 0:v -map 0:a -vcodec libx264 -acodec aac -ac 2 -b:a %dk -crf %d -preset %s -y -progress pipe:1 "%s"',
      [FFmpegPath, InputFile, AudioBitrate, VideoCRF, strPreset, OutputFile]
    );

    if not CreateProcess(nil, PChar(CmdLine), nil, nil, True,
      CREATE_NO_WINDOW, nil, nil, StartupInfo, ProcessInfo) then
    begin
      CloseHandle(StdOutRead);
      CloseHandle(StdOutWrite);
      RaiseLastOSError;
    end;

    CloseHandle(StdOutWrite);

    LogBuffer := '';
    DurationInSec := 0;

    repeat
      FillChar(Buffer, SizeOf(Buffer), 0);
      if ReadFile(StdOutRead, Buffer, SizeOf(Buffer) - 1, BytesRead, nil) and (BytesRead > 0) then
      begin
        LogBuffer := LogBuffer + string(Copy(Buffer, 0, BytesRead));

        //改行で分割して処理
        Lines := LogBuffer.Split([#10, #13], TStringSplitOptions.ExcludeEmpty);
        if Length(Lines) > 0 then
        begin
          for i := 0 to High(Lines) - 1 do
          begin
            Line := Trim(Lines[i]);

            //ログ出力内容を確認
            //Memo1.Lines.Add(Line);

            if (DurationInSec = 0) and (Pos('Duration:', Line) > 0) then
            begin
              TotalDurationStr := Copy(Line, Pos('Duration:', Line) + 9, 12);
              DurationInSec := TimeStringToSeconds(Trim(TotalDurationStr));
            end;

            if Pos('out_time=', Line) > 0 then
            begin
              TimeStr := Copy(Line, Pos('out_time=', Line) + 9, 11);
              CurrentTimeInSec := TimeStringToSeconds(Trim(TimeStr));

              if DurationInSec > 0 then
              begin
                ProgressBar.Position := Min(100, Round((CurrentTimeInSec / DurationInSec) * 100));
                Application.ProcessMessages;
              end;
            end;
          end;
          LogBuffer := Lines[High(Lines)];
        end;
      end;
    until WaitForSingleObject(ProcessInfo.hProcess, 10) = WAIT_OBJECT_0;

    CloseHandle(StdOutRead);
    CloseHandle(ProcessInfo.hProcess);
    CloseHandle(ProcessInfo.hThread);

  end;

begin

  //変換元ファイルの指定がない場合は、処理しない
  if Edit1.Text='' then
  begin
    Edit1.SetFocus;
    Exit;
  end;

  //プログレスバーを表示
  ProgressBar1.Visible:=True;
  try
    //MTS -> MP4変換
    RunFFmpegWithProgressBar(Edit1.Text, Label1.Caption, ProgressBar1);
  finally
    //非表示にする
    ProgressBar1.Visible:=False;
  end;

end;

私の手持ち機材で録画した MTS ファイルを MP4 ファイルへ変換する作業は、･･･安定動作するまでに様々な紆余曲折はありましたが、最終的に上のコードで問題なく動作するようになりました。･･･が、（日々進化する）使用機材とPC環境により、録画＆録音の環境は、その利用者により当然異なると思います。

例えば、私の環境では、音声は 5.1ch → 2ch として「品質を低下」させないと生成された MP4 には音声が入らないというトラブル（？）がありました。

//-ac 2 を追加して、5.1ch → 2ch ステレオ に変換して出力
CmdLine:= Format(
      '"%s" -i "%s" -map 0:v -map 0:a -vcodec libx264 -acodec aac -ac 2 ･･･

ですので、上記コードがあらゆる録画＆録音設定に対応できるものでは『ない』ことに十分ご留意いただけますよう、心からお願い申し上げます。万一、上記コードを流用される場合、環境によっては、様々な不具合が生じることが予想されます。その場合は、利用者各自の責任でコードに適切な修正または改良を加えていただけますよう、お願い申し上げます。

５．文字列の一部を省略（…）して表示

【追記_20250815】

この記事で紹介している「文字列の一部を省略（…）して表示」するコードの Path 版には、さらに改良したコードがあります。

PDFファイルの向きを変更したい！

Delphiでは（他の言語についてはさらに知りませんが）、TEditやTLabelに長い文字列を表示した時、コントロールの幅より文字列の長さが長いと文字列の後半が切れて表示されてしまいます。そうならないように自動的に長い文字列の中央よりの一部を … のように省略して表示する機能はデフォルトの状態では準備されていないようです（間違っていたらすみません）。

この機能を実装してみました。設定可能なコントロールは TEdit と TLabel です。コンポーネント化する方法もあるかと思いますが、より簡単に、関数として実装しました。

最初に、非 Path 文字列用の場合です。

次に、フォルダ名部分はなるべく残す Path 文字列専用バージョンです。

TEdit のText や TLabel の Caption を参照したい場合に備えて、省略していない Path 文字列をグローバル変数に保存しておきます。必要な場合は Edit1.Text や Label1.Caption ではなく、グローバル変数から Path 文字列を取得して利用します。コードは次の通りです。

  private
    { Private 宣言 }
    //省略していない Path 文字列をグローバル変数に保存
    SrcFileName, DstFileName:string;

implementation

uses
  Winapi.ShellAPI,
  System.Math;

{$R *.dfm}

procedure TForm1.Button1Click(Sender: TObject);
var
  SelectedFile: string;
  strMsg: string;

  //表示する文字列の長さの自動調整
  //非Path用
  function FitTextWithMiddleEllipsis(TargetControl: TControl; const Text: string): string;
  var
    Bitmap: TBitmap;
    Canvas: TCanvas;
    MaxWidth: Integer;
    LeftPart, RightPart: string;
    Ellipsis: string;
    i, j: Integer;
    CharWidth: Double;
    InitKeep: Integer;
  begin
    Bitmap := TBitmap.Create;
    try
      Canvas := Bitmap.Canvas;

      if TargetControl is TLabel then
        Canvas.Font := TLabel(TargetControl).Font
      else if TargetControl is TEdit then
        Canvas.Font := TEdit(TargetControl).Font
      else
        raise Exception.Create('Font にアクセスできないコントロールです。');

      MaxWidth := TargetControl.Width;
      Ellipsis := '...';

      //全部入るならそのまま返す
      if Canvas.TextWidth(Text) <= MaxWidth then
        Exit(Text);

      //1文字あたりの平均幅を計算
      if Length(Text) > 0 then
        CharWidth := Canvas.TextWidth(Text) / Length(Text)
      else
        CharWidth := Canvas.TextWidth('W');

      // 残せる文字数を幅から概算（両端合計）
      InitKeep := Trunc((MaxWidth - Canvas.TextWidth(Ellipsis)) / CharWidth);

      // 左右で半分ずつ残す
      if InitKeep < 2 then InitKeep := 2; //最低1文字ずつ残すため
      i := InitKeep div 2;
      j := Length(Text) - (InitKeep - i) + 1;

      //徐々に調整して収まる長さを探す
      while (i >= 1) and (j <= Length(Text)) do
      begin
        LeftPart := Copy(Text, 1, i);
        RightPart := Copy(Text, j, Length(Text) - j + 1);
        Result := LeftPart + Ellipsis + RightPart;

        if Canvas.TextWidth(Result) <= MaxWidth then
          Exit(Result);

        Dec(i);
        Inc(j);
      end;

      //最後の手段：1文字ずつ残す
      if Length(Text) >= 2 then
        Result := Copy(Text, 1, 1) + Ellipsis + Copy(Text, Length(Text), 1)
      else
        Result := Ellipsis;

    finally
      Bitmap.Free;
    end;
  end;

  //Path用
  function FitPathWithMiddleEllipsis(TargetControl: TControl; const FilePath: string): string;
  var
    Bitmap: TBitmap;
    Canvas: TCanvas;
    MaxWidth: Integer;
    Ellipsis: string;
    DirPart, FilePart, DrivePart: string;
    Parts: TArray<string>;
    i, LeftCount, RightCount: Integer;
    TestPath: string;

    function MeasureTextWidth(const S: string): Integer;
    begin
      Result := Canvas.TextWidth(S);
    end;

  begin
    Bitmap := TBitmap.Create;
    try
      Canvas := Bitmap.Canvas;

      if TargetControl is TLabel then
        Canvas.Font := TLabel(TargetControl).Font
      else if TargetControl is TEdit then
        Canvas.Font := TEdit(TargetControl).Font
      else
        raise Exception.Create('Font にアクセスできないコントロールです。');

      MaxWidth := TargetControl.Width;
      Ellipsis := '...\';

      //全部入る場合
      if MeasureTextWidth(FilePath) <= MaxWidth then
        Exit(FilePath);

      //ファイル部分とディレクトリ部分を分離
      FilePart := ExtractFileName(FilePath);
      DirPart  := ExtractFilePath(FilePath);
      DrivePart := ExtractFileDrive(FilePath);

      //パスのディレクトリ部分を分解（ドライブ部分は除外）
      Parts := DirPart.Substring(Length(DrivePart) + 1).Split([PathDelim], TStringSplitOptions.ExcludeEmpty);

      //初期は全部表示してみる
      TestPath := IncludeTrailingPathDelimiter(DirPart) + FilePart;

      //左右を削っていくアプローチ
      LeftCount := 0; // 先頭から残すディレクトリ数
      RightCount := Length(Parts); // 後ろから残すディレクトリ数

      while (LeftCount < Length(Parts)) and (MeasureTextWidth(TestPath) > MaxWidth) do
      begin
        //最初の方のディレクトリを省略（中央に Ellipsis）
        Inc(LeftCount);
        TestPath := DrivePart + PathDelim;

        if LeftCount > 0 then
          TestPath := TestPath + Parts[0] + PathDelim;

        if LeftCount < Length(Parts) then
          TestPath := TestPath + Ellipsis;

        if RightCount > 0 then
        begin
          for i := Length(Parts) - RightCount to High(Parts) do
            if i >= 0 then
              TestPath := TestPath + Parts[i] + PathDelim;
        end;

        TestPath := TestPath + FilePart;
        Dec(RightCount);
        if RightCount < 0 then RightCount := 0;
      end;

      //収まる長さで返す
      Result := TestPath;

      //それでも収まらなければ中央省略だけで返す
      if MeasureTextWidth(Result) > MaxWidth then
      begin
        Result := Copy(FilePath, 1, 1) + '...' + Copy(FilePath, Length(FilePath), 1);
      end;

    finally
      Bitmap.Free;
    end;
  end;

begin
  OpenDialog1.Filter := 'MTS ファイル (*.MTS)|*.MTS|すべてのファイル (*.*)|*.*';
  OpenDialog1.Title := 'MTS 形式の動画ファイルを選択してください';
  //ofFileMustExist:ファイルが存在していなければ選択できない
  //ofHideReadOnly:読み取り専用チェックボックスを非表示にする
  OpenDialog1.Options := [ofFileMustExist, ofHideReadOnly];
  OpenDialog1.InitialDir:=ExtractFilePath(Application.ExeName)+'Src';

  if OpenDialog1.Execute then
  begin
    //ShowMessage('選ばれたファイルは: ' + OpenDialog1.FileName);
    //拡張子をチェック
    SelectedFile := OpenDialog1.FileName;
    //拡張子を小文字で取得して比較
    if not SameText(ExtractFileExt(SelectedFile), '.mts') then
    begin
      strMsg:='選択されたファイルは .MTS ファイルではありません。処理を中止します。';
      Application.MessageBox(PChar(strMsg), PChar('エラー'), MB_ICONERROR);
      Edit1.Text:='';
      Button1.SetFocus;
      Exit; // 以降の処理をキャンセル
    end;

    //変数内には正しい文字列が保存されている
    SrcFileName:=OpenDialog1.FileName;
    DstFileName:=ExtractFilePath(Application.ExeName)+'Dst\'
      +ChangeFileExt(ExtractFileName(OpenDialog1.FileName), '')+'.mp4';

    //短く表示_非Path用
    //Edit1.Text:= FitTextWithMiddleEllipsis(Edit1, SrcFileName);
    //Label1.Caption:= FitTextWithMiddleEllipsis(Label1, DstFileName);

    //短く表示_Path表示用に特化
    Edit1.Text:= FitPathWithMiddleEllipsis(Edit1, SrcFileName);
    Label1.Caption:= FitPathWithMiddleEllipsis(Label1, DstFileName);

  end;
end;

６．プログラムのダウンロード

FFmpeg 関連のファイルの除いたプログラム一式を以下からダウンロードできます。なお、ダウンロードとご使用にあたっては、免責事項及び使用条件への同意が必要です。免責事項及び使用条件の詳細は付属の License.txt をご覧ください。

また、動作には FFmpeg が必要です。

FFmpeg のダウンロードサイト : https://ffmpeg.org/download.html

ダウンロードするファイルは、次のいずれかを推奨します。ご自身の環境で展開しやすい方を選択してください。

・ffmpeg-release-essentials.7z
・ffmpeg-release-essentials.zip

MTStoMP4.zip を展開（解凍）した後、以下のようなフォルダ・ファイル構成となるようにダウンロードした FFmpeg.exe を配置してください。

MTStoMP4\
　├ Dst
　├ FFmpeg\bin\ffmpeg.exe
　├ Src
　├ License.txt
　└ MTStoMP4.exe

MP4 形式に変換する MTS 形式の動画ファイルは必ず Src フォルダ内に準備してください。

MTS2MP4

1 ファイル 948.02 KB

ダウンロード

マウスだけで操作可能な画面の拡大表示ツール “KindLens” のご紹介

７．まとめ

このプログラムは変換元の MTS ファイルを選択後、オプションを指定して「変換実行」ボタンをクリックすることで動作します。複数の MTS ファイルを同時に指定して、MP4 変換することはできません。

このプログラムを用いて大きさ 2.09 GB（＝2135.36 MB）の MTS 形式の動画ファイルを MP4 形式に変換してみました。なお、各パラメータですが、CRF 値は「23」、Preset は「Medium」、AudioBitRate は「128」を指定しました。生成された MP4 形式の動画の大きさは 287 MB でしたので、削減量は 1848.36MB 、削減率は約86.6% になります。My NotePC （ Panasonic CF-QV ）で生成された MP4 ファイルを視聴しましたが、自分個人の感想として、気になるレベルでの画質や音質の劣化はないように思えました（私の矯正視力は両眼とも 1.5、人間ドックでの聴力検査結果は正常範囲です）。

８．お願いとお断り

また、FFmpeg.exe 他、FFmpeg 関連のファイルを同梱した状態での MTStoMP4.exe の再配布を禁じます。MTStoMP4.exe を再配布される場合は、FFmpeg関連のファイルはすべて削除し、MTStoMP4.zip に添付した License.txt を必ず添付してください。

マウスだけで操作可能な画面の拡大表示ツール “KindLens” のご紹介

「見る力を、やさしく支える」KindLens — ドラッグとクリックだけで、視界のバリアを取り払います。

【もくじ】

１．機能のご紹介
２．ダウンロード
３．お願いとお断り

予め設定した範囲を、指定した倍率で、図のように枠のない別窓に拡大表示します。
別窓を指定時間後に自動で閉じる設定も可能です。
（デフォルト設定では、幅640×高さ320ピクセル、倍率２倍で、2.5秒間表示後、自動で閉じます）

追記（20250715）

初期バージョンにあった不具合を解消しました。主な改善点は以下の通りです。

（１）矢印型 Form の画面上の位置に応じて、矢印の向きとキャプチャ範囲を自動設定します。
（２）矢印形状（方向）のリアルタイム描画で、より直感的なキャプチャ範囲設定を可能としました。
（３）キャプチャ画面を指定時間後に自動で閉じる機能を追加しました（0.5秒刻みで設定可）^※。

　^※ 指定時間経過後に拡大表示画面が自動で閉じる機能はデフォルト ON になっています。

また、上記改善を行った後、マルチモニター環境で行ったテストにおいて、プログラムの設計時、設定 Form の Scaled プロパティの確認を怠り、これを「 True のまま」としたため（なぜ、そうなっているのか、わかりませんが、 Delphi では Form の Scaled プロパティはデフォルト True なのです）、設定 Form に配置した VCL コントロールの配置がモニタの解像度によっては乱れてしまうことを確認し、一旦公開を中止して当該箇所の不具合を修正し、再度公開しました。

プログラムにはバージョン番号の表記等は一切ありませんので、矢印型 Form を右クリックすると表示されるサブメニューから「設定」をクリックして選択し、表示される設定画面が正常でない場合は、当記事のダウンロードリンクより、最新版の KindLens.exe をダウンロードしていただけますよう、伏してお願い申し上げます。

今後も、修正・改善箇所があればこの記事で報告し、修正・改善したプログラムをダウンロードリンク先にアップロードいたします。

追記（20250716）

拡大表示画面の表示位置の微調整を行いました。また、矢印型 Form の初期表示色を「白」、サイズを設計時の50％としました。

追記（20251001）

設定を保存しても、次回起動時に保存した設定が反映されない不具合を解消しました。INI ファイルに保存した設定内容を次回起動時に読み込む処理を書き忘れておりました。その他、型の違いにより発生するエラー等、今回、発見できた不具合も併せて修正しました。まだ他にも未発見の不具合があるかもしれまんが、見つけ次第修正し、こちらで報告させていただきます。これらの不具合でご迷惑をおかけした方々に、心よりお詫び申し上げます。誠に申し訳ありませんでした。

１．機能のご紹介

このプログラムは、重い障害のある方が右手でトラックボールマウスを操作して、動画・静止画を問わず、画面上に表示されている細かな文字や図を拡大表示して読めるように Delphi の力を借りて開発したものです。利用規約及び使用条件に同意していただければ、どなたでも無料でお使いいただけます。

PCの画面を拡大表示できるツールは Windows の拡大鏡をはじめとしてさまざまなものがありますが、各種設定変更の必要性がなく、単一の実行形式ファイルのダブルクリックで起動し、マウス操作（ドラッグ＆ドロップと左ボタンクリック）のみで画面の拡大表示を実現できる無料ツールはおそらくないのではないかと思います。

使い方は･･･

【初期バージョン】※ 現在、ダウンロードできません。

（１）矢印型の Form を拡大表示したい領域の右下へドラッグして移動します。
（２）ドロップした矢印型 Form 上をクリック（マウスの左ボタンを押し下げ）します。
（３）ドロップした位置の左上方向の画面が、拡大表示されます。

【改良バージョン】

矢印型のFormを拡大表示したい領域へドラッグすると、その位置に応じて矢印の形状（指し示す方向）が変化しますので、拡大表示したい領域（の右上・左上・左下・右下位置）へドロップすると、自動的にキャプチャされた範囲が、予め設定した倍率・大きさで拡大表示されます。

拡大したい領域の右上・左上・左下・右下のどこにドロップしたらよいのかは、矢印の形状から直感的に判断できるように改善しました。

拡大倍率は、デフォルト設定２倍です。表示窓の大きさは、デフォルト設定で幅640ピクセル、高さ320ピクセルです。これらの設定は任意の値への変更と、変更した状態の保存が可能です（ただし、簡単にデフォルト設定に戻す機能は用意してありません — 少々乱暴ですが、exe と同じ場所にある exe と同じ名前の拡張子が ini のイニシャライズファイルを削除すれば、デフォルト設定に戻ります）。なお、イニシャライズファイルは、削除しても「設定」画面の保存ボタンをクリックすれば、exe と同じ場所に再生成されます。

言葉で表現しても動作の様子がイメージしにくいと思いますので、実際の実行例をご覧ください。

矢印型 Form 上（内部）をクリック（マウスの左ボタン押し下げ）します。すると、次のように矢印方向左上の画面が拡大表示されます。※ 改良版では、矢印型 Form のドロップと同時に拡大表示されます。

拡大表示された別窓（窓枠はありません）をクリックすれば表示は消えます。
改良版では、指定時間経過後に自動的に消去する設定も可能です。
（ESCキー押し下げでも拡大表示は消えます）

ESCキー押し下げによる拡大表示の消去機能は、当初、計画したプログラムの仕様にはありませんでしたが、このプログラムをお使いになる方の左側に、介助される方がいらっしゃるような場合には役立つことがあるかもしれないと考え、実装しました。

また、矢印型の Form は、常に最前面に表示されますので、動画等を全画面表示している場合でも問題なく動作します。拡大表示は矢印型の Form 上をクリックすることで実行されますので、動画アプリの操作と干渉することはありません（動画を流したまま、その一部の拡大表示が「静止画」として可能^※です）。

^※ 私のPC環境では、TEAMSで配信した動画や、YouTube の動画は静止画として拡大表示できましたが、PC環境や通信方法によっては動画を静止画として取得できない場合があるかもしれません。また、このプログラムは Microsoft 社の Windows11 で開発し、同 OS 上で動作確認を行っています。他社製 OS 上での動作は未確認ですので、間接的な方法やエミュレーション技術を利用されて本プログラムを Windows 以外の OS 上で実行される場合は、プログラムそのものが動作しない可能性があることに十分ご注意ください。

【プログラムの開発環境（ご参考まで）】

・デバイスの仕様

　デバイス名	XXX
　プロセッサ	11th Gen Intel(R) Core(TM) i7-1185G7 @ 3.00GHz (3.00 GHz)
　実装 RAM	32.0 GB (31.7 GB 使用可能)
　デバイス ID	
　プロダクト ID	
　システムの種類	64 ビット オペレーティング システム、x64 ベース プロセッサ
　ペンとタッチ	10 タッチ ポイントでのペンとタッチのサポート

・Windowsの仕様

　エディション	Windows 11 Pro
　バージョン	24H2
　インストール日	‎2024/‎10/‎05
　OS ビルド	26100.4652
　エクスペリエンス	Windows 機能エクスペリエンス パック 1000.26100.128.0

・開発環境

　Embarcadero® Delphi 12.3 （バージョン 29.0.55362.2017）
　Professional with Mobile

当初は、拡大対象が動画であった場合は、拡大表示の映像も動画そのものをリアルタイムで拡大して表示する実装でプログラミングしていたのです･･･が、よくよく考えますと、このプログラムは、その前提として、定点に固定されたビデオカメラで写した映像を視聴する場合を想定しており、特に、「ビデオカメラ自体による画面のズームや向きの変更がない」状態で配信された映像中の文字や図表等を確認したい場合のヘルパーとして役立つ（使える）ように開発しましたので、「読めること」を何よりも優先し、動画も静止画として拡大表示する実装に途中から設計方針を変更しました。

また、矢印型 Form の大きさはデフォルト設定よりさらに大きくすることもできます。ただし、大きくした場合は、矢印内でのクリック位置により、意図した表示範囲と拡大画像の範囲が若干ずれることがあります。

【設定の変更方法】

設定を変更するには、矢印型の Form 上を右クリック（マウスの右ボタン押し下げ）して、表示されるサブメニューから「設定」を選んでクリックします。

設定画面が次のように表示されます。矢印のサイズは設計時の設定を100（％）としてあります。その他の項目は直感的に意味を御理解いただけると思います。

矢印型 Form の色と大きさを変更してみました。

矢印の色に「白」を設定した場合は、矢印の輪郭を黒で描画して白背景の画面でも矢印 Form の位置がわかるように工夫してあります。ただし、白以外の淡色を指定した場合は、このような黒い輪郭の描画は行われません。くれぐれもご注意ください^※。

^※ もし、矢印 Form の色を白以外のごく薄い淡色に設定して、矢印型 Form の表示位置がわからなくなった場合は、タスクバーに表示されている KindLens のアイコンを右クリックして表示されるメニューから「ウィンドウを閉じる」を選択（クリック：マウスの左ボタン押し下げ）する方法で、プログラムを終了することができます。

設定状態を保存していない場合は、次回起動時には矢印型 Form の色は以前の状態に戻ると思いますが、ごく薄い淡色の設定状態を保存した場合は、KindLens.exe と同じ場所にある KindLens.ini を削除してから KindLens.exe を起動してください。矢印型 Form は初期設定の赤い状態で表示されます。その後、必要に応じて各種設定を変更してください。設定変更後、「保存」ボタンをクリックすれば、拡張子が ini のイニシャライズファイルが再作成され、新しい設定がこのファイルに保存されます。

上の図で、本来「 KindLens 」と表記されるはずの部分が「 Project1 」と表示されているのは、開発環境である Delphi の最初の保存時のプロジェクトファイルの名称が「 Project1 」であったためかと思われます。

開発が軌道に乗った後、プロジェクトファイルの名称を「 KindLens.dproj 」に変更したのですが、この部分の表記は変更されませんでした。これは Delphi の仕様かと思われます。

【設定の保存】

設定画面左下の「保存」ボタンをクリックすれば、イニシャライズファイルに設定内容が記録され、次回起動時は保存された設定内容に従って起動します。

「保存」ボタンをクリックすると、KindLens.exe と同じ場所に KindLens.ini が自動的に作成されます。この拡張子が ini のファイルは設定が記録されているファイルなので、誤って消去しないよう十分にご注意ください（ini ファイルを消去した場合、プログラムはデフォルト設定で起動します）。

また、キャプチャする幅と高さは任意の値を直接指定するか、ComboBox の選択肢から選べます。

//キャプチャ画面の幅と高さの実装コード
cmbCW.Items.AddStrings(['240', '320', '400', '480', '560', '640', '720', '800']);
cmbCH.Items.AddStrings(['240', '320', '400', '480', '560', '640', '720', '800']);

上のコードからわかる通り、選択肢から選べる値は、80の倍数としてあります（80の倍数とした理由は特にありません。480とか、640という数字に対して、僕がうまく言葉に出来ない懐かしさを感じることが、その最大の理由であるように感じます）。

この KindLens と題したプログラムには、自分で考えた最低限の「あったらいいな！」と思う機能はすべて搭載しましたが、今後、実際に使用して判明した問題点等があれば速やかに改善したいと思います。その際は、この blog にバージョンアップ版を掲載いたします。

KindLens に関する操作の説明は以上です。たいへん申し訳ありませんが、取扱説明書やヘルプファイルの準備はございません。仕様・操作方法の説明につきまして、その必要がありましたら、この記事をご参照いただけますよう、お願いできましたら（また、ご案内等いただけましたら）幸いです。

２．ダウンロード

KindLens は、次のリンクからダウンロード可能です。ただし、ご利用に当たっては、利用規約及び使用条件への同意が必要です。

マウスだけで操作可能な画面の拡大表示ツール"KindLens"

1 ファイル 925.82 KB

ダウンロード

ダウンロード後、ダウンロードした KindLens.zip を右クリックし、表示されるサブメニューから「すべて展開」を選んでクリックしてください。次の画面が表示されます。

展開する場所を指定される場合は「参照」をクリックして、任意のフォルダを指定します。
zip ファイルと同じ場所に展開する場合は、そのまま「展開」をクリックしてください。

無事、ファイルが展開（いまだにこの表現に慣れません。どうしても解凍と言いたくなります）されると、次の３つのファイルがエクスプローラーに表示されます。

Windowsの設定によっては、exe 等の拡張子は表示されません。
（License.txt の内容は必ずご確認ください）

ルーペの中にハートの描かれたアイコンが KindLens の実行形式ファイル（ exe ）です。

このファイルをダブルクリックしてプログラムを起動してください。
（いきなりダブルクリックせず、このアイコンを右クリックすると表示されるサブメニューから「プロパティ」を選んで、Windows Defender SmartScreen による警告画面の表示を回避することもできます：後述）

【初回起動時に表示される警告について】

プログラムの起動に成功すると、初期状態では赤い矢印型 Form がお使いの PC の画面中央に表示されますが、ダウンロード＆展開直後の最初の実行（プログラム起動）時には Windows の保護機能が働いて、次に示す Windows Defender SmartScreen による警告画面が表示されます。

次の画面が表示されます。

これは KindLens.exe が悪意のあるプログラムであるために表示される警告ではなく、Windows に搭載されたセキュリティ機能に「未知の発行元や信頼性の低いファイルに対して警告を出す仕組み^※がある」ために表示されるものです。

^※ ダウンロードされたファイルに「 Zone.Identifier 」という「ゾーン識別子」が付加されていると、Windows はこの識別子を見て「インターネット経由で取得されたファイル」と判断し、SmartScreen が警告を表示します。

【Windows Defender SmartScreen による警告画面を回避する方法】

ダウンロード＆展開直後の最初の実行（プログラム起動）時には Windows の保護機能が働いて、上記 Windows Defender SmartScreen による警告画面が表示されますが、これを回避する方法もあります。以下、その手順です。

（１）KindLens.exe をいきなりダブルクリックせず、KindLens.exe のアイコンを右クリックすると表示されるサブメニューから「プロパティ」を選んでクリックしてください。

（２）次の画面が表示されますので、「全般」タブのいちばん下にある「セキュリティ：」部分を図に示した順にクリックしてください。

この作業を行うと、Zone.Identifier が削除され、警告は表示されなくなります。

上記作業を行うと、KindLens.exe に付加されていた「 Zone.Identifier 」という代替データストリーム（ADS）が削除され、警告の表示が出なくなります。「 Zone.Identifier 」はファイルの「本体（メインストリーム）」とは別の Windows の NTFS ファイルシステムの隠れた領域に付加されるメタ情報で、隠しストリームです。

上記のどちらかの方法で Windows の警告が表示される仕組みを解除してください。ADS の削除に成功すれば、次回の実行時から警告は表示されなくなります。

３．お願いとお断り

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！

今回ご紹介するプログラムで、自動採点できるかもしれない（？）手書き答案の解答は･･･

カタカナ「ア・イ・ウ・エ・オ」のいずれか１文字、それから
数字の「１・２・３・４・５」のいずれか１つ、そして
記号の「〇・ × 」のどちらかです。

この･･･わずか 12 個の、文字・数字・記号に限定したお話ですが、僕が行ったテストでは各種パラメータの微調整を行うことなく、デフォルト設定のまま、テストデータ（少ないですが）をほぼ正しく推論できました。※ 制作の最終段階での検証結果です。

「自己責任・サポート無し」という条件付きですが、もし、よかったら、お試しください。

どなたにもお待ちいただいておりませんが、２年ぶりにバージョンアップした解答欄リーダーです。

【もくじ】

０．注意事項
１．論より証拠
２．自動採点機能の使い方
３．推論用画像データの確認
４．プログラムのダウンロード
５．お願いとお断り

【注意事項】

初回の自動採点実行時にPCがフリーズしたような状態になることがあります（正しく動作している状態であっても、Python Engine の初期化には数秒を要します）。特に、ダウンロードした Zip ファイルを展開（解凍）した直後の初めての実行時や、インターネット接続が切れた状態で使用した場合、この初期化作業にかなりの時間を要する場合があることを実際に確認しました（常に、この現象が起きるわけではありません）。この現象発生時に、内部的に呼び出して実行している組み込み Python 環境はエラーメッセージを出しません。つまり、プログラムは単に PythonEngine の初期化等、何らかの作業の完了を待つ「待機状態」であることは明らかなのです･･･が、「プログラムで使用しているどのライブラリがこの待機状態を作り出しているのか」という、はっきりした原因の特定まで現在至っておりません。

この現象は、自動採点実行時、最初の１回に限って発生します。２回目以降は、採点終了まで滞りなく（素人が作ったプログラムなので実行速度は遅いですが）動作すると思います。

お試しいただける方には、たいへん申し訳ありませんが、そのような現象が発生することをご理解いただいた上で、ご試用いただけますよう、伏してお願い申し上げます。

【追記_20250823】

上記の現象について調査した結果、これは「 Windows Defender や McAfee などの Anti-Virus Software または Antivirus Software : AV による『未知バイナリの初回スキャン』により発生している可能性が極めて高い」ことがわかりました。

このプログラムでは、内部的に（バックグラウンドで）PythonForDelphi（P4D）を通じて Python 環境を利用し、自動採点処理を実行しています。ですので、自動採点実行時には、cv2.pyd や numpy 及び scikit-image の HOG や LBP に関連する pyd （ Python Dynamic Module の略＝ Python の拡張モジュール）が必ず読み込まれます（これらの pyd ファイルは、内部的にはネイティブ DLL と同等に扱われるようです）。

AV は「初めて見る未知の DLL」をロードしようとした時に、ファイル全体をディスクから読み込み、サンドボックス（外部と隔離された仮想環境：ITやセキュリティの分野では、主に怪しいプログラムを安全に試すための実験室として使われる）や、クラウドサービスに投げて解析（インターネット接続が出来ない環境である場合には、一定時間のタイムアウトを設け、その後ローカル判定にフォールバックする：なのでインターネット接続環境がないPCで実行してもいつまでもフリーズしたような状態が続くわけではない → 待機時間は Windows Defender の場合、既定で数秒～数十秒程度）し、ハッシュをキャッシュに登録という処理を行うため、この「初回スキャン」が終わるまで、DLL ロードは OS レベルでブロックされてしまい、アプリケーション側から見るとフリーズ、すなわち「固まった」ようにしか見えない状態になるわけです。一度、このスキャンを通過すれば「このファイルは安全」とキャッシュされるので、以後は高速にロードできるようになります。

自動採点の初回実行時のみ PC がフリーズしたようになり、２回目以降は何の問題もなかったかのように動作するのは、このスキャンが実行されている証拠だと思われます（このスキャンが実行されていることを直接確認する方法はないようです： AV が検査状態を外部に直接公開すると、逆にマルウェアに悪用される可能性が高まるため）。

さらに「実行形式ファイルを別の場所にコピーすると再びフリーズする」のは、 AV によってはファイルパスや場所ごとにキャッシュが分かれるためです（同じファイルでもデスクトップに置いたら「未知扱い」になる）。

この問題への対策として、セキュリティソフトを無効化するのは論外ですし、また、それが真の原因とわかったわけではなく、現段階ではその可能性が極めて高いと思われるということなので、次の実験を試行して、結果を後日、こちらに記載させていただきます。

（１）「ウォームアップ import」をアプリ起動時にバックグラウンドで実行。
（２）バックグラウンドスレッドで AV スキャンを監視し、UI に進捗状況を表示。

（追記_20250823 ここまで）

【追記_20250825】

ここで紹介している AC_Reader をはじめ、この Blog の過去記事に掲載したアプリケーションはすべてディスプレイ解像度が 1366 × 768 の環境で実行することを前提として開発しています。高解像度ディスプレイで実行される場合、次のリンク先の記事にあります「高 DPI 設定の変更」を行ってから実行していただけますようお願い申し上げます。

高解像度画面で使いやすくするには？

（追記_20250825 ここまで）

【追記_20250826】

ユーザー体験を少しでも向上させるべく、以下の順番で AV のスキャンによる待機状態の改善を目標にプログラムの見直しを図りました。

（１）「ウォームアップ import」をアプリ起動時に~~バックグラウンドで~~実行。
（２）バックグラウンドスレッドで AV スキャンを監視し、UI に進捗状況を表示。

（１）については、まず、バックグラウンドで実行はやめることにしました。理由は、バックグラウンドで実行してしまうと、AV のスキャンが完了しないうちにメインスレッド側で Python モジュールが使われてしまう可能性があることに気づいたためです。そこで、スキャン対象となる .pyd ファイルをアプリケーション起動時に全て読み込み、スプラッシュフォームの表示中にAnti-Virus Software による『未知バイナリの初回スキャン』を強制的に実行、この処理が確実に完了するまで待機して、安心安全な状態でアプリケーションを実行し、かつ自動採点機能等 Python のモジュールを使用中に発生する待機状態が極力短くなるよう、プログラムを修正しました。コードは以下の通りです。

procedure TFormCollaboration.LoadAllPythonModules;
var
  PyCode: TStringList;
begin
  PyCode := TStringList.Create;
  try
    //スキャン対象となるモジュール
    PyCode.Add('import cv2');
    PyCode.Add('import numpy');
    PyCode.Add('from skimage.feature import hog, local_binary_pattern');
    //その他 Python モジュール
    //スキャン対象ではないモジュールも読み込んでおく
    //初期化の待機時間短縮やエラー回避のため preload
    PyCode.Add('import os');
    PyCode.Add('import glob');
    PyCode.Add('import re');
    PyCode.Add('import joblib');
    // 実行
    PythonEngine1.ExecStrings(PyCode);
  finally
    PyCode.Free;
  end;
end;

procedure TFormCollaboration.FormCreate(Sender: TObject);
var
  ･･･ 省略 ･･･
begin
  //embPythonの存在の有無を調査（条件コンパイル）
  {$IFDEF WIN32}
    //32bit環境での処理
    AppDataDir:=ExtractFilePath(Application.ExeName)+'Python39-32';
  {$ELSE}
    //64bit環境での処理
    AppDataDir:=ExtractFilePath(Application.ExeName)+'Python39-64';
  {$ENDIF}

  if DirectoryExists(AppDataDir) then
  begin
    //フォルダが存在したときの処理
    PythonEngine1.AutoLoad:=True;
    PythonEngine1.IO:=PythonGUIInputOutput1;
    PythonEngine1.DllPath:=AppDataDir;
    PythonEngine1.SetPythonHome(PythonEngine1.DllPath);
    PythonEngine1.LoadDll;
    //PythonDelphiVar1のOnSeDataイベントを利用する
    PythonDelphiVar1.Engine:=PythonEngine1;
    PythonDelphiVar1.VarName:=AnsiString('var1');
    //初期化
    PythonEngine1.Py_Initialize;
  end else begin
    PythonEngine1.AutoLoad:=False;
  end;

  //Splashフォームを表示
  theSplashForm:=TSplashForm.Create(Application);
  try
    theSplashForm.Show;
    theSplashForm.Refresh;
    theSplashForm.TimeLabel.Caption :=
      'ライブラリをロード中...(スキャンにより数分かかる場合があります)';
    theSplashForm.Update;
    Sleep(1500);
    LoadAllPythonModules;  //Pythonのモジュールを読み込み
    theSplashForm.TimeLabel.Caption := '準備が整いました！';
    theSplashForm.Update;
    Sleep(500);
    FadeOutForm(theSplashForm);
    theSplashForm.Close;
  finally
    theSplashForm.Free;
  end;
  ･･･ 省略 ･･･
end;

上記コードを実行した結果、初回起動時、私の環境では約２分５秒間 PC が待機状態になりました。また、自動採点機能の初回使用時は、私の環境では 15 秒間待機状態が続きました。２回目のアプリケーション起動時、自動採点実行時は、いずれも待機時間は大幅に短縮され、ほとんど気にならないレベル（個人差はあると思いますが）になりました。

（２）について

（１）ではユーザーへの案内が「’ライブラリをロード中…(スキャンにより数分かかる場合があります)’」のみとなってしまい、処理の経過状況がうまく伝わらない可能性があると考え、当初、別スレッドで AV スキャンを監視し、UI （theSplashForm.TimeLabel.Caption）に進捗状況を表示できないかと考えました。そこで、.pyd ファイル（＝Python モジュール）のロードと同時に監視を自動で開始し、スキャンが収束するまで待機するユーティリティ関数を作成してみたのですが、PC の環境によりインストールされている AV は異なっていて当然ですので、この AV プロセスをどうすれば確実に取得できるかという部分が、まず大きな問題となりました。

const
  AVList: array[0..4] of TAVInfo = (
    (Name: 'MsMpEng'; Path: 'C:\Program Files\･･･\MsMpEng.exe'),
    (Name: 'McShield'; Path: 'C:\Program Files\･･･\McShield.exe'),
    (Name: 'savservice'; Path: 'C:\Program Files\･･･\XXX.exe'),
    (Name: 'ccSvcHst'; Path: 'C:\Program Files (x86)\･･･\YYY.exe'),
    (Name: 'avp'; Path: 'C:\Program Files\･･･\ZZZ.exe')
  );

PC 環境が異なっても上記 Path を確実に取得できるよう、次のようにしたり･･･

type
  TAVInfo = record
    Name: string;
    Path: string;
  end;

function DetectAVProcesses: TArray<TAVInfo>;

implementation

const
  AVCandidates: array[0..4] of TAVInfo = (
    (Name: 'MsMpEng'; Path: '') //動的に取得する
  );

function GetProcessPath(const ProcName: string): string;
var
  Snapshot: THandle;
  ProcEntry: TProcessEntry32;
  hProcess: THandle;
  PathBuffer: array[0..MAX_PATH - 1] of Char;
begin
  Result := '';
  Snapshot := CreateToolhelp32Snapshot(TH32CS_SNAPPROCESS, 0);
  if Snapshot = INVALID_HANDLE_VALUE then Exit;

  ProcEntry.dwSize := SizeOf(TProcessEntry32);
  if Process32First(Snapshot, ProcEntry) then
  begin
    repeat
      if SameText(ProcEntry.szExeFile, ProcName + '.exe') then
      begin
        hProcess := OpenProcess(PROCESS_QUERY_INFORMATION or PROCESS_VM_READ, False, ProcEntry.th32ProcessID);
        if hProcess <> 0 then
        begin
          if GetModuleFileNameEx(hProcess, 0, PathBuffer, Length(PathBuffer)) > 0 then
            Result := PathBuffer;
          CloseHandle(hProcess);
        end;
        Break;
      end;
    until not Process32Next(Snapshot, ProcEntry);
  end;
  CloseHandle(Snapshot);
end;

function DetectAVProcesses: TArray<TAVInfo>;
var
  i: Integer;
  L: TList<TAVInfo>;
  Path: string;
  Info: TAVInfo;
begin
  L := TList<TAVInfo>.Create;
  try
    for i := Low(AVCandidates) to High(AVCandidates) do
    begin
      Path := GetProcessPath(AVCandidates[i].Name);
      if Path <> '' then
      begin
        Info := AVCandidates[i];
        Info.Path := Path;
        L.Add(Info);
      end;
    end;
    Result := L.ToArray;
  finally
    L.Free;
  end;
end;

さまざまに頑張ってみたのですが･･･、最終的に、どうやっても「’対象AVが見つかりません’」という表示が消えません･･･。つまり、AV プロセスを取得することが私の技術では出来ませんでした (ToT)

var
  AVProcesses: TArray<string>;
begin
  theSplashForm.TimeLabel.Caption := 'AV監視開始…';

  AVProcesses := DetectAVProcesses;
  if Length(AVProcesses) = 0 then
  begin
    theSplashForm.TimeLabel.Caption := '対象AVが見つかりません';
    Exit;
  end;

  AVThread := TAVScanThread.Create(
    AVProcesses, 10, 3, 60000,
    procedure(const Msg: string)
    begin
      theSplashForm.TimeLabel.Caption := Msg;
    end
  );

  AVThread.Start;
end;

（１）「ウォームアップ import」をアプリ起動時に実行だけで十分な気がしてきました！

なので、ここは潔く･･･

撤退します！

（追記_20250825 ここまで）

【追記_20250924】

ユーザーの方から、「手書き答案の採点補助プログラム（ AC_Reader ）を使用していると、突然、白紙のメッセージがたくさん出て止まるんだけど･･･」という不具合発生の報告をいただきました。

私が動作確認した際には経験しなかった現象なので、具体的に「ナニを・どうすると・それが起きるのか」が当初まったくわからず、はたして不具合を解消できるかどうか、大いに不安でしたが、年齢層で言うとかなり高めの方からの不具合の報告であったことを念頭に置き、得点の「入力」、採点結果の「書込」、採点対象答案の「移動」あたりのボタンクリックに関する問題なのではないかと推測して、不具合の再現を図ったところ、予想が的中し、「書込」ボタンを連打すると PC がフリーズしてプログラムが落ちることを確認しました。

Delphi の VCL の Button コントロールには、最初からダブルクリックを受け付ける機能そのものがありません（ = OnDblClick イベントが存在しない）。これは考えてみれば当然のことで、ダブルクリックイベントを許可すれば、意図しない二重実行が発生しまくるからです。

ただ、人間ですから、何かの拍子に、つい！ボタンを連打してしまうことはあって当然のことですので、ここはプログラム側できちんと連続クリックを受け取らないよう、対策しておく必要があります。

プログラマなら誰もが最初に考えることは、OnClick イベントの先頭に Button1.Enabled := False; を記述することだと思います。しかし、これでは対応できませんでした。連続クリックするとボタンが操作不可能になる前に、ボタンはクリックを拾ってしまいます。

そこで、FIsSaving: Boolean; のようなグローバル変数を設けて、ボタンクリックイベントの先頭行で、if FIsSaving then Exit; 次の行に FIsSaving := True を記述して連続クリックを阻止しようと考えました。しかし、この方法でも連続クリックの２回目以降を受け取らないようにすることはできませんでした。やはり、ボタンは連続クリックを拾ってしまうのです。

そこで、次のようにして、

Button1.Enabled := False;
Application.ProcessMessages;

これなら上手く行くかと思いましたが、これもダメです。例え Button1.Enabled := False を設定しても、すでにクリックメッセージが処理順番待ち行列（キュー）に積まれていると（具体的には早打ちした WM_LBUTTONDOWN / WM_LBUTTONUP が複数積まれていると？）、OnClick イベントが複数回呼ばれてしまい、Application.ProcessMessages はそれらを即座に処理しますから、再入が発生し、データの保存（書込み）処理が複数回、同時実行されてしまうようです。

この同時実行によって、競合や例外が発生し、プログラムが落ちるわけです。

これはたいへんなコトになったと思いました。ボタンが連続クリックを拾ってしまうことを私の知識では止められない以上、別の方向性をとらざるを得ません。ですので途中から方針を変更し、連続クリックされても「クリックそのものは受け取って、同じ処理を繰り返し実行」、しかし、「プログラムは落ちない」方向で問題を解決（･･･というか、問題に対応？）することに決め、保存処理の実行ではプログレスバー以外の UI に一切触らず、エラー発生の原因となる保存手続き中の Application.ProcessMessages; はすべて削除して、手続きの外部へ移し、さらにボタンの OnClick イベントの直接呼出し等の処理は全部止めるよう見直しを図った結果、次のコードにたどり着くことができました。びっくりするくらいシンプルなコードです。書いた本人も驚きでした･･･　DoSaveData; 手続き内に保存の処理は全部詰め込んであります。

相変わらず、連続クリックそのものは、阻止できていませんが･･･プログラムは落ちなくなりました。

procedure TForm1.Button1Click(Sender: TObject);
begin
  Button1.Enabled := False;
  try
    DoSaveData;
    Application.ProcessMessages;
  finally
    Button1.Enabled := True;
  end;
end;

で、DoSaveData 手続き側では、グローバル変数を利用し、さらなる安全策をとりましたが、これもやはり全然、はい。まったく！効いていませんが、プログラムはとにかく落ちません。少なくとも、私の環境では連続クリックに対応できるようになりました。

procedure TForm1.DoSaveData;
var
  i:integer;
begin
  if FIsSaving then Exit; // 多重実行防止
  FIsSaving := True;
  ･･･ 省略 ･･･
end;

なお、自動採点機能もどきを搭載した Version 3 の修正作業を行っているうちに、私の周囲では、旧版の Version 2 の方が手に馴染むと、そちらを使い続けてくださっている方が複数いることを思い出し、Version 3 に行ったものと同等の修正（今回の修正に加えて、高 DPI 環境下でのスケーリング問題への対応や、メモリーリークを防止するため、設定画面が表示されている際には「閉じる」ボタンを無効化する処理等）を Version 2 にも同様に施して、Version 3 側を「 AC_Reader_AutoGrading.exe 」、Version 2 側を「 AC_Reader_NoneAutoGrading.exe 」として、上記リンクからダウンロードできる「デジタル採点 All in One.zip 」に同梱しました。

自動採点機能もどきを搭載した Version 3 は、初回起動時に必ず実行される Windows Defender や McAfee などの Anti-Virus Software : AV による『未知バイナリの初回スキャン』の対象ファイルが多いため、実行環境を別ディレクトリに移動した際等、必ずこの処理が走り、長い待機状態が発生します。自動採点機能が不要の場合は、それがなく、『未知バイナリの初回スキャン』の対象ファイルが少ない「 AC_Reader_NoneAutoGrading.exe 」をお試しいただいた方がいいかもしれません。

AI に確認したところ、『多くのAVは、過去にスキャン済みのファイル情報をキャッシュしており、安全と判断したファイルはスキャン対象から外すようにしているが、そのキャッシュには有効期限があるため、検査後一定時間が経過すると「再評価が必要」と判断され、再スキャンが実行される』とのことです（私の環境下では、たとえディレクトリ構成を変えていない場合でも、前回起動時からひと月ほど経過？していたりするとプログラム起動時に待機状態が長く続く現象を確認しました。なので、間違いなくキャッシュには有効期限があるようです）。この他にも『スケジュールされた定期スキャン』や『アイドル時スキャン（ ScanOnlyIfIdle ）』の実行時、さらに『ウイルス定義ファイル更新後に再評価対象とされた場合』等にも再スキャンされる可能性があるとのことです。安全のためには仕方のないこととは言え、もう少しスキャン時間が短くなるとありがたいのですが･･･。

（追記_20250924 ここまで）

また、このプログラムの動作には「Microsoft Visual C ++ ランタイムライブラリ」のインストールが必要です。お使いのPCに「Microsoft Visual C ++ ランタイムライブラリ」が入っていない場合は、下記 Web サイトから「VisualCppRedist_AIO_x86_x64.exe」をダウンロードし、ダウンロードしたプログラムを管理者権限で実行し、動作に必要なライブラリをPCにインストールしてください。なお、インストール時には Windows のユーザーアカウント制御（UAC）が起動し、管理者用のID とパスワードの入力を求められます。インストールでは、exe の名称からわかるように 32 ビット版と 64 ビット版それぞれの VC++ランタイムライブラリがお使いの PC にセットアップされます。なお、インストール後は（僕のPC環境では）再起動なしで、そのまますぐに AC_Reader.exe を実行できました。

「VisualCppRedist_AIO_x86_x64.exe」の入手先：

https://www.majorgeeks.com/files/details/visual_c_redistributable_runtimes_aio_repack.html

2025年６月11日現在、バージョンは「0.91.0」でした。上記 Web サイトの Download (64-Bit EXE) というリンクをクリックすればインストールプログラムをダウンロードできます。

１．論より証拠

自動採点実行時の画面のハードコピーを以下に示します。なお、テスト用データの手書き「文字・数字・記号」は、すべて「お手本」を参照しながら、僕自身が「お手本」を真似て書いたものです。

まず、最初にカタカナの「アイウエオ」５文字の推論結果です。

正解ラベル：「ア」の場合です。（全体を表示するため、解答欄画像は縮小表示しています）

正解ラベル：「イ」の場合です。

正解ラベル：「ウ」の場合です。

正解ラベル：「エ」の場合です。

No,1とNo,12の画像に縦方向の直線状の汚れがありますが、推論用画像作成の前段階の処理でその除去に成功しています（これを除去しておかないと、例えばNo,12の画像の推論用データは空白の画像ではなく縦線「｜」が入った画像になり、学習モデルは間違いなくこれを「1」と推論してしまうはずです）。

解答欄の切り出し直後の画像では、No,1とNo,12の画像の左側に薄い灰色の直線状の汚れがあります。

推論用データ（文字の輪郭を検出して縦横28ピクセルの画像として解答欄の画像から切り出す）を作成する前段階で、これらの汚れを除去する処理を入れています。

この「文字を消さずに汚れのみ除去する」処理はけっこう苦労しました。が、なんとか工夫を重ねて実現できました。「エ」の構成部品である「｜」を消さずに、左側の汚れの「｜」のみ除去するのは大変でしたが、線状の汚れと判断する基準にその高さ（長さ）を採用して、それが画像の高さとほぼ等しい場合は汚れと見なすことで、この問題はクリアできました。

以下、そのスクリプトです（ご参考まで）。

# 画像内の灰色の直線状汚れを除去

import cv2
import numpy as np
import os
from glob import glob

folder = r".\GrayLine"
image_extensions = ["*.png", "*.jpg", "*.jpeg"]
image_paths = []
for ext in image_extensions:
    image_paths.extend(glob(os.path.join(folder, ext)))

tolerance = 20  # 画像の高さとの誤差許容範囲（ピクセル単位）

for image_path in image_paths:
    image = cv2.imdecode(np.fromfile(image_path, dtype=np.uint8), cv2.IMREAD_COLOR)
    if image is None:
        continue
    height, width = image.shape[:2]
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    edges = cv2.Canny(gray, threshold1=20, threshold2=80, apertureSize=3)
    lines = cv2.HoughLinesP(edges, rho=1, theta=np.pi / 180, threshold=50, minLineLength=50, maxLineGap=5)

    if lines is not None:
        for line in lines:
            x1, y1, x2, y2 = line[0]
            angle = np.degrees(np.arctan2(y2 - y1, x2 - x1))
            line_length = np.hypot(x2 - x1, y2 - y1)

            # 垂直線かつ画像の高さとほぼ同じ長さのみ除去
            if (abs(angle - 90) < 1 or abs(angle + 90) < 1) and abs(line_length - height) < tolerance:
                cv2.rectangle(image, (x1-5, 0), (x2+5, height), (255, 255, 255), 2)
                cv2.rectangle(image, (x1-4, min(y1, y2)-5), (x2+4, max(y1, y2)+5), (255, 255, 255), -1)

    cv2.imencode(".png", image)[1].tofile(image_path)

正解ラベル：「オ」の場合です。

カタカナ「アイウエオ」の５文字は間違えずに推論できました。イイ感じです。
次は数字の「１２３４５」。何となくイケそうな気がしてきました☆

正解ラベル：「１」の場合です。

あ・れ・？

なんで「2」に〇が･･･

夢なら覚めてくれ･･･ T_T

一瞬。そう思いましたが･･･

大丈夫。転ぶのには慣れています。これまでだってさんざん･･･、

ここまで来て、あきらめるなんて、そっちの方が無理です。

急いで推論用の画像を確認。

･･･ということは、学習データに問題があったってコトか？

左へ微妙に傾いているように見えます･･･

よくよく考えてみると、このような左に傾いた「2」は、利き腕が右の場合、なんとなく書きにくいような気もします。このことから、つまり、推論をミスした原因は、学習用データとして用意した画像の中に、左に傾いた「2」が少なかったため（？）ではないかと思えてきました。

見たところ、この「2」の画像には極端なシミも汚れもなく、色の濃さも十分、形状もちょっと縦に伸びてるかなって感じもしますが、まぁ、これは一般的にどう見ても「2」です。輪郭検出にも間違いなく成功して期待通りに切り出せている以上、やはり推論ミスの原因は「その傾きにある」としか思えません。

そこで･･･ナニをしたかというと、

取りあえず、1～20°の範囲で、0.5°ずつ傾きに変化をつけ、推論をミスした「2」を左に回転させた画像を上のように50枚用意（処理する際に名称は関係ないので、ファイル名に一貫性はありません）して、さらに「2」の学習データは全体で約7000枚あるので、その１割にあたる700枚を抜き出し、ランダムに5°、10°、15°、20°のいずれかの角度で左に回転させ、先に用意した50枚と合わせて水増し学習データを合計750枚作りました。

「水増し」なんて言うと（文脈にもよりますが）どちらかと言えばネガティブな意味を含むことが多く、なんだか、とてもずる賢い・よからぬことをしているように感じますが、機械学習で使われる「水増し」という言葉は、データ拡張（Data Augmentation）という概念を表すもので、基本的に悪い意味はないようです。むしろ、このテクニックは、モデルの汎化性能を向上させ、過学習（Overfitting）^※を防ぐために重要な技術とされているようです。十分な学習データがない場合に、画像の回転・拡大・ぼかし・ノイズ追加などを行うことで、実質的にデータ数を増やせますし（＝過学習の防止という意味でもこれは有効）、既存の学習用データに回転（やりすぎは禁物！）や、サイズ変更して作成した水増し学習用データを加えて学習モデルを作れば、異なる角度やサイズの文字にも対応できる、より頑健なモデルにすることができます。

※ 過学習（Overfitting）：学習用データが少なかったりすると、学習モデルがそのデータに最適化されすぎてしまい、汎化性能が低下してしまうことを言うそうです。つまり、見たことがあるデータしか、推論に成功しなくなる（見たことがないデータに対して非常に弱くなる）わけですね。

こうして作成した水増し学習用データをを元の約7000枚に追加し、画像をランダムに並び替えて、連番の名前を付け直し、約7800枚の「2」の画像データを作り、そのうち1/3のデータは余白「4」、1/3のデータは余白「5」、1/3のデータは余白「6」を設定（余白の取り方を変更してモデルの汎用性を高めるため）して再学習用の縦横28ピクセルの画像データに変換し、１、３、４、５の各学習用データと合わせて、カタカナ「アイウエオ」の学習モデルを再度構築し直しました。

実際は、再度ではなく、再々々々・・・度の「構築し直し」ですが。
夢は、きっと、叶えるために、あります。

基本的な考え方としては（間違っているかもしれませんが）、学習用データの余白分布が4～6ピクセルであれば、モデルはその範囲内の「平均的」な状態、すなわち中央値に近い値（つまり5ピクセル）に合わせた特徴抽出を学習する（＝最も代表的な状態に合わせて内部の重みが調整される）と仮定して･･･

（推論用データの余白の設定を中央値にすると正解率が良いように経験的に感じたのです）

この仮定がもし正しければ、推論用の画像データはそのすべてを「検出した輪郭の周囲に余白5を指定して作成」することで、モデルは最も慣れている条件下で推論動作を行える＝最も良い正解率を示すはずだと･･･

実は、この輪郭検出（＝文字認識）後、その周囲にどの程度の余白を設定するかについて最初は適当に「8」とか指定していたのですが、モデルの汎用性を高めるためには、学習データの余白の設定は一律に同じ設定としない方が良いはずなので、ある時、ふとその1/3に余白「8」、1/3に余白「9」、1/3に余白「10」を設定して学習モデルを作成し、推論の成否を確認していたところ、推論用データの余白を「9」に設定した場合に正解率がよくなるように感じました（正確に統計をとったわけではありません）。それと最終的には、学習用データ・推論用データともに縦横28ピクセルの画像とすることから、中央に配置した文字が実質縦横20ピクセル程度の領域に入る余白「4・5・6」あたりが最も適当であろうと考えたわけです。MNISTの作りを見ても、この考えは正しいように思われました。

もちろん、学習用データの余白を3・4・5として、推論用データの余白を中央値の4とする設定も考えましたが、余白が3ピクセルではさすがに小さすぎるのではないかと思い直し･･･つまり、ちょっとした輪郭抽出のズレでも、文字がフレームに近づきすぎて、文字の上下左右の位置のバラつきが大きくなり、モデルが位置変動に過敏になる可能性が大きいと考えました。

逆に余白が6ピクセルと大きい方が、余白を3ピクセルとした場合よりも、文字が中央に安定しやすく、多少のズレがあっても特徴が大きく変わらなくなるはずです（機械学習においては、機械が覚え込んだ特徴量に近い特徴量を示す推論対象が正解とされるわけですから、このことは非常に重要です）。解答欄画像から輪郭検出を行って推論用データを作成する際の余白の設定を様々に変えて試行している際に、わずか1ピクセル、余白の設定を変更しただけで、正解になったり、不正解になったりする事実（プログラムのテストを繰り返す中で、この現象に気づいた当初は本当に不思議に感じました）は、まさにこの推測が正しいことの証明ではないかと思われました。

最終的には、すべて縦横28ピクセルの画像データとするわけですから、このあたりの判断がコトの成否を分ける、言わば「運命の分岐点」であったと、今、ここまでの歩みを振り返って思います。

また、この各数字の画像が約7000枚ずつあるというのは、僕の制作環境においては学習モデルを作成可能な制限ギリギリの値であったようで、学習モデル作成にあたってはまずPCそのものを再起動し、他のアプリが一切動作していない（メモリが十分に空いている）状態を作ってから、学習モデルを作成するスクリプトを実行する必要がありました。

ちなみに僕のPC環境（仕様）は、以下の通りです。

【デバイスの仕様】
プロセッサ	11th Gen Intel(R) Core(TM) i7-1185G7 @ 3.00GHz   3.00 GHz
実装 RAM	32.0 GB (31.7 GB 使用可能)
システムの種類	64 ビット オペレーティング システム、x64 ベース プロセッサ
ペンとタッチ	10 タッチ ポイントでのペンとタッチのサポート

【Windowsの仕様】
エディション	Windows 11 Pro
バージョン	24H2
インストール日	‎2024/‎10/‎05
OS ビルド	26100.4351
エクスペリエンス	Windows 機能エクスペリエンス パック 1000.26100.107.0

様々なアプリを使用した後や、Webブラウザを開いたままの状態で学習モデルを作成するスクリプトを実行すると、必ず「メモリが足りません！」というエラーメッセージが表示され、学習モデルの作成に失敗してしまうので、「再起動直後に実行する」という手を思いつく前は、「もはやこれまで」とせっかく作った学習データを減らそうかと思ったりもしました。

誰も教えてくれる人はいませんので、すべてが手探り状態で、後から考えれば実に様々な「それくらい最初から気がつけよ！」みたいな「プロから見れば当たり前のこと」に気づくまでに、試行錯誤を繰り返し、膨大な時間を費やしつつ、一歩一歩前進するしかありません。

昼間は仕事があるし･･･、夜はあたまの回転がトロくなるし･･･、なんや・かんやで、
だいたい日付が変わる頃に目を覚まし、あとは朝が来るまで、ちいさな灯りをともして･･･
僕の人生の中で、いちばん充実した「時」を過ごします･･･

自動採点を、あきらめない以上は･･･その時々で、僕に出来る最善を尽くすのみです。

何はともあれ、左に傾いた「2」を新しく学習したモデルが出来ました！

このモデルを用いて「1」の推論に再チャレンジした結果です。

やった！　やった！！

なせばなる！！！

もちろん、余白の設定は「5」としてあります。

正解ラベル：「2」の場合です。

No,10の画像の「2」が正解となっていることもうれしいことです。
実は、No,11の画像は、検証用にわざと誤りのデータを他の画像から切り貼りして作成したものです。
つまり、正解ラベル「1」のNo,11の「2」と、上のNo,10の「2」は同じデータと思われます。

正解ラベル：「3」の場合です。

正解ラベル：「4」の場合です。

正解ラベル：「5」の場合です。

数字も正しく読めるようになりました☆

次は、記号の「 ○ と × 」です。

正解ラベル：「 ○ 」の場合です。

正解ラベル：「 × 」の場合です。

・・･･･・・

2025 年 6 月 15 日午前４時
とうとう・・・
夢がかないました！

とても静か・・・

まだみんな
眠っています。

これも夢かもしれません。

夢なら、どうか・・・
覚めないでください。

２．自動採点機能の使い方

ダウンロードした zip ファイルを展開すれば、すぐにお試しいただけるよう、次に紹介する採点サンプルデータを同梱してあります。記事の説明を参照しながら、操作していただけますよう、お願い申し上げます。

この記事の冒頭にも書きましたが、プログラムの動作には「Microsoft Visual C ++ ランタイムライブラリ」のインストールが必要です。お使いのPCに「Microsoft Visual C ++ ランタイムライブラリ」が入っていない場合は、下記 Web サイトから「VisualCppRedist_AIO_x86_x64.exe」をダウンロードし、ダウンロードしたプログラムを管理者権限で実行し、動作に必要なライブラリをPCにインストールしてください。なお、インストール時には Windows のユーザーアカウント制御（UAC）が起動し、管理者用のID とパスワードの入力を求められます。インストールでは、exe の名称からわかるように 32 ビット版と 64 ビット版それぞれの VC++ランタイムライブラリがお使いの PC にセットアップされます。なお、インストール後は（僕のPC環境では）再起動なしで、そのまますぐに AC_Reader.exe を実行できました。

「VisualCppRedist_AIO_x86_x64.exe」の入手先：

https://www.majorgeeks.com/files/details/visual_c_redistributable_runtimes_aio_repack.html

【採点の準備】

AC_Reader.exe をダブルクリックしてプログラムを起動したら、「採点作業」ボタンをクリックします。ここで「Windows によって PC が保護されました」と書かれた青い画面が表示された場合は、当 blog の過去記事に対応方法の詳細な説明を載せてありますので、そちらをご参照ください。

無料で使える手書き答案採点補助プログラム

この青い画面（ Windows Defender SmartScreen ）に関するより詳細な説明は、次の過去記事にも掲載しています。もし、よろしければ合わせてご参照ください。

マウスだけで操作可能な画面の拡大表示ツール “KindLens” のご紹介

「採点作業」ボタンをクリックすると、次のメッセージが表示されます。

「はい」をクリックすると、既存の採点設定を選択できるようになります。

採点設定ファイルを選択するには、ComboBox の右側の ∨ マークをクリックします。すると候補の選択肢として採点サンプルファイルが１つだけ表示されますので、これをクリックして選びます。

案内メッセージが表示されます。

「フォルダ選択」用のダイアログが表示されますので、解答用紙画像の入っている「フォルダを選択」してから OK をクリックしてください。

【重要】 選択するのは「フォルダ」であって、「ファイル」ではありません！

案内メッセージが表示されます。よく読んで OK をクリックしてください。

【採点設定ファイルとフォルダの関係】

最初に選んだ「採点設定ファイル」は、試験で使用した解答用紙の解答欄の座標他が登録されています。ですので、同じ解答用紙を使用して行った試験であれば、すべて同一の採点設定ファイルで採点作業を行うことができます。

通常、テストは「クラス単位」で実施されますが、採点設定ファイルはどのクラスに対しても共通で利用しますので、クラス名を入れない名称を付けて保存（例：R7_考査①_数学Ⅰ）するよう、ユーザーの皆さまにはご案内しています。

解答用紙の画像は、通常であれば「クラス名を付けたフォルダ（例：R7_考査①_数学Ⅰ_1A）」に保存するのが一般的であると思います。

ですので、このプログラムの実際の運用に当たっては、「採点設定ファイルにはクラス名を入れず、解答用紙の画像を保存するフォルダにはクラス名を含めた名前を付けてください。」とユーザーの皆さまへご案内しております。

【採点方法】

自動採点は、次の GUI で行います（僕は「フローティングパネル」と呼んでいます）。いろいろ考えてデザインしましたが、使い勝手がよくないと感じられる方もいらっしゃるかもしれません。そうだったら、ほんとに、ごめんなさい。

上部のタイトルバーに相当する部分を左クリックして、
そのまま（左ボタンを押したまま）ドラッグすると、
フローティングパネルを任意の位置へ移動できます。
（閉じるボタンは無効化してあります）

まず、現在、採点しようとしている設問への配点を設定します。

以下、手動採点時の採点方法の説明です。

手動採点時には、このまま、配点設定欄の下にある入力ボタンをクリックすると、配点設定欄が「０」であれば、現在表示されているすべての解答欄に不正解の「×」が、配点設定欄が「１以上」であれば、現在表示されているすべての解答欄に正解の「○」が（設定によっては配点の数字も）自動で入力されます。

これは、つまり、手動採点時には、初めに解答欄全体の出来栄えを見て、全体的によく出来ているような場合は一括して正解とし、不正解の解答欄だけを手動で採点、逆に全体的に出来がよくない場合には、一括して不正解とし、正解の解答欄だけを手動で採点した方が、効率よく採点できると考えて、このような仕様としました。

もちろん、自動採点時には、この入力ボタンをクリックする必要はありません。

また、配点を設定する ComboBox の右隣りの CheckBox「□する」にチェックを入れると、手動採点時に入力ボタンをクリックして、一括採点操作が行われる前に確認メッセージが表示されるようになります（誤入力を防ぎたいという、ユーザーからの要望で追加した機能です）。

【ここから自動採点の実行方法の説明です】

配点を入力後、自動採点を行う場合は、「□自動採点」にチェックを入れます。
次に、その下にある ComboBox からその設問の正解を選び、実行ボタンをクリックします。

正解として指定できるのは･･･

・カタカナの「ア・イ・ウ・エ・オ」のいずれか１文字、
・記号の「○・×」のどちらか１つ、
・数字の「１・２・３・４・５」のいずれか１つです。

これ以外のカタカナ（例えば「カ」）、記号（例えば「△」）、数字（例えば「６以上の数字」）は指定できません（決まりとして指定できないだけで、正解ラベルとしてComboBoxの入力欄に入力することはできます･･･が、正しく採点することは絶対に不可能です）。ただ、数字のゼロは、たぶん記号の「○」で代用が可能かと思われます･･･ので、数字については、もしかしたら「０・１・２・３・４・５」の６種類が採点可能かも？しれません（試していませんが）。

また、正解ラベルに指定する文字・記号・数字は、直接入力せず、ComboBox の選択肢から選択してください。記号の「○：まる」に誤って漢数字の「ゼロ：〇」を指定しないようご注意願います。漢数字のゼロは「まる」の変換でも IME の変換候補の選択肢に表示されるので十分注意してください。

採点が完了すると、解答欄の画像の左上に、採点記号（自動採点を利用した場合は、○ or × のいずれか）と、先に設定した配点が赤く表示されます（表示位置は任意の位置に変更できます。変更方法は上で紹介しました当 blog の過去記事をご参照ください）。

【お願い】
ここで、全ての解答欄について、機械の採点結果を目視で必ず確認してください。

※ このプログラムは、添付した学習モデルの性能が及ぶ範囲で「正解・不正解」のいずれかを判定する自動採点を実行しますが、自動採点結果について、それが常に 100 ％「正しい」ことを保証するものではありません。自動採点を行った結果につきましては、必ず、ご自身の責任で、直接、目視によって、その成否をご確認いただけますよう、お願い申し上げます。この使用条件に完全に同意し、かつ確実に目視による確認作業を実行していただける方のみ、このプログラムをお使いいただけますことを申し添えます。このプログラムに搭載した手動及び自動の採点機能を利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

【修正が必要な場合】

もし、修正が必要な場合は、修正対象の解答欄の画像をまずクリックします。

・正解に修正する場合は、配点に相当する数字キー（その設問の配点が「２」なら「２」のキー）を押下げします。

・不正解に修正する場合は、「B」キーを押下げします。ちなみに「B」は「 ×：Batsu 」の頭文字で、右手でマウス・左手で手動採点する際に「B」キーは押しやすい位置にあり、また、機能を覚えやすいんじゃないかと考え、「B」を不正解の入力キーとしました。

【採点結果の保存方法】

採点結果を保存（＝書込み）しないと、次の解答欄を表示することはできません。実行の左隣にある「書込」ボタンをクリックしてください。採点結果が保存されます。

３．推論用画像データの確認

プログラム設計時の動作検証用に作成した機能ですが、解答用紙画像から切り出した解答欄画像と、その解答欄画像から切り出した推論用画像データの状態を確認することが出来ます。

【解答欄画像の確認方法】

まず、次のように、正解ラベルが「空欄」の状態で確認作業を実行した場合、解答用紙画像から切り出した解答欄画像を確認することが出来ます。

正解ラベルが「空欄」のままであることを確認した後、「設定」→「推論用画像を確認する」の順にクリックしてください（元々、開発時に推論用画像を確認するために設けた機能なので、ボタンの名称が「解答欄･･･」ではありません）。

【重要】設定画面表示中は、Form の「閉じる」ボタンは無効化されます。

解答欄画像が表示されます。

解答用紙から切り出した解答欄画像のクリーニングは、採点作業補助用の GUI （フローティングパネル）の CheckBox 「□自動採点する」をチェックして、さらに正解ラベルが空欄ではない状態で、実行ボタンをクリックすると行われる（ように設定してある）ので、クリーニング前の状態を確認したい場合は、自動採点を実行する前の段階、すなわち、「◀」もしくは「▶」ボタンをクリックした直後の、まだ「□自動採点する」をチェックせず、正解ラベルも指定していない状態で、「設定」ボタンをクリックして、「推論用画像を確認する」^※をクリックすれば（クリーニング前の解答欄画像を）表示できます。

^※リリース版では、上のプロトタイプの状態にさらに画像のクリーニング機能を追加、パラメータが増えたため、ボタンのキャプションは単に「推論用画像」としています。

採点エンジンは２系統あります。
Version1 を選択した場合は、各パラメータを調整できます。
（デフォルト設定は、パラメータを調整済みの Version2 としてあります）

プログラムは、「実行」ボタンをクリックすると、まず、解答用紙から切り出した解答欄画像のクリーニングを行って、それから自動採点を行います。初回のみならず、２度目、３度目の見直し採点時であっても、プログラムは「修正等を一切加えていない無加工の解答用紙画像」から解答欄を切り抜いて解答欄画像として表示しているので、汚れのある解答欄が毎回表示されます。クリーニングが行われるのは、実行ボタンをクリックした後であることにご留意ください。

【点状汚れの除去の例】

クリーニング後の画像は･･･

よーく見ると、微かにうすいシミが残っていますが･･･まぁ、消えたと言えるんじゃないかと。
（ここは後日、さらに改良してより白くなるように修正しました）

【線状汚れの除去の例】

クリーニング後の画像は･･･

【推論用画像の確認方法】

自動採点を実行すれば、推論用に解答欄画像から切り出した、縦横28ピクセルの推論用画像を確認できます。自動採点時、実際に機械が見ているのは、この推論用画像になります。

上の図のような状態で、「実行」ボタンをクリックした後で、「設定」→「推論用画像」の順にクリックします。

縦横28ピクセルの、この小さな画像を思った通りに切り出せるようになるまで、いったいどれくらいの試行錯誤を繰り返したか、今はもうそのすべてを思い出せませんが、自分の中に「あきらめる」という選択肢だけはなかったように思います。

これまでの経験から、ただひとつだけ言えることは、機械学習の成否はこの機械が見る（機械に見せる）画像にあるということです。

学習用データとまったく同じ手法で作成した推論用画像を自分では「ブレない画像」と呼んでいますが、画像中の汚れ・シミ等も含めて輪郭検出した部分の面積を計算し、その大きな部分を組み合わせた範囲を文字として切り抜き、中心位置を計算し、最適な余白を設け、汚れ・シミを除去し、白い部分はより白く、逆に薄い灰色は黒く（濃く）する等、文字の特徴量抽出を阻害する要素をできるだけ取り除いた、わずか縦横28ピクセルの、このちいさな文字。その「作り方」として、僕のとった方法が正解であったかどうかの答えを AC_Reader が出してくれると信じています。

もりろん、手書き文字にひとつとして同じ文字はありませんから、そのような意味で「正しいア」は存在しません。ただ、これまでの経緯から、特徴量抽出で機械が学んだ「ア」こそ、もしかしたら「正しいア」に最も近い「ア」なのではないかと思うようになりました。

ひとことで言えば、「正解がないのに、正解を探す旅」それが今、僕が思う機械学習のイメージです。

４．プログラムのダウンロード

この記事で紹介した「手書き答案の採点補助プログラム AC_Reader.exe」他、この Blog の過去記事に掲載しましたデジタル採点関連のプログラム一式を同梱した DigitalSaiten_All_in_One.zip を次のリンク先からダウンロードできます。なお、ダウンロードとご使用にあたっては、免責事項及び使用条件への同意が必要です。免責事項及び使用条件の詳細は付属の License.txt をご覧ください。

デジタル採点 All in One !

【更新履歴】

・2024年9月29日　初版公開
・2025年8月25日　不具合の修正及び新機能を追加したバージョンアップ版に更新
・2025年8月26日　Anti-Virus Software による『未知バイナリの初回スキャン』の待機状態を改善
・2025年9月22日　連続ボタンクリックで落ちる問題を改善／自動採点機能無し版も同梱

５．お願いとお断り

追記_返却用答案の印刷方法について

元々、この AC_Reader には簡易的な合計点の計算と返却用答案の印刷機能があったのですが、高等学校現場における観点別評価の導入に伴い、返却用答案の印刷プログラムは、マークシートリーダーと共用の別プログラム（ReportCard_2024.exe）としました。

AC_Reader.exe から ReportCard_2024.exe を呼び出して実行できます。ReportCard_2024.exe の操作方法は、当ブログの過去記事をご参照ください。

マークシートの採点結果通知（個票）及び成績一覧表の作成

こちらの過去記事にも ReportCard_2024.exe の操作方法の解説があります。上の記事と合わせてご参照ください。

デジタル採点 All in One !

デジタル採点手書きフリーで検索したら、その後の続き

ほんとうは、今回のお話のタイトルは･･･

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能も搭載しました！

･･･にしたかったのですが、すみません。その前に、自動採点を行うための準備ついて、どこのサイトにもあまり書いてないことを、書いておきたいと思います。

これから書くことは、もしかしたら僕が知らなかっただけで、機械学習に携わる方であれば注意・留意事項以前の「常識」と言っていいようなことなのかもしれません。

それでも、万一にでも、僕の経験が、初めて機械学習や自動採点に挑戦される方の参考になれば、それこそ、何よりの幸いです。

追記

機械学習のライブラリは何にするか･･･とか、溢れんばかりに、いや、溢れかえるほどに情報があることではなく、僕は、それ以前の物語（準備作業）の重要性に気づいたのです。思ったような結果が出ないのは、ライブラリが悪いのではなく、学習用データや推論用データの作り方に問題があったのです。

ある規格に揃えられた、ブレないデータで学習し、学習時と同じ規格で生成された、ブレないデータで推論（判定）する。これがさんざんまわり道をしてたどり着いた、僕なりの結論です。機械学習の最重要ポイントは、データの作成にありました。

【もくじ】

１．学習＆推論データについて
２．解答欄の切り出し
３．解答欄からの解答の切り出し
４．学習用データを作る
５．学習モデルを作る
６．まとめ
７．お願いとお断り

１．学習＆推論データについて

機械学習を行うためには、機械に学習させるデータが必要なことは言うまでもありません。数字ならMNIST、日本語のカタカナであれば ETL といったところでしょうか。

２年前、初めて機械学習にチャレンジしたとき、上の２つのデータベースを知り、当時は keras とニューラルネットワークを使ってカタカナ「アイウエオ」の自動採点に挑戦･･･

それなりに時間と、手間暇をかけて自分なりに頑張ったのですが、どうしても夢見たような結果が得られず、最終的には･･･自作のデジタル採点プログラムへの搭載を断念。

そのいちばんの原因は、（今思えば）学習モデル作成以前に、「高品質な学習データを準備できなかった」ことにありました。

例えば、学習データとする文字・数字・記号を縦横 28 ピクセルの画像として用意するとした場合、画僧中の文字・数字・記号の大きさ、位置、濃さ、その他、画像中のシミや汚れ、等々と言った実に様々な要素の影響を考慮し、必要な場合は修正（補正）を施して･･･、

学習モデル作成用に準備した学習用画像の「それ」と

実際の採点に利用する解答用紙の解答欄から切り出した推論用画像の「それ」が

完全に一致するように「学習用」＆「推論用」画像を準備しなければなりません。

場合によっては、推論対象ごとに処理（修正・補正）を変更する必要すら生じます。例えば「１」や「イ」など、その形状が比較的単純な数字・文字は、画像を二値化して処理した方が認識率が高まるのではないかと実験して感じました（あくまでも、僕自身の実験結果からの判断です。ご注意ください。ただ、僕自身は、この目で見た実験の結果を信じて、推論対象とする数字や文字ごとに処理を分けて実装しています）。

２年前の僕は、学習用画像を作成する段階で、解答用紙の『解答欄の切り出し』にはなんとか成功したものの、解答欄の中の『解答そのものの切り出し』に失敗（例えば、同じ「ア」でも、「つ」と「ノ」の組み合わせのように見える「ア」の場合、機械は「ア」ではなく、「つ」と「ノ」のように別々に輪郭検出）してしまい、高品質な学習用画像が作れませんでした。もちろん、同じ理由から、思うような推論用画像も、生成できるわけがなく･･･

様々に試行を繰り返しましたが、結果としては、自作ソフトへの自動採点機能の搭載を断念せざるを得ませんでした。ただ、自分がとった方法では『ダメ』だという事実と、無加工状態の大量の手書きのカタカナ文字「アイウエオ」、数字の「０～９」、記号の「〇と × 」の画像データが残りました。今回の再チャレンジで、これらのデータが役に立ったことは言うまでもありません。もちろん、『ダメだった』という貴重な経験も、今回はその方向に進んではいけないという、良い指標となりました。

まとめると、良い学習モデルを作成するためには、学習モデルを作成するために使用する学習用画像そのものの品質を、高品質化･･･と言うか、学習用画像の作成方法と、推論用画像の作成方法の差異をなくし、縦横 28 ピクセルの画像とする過程で、数字・文字・記号の大きさを揃え、画像中の位置を中心化し、シミや汚れの除去等々、徹底した修正（補正）を行って、機械が学習しやすく、かつ、判定もより確実に行えるよう、推論用の画像データも学習用データと同じ処理を行って作成したものにする等、ヒトの側で、学びやすい環境と推論しやすい環境を整えてあげることが、ライブラリ云々以前に、他のどんな要素よりも重要で大切なことなんだということが（僕がそう思うだけかもしれませんが）自分なりに納得できた、機械学習で使用する学習＆推論用データ作成に関する最終的な結論です。

以下、僕自身が行った画像の切り出しと修正（補正）方法の一部を紹介します。

２．解答欄の切り出し

２年前は、64 ビット環境で作業したのですが、今回は敢えて 32 ビット環境での機械学習にチャレンジすることにしました。理由は、ただひとつ。自分のアプリケーションがいつも利用している組み込み用の Python 環境である Embeddable Python が 32 ビットバージョンであるためです。

利用するライブラリも、２年前の keras ではなく、scikit-learn に変更しました。２年前は、見様見真似で作ったニューラルネットワークを用いましたが、今回は特徴量を抽出する手法（HOG + LBP）を用いて学習モデルを作成し、推論に利用しました。

世の中の流れには、完全に逆行しているような気がしますが、『正しく自動採点できた！』という結果が出せれば、方法は何でも良いと考え、ニューラルネットワークのことは忘れることにしました。

『機械学習』と言えば、即、ニューラルネットワークだと思い込んでいた･･･２年前の僕に、今は･･･、「そんなに短絡的に、思い込まなくても、よかったんじゃないか･･･」って言ってあげたい気もします。

それより、学習用データや、推論用データを、しっかり作ることの方が、大切だよ･･･って。

データが正しければ、ライブラリは間違えない。
データに誤りがあれば、ライブラリも間違える。

ライブラリの性能を、最高に引き出せるデータを作ることが、

機械学習では、きっと･･･

いちばん、大切な、こと･･･なんだよって。

それが、今回のチャレンジを終えて、感じた･･･僕自身の偽りのない、正直な、思いです。

プログラムに自動採点機能を実装するためには、文字を認識し、推論（判定）する処理が必要です。そのため、最初に行わなければならないのが解答用紙画像から解答欄矩形を切り出す処理です。これには次のようなスクリプトを使用しました。

# 解答用紙から解答欄矩形を切り出すスクリプト（AnswerColumnCutter.py）

import cv2
import numpy as np
import os
from glob import glob

# 入出力フォルダ
input_folder = r'.\MyData'  # 解答用紙画像のあるフォルダ
output_folder = r'.\ACData'  # 切り出した解答欄の保存先
os.makedirs(output_folder, exist_ok=True)

# 対象画像の拡張子
image_extensions = ['*.png', '*.jpg', '*.jpeg']
image_files = []
for ext in image_extensions:
    image_files.extend(glob(os.path.join(input_folder, ext)))

# 解答欄サイズの閾値（調整可能）
min_width = 100
min_height = 50
max_width = 800
max_height = 400

# 保存ファイルの連番用カウンタ
save_index = 1

# 処理ループ
for image_path in image_files:
    filename = os.path.basename(image_path)

    # 画像読み込み（日本語ファイル名に対応）
    image = cv2.imdecode(np.fromfile(image_path, dtype=np.uint8), cv2.IMREAD_COLOR)
    if image is None:
        print(f'読み込み失敗: {filename}')
        continue

    # グレースケール変換と二値化
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    blur = cv2.GaussianBlur(gray, (5, 5), 0)
    _, binary = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    # 輪郭検出（内枠も含める）
    contours, _ = cv2.findContours(binary, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

    for cnt in contours:
        area = cv2.contourArea(cnt)
        if area < 1000:
            continue

        approx = cv2.approxPolyDP(cnt, 0.02 * cv2.arcLength(cnt, True), True)

        if len(approx) == 4:
            x, y, w, h = cv2.boundingRect(approx)

            if min_width <= w <= max_width and min_height <= h <= max_height:
                roi = image[y:y+h, x:x+w]

                save_name = f'answer_{save_index:04d}.png'
                save_path = os.path.join(output_folder, save_name)
                cv2.imencode('.png', roi)[1].tofile(save_path)

                save_index += 1

print(f'Saving complete! {save_index - 1} items saved.')

実行結果は、次の通りです。数字・文字（記号）は、この記事用にすべて自分で書きました。

これでOKかというと、実はOKではありません。解答用紙の画像から切り出した解答欄の画像１枚１枚をよく見ると･･･

文字の他に、解答欄の矩形の一部が見えます。最終的には輪郭検出で文字の部分のみを見つけて、文字のみを切り出すので影響はないようにも思いますが、より確実に文字を切り出すために不安要素はすべて準備段階で取り除いておくことにしました。

上のスクリプトに、枠線（罫線）を除去する機能を追加します。

# 解答欄矩形の枠線を消す処理を追加したスクリプト（AnswerColumnCutter2.py）

import cv2
import numpy as np
import os
from glob import glob

# 入出力フォルダ
input_folder = r'.\MyData'  # 解答用紙画像のあるフォルダ
output_folder = r'.\ACData'  # 切り出した解答欄の保存先
os.makedirs(output_folder, exist_ok=True)

# 対象画像の拡張子
image_extensions = ['*.png', '*.jpg', '*.jpeg']
image_files = []
for ext in image_extensions:
    image_files.extend(glob(os.path.join(input_folder, ext)))

# 解答欄サイズの閾値（調整可能）
min_width = 100
min_height = 50
max_width = 800
max_height = 400

# ROIの枠線除去用パディング（上下左右のピクセル数）※状況によっては、個別に指定することも可とした
Pad = 10  # 画像の状態に応じて適宜修正する
padding_top = Pad
padding_bottom = Pad
padding_left = Pad
padding_right = Pad

# 保存ファイルの連番用カウンタ
save_index = 1

# 処理ループ
for image_path in image_files:
    filename = os.path.basename(image_path)

    # 画像読み込み（日本語ファイル名対応）
    image = cv2.imdecode(np.fromfile(image_path, dtype=np.uint8), cv2.IMREAD_COLOR)
    if image is None:
        print(f'読み込み失敗: {filename}')
        continue

    # グレースケール変換と二値化
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    blur = cv2.GaussianBlur(gray, (5, 5), 0)
    _, binary = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    # 輪郭検出（内枠も含める）
    contours, _ = cv2.findContours(binary, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

    for cnt in contours:
        area = cv2.contourArea(cnt)
        if area < 1000:
            continue

        approx = cv2.approxPolyDP(cnt, 0.02 * cv2.arcLength(cnt, True), True)

        if len(approx) == 4:
            x, y, w, h = cv2.boundingRect(approx)

            if min_width <= w <= max_width and min_height <= h <= max_height:
                roi = image[y:y+h, x:x+w].copy()

                # 枠線を削除（上下左右 padding ピクセルを白で塗りつぶす）
                roi[:padding_top, :] = 255  # 上
                roi[-padding_bottom:, :] = 255  # 下
                roi[:, :padding_left] = 255  # 左
                roi[:, -padding_right:] = 255  # 右

                save_name = f'answer_{save_index:04d}.png'
                save_path = os.path.join(output_folder, save_name)
                cv2.imencode('.png', roi)[1].tofile(save_path)

                save_index += 1

print(f'Saving complete! {save_index - 1} items saved.')

結果は、次の通りです。

では、これで OK かというと、まだ問題があります。問題の１つが画像中の黒や灰色の汚れです。

これらも出来る限り、除去できるよう解答欄の切り出しスクリプトを改良します。

'''
解答欄矩形の枠線を消す処理を追加したスクリプト（AnswerColumnCutter2.py）に
黒点も削除する処理を追加したAnswerColumnCutter3.py
'''

import cv2
import numpy as np
import os
from glob import glob

# 入出力フォルダ
input_folder = r'.\MyData'  # 解答用紙画像のあるフォルダ
output_folder = r'.\ACData'  # 切り出した解答欄の保存先
os.makedirs(output_folder, exist_ok=True)

# 対象画像の拡張子
image_extensions = ['*.png', '*.jpg', '*.jpeg']
image_files = []
for ext in image_extensions:
    image_files.extend(glob(os.path.join(input_folder, ext)))

# 解答欄サイズの閾値（調整可能）
min_width = 100
min_height = 50
max_width = 800
max_height = 400

# ROIの枠線除去用パディング（上下左右のピクセル数）
Pad = 5
padding_top = Pad
padding_bottom = Pad
padding_left = Pad
padding_right = Pad

# 保存ファイルの連番用カウンタ
save_index = 1

# 処理ループ
for image_path in image_files:
    filename = os.path.basename(image_path)

    # 画像読み込み（日本語ファイル名対応）
    image = cv2.imdecode(np.fromfile(image_path, dtype=np.uint8), cv2.IMREAD_COLOR)
    if image is None:
        print(f'読み込み失敗: {filename}')
        continue

    # グレースケール変換と二値化（binaryにはblurされた白黒反転画像が入る）
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    blur = cv2.GaussianBlur(gray, (5, 5), 0)
    _, binary = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    # 輪郭検出（内枠も含める）
    contours, _ = cv2.findContours(binary, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

    for cnt in contours:
        area = cv2.contourArea(cnt)
        if area < 1000:
            continue

        approx = cv2.approxPolyDP(cnt, 0.02 * cv2.arcLength(cnt, True), True)

        if len(approx) == 4:
            x, y, w, h = cv2.boundingRect(approx)

            if min_width <= w <= max_width and min_height <= h <= max_height:
                # imageは元のカラー画像（輪郭検出に使用したbinaryではないことに注意する！）
                roi = image[y:y+h, x:x+w].copy()

                # 枠線を削除（上下左右 padding ピクセルを白で塗りつぶす）
                roi[:padding_top, :] = 255  # 上
                roi[-padding_bottom:, :] = 255  # 下
                roi[:, :padding_left] = 255  # 左
                roi[:, -padding_right:] = 255  # 右

                # --- シミやノイズを除去する処理を追加 ---
                gray_roi = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY)

                # 小さな黒点や灰色点を除去（モルフォロジー開演算）
                kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (3, 3))
                opened = cv2.morphologyEx(gray_roi, cv2.MORPH_OPEN, kernel, iterations=1)

                # 小さな輪郭（ノイズ）を除去
                cleaned = opened.copy()
                contours_noise, _ = cv2.findContours(255 - opened, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
                for c in contours_noise:
                    if cv2.contourArea(c) < 150:  # 小さな汚れを消す
                        cv2.drawContours(cleaned, [c], -1, 255, -1)

                # グレースケール→カラーに戻す
                cleaned_color = cv2.cvtColor(cleaned, cv2.COLOR_GRAY2BGR)
                roi = cleaned_color

                # 保存
                save_name = f'answer_{save_index:04d}.png'
                save_path = os.path.join(output_folder, save_name)
                cv2.imencode('.png', roi)[1].tofile(save_path)

                save_index += 1

print(f'Saving complete! {save_index - 1} items saved.')

結果は、次の通り。

しかし、まだ問題が残っています。それは･･･

この灰色の直線のようなものが入る理由がわからないのですが、現実問題として、僕が利用している複合機でスキャンしたJpeg画像には時折り、このような直線が入ってしまいます（もっと黒い線になることもあります）。理由はともあれ、これを除去できるよう、新しくスクリプトを作成しました。解答用紙から切り出して保存した解答欄画像に対して処理を行っていることにご注意ください。

'''
縦線は画像の高さに匹敵する長さ、
横線は画像の幅に匹敵する長さを持つ直線のみを除去するスクリプト。
image.shape を使って幅 (width) と高さ (height) を取得。
縦線: 傾き ≒ 垂直（3度以内）かつ 長さ ≥ 高さの 80%。
横線: 傾き ≒ 水平（3度以内）かつ 長さ ≥ 幅の 80%。
'''

import cv2
import numpy as np
import os
from glob import glob

# 処理対象フォルダ
folder = r'.\ACData'  # 解答欄画像として保存したデータを修正しています
image_extensions = ['*.png', '*.jpg', '*.jpeg']
image_paths = []
for ext in image_extensions:
    image_paths.extend(glob(os.path.join(folder, ext)))

for image_path in image_paths:
    # 日本語ファイル名対応で画像読み込み
    image = cv2.imdecode(np.fromfile(image_path, dtype=np.uint8), cv2.IMREAD_COLOR)
    if image is None:
        print(f"読み込み失敗: {image_path}")
        continue

    height, width = image.shape[:2]
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

    # エッジ検出（低い閾値で薄い線も対象）
    edges = cv2.Canny(gray, threshold1=20, threshold2=80, apertureSize=3)

    # HoughLinesPで直線検出
    lines = cv2.HoughLinesP(
        edges,
        rho=1,
        theta=np.pi / 180,
        threshold=50,
        minLineLength=30,
        maxLineGap=5
    )

    # 線を描画するマスク
    mask = np.zeros_like(gray)

    if lines is not None:
        for line in lines:
            x1, y1, x2, y2 = line[0]
            dx = x2 - x1
            dy = y2 - y1
            length = np.sqrt(dx ** 2 + dy ** 2)

            # 傾きが垂直に近く、高さに匹敵する長さを持つ線
            if (abs(dx) < 1e-5 or abs(dy / dx) > 20) and length >= height * 0.8:
                cv2.line(mask, (x1, y1), (x2, y2), 255, thickness=2)

            # 傾きが水平に近く、幅に匹敵する長さを持つ線
            elif (abs(dy) < 1e-5 or abs(dx / dy) > 20) and length >= width * 0.8:
                cv2.line(mask, (x1, y1), (x2, y2), 255, thickness=2)

    # マスクされた領域を修復（inpainting）
    if np.count_nonzero(mask) > 0:
        inpainted = cv2.inpaint(image, mask, inpaintRadius=3, flags=cv2.INPAINT_TELEA)
    else:
        inpainted = image  # 線が見つからなければそのまま

    # 上書き保存（日本語ファイル名対応）
    cv2.imencode('.png', inpainted)[1].tofile(image_path)

    print(f'修正完了: {os.path.basename(image_path)}')

print("全ファイルの処理が完了しました。")

結果は、次の通り。

これでようやく安心して使える解答欄の切り出し画像が準備できました！

３．解答欄からの解答の切り出し

次は、解答の切り出しです。２年前はここで失敗しました。今回、あらためて失敗の原因を考えてみると、２年前も輪郭検出までは成功したのですが、輪郭検出できた場合に、『その後の処理をどう行うか？』という部分で（２年前は）工夫が足りなかったことに気づきました。

それはどういうことか、説明します。
まず、輪郭検出です。わかりやすさのために、検出した部分を赤枠で囲って示します。

文字全体が一筆書きのように描かれていれば正しく検出できるのですが、文字を構成する部品が独立して描かれている場合には、文字全体を正しく検出できていません。

今回は、『輪郭検出できた部分を組み合わせて出来る範囲の周囲を文字と見なして切り取る』という方法を用いてみました。次の画像にその結果を示します。

左から順に拡大して見てみます。

拡大すると、文字を構成する部品が完全に繋がっているわけではないようです。が、輪郭検出自体には成功しています。輪郭検出に使用した OpenCV は本当に優秀なライブラリです。

こちらの「ア」は、３つの輪郭の範囲を合わせて文字として認識。切り出しに成功しました！

こちらの「イ」は、２つの輪郭の範囲を合わせて文字として認識。切り出しに成功しました！

では、これで本当に OK かというと、コトはそう簡単ではありませんでした。

次のような、黒点が残ってしまった画像に対し、この切り抜き処理を実行すると･･･

次のように、左隅の黒点部分まで、文字を構成する部品の一部と見なし、（ヒトから見れば）誤った範囲を文字として切り出してしまいます。

機械的には、極めて正確に、ヒトの命令に忠実に、正しい処理を行っているわけですが･･･

この問題に対しては、『検出した輪郭の中から「面積の大きな輪郭」（最大輪郭の面積の10%以上のもの）をすべて組み合わせた領域を文字領域とみなし、その周囲に上下左右10ピクセルの白い余白を付けて切り抜く』方法で対応しました。次がそのスクリプトです。

import cv2
import numpy as np
import os
from glob import glob

# 入出力フォルダのパス（必要に応じて変更）
input_folder = r'.\MyInputFolder'     # ←処理対象フォルダ
output_folder = r'.\Crop04_Pic'       # ←保存先フォルダ
os.makedirs(output_folder, exist_ok=True)

# 画像拡張子に対応
image_extensions = ['*.png', '*.jpg', '*.jpeg']
image_files = []
for ext in image_extensions:
    image_files.extend(glob(os.path.join(input_folder, ext)))

# 処理ループ
for image_path in image_files:
    filename = os.path.basename(image_path)

    # 日本語ファイル名対応の読み込み
    image = cv2.imdecode(np.fromfile(image_path, dtype=np.uint8), cv2.IMREAD_COLOR)
    if image is None:
        print(f'読み込めません: {filename}')
        continue

    # グレースケール & 二値化
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    _, binary = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    # 縦線除去処理（細い直線ノイズを消す）
    vertical_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (1, 30))  # 縦方向に長いカーネル
    vertical_lines = cv2.morphologyEx(binary, cv2.MORPH_OPEN, vertical_kernel, iterations=1)
    binary_cleaned = cv2.subtract(binary, vertical_lines)

    # 輪郭検出（外側のみ）
    contours, _ = cv2.findContours(binary_cleaned, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    if not contours:
        print(f'輪郭なし: {filename}')
        continue

    # 最大輪郭の面積を基準に、大きな輪郭（最大輪郭の10%以上）を抽出
    max_area = max([cv2.contourArea(c) for c in contours])
    area_threshold = 0.1 * max_area
    large_contours = [c for c in contours if cv2.contourArea(c) >= area_threshold]
    if not large_contours:
        print(f'大きな輪郭なし: {filename}')
        continue

    # 大きな輪郭群の外接矩形の結合領域を求める
    x_vals = []
    y_vals = []
    x2_vals = []
    y2_vals = []
    for cnt in large_contours:
        x, y, w, h = cv2.boundingRect(cnt)
        x_vals.append(x)
        y_vals.append(y)
        x2_vals.append(x + w)
        y2_vals.append(y + h)
    combined_x = min(x_vals)
    combined_y = min(y_vals)
    combined_x2 = max(x2_vals)
    combined_y2 = max(y2_vals)

    # 余白を加える（画像範囲内に収める）
    pad = 10
    x1 = max(combined_x - pad, 0)
    y1 = max(combined_y - pad, 0)
    x2 = min(combined_x2 + pad, image.shape[1])
    y2 = min(combined_y2 + pad, image.shape[0])
    cropped = image[y1:y2, x1:x2]

    # 保存（PNG形式、元のファイル名と同じ名前）
    save_path = os.path.join(output_folder, os.path.splitext(filename)[0] + '.png')
    cv2.imencode('.png', cropped)[1].tofile(save_path)

print(f'Saving complete!')

次のように、構成部品が離れている「ア」であっても（思った通りに）切り出すことに成功しました！

このようにして切り出した画像から、次に機械学習による学習モデルを作るための学習用データを準備します。今回は、scikit-learn の HOG特徴量抽出を利用するので、解答欄から切り出した手書き数字・文字・記号の画像を、手書き数字や単純な記号認識に適しているとされ、MNISTデータセット（手書き数字認識の標準データセット）で採用されているサイズである 28 × 28 ピクセルの画像に変換します。

次に、その変換方法について説明します。

４．学習用データを作る

機械学習の学習用データの作成方法として、僕が行ったことが正しいかどうかは、この記事をお読みになった方ご自身でご判断ください。僕自身は、機械学習を理論的な背景を含め、基礎からきちんと学んだことはありませんし、今回利用した HOG（ Histogram of Oriented Gradients ）＋ LBP（Local Binary Patterns ）という特徴量抽出手法についてもその詳細な部分まで理解しているわけではないからです。そのような点を御理解の上、記事をお読みいただけましら幸いです。

学習用データは、予め、「ア」なら「ア」だけを、正解ラベル名を付けたフォルダに分類しておきます。

これを処理して、次に示すような 28 × 28 ピクセルの画像を作成します。

この 28 × 28 ピクセルの画像を作成する過程で、必要に応じて、補正処理をかけ、機械学習を行うために必要十分と思われる画像となるよう準備します。ここで言う必要十分とは、機械に見せる画像内の推論対象の「大きさ・位置・傾き・濃さ」等をヒト基準で一定の範囲に収まるように、予め個々の画像を学習前・推論前に調整し、学習時も推論時も同じ処理の過程を経て作成された･･･言わば「ブレていない」画像（データ）を機械が見れる＝機械は余計な気遣いなどできないので、同じ条件下で作成された画像を見て、機械は「その特徴量抽出のみに専念できるようにする」という意味です。

繰り返しになりますが、学習用画像を作成する時だけでなく、推論用画像を作成する際も、学習用画像を作成する際に行ったのと同じ処理をそっくりそのまま行って、機械が常に同じ（安定した）条件下で推論（手書き文字の認識作業）を実行できるようにするという部分も非常に重要だと考えます。

処理に使用したライブラリの一覧です。

import cv2
import numpy as np
import os
from glob import glob
import re
import joblib
from skimage.feature import hog, local_binary_pattern

文字を傾きを均一化し、分類器がより正確な特徴を学習できるようにするために次の関数を用意。

def deskew(img):
    m = cv2.moments(img)
    if abs(m["mu02"]) < 1e-2:
        return img.copy()
    skew = m["mu11"] / m["mu02"]
    M = np.float32([[1, skew, -0.5 * 28 * skew], [0, 1, 0]])
    return cv2.warpAffine(img, M, (28, 28), flags=cv2.INTER_NEAREST | cv2.WARP_INVERSE_MAP, borderValue=255)

学習用画像データの読み込み処理部分は割愛します。

次が学習用画像の処理ループ部分です。任意に指定した学習用データを保存したフォルダ内の全画像について処理を以下の通り実行します。補正処理の実行内容は、各々のコメントをご参照ください。

index = 1
light_text_threshold = 215  # 文字の視認性の向上（薄いと判断する閾値）
pad = 10                     # 周囲に設定する余白
clip_limit = 0.3            # コントラストの過剰な増加を防ぐための制限値。ごく弱く設定。
tile_grid_size = 2          # 画像を分割するグリッドのサイズ。ごく小さめに設定

# 学習用データの数だけループする
for image_path in image_files:
    image = imread_utf8(image_path)
    if image is None:
        continue
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    _, binary = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    '''
    小さすぎる or 明るすぎる成分は除外して、画像の連結成分を解析し、有効な成分のみを抽出、
    適切な境界を決めて、その範囲を文字として切り出す処理。
    '''
    num_labels, labels, stats, centroids = cv2.connectedComponentsWithStats(binary, connectivity=8)
    min_area = 50
    brightness_threshold = 200

    valid_components = []
    for i in range(1, num_labels):
        x, y, w, h, area = stats[i]
        if area < min_area:
            roi = gray[y:y+h, x:x+w]
            mean_val = cv2.mean(roi)[0]
            if mean_val > brightness_threshold:
                continue
        valid_components.append((x, y, w, h))

    if not valid_components:
        cropped = np.full((28, 28, 3), 0, dtype=np.uint8)
    else:
        x_vals = [x for x, y, w, h in valid_components]
        y_vals = [y for x, y, w, h in valid_components]
        x2_vals = [x + w for x, y, w, h in valid_components]
        y2_vals = [y + h for x, y, w, h in valid_components]
        combined_x = min(x_vals)
        combined_y = min(y_vals)
        combined_x2 = max(x2_vals)
        combined_y2 = max(y2_vals)

        x1 = max(combined_x - pad, 0)
        y1 = max(combined_y - pad, 0)
        x2 = min(combined_x2 + pad, image.shape[1])
        y2 = min(combined_y2 + pad, image.shape[0])
        cropped = image[y1:y2, x1:x2]

    '''
    明るい文字のコントラストを調整し、認識しやすくする処理。白飛びを防ぎ、画像の視認性を改善する。
    '''
    trimmed_gray = cv2.cvtColor(cropped, cv2.COLOR_BGR2GRAY)
    mask = (trimmed_gray >= light_text_threshold).astype(np.uint8) * 255
    adjusted = trimmed_gray.copy()
    adjusted[mask == 255] = np.clip(adjusted[mask == 255] - 20, 0, 255)

    # 輪郭検出
    contours, _ = cv2.findContours(adjusted, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    if contours:
        # CLAHEを適用
        clahe = cv2.createCLAHE(clipLimit=clip_limit, tileGridSize=(tile_grid_size, tile_grid_size))
        trimmed_gray = clahe.apply(trimmed_gray)
        # 調整した結果、ここではぼかし無しと同等にしておくことにした。必要であればより強く設定。
        trimmed_blur = cv2.GaussianBlur(trimmed_gray, (1, 1), 0)
        # 単純な形であれば二値化して処理する
        if label in ["イ", "1"]:
            _, trimmed_thresh = cv2.threshold(trimmed_blur, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
            h_trim, w_trim = trimmed_thresh.shape[:2]
        else:
            h_trim, w_trim = trimmed_blur.shape[:2]

        scale = 20.0 / max(h_trim, w_trim)
        new_w = int(w_trim * scale)
        new_h = int(h_trim * scale)

        if label in ["イ", "1"]:
            resized = cv2.resize(trimmed_thresh, (new_w, new_h), interpolation=cv2.INTER_AREA)
        else:
            resized = cv2.resize(trimmed_blur, (new_w, new_h), interpolation=cv2.INTER_AREA)

        # 学習用データから切り出した文字を28×28ピクセルのキャンバスの中央に配置する。
        # 入力画像を統一されたサイズに整える。
        canvas = np.full((28, 28), 255, dtype=np.uint8)
        x_offset = (28 - new_w) // 2
        y_offset = (28 - new_h) // 2
        canvas[y_offset:y_offset + new_h, x_offset:x_offset + new_w] = resized
        # 文字の傾きを均一化する
        deskewed = deskew(canvas)

        # - 画像のモーメント（統計量） を計算し、文字の重心（中心）を求めてセンタリングする処理
        M = cv2.moments(deskewed)
        if M["m00"] != 0:
            cx = int(M["m10"] / M["m00"])
            cy = int(M["m01"] / M["m00"])
            # 画像を重心基準で移動
            shift_x = 14 - cx
            shift_y = 14 - cy
            trans_mat = np.float32([[1, 0, shift_x], [0, 1, shift_y]])
            deskewed = cv2.warpAffine(deskewed, trans_mat, (28, 28), flags=cv2.INTER_AREA, borderValue=255)

        canvas = deskewed

        # 画像の標準化
        mean, std = cv2.meanStdDev(canvas)
        std = std[0][0] if std[0][0] > 1e-5 else 1.0
        # 画像の正規化
        norm_img = (canvas.astype(np.float32) - mean[0][0]) / std
        norm_img = cv2.normalize(norm_img, None, 0, 255, cv2.NORM_MINMAX)
        canvas = norm_img.astype(np.uint8)
    else:
        # - 有効な画像データがない場合は、白色の 28×28 画像を作成。
        canvas = np.full((28, 28), 255, dtype=np.uint8)

    # png形式で保存する
    save_path = os.path.join(output_folder, f"crop_Img{index:04d}.png")
    is_written = cv2.imencode(".png", canvas)[1]
    with open(save_path, "wb") as f:
        f.write(is_written)
    index += 1

png 形式での保存を選択したことにも理由があります。データを間引いて保存する Jpeg 形式よりも、可逆圧縮を使用し、元の画像データを損失なく保存（ピクセル単位での正確性を維持）できる png 形式の方が機械学習には適しているからです。

こうして、次のような学習用データが完成しました。

こんな小さな画像ですが、ここまで到達するには･･･　本当に長い時間と･･･試行錯誤が必要でした。

５．学習モデルを作る

任意のフォルダ内（ここでは trimed フォルダ）に、正解ラベルの名前を付けたフォルダを必要数分準備して、上の４で作成した学習データを格納しておきます。

そして、学習モデルを作成するスクリプトを実行します。例としてカタカナ「アイウエオ」の推論用の学習用データ作成スクリプトを示します。

import os
import cv2
import numpy as np
import joblib

from skimage.feature import hog, local_binary_pattern
from sklearn.decomposition import IncrementalPCA
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.metrics import classification_report

LABELS = {'ア': 0, 'イ': 1, 'ウ': 2, 'エ': 3, 'オ': 4}
IMG_SIZE = (28, 28)

LBP_RADIUS = 1
LBP_POINTS = 8 * LBP_RADIUS
LBP_METHOD = 'uniform'

DATASET_DIR = r".\aiueo\Trimed"

def extract_features(image):
    image = cv2.GaussianBlur(image, (3, 3), 0)
    hog_features = hog(image, pixels_per_cell=(4, 4), cells_per_block=(2, 2), feature_vector=True)
    lbp = local_binary_pattern(image, LBP_POINTS, LBP_RADIUS, method=LBP_METHOD)
    lbp_hist, _ = np.histogram(lbp.ravel(), bins=np.arange(0, LBP_POINTS + 3), range=(0, LBP_POINTS + 2))
    lbp_hist = lbp_hist.astype("float32")
    lbp_hist /= (lbp_hist.sum() + 1e-6)
    return np.concatenate([hog_features, lbp_hist])

def load_dataset_in_batches(root_dir, max_samples_per_label=7000, batch_size=500, show_progress=False):
    label_dirs = [d for d in os.listdir(root_dir) if os.path.isdir(os.path.join(root_dir, d)) and d in LABELS]

    for label_name in label_dirs:
        label_path = os.path.join(root_dir, label_name)
        files = os.listdir(label_path)
        np.random.shuffle(files)
        batch_features = []
        batch_labels = []

        total_files = min(len(files), max_samples_per_label)
        if show_progress:
            print(f"\n[{label_name}] 読み込み開始 (最大{total_files}枚)")

        for i, file in enumerate(files):
            if i >= max_samples_per_label:
                break
            file_path = os.path.join(label_path, file)
            image = cv2.imdecode(np.fromfile(file_path, dtype=np.uint8), cv2.IMREAD_GRAYSCALE)
            if image is None or image.shape != IMG_SIZE:
                continue
            feat = extract_features(image)
            batch_features.append(feat)
            batch_labels.append(LABELS[label_name])

            if show_progress and ((i + 1) % max(1, total_files // 20) == 0 or (i + 1) == total_files):
                progress = (i + 1) / total_files * 100
                print(f"  {i+1}/{total_files}枚完了 ({progress:.1f}%)")

            if len(batch_features) >= batch_size:
                yield np.array(batch_features, dtype=np.float32), np.array(batch_labels, dtype=np.int32)
                batch_features = []
                batch_labels = []

        if batch_features:
            yield np.array(batch_features, dtype=np.float32), np.array(batch_labels, dtype=np.int32)

# 特徴抽出
print("\n[特徴量収集]")
all_features = []
all_labels = []
for batch_features, batch_labels in load_dataset_in_batches(DATASET_DIR, show_progress=True):
    all_features.append(batch_features)
    all_labels.append(batch_labels)

X_all = np.vstack(all_features)
y_all = np.hstack(all_labels)

# PCA学習
print("\n[PCA学習開始]")
n_components = 200
pca = IncrementalPCA(n_components=n_components)
pca.fit(X_all)

# 特徴量変換
X_pca = pca.transform(X_all)

# データ分割
print("\n[データ分割]")
X_train, X_test, y_train, y_test = train_test_split(X_pca, y_all, test_size=0.2, random_state=42)

# 間違えてもとにかく判定
# model = SVC(kernel='rbf', gamma='scale', C=10)
# 指定正解率未満の場合は「判定不可能」と表示
# この指定着きでビルドしていない場合、判定スクリプトを実行すると「handwritten_digit_0.png の推定結果: モデルが確率推定に未対応」と表示される
model = SVC(kernel='rbf', C=10, probability=True)

'''
# ハイパーパラメータ探索 -> 1, 10, 50, 100 の中から探す。結果、C=10 だった！
print("\n[グリッドサーチ]")
param_grid = {'C': [1, 10, 50, 100]}
svc = SVC(kernel='rbf', gamma='scale')
clf = GridSearchCV(svc, param_grid, cv=3)
clf.fit(X_train, y_train)
print(f"最適なCの値: {clf.best_params_['C']}")
model = clf.best_estimator_
'''

# モデル学習（これが抜けているとエラーになる！）
model.fit(X_train, y_train)

# 評価
print("\n[テストデータで評価]")
y_pred = model.predict(X_test)
print(classification_report(y_test, y_pred, target_names=list(LABELS.keys())))

# 確率推定
# y_proba = model.predict_proba(X_test)  # 各クラスの確率を取得
# print(y_proba[:5])  # 最初の5つの予測結果の確率を表示

# モデル保存
print("\n[モデル保存]")
joblib.dump(model, "aiueo_svm_model.pkl")
joblib.dump(pca, "aiueo_pca.pkl")
print("[保存完了]")

実行結果は、次の通りです。

[特徴量収集]
[ア] 読み込み開始 (最大2511枚)
  125/2511枚完了 (5.0%)
　･･･（省略）･･･
  2511/2511枚完了 (100.0%)
[イ] 読み込み開始 (最大2575枚)
  128/2575枚完了 (5.0%)
  ･･･（省略）･･･
  2575/2575枚完了 (100.0%)
[ウ] 読み込み開始 (最大2636枚)
  131/2636枚完了 (5.0%)
  ･･･（省略）･･･
  2636/2636枚完了 (100.0%)
[エ] 読み込み開始 (最大2582枚)
  129/2582枚完了 (5.0%)
  ･･･（省略）･･･
  2582/2582枚完了 (100.0%)

[オ] 読み込み開始 (最大2602枚)
  130/2602枚完了 (5.0%)
  ･･･（省略）･･･
  2602/2602枚完了 (100.0%)
[PCA学習開始]
[データ分割]
[テストデータで評価]
              precision    recall  f1-score   support

           ア       1.00      1.00      1.00       516
           イ       1.00      1.00      1.00       538
           ウ       1.00      1.00      1.00       537
           エ       1.00      1.00      1.00       499
           オ       1.00      1.00      1.00       492

    accuracy                           1.00      2582
   macro avg       1.00      1.00      1.00      2582
weighted avg       1.00      1.00      1.00      2582

上のスクリプトで、

X_train, X_test, y_train, y_test = train_test_split(X_pca, y_all, test_size=0.2, random_state=42)

としていますので、データセットの 80% を学習用 (X_train, y_train)、20% をテスト用 (X_test, y_test) に分割していることになります。

スクリプトを実行する度に、テスト用の20%の内容は変化しますので [テストデータで評価] の部分は変化するはずですが、何回か、実行した結果悪くても 0.99 で、どの文字についても、ほとんど 1.00 から変化がありませんでした。

ちなみに、もう１回実行してみると･･･

[テストデータで評価]
              precision    recall  f1-score   support

           ア       1.00      1.00      1.00       516
           イ       1.00      1.00      1.00       538
           ウ       1.00      1.00      1.00       537
           エ       1.00      1.00      1.00       499
           オ       1.00      1.00      1.00       492

    accuracy                           1.00      2582
   macro avg       1.00      1.00      1.00      2582
weighted avg       1.00      1.00      1.00      2582

もう１回、実行してみました。

[テストデータで評価]
              precision    recall  f1-score   support

           ア       1.00      1.00      1.00       516
           イ       0.99      1.00      1.00       538
           ウ       1.00      1.00      1.00       537
           エ       1.00      1.00      1.00       499
           オ       0.99      0.99      0.99       492

    accuracy                           1.00      2582
   macro avg       1.00      1.00      1.00      2582
weighted avg       1.00      1.00      1.00      2582

「イ」と「オ」が 0.99 ですが、それでも 0.99 です。

・適合率 (precision) がほぼ 1.00 なので、正解ラベルを正しく予測できています。
・再現率 (recall) がほぼ 1.00 なので、実際の正解ラベルを確実に検出できています。
・F1スコアがほぼ 1.00 なので、誤分類はありません。

で、総合精度 (accuracy) が 1.00 ですから、今回、作成した学習モデルはテストデータに対して完璧に近い性能を発揮していると言ってよいと思います。ただ、ただ、過学習に陥ってないことを祈るのみです。過学習に陥っていないことの確認するのは簡単です。未知の手書きカタカナ「アイウエオ」のデータを、この学習モデルに見せて、正しく推論できるか、テストしてあげればよいのです。

なので、未知のカタカナ文字を正しく推論できるか、テストしてみました。

テストに使用したスクリプトです。こちらは簡易版で、実際の場面では、より良い推論用データとなるよう、このスクリプトを適用する前処理として、上で学習用データを作成するために行った補正（修正）を上の５つの画像に対して行い、その後、このテスト用スクリプトを適用することになります。

# アイウエオ判定用最終版

import os
import cv2
import numpy as np
import joblib
from skimage.feature import hog, local_binary_pattern

# 定数
IMG_SIZE = (28, 28)
LBP_RADIUS = 1
LBP_POINTS = 8 * LBP_RADIUS
LBP_METHOD = 'uniform'

# 特徴量抽出関数（前処理スクリプトと整合）
def extract_features(image):
    image = cv2.GaussianBlur(image, (3, 3), 0)

    # HOG特徴量
    hog_features = hog(
        image,
        pixels_per_cell=(4, 4),
        cells_per_block=(2, 2),
        feature_vector=True
    )

    # LBP特徴量（ヒストグラム）
    lbp = local_binary_pattern(image, LBP_POINTS, LBP_RADIUS, method=LBP_METHOD)
    lbp_hist, _ = np.histogram(
        lbp.ravel(),
        bins=np.arange(0, LBP_POINTS + 3),
        range=(0, LBP_POINTS + 2)
    )
    lbp_hist = lbp_hist.astype("float")
    lbp_hist /= (lbp_hist.sum() + 1e-6)

    return np.concatenate([hog_features, lbp_hist])

# モデルとPCA読み込み
model = joblib.load("aiueo_svm_model.pkl")
pca = joblib.load("aiueo_pca.pkl")

# 推論対象ファイル（日本語ファイル名対応）
file_list = [f"katakana_sample_{i+1}.jpg" for i in range(5)]

# 推論実行
for file_name in file_list:
    if not os.path.exists(file_name):
        print(f"ファイルが存在しません: {file_name}")
        continue

    file_path = os.path.abspath(file_name)
    # 日本語パス・ファイル名対応
    image = cv2.imdecode(np.fromfile(file_path, dtype=np.uint8), cv2.IMREAD_GRAYSCALE)

    if image is None:
        print(f"読み込み失敗: {file_name}")
        continue

    # サイズ変換（28x28）と前処理との整合
    image_resized = cv2.resize(image, IMG_SIZE, interpolation=cv2.INTER_AREA)

    # 特徴量 → PCA変換 → SVM予測
    features = extract_features(image_resized)
    features_pca = pca.transform([features])
    prediction = model.predict(features_pca)

    print(f"{file_name} の推定結果: {prediction[0]}")

学習モデル（ aiueo_svm_model.pkl と aiueo_pca.pkl ）は、スクリプトと同じ場所に置いて実行します。結果は、次の通りです。

katakana_sample_1.jpg の推定結果: 0
katakana_sample_2.jpg の推定結果: 1
katakana_sample_3.jpg の推定結果: 2
katakana_sample_4.jpg の推定結果: 3
katakana_sample_5.jpg の推定結果: 4

よかった･･･。過学習には陥っていないようです。

あとは･･･ Delphi の P4D（ Python4Delphi ）を使って、僕の手書き答案採点補助プログラム AC_Reader で、このスクリプトを実行すれば･･･

自動採点を、実現できます。

６．まとめ

機械学習で良い学習モデルを作るには、学習用データ作りをしっかり行うことが大切。文字の大きさ・位置（配置）・濃さ等の調節、及び、画像中の不要な点（シミ）や汚れを除去する等々して、個々にブレのない安定した学習用データ（もちろん、推論用データも同様）を作成、これを元に学習モデルを作成すれば上に示した結果を出せるはずです。

今回の記事で紹介した内容は、テストを繰り返し行って、問題点を洗い出し、それら問題点を１つ１つ丁寧に解決した結果です。絶対に『あきらめない』こと、もしかしたら、それがいちばん重要で大切なポイントかもしれません。

７．お願いとお断り

TSL205の修理、その後･･･

樹林帯を抜けると、そこからは５月の残雪が輝きながら、僕を待っていた。

【もくじ】

１．軽アイゼンを選ぶ
２．左膝の違和感
３．装備をチェック
４．出発
５．切れたバンド
６．先輩の言葉
７．オベリスク
８．エピローグ

１．軽アイゼンを選ぶ

先輩に修理してもらったスノーシューは、今回は家に置いてきた。昨年のこの時期、今回目指すピークのふたつ隣のピークを目指した際、日当たりの良い斜面で、完全にグシャグシャになった残雪を経験したことを思うと、それを使いたい気持ちはあるにはあった。その気持ちに嘘はないのだが。

三歩に一歩は、足が深く雪面に潜り、転ばずに十歩以上は歩けなかった･･･去年の春山の記憶。

今回の計画に際し、もし、今年も雪があの状態であれば、スノーシューも期待した程には役立たないのでは･･･と思ったこと、及び、今回目指すピークは自宅からそれなりに遠方にあり、スノーシューを運ぶこと自体が手間になること、かつ、テント場からスノーシューが必要になる高度まで、それを運ぶ距離を考えると、スノーシューを使う（運ぶ）メリット以上に、体力的な面で、それを使わない（運ばない）メリットの方が大きいと思えたのだ。

･･･とは言え、雪への備えは必要。スノーシューを選択しないのであれば、カンジキは持っていないので、残る装備品はアイゼンしか、ない。

ただ、ホンモノのアイゼンは重い。それが必要となる高度までの距離と、雪の状態を思うとホンモノのアイゼンを装備するメリットは相当に薄れる･･･。雪対策が必要な高度は森林限界を超えてから 300 ｍ程度のはずだ。そう考えた僕は、様々に悩んだ結果として、軽アイゼンを持参することにした。

本当ならばここで、持参する軽アイゼンを、実際に今回使用する登山靴に装着して、その相性を確認しなければならない。

そう、･･･確認しなければ、ならないのだが･･･正直に言うと、持参する予定の軽アイゼンの登山靴への試着を今回、僕は行わなかった。

昨年もこの時期に同型の軽アイゼンを使用したし、装着法も分かっているので、現地で、もし必要になったら、装着すればいいだけのこと。装備品として忘れずに持参さえすれば「何の問題も起こらない」･･･と、僕はそう信じ込んでいた。

山行前に入手した今年の残雪の状況は少なそうだったこともあり、もしかしたら、アイゼンを使わなくてもいい状況かもしれないとさえ、考えた。まさか、そのことが後で大きな問題に発展するとは、この時、僕は思いもしなかった。

２．左膝の違和感

実は、今回の山行で、僕の中には雪への対策以上に大きな不安があった。それは両膝の違和感だ。どちらかと言えば、左膝･･･。もちろん、山行自体をキャンセルすれば何の問題もないのだが、その選択肢が僕の中に「ない」以上、すべては「行く」という前提での話になる。

この春先から両ひざに何か違和感があり、特に左膝のそれは登山予定日にセットされた時限爆弾であるかのような思いがして、こちらも TSL205 の修理の先輩から教えてもらったＰという商品を爆買いして朝晩飲もうと冷蔵庫に数パックを保管･･･したまではよかったのだが、それを一緒に暮らしている人が見つけ、「賞味期限までに飲み切れないでしょう。１日１本で十分です。実家の母もひざが痛いと言ってるので、母の日のプレゼントにします。」と最高の理由付きで、先輩から教えてもらったＰは冷蔵庫から２パックが消え･･･

そんな想定外の試練を乗り越えて、P を１日１本、飲み続けてはいたのだが、違和感の解消には至らないまま、出発の日を迎えることに･･･

３．装備をチェック

電車に揺られること、数時間。星空の下に張ったテントの中で迎えた 20:45、持参した装備を最終点検。ライトが照らし出す物品を一つ一つチェックする。

僕は、ごく薄い、耐水性のある、軽い布で出来た、濃いオレンジ色のポーチを緊急用装備品入れとして活用している。薬品類他、様々なものが入っているが、ただの一度も活用したことのない物品も混じっている。山行の度に、持って行くかどうか、真剣に悩んで、その都度、取捨選択して残してきたものばかりだが･･･。

今回はいつも以上に膝に不安がある。わずか数グラムでも軽さを優先したい。塵も積もれば･･･の例えの通り、わずか数グラムであっても、その積み重ねが背負う荷を例えようもなく重くするのだ。

登りと降りの連続した･･･木の根っこや、泥んこの、あるいは岩石が作る自然の階段を 10 km 以上歩いた時に感じる荷の重さは、疲れを知らない時に想像するそれとは比べものにならない。

（明日、僕は、これまで経験したことのない距離を歩く･･･。だから、少しでも、軽く･･･）

そんなことを思いながら、装備品を選別する中で、ふと、目に留まったものがあった。

『細引き』

今まで現地で使ったことは１回しかない。地面が固すぎてペグを打ち込めなかった際、フライシートのペグを引っ掛ける紐を延長して、岩に結ぶために切って使用したことがあるだけだ。今回持参したものは、その時の余りを巻き直したもので、前回使用した紐はフライシートに結び付けたままだし、今回、もし、それが必要になったとしても、前回の使用分がそのまま利用できる。その他に細引きが必要になるシーンがあるとは思えない。そう思った僕は、今回、細引きをテントに残して行くことに決めた。

これで数十グラムだが、荷は軽くなった。

もうひとつ、目に留まった物品があった。『結束バンド』だ。

「何年も使った登山靴は山で突然、底が剥がれることがある。そんな時、役立つのがコレなんだ。あるとないとでは大違い。荷物の中に必ず入れておいた方がいい。」

思い出したのは、僕のスノーシューを修理してくれた大好きな先輩の言葉だった。

僕は、６本の結束バンドを入れたビニール袋を持って考えた。６本としたのは左右２本ずつで４本に予備をそれぞれ１本ずつ加えての数字。持参する量としては、これで十分だと思えたが、それ以前に、僕の靴は去年買ったばかりの靴だ。今回の山行で壊れるとは到底思えない。山行前に防水性能を維持するため、靴の手入れをした際にも、靴に問題点は何一つ発見できなかった。

（いらないか･･･）

毎回、そう、繰り返してきた自分への問いを、今回もまた繰り返した･･･その時、

「外したら、ダメだ。」

なぜか、大好きな先輩の声が聴こえた気がした･･･。

今回の山行で、それが必要になるとは思えない。でも、尊敬する先輩は、「必ず持参せよ」と言ってる。これまで、ずっと、先輩の言葉を信じてきて、何一つ、間違いはなかった。

わずか、数グラム。

（ S さん。僕は、あなたを、信じる。）

そう、決心した僕は、結束バンド６本を明日持って行くオレンジ色のポーチに、そっと入れた。

４．出発

目覚ましは、その必要性を感じなかったのでセットしなかった。

予定通りの時刻に目覚めた僕は、装備品を最終点検。テントはここに張ったまま、シュラフや着替え、その他不要な装備はテント内に置いて行く。ただし、防寒用のダウンジャケットだけはザックの中へ。真水は１L。ペットボトル飲料３本。ヘッドライトの点灯と明るさを確認し、予備電池３本をもう一度、ポーチの中に見る。

予備電池３本は、もちろん、朝用ではない。日没までにここに戻ることが出来なかった･･･万一の事態に備えての準備だ。

「あの山の下りは長い。日が暮れて、同行者のヘッドライトの光量が足りず、道を見失って･･･」

ここでもまた、先輩の言葉を思い出す。経験は絶対だ。そこに嘘はない。

今日の予定も再確認。

04:00 出発。12:00までに登頂。下りに５時間 20 分。日没は 18 時 38 分。行動が困難となる時刻までに数字上の余裕は、１時間以上ある。

夜半から３時ころまで降っていた雨は、今は止んでいる。

樹木の隙間にまたたく星が見える。

（上は風が強そうだ･･･）

風が枝を揺らす度に雫が落ちてくる。

頬に当たるそれは、驚くほどに冷たい。

スマートウォッチのルート案内を ON にして、僕は行動を開始した。

５．切れたバンド

日の出は 04:48 。行動開始後、すぐにヘッドライトは不要になる。1500 万年前の地殻変動で誕生したという花崗閃緑岩の大地を僕は順調に踏みしめて進む。この深成岩類は大量の捕獲岩を含んでいる。日本列島が折れ曲がる程に激しかったという、その地殻変動を思いながら、僕は高度を稼いでゆく。

登りはかなり急だ。スマートウォッチの高度計の数字はぐんぐん上がるが、残りの距離を示す数値はほとんど減らない。

（登りの行動は正午まで。その時、ピークにいなければ、引き返す。）

胸の中で、そのことを何度も、何度も、繰り返す。その都度、左膝に関心が集まる。大きく屈伸すると違和感がないわけではないが、今のところ、歩く分には痛みなどの問題はない。そのことが何よりの救いだ。

谷間の樹々を揺らす風はかなり強い。森林限界を超えたあたりから、行動に影響が出そうだ。ザックの中に入れてあるシェルジャケットが役に立つだろうか･･･

F 社製のそれは、びっくりする程、高価だったが『オールシーズン対応のミッドシェルで、防風性・透湿性に優れ、ストレッチ性が高く快適な着心地を提供する』という。今日はその性能を試す絶好の機会になりそうだ。

所々で左手側に大小さまざまな滝を見る。谷間には巨大な花崗閃緑岩が転がっている。岩石と言えばその色は黒と思いがちだが、こんなにも白い岩もあるのだ。その岩間を轟音を立てて水が流れ落ちて行く。雪解け水だ。その冷たさはどれ程だろう･･･

ふと気がつくと、先ほどから、ずっと同じ鳥が鳴いている･･･

まるで、僕の後を付けてくるかのようだ。鳥語がわかればどれほど面白いだろう。分かったところで、もしかしたら、それは恐怖の言葉かもしれないが･･･

膝の状態だけは気がかりだが、そんな様々なことを思うほど、今日の僕は体力に余裕があった。

（もしかしたら、正午前に登頂できるかもしれない･･･）

そう思い始めた頃、残雪が残る高度に達し、足元の岩石を覆う樹々の根に残る雪が、固い透明な氷となり、非常に滑りやすいことに気づく。

（ここで軽アイゼンを付けよう）

そう考えた僕は、登山道がやや広くなった場所でザックを降ろし、中から軽アイゼンを取り出した。

靴を履くときのクセで、左足側から装着。昨年は少し手間取ったが、今年はスマートに作業が進む。左足側の装着が完了。続けて右足側を登山靴にセット。まず足の上側を覆うゴムバンドを締める。一発で決まる。次は踵側のバンドだ。少し長さが足りないようで、引っ張ってもフックが穴に届かない。予め試着して調節しなかったためだ。長さの調節金具部分を確認、ゴムの長さは幾分長く出来そうだ。僕は、調節金具部分のゴムを出し入れして長さを調節（少し長く）し、試しにフックを引いてみた。その時、右足内側の外れないように予め固定されている金具に挟まれたゴムの付け根が･･･切れかけている･･･ように見えた。

（南無三。頼む、切れないでくれ！）

そう願いながらフックを引いた時、事故が起きた。

軽アイゼンを固定するゴムバンドがその根元から、切れて、しまった･･･

６．先輩の言葉

切れたゴムバンドを手にして、僕は言葉を失った。

（どうしたら、いい？）

ここで軽アイゼンをきちんと修理することは不可能だ。代替部品も、工具もない。

（まず、落ち着こう！）

そう、自分に言い聞かせる。こんな時、焦って取る行動はほとんどが間違いだ。

そう思った僕は、一度、大きく深呼吸してみる。そして、気持ちを落ち着けて、考える。

（上側、つまり足の甲側のフックは生きている。これだけで行けないか？）

（それは、恐らく、無理だ。設計上の強度が半分になり、やがて、必ず、外れる･･･）

（代替部品はない。）

いちばん先に脳裏に浮かんだのは、細引きだが、その細引きはテントに置いてきてしまった･･･

後悔で胸が痛くなる。あれさえあれば、何とかなったのに･･･

でも、今はそれを百万遍繰り返しても、どうにもならない･･･

（なぜ、試着しなかったのか･･･）

「事故」という言葉の意味を始めて知った思いがする。

試着する「事」を、しなかった「故」に、起きてしまったこと。

（後悔ではなく、これを教訓にするんだ。今は前向きになろう･･･）

今度から、装備品は必ず試着する。そう、自分と絶対の約束を交わす。気持ちが少しだけ、前向きに切り替わった。

（手持ちの物品で、他に使えるものは･･･）

そこで、ようやく僕は先輩の言葉を思い出せた。

それを･･･今まで１度も使ったことがなかったから･･･思い出せなかったのだ。

「靴の底が取れたときは、結束バンドを使うんだ」

（そうだ。結束バンドがあった！）

緊急用の装備を入れた濃いオレンジ色のポーチの中に、それはあった。

結束バンドを手にして考える。

（どう使ったら、いい？）

結束バンド１本分の長さでは、到底、足りない。軽アイゼンの左側の穴から登山靴の踵を周って右側の穴へ、結束バンドを上手く廻すには･･･

何となく２本のバンドを繋いでみる。

「この穴にバンドを通して締めると･･･」

「しまった！　外れない。」

だから結束バンドって言うんだ。何やってるんだ。これで６本のうち２本が無駄になった。残りは４本しか、ない。

その時、なぜか、大好きな先輩が心を込めて修理してくれたあの TSL205 が脳裏に浮かんだ。

先輩は２本の細引きで、それぞれ環を作り、その環を TSL205 の左右の金具に固定、その環と環の間に 100 均で購入した長さ 60 cm荷締めベルトを通して･･･

（そうだ。あれを真似しよう！）

僕は、まず、軽アイゼンの左側、切れたゴムバンドの固定金具だけが残った側に結束バンドを通し、適当と思われる大きさで時計回りに環を作った。続いて反対の右側、こちらは反時計回りに環を作る。取り敢えず、ザックのハーネスから外した･･･ペットボトル入れを固定するためにハーネスに結んでおいたナイロン製の･･･紐で環と環を結んで踵に固定してみる。いい感じだ。なんとかなるかもしれない。

（この紐は保険として残したまま、荷締めベルトでしっかり固定する）

思わず笑みが浮かぶ。心の底から、先輩に感謝する気持ちが込み上げてくる。

自宅で装備品をパッキングする時、ザックの外側に 60 cm の荷締めベルトを２本付けておいた。だから、当たり前のように、それは、そこにあった。この安心・安堵感こそ、言い付けを守ったことに対する先輩からのプレゼントに違いない･･･そう感じつつ、そのうちの１本を取り外す。

「結んで締める。これがいちばん確実な方法なんだ。」

先輩の言葉を反芻しながら、軽アイゼンに結んだ結束バンドの環と環の間に荷締めベルトを通し、軽アイゼンが外れない適切な強さで締め上げる。さらに、保険のつもりで残した紐の方も解けないように結ぼうとしたが、肝心な･･･その解けない結び方がわからない。舫い結びは知ってるが、この場合、適切ではないようだ。携帯電話で動画検索･･･そう思ったが、僕の携帯電話のキャリアの電波はこの山域では使用できなかったことを思い出し、携帯電話に伸ばしかけた手を止める。ここでは僕の携帯電話は、カメラとしての役割しか果たさない。

（そうだ。記録に残しておこう！）

転んでもタダでは起きなかった何よりの証拠だ。そう思った僕は、右足にようやく装着できた軽アイゼンの写真を数枚、撮影した。もちろん、後で先輩に見せるためだ。

荷締めベルトを使って踵側と甲側をさらに補強する前の状態。
（この写真では、まだ、左（内）側の結束バンドの先端部分が残っている）

【追記】
今、こうして写真を確認すると、写真に写っているのは、荷締めベルトで補強する前の状態のようです。記憶の中では、最終的な完成形を撮影したように思うのですが、やはり、自分的にはかなりの緊急事態だったので、この時もまだ動揺があり、混乱していたのかもしれません。落ち着いて行動したように思っても、あらためて人間･･･というか、自分の弱さを感じました。上記の文言の訂正も考えましたが、その時の僕の状態を正確に記録するには「訂正しない方が良い」と考え、そのままにしました。

以下の写真がテント場に戻ってから撮影した完成形です。

写真を見て、さらに気が付いたのですが、左側の結束バンドが危ない所で切れています･･･。
いつ切れたのか、まったくわかりませんが、結束部の外側だったのが幸いでした。
（アイゼンの左には切れたゴムバンドの固定金具部分のみ、残っています）

この事故によるロスタイムが気になったが、片側アイゼンで歩くより、この方がずっと安全だ。同じ命がけの遊びなら、安全な方を選ぶのが当然だ。

アイゼンの効きを確かめながら、僕は行動を再開した。

７．オベリスク

写真の撮影時刻は 10:50 a.m. 心に決めたタイムリミットは 12:00。残りは時間との競争だ。

時計が廻るのが早いか、僕がオベリスクの向こう側の世界を見るのが早いか、答えは２つに１つ。

標高 2,764 m まで続く、自分との戦いだ。ここまで来て、負けるわけにはいかない･･･。

足よ。どうか、僕を誘ってくれないか。

遥かなる、あの場所へ。

オベリスクよ。心有らば聞いてくれ。

きみが見ている風景を、僕は、きみとふたりで見たいんだ･･･。

でも、風が･･･

風が、強すぎる･･･

天候は晴れているが、出発時、瞬く星を見て予想した通り、強風が時折り吹いてくる。「吹き荒ぶ」のではなく、思い出したような吹き方の風だ。「吹き荒れてない」のは救いだが、ただ、その時折り吹く強風は一気に体温を奪って行くほどに冷たい。半袖の汗をよく通す速乾性の下着に、こちらもまた通気性に優れた長袖の行動着１枚では、到底、耐えられない。時間は惜しいがザックを降ろし、素早く F 社製のシェルジャケットを取り出して、身に纏う。

一気に表面体温が回復する。このシェルジャケットは、細身のせいだろうか、風によるバタつきも少ないようだ。胸のワンポイントの他は、一切の装飾を廃して性能だけを追求したのだろう。この高価なオールシーズンに対応したジャケットは、山での必需品になりそうな気がする。

風の息が強まった。風化した花崗岩が礫（つぶて）となって飛んでくる。

頬が痛い。

冗談じゃない。僕が暮らしている街では、通常、風で、石は飛ばない･･･。

あぁ･･･　タイムリミットだ。

空が、きれい。

最後の力を振り絞って、登る。

この壁の向こう側を見たかったんだ。

喘ぐように、息をしながら･･･僕が、見た

壁の向こう側は･･･

理由･･･など、ない。

この景色が見たかったんだ･･･

振り返ると、月が見えた･･･

きみと、月を見た･･･

うん。もう十分だ。

まだ、帰りの道が残っている。

長い、ながい･･･道だ。

新しいタイムリミットは、日没。

それまでにシュラフを残した僕のテントへ戻らねばならない。

大丈夫。

右足の軽アイゼンは、外れない。

戻ったら、先輩に話すんだ。

今日、僕に、起きたことを･･･。

８．エピローグ

この山行では、この後の、長いながい下りの道でも生涯忘れ得ない出来事がありました。
まったくの偶然から、僕はある人と一緒に山を下りることになります。
その人との物語も、いつか、ここに残せたらいいな･･･と、思います。
拙い山行記録をここまでお読みくださいましたこと、心から感謝申し上げます。
ほんとうに、ありがとうございました。

【お願いとお断り】

この記事で紹介した軽アイゼンの修理方法は、あくまでも緊急の事態に際して応急的にとった措置であり、それを推奨するものではありません。同様の事故が起きた際に、私と同じ方法で軽アイゼンを修理されたとしても、その効果は保証できません。軽アイゼンの修理・装着後、登り２時間及び下り５時間30分（安全のため残雪帯を過ぎた後も軽アイゼンを装着したまま、テント場の直前まで下りました）の合計７時間半、私の軽アイゼンが外れなかったのは、単に、偶然と幸運であったことを申し添えます。

デジタル採点手書きフリーで検索したら、その後

前回の記事を書いてから、scikit-learn を使った機械学習による手書きカタカナ文字「ア・イ・ウ・エ・オ」及び記号「○・×」の認識用学習モデル作成について、さらに勉強しました☆

今回は、その記録と、今後の抱負です。

【もくじ】

１．さらに勉強した理由
２．HOGを知る
３．気分は「写経」
４．今後の抱負
５．まとめ
６．お願いとお断り

１．さらに勉強した理由

なぜ、さらに勉強したかというと、前回の記事では、画像のピクセル値をそのまま利用する Flattening という特徴量抽出の手法を用いて学習モデルを作成したのですが、前回の記事にある通り、既知の（＝学習に利用した）カタカナ文字については、アイウエオ各文字ともに 98 ％正しく判定できたという好結果に力を得て、Delphi で GUI を作成した手書き答案の採点補助プログラムから、Python の文字認識スクリプトを実行できるよう、新しくプログラムを書いて実験してみた結果、期待に反して１回も見たことのない新規の文字については、正しく判定できないことがありました。特に「オ」は全滅･･･

以下、かるーくやってみた実験の結果です。

「ア」はふたつとも読めた･･･

記入位置の探索も、上手く行えてるようです･･･

ふたつめの「ウ」の方が、典型的な「ウ」により近い？気がするけど･･･

「エ」は得意なのかな･･･

この「オ」の認識結果を見て、正直、これはダメだと思いました。また、失敗です。T_T

ちなみに「○・×」は･･･

なにか書いてあれば･･･「○」だと思ってる･･･
（空欄を識別しているのは、うれしい限りですが）

「○ or ×」認識テストの結果は、「オ」の場合よりさらにダメです。まぁ上の「オ」の場合の「ア」についても確信を持って見分けて「×」を付けているのか、どうか、この結果を見てだいぶ怪しくなってきました。（果たして、あの「オ」や「ア」をどう読んだのか･･･、それを確認する気力も失せました･･･）

さらに、お見せしたくないのが、「×」が正解ラベルの場合です。

THE END.
その想いで胸がいっぱいに！

実装が超シンプルで、かつ高速で軽量、文字画像のピクセル値（28×28）をそのまま利用する Flattening という手法では、これが限界なのでしょうか？

学習用データをさらに増やせば、もっと良い結果が得られるのではないか･･･とも考えましたが、手元にその学習用データがありません。新規に学習用データを集めるには莫大な手間と時間が必要です。

ただ･･･失敗の中でも唯一救いに感じたのは、２年前の文字認識チャレンジでどうしてもクリア出来なかった解答欄中の文字が書かれている位置を正しく認識することに成功し、意図した通りに文字画像を取得出来ていることです。

プログラムはその記入位置を正確に見つけ出し、28×28の矩形画像への切り出しに成功しています。

実は、この Blog の過去の記事で「失敗の記録」として掲載した手書き文字認識チャレンジの試行錯誤の記事を書いた当時、文字の認識に失敗した最大の原因は「正しく文字を切り出せなかった」ことにありました。今回、テストしたのは、たった３枚の画像ですが、いずれも問題なく文字が記入されている位置をプログラムは特定し、その正確な切り出しに成功しています。

切り出した画像の縦横比が、元の画像と変化していることに、画像を見て気づきました！
ここは出来れば改善したいところです。

２年前の僕の技術では、例えば「ア」について、文字を構成する線がすべて繋がっている場合は「ア」という文字１文字だと正しく認識できても、「つ」部分と「ノ」部分が離れている場合は、「ア」ではなく「つ」と「ノ」に分解して認識してしまうミスをどうしても防げなかったのです。今回のチャレンジでは、この問題を無事クリアできました。

２年前の僕の技術では、３つめの「ア」は「つ」と「ノ」になってしまいましたが･･･

今回のプログラムは、ちゃんと「ア」として切り出しています。
ただ、やはり縦横比が･･･気になりますので、ここは何とかします！

さらに、解答欄から切り出した文字の位置が切り出し画像の中央にあることも、長い間ずっと･･･この胸に思い描いた夢の通りです。

文字の縦横比は変わっていますが、文字位置の特定には何の問題もなく、成功しています☆
さらに、解答欄左にある（５）のような解答欄の番号を無視することにも成功しています☆☆
２年前にどうしてもクリア出来なかった複数の問題を、今回はすべてクリア出来ました☆☆☆

総合的な意味では今回も失敗でしたが、自分にとって、前回、クリア出来なかった幾つもの問題を解決できたことは、本当に大きな前進でした。だから、総合的には失敗でも、☆５つが完全な成功だとしたら、自分的には ☆☆☆ です。

また、今回、Flattening による学習モデル作成方法を学ぶことで、Python に 32 ビット環境の scikit-learn ライブラリを導入する手法を完全に理解できました。機械学習そのものが現在 64 ビット環境へ移行しつつある中で、32 ビット環境の最後の輝きを、今、僕は目の当たりにしている･･･そんな気がしてなりませんでした。

２．HOGを知る

Flattening の欠点に気づいたのは、Python 環境で作成した学習モデルを Delphi の Object Pascal から操作できるようにプログラミングを終えた段階（上の画像は、その段階での試行の様子）だったので、･･･結果的に Delphi 側の最も重要なプログラムを最初から組み直すことにはなりましたが･･･ここで僕は、エッジや輪郭の方向に強く、ノイズの影響も受けにくい HOG（Histogram of Oriented Gradients）という特徴量を抽出する手法があることを知ります。HOG を勉強してみたところ、こちらの手法の方が画像のピクセル値のそのまま利用する Flattening より、文字の識別精度が高いのではないかと思えてきました。

そこで HOG を用いて文字の特徴量を抽出して学習モデルを作成するスクリプトを書きました。最初に、ごく基本的なコードを書き、そこに必要な様々な処理を追加して行く方法で一歩一歩確実に進んだ結果、文字の認識能力が Flattening 特徴量抽出手法を使ったそれよりは高いのではないか？と、確かに思える学習モデルを作成することができました。HOG 特徴量抽出手法を使った学習モデルは、Delphi に組み込む前に、Python スクリプトを使って行った試行で、上の「オ」を２つともサラっと認識してくれたのです！

試行の様子がこちらです。

解答用紙から切り出した解答欄の矩形画像

さらに解答欄の中の文字部分を探索して、切り抜いて･･･

解答欄から切り出した28×28ピクセルの矩形画像
（新しいプログラムではファイル名のIndexは１始まりにしました）

Delphi に埋め込む前に、Python 用のスクリプトで読んでみます･･･

やった！　ちゃんと読めた！！　「オ」だけじゃなく「ア」も正しく読めています！！！

以下、HOG特徴量抽出手法を適用した学習モデル作成に必要な、学習用の文字データを作成するために使用したスクリプトです（使用を推奨するものではありません。あくまでもご参考まで）。

このスクリプトは、輪郭検出と文字切り出し、周囲パディングを均一化して、文字を画像の中心に配置、GaussianBlurによるノイズ除去、傾き補正、28×28ピクセルに正規化して保存･･･と言った機能を備えています。万一、コピペして試される場合は PATH をご自身の環境に合わせて変更してください。

import cv2
import numpy as np
import os
from glob import glob
import re

# UTF-8 パス対応の画像読み込み
def imread_utf8(path):
    stream = np.fromfile(path, dtype=np.uint8)
    return cv2.imdecode(stream, cv2.IMREAD_COLOR)

# 傾き補正（修正: warpAffine に補間法と白背景を明示）
def deskew(img):
    m = cv2.moments(img)
    if abs(m['mu02']) < 1e-2:
        return img.copy()
    skew = m['mu11'] / m['mu02']
    M = np.float32([[1, skew, -0.5 * 28 * skew], [0, 1, 0]])
    return cv2.warpAffine(img, M, (28, 28), flags=cv2.INTER_NEAREST | cv2.WARP_INVERSE_MAP, borderValue=255)

# ファイル名から数値を抽出（img12.png → 12）
def extract_number(path):
    filename = os.path.basename(path)
    match = re.search(r'img(\d+)', filename)
    return int(match.group(1)) if match else float("inf")

# 入力・出力フォルダ（パスに全角文字が含まれていてもOK）
input_folder = r"C:\Python39-32\Images_tegaki\aiueo\ア"
output_folder = os.path.join(input_folder, "Trimed")
os.makedirs(output_folder, exist_ok=True)

# 対象画像拡張子
image_extensions = ['*.jpg', '*.jpeg', '*.png']
image_files = []
for ext in image_extensions:
    image_files.extend(glob(os.path.join(input_folder, ext)))

# 並べ替え（img番号順）
image_files.sort(key=extract_number)

index = 1
for image_path in image_files:
    image = imread_utf8(image_path)
    if image is None:
        print(f"読み込めない画像: {image_path}")
        continue

    h, w = image.shape[:2]
    gray_for_line = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    edges = cv2.Canny(gray_for_line, 50, 150, apertureSize=3)

    raw_lines = cv2.HoughLinesP(edges, 1, np.pi / 180, threshold=100,
                                minLineLength=min(w, h) // 3, maxLineGap=10)
    filtered_lines = []
    if raw_lines is not None:
        for line in raw_lines:
            x1, y1, x2, y2 = line[0]
            angle = abs(np.arctan2(y2 - y1, x2 - x1) * 180 / np.pi)
            length = np.hypot(x2 - x1, y2 - y1)
            if (angle < 10 or angle > 170) and length < w // 2:
                continue
            filtered_lines.append([[x1, y1, x2, y2]])

    if filtered_lines:
        for line in filtered_lines:
            x1, y1, x2, y2 = line[0]
            if abs(x2 - x1) < 10 or abs(y2 - y1) < 10:
                cv2.line(image, (x1, y1), (x2, y2), (255, 255, 255), thickness=3)

    if w > h:
        offset = w // 4
        cropped = image[:, offset:w - offset]
    else:
        offset = h // 4
        cropped = image[offset:h - offset, :]

    gray = cv2.cvtColor(cropped, cv2.COLOR_BGR2GRAY)
    _, thresh = cv2.threshold(gray, 200, 255, cv2.THRESH_BINARY_INV)

    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (10, 10))
    dilated = cv2.dilate(thresh, kernel, iterations=1)
    contours, _ = cv2.findContours(dilated, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    if contours:
        all_points = np.vstack(contours)
        x, y, w_box, h_box = cv2.boundingRect(all_points)
        padding = 20  # この値は、切り抜き画像を確認しつつ、適宜調整してください。
        if w > h:
            x += offset
        else:
            y += offset

        x1 = max(0, x - padding)
        y1 = max(0, y - padding)
        x2 = min(w, x + w_box + padding)
        y2 = min(h, y + h_box + padding)

        trimmed = image[y1:y2, x1:x2]
        trimmed_gray = cv2.cvtColor(trimmed, cv2.COLOR_BGR2GRAY)
        trimmed_blur = cv2.GaussianBlur(trimmed_gray, (3, 3), 0)

        h_trim, w_trim = trimmed_blur.shape[:2]
        scale = 20.0 / max(h_trim, w_trim)
        new_w = int(w_trim * scale)
        new_h = int(h_trim * scale)
        # resized = cv2.resize(trimmed_blur, (new_w, new_h), interpolation=cv2.INTER_AREA)
        resized = cv2.resize(trimmed_blur, (new_w, new_h), interpolation=cv2.INTER_NEAREST)

        canvas = np.full((28, 28), 255, dtype=np.uint8)
        x_offset = (28 - new_w) // 2
        y_offset = (28 - new_h) // 2
        canvas[y_offset:y_offset + new_h, x_offset:x_offset + new_w] = resized        

        deskewed = deskew(canvas)

        # モーメントで中心を合わせる（修正: warpAffine に補間法と白背景を明示）
        M = cv2.moments(deskewed)
        if M['m00'] != 0:
            cx = int(M['m10'] / M['m00'])
            cy = int(M['m01'] / M['m00'])
            shift_x = 14 - cx
            shift_y = 14 - cy
            trans_mat = np.float32([[1, 0, shift_x], [0, 1, shift_y]])
            deskewed = cv2.warpAffine(deskewed, trans_mat, (28, 28), flags=cv2.INTER_NEAREST, borderValue=255)

        canvas = deskewed
    else:
        print(f"文字が検出されませんでした: {os.path.basename(image_path)}")
        canvas = np.full((28, 28), 255, dtype=np.uint8)

    # 保存（全角パスにも対応）
    save_path = os.path.join(output_folder, f"{index:04d}.png")
    is_success, encoded_img = cv2.imencode('.png', canvas)
    if is_success:
        encoded_img.tofile(save_path)
        print(f"{save_path} を保存しました。")
    else:
        print(f"{save_path} の保存に失敗しました。")

    index += 1

print("すべての画像の処理が完了しました。")

上のスクリプトで 28×28 ピクセルに整形して保存した大量の学習用データ画像を、次のスクリプトで処理して学習モデルを生成します。こちらについても、万一、コピペして試される場合は PATH をご自身の環境に合わせて変更してください（こちらも使用を推奨するものではありません。あくまでもご参考まで）。

import cv2
import numpy as np
from sklearn import svm
from sklearn.model_selection import train_test_split
import os
import joblib  # モデルの保存と読み込みに使用
from skimage.feature import hog
from sklearn.svm import SVC

# カタカナのクラス
CATEGORIES = ["ア", "イ", "ウ", "エ", "オ"]

# Pathの中の日本語に対応
def imread(filename, flags=cv2.IMREAD_GRAYSCALE, dtype=np.uint8):
    try:
        n = np.fromfile(filename, dtype)
        img = cv2.imdecode(n, flags)
        return img
    except Exception as e:
        print(e)
        return None

# HOG特徴量を抽出する関数
def extract_hog_features(img):
    # 画像はすでに28x28の想定
    features = hog(img,
                   orientations=9,
                   pixels_per_cell=(4, 4),
                   cells_per_block=(2, 2),
                   block_norm='L2-Hys')
    return features

# データセットの準備（28x28 の手書きカタカナ画像）
def load_images_from_folder(folder, categories):
    images = []
    labels = []
    for label, category in enumerate(categories):
        path = os.path.join(folder, category)
        print(f"Processing category: {category}, Path: {path}")

        if not os.path.exists(path):
            print(f"Warning: Path does not exist: {path}")
            continue

        for file in os.listdir(path):
            if file.lower().endswith(('.png', '.jpg', '.jpeg')):
                file_path = os.path.join(path, file)
                try:
                    img = imread(file_path)
                    if img is not None:
                        img = cv2.resize(img, (28, 28))
                        hog_features = extract_hog_features(img)
                        images.append(hog_features)
                        labels.append(label)
                    else:
                        print(f"Failed to load image: {file_path}")
                except Exception as e:
                    print(f"Error loading {file_path}: {e}")
            else:
                print(f"Skipping non-image file: {file}")
    print(f"Loaded {len(images)} images")
    return np.array(images), np.array(labels)

# データ読み込み
X, y = load_images_from_folder(r"C:\Python39-32\Images_tegaki\aiueo\Trimed", CATEGORIES)

if len(X) == 0:
    raise ValueError("No images loaded. Please check the image files and paths.")

# 学習とテストの分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# SVM モデルの作成と学習
model = svm.SVC(kernel='linear')
model.fit(X_train, y_train)

# モデルを保存する
joblib.dump(model, 'katakana_hog_svm_model.pkl')
print("Model saved as 'katakana_hog_svm_model.pkl'")

# 予測用前処理（HOG版）
def preprocess_image(image_path):
    img = imread(image_path)
    h, w = img.shape

    size = max(h, w)
    square_img = np.full((size, size), 255, dtype=np.uint8)
    x_offset = (size - w) // 2
    y_offset = (size - h) // 2
    square_img[y_offset:y_offset + h, x_offset:x_offset + w] = img

    img_resized = cv2.resize(square_img, (28, 28))
    hog_features = extract_hog_features(img_resized)
    return hog_features

def predict_character(image_path):
    img = preprocess_image(image_path)
    model = joblib.load('katakana_hog_svm_model.pkl')
    label = model.predict([img])[0]
    return CATEGORIES[label]

# テスト画像の認識（テスト用の画像は実行中のスクリプトと同じフォルダに用意・保存する）
for image_path in [
    "katakana_sample_a.jpg",
    "katakana_sample_i.jpg",
    "katakana_sample_u.jpg",
    "katakana_sample_e.jpg",
    "katakana_sample_o.jpg"
]:
    result = predict_character(image_path)
    print(f"{os.path.basename(image_path)} の認識結果: {result}")

テストに使用した画像は、次の通りです。文字の太さはテスト用に変化のあるものを選びました。

上記、学習モデルを作成するスクリプトの実行結果です。

３．気分は「写経」

次は、完成した学習モデルをDelphiから使えるようにすれば OK なのですが、この作業は毎回「写経」を行っているような気持ちを感じる作業です。･･･と、言う僕自身、写経の経験は皆無ですが･･･この業界で一般的に使用される「写経」的意味合いと、ここでのそれは異なり、感覚的にはむしろ「修行」に近いものです。

次のコードを見ていただければ、なぜ「修行」なのか、ご理解いただけると思います。

procedure TFormCollaboration.btnAutoClick(Sender: TObject);
var
  strScrList:TStringList;
  strAnsList:TStringList;
  j:integer;
  intCols:integer;
  results: TArray<string>;
  s: string;
begin
  // ･･･ 略 ･･･
  try

    //Scriptを入れるStringList
    strScrList:=TStringList.Create;

    //手書き文字の認識結果
    strAnsList:=TStringList.Create;

    try

      strScrList.Add('import cv2');
      strScrList.Add('import numpy as np');
      strScrList.Add('import os');
      strScrList.Add('from glob import glob');
      strScrList.Add('import re');
      strScrList.Add('from skimage.feature import hog');
      strScrList.Add('import joblib');

      //カタカナラベル
      if (cmbAL.Text = 'ア') or (cmbAL.Text = 'イ') or (cmbAL.Text = 'ウ') or (cmbAL.Text = 'エ') or (cmbAL.Text = 'オ') then
      begin
        strScrList.Add('CATEGORIES = ["ア", "イ", "ウ", "エ", "オ"]');
      end;

      //○×ラベル
      if (cmbAL.Text = '○') or (cmbAL.Text = '×') then
      begin
        strScrList.Add('CATEGORIES = ["○", "×"]');
      end;

      //HOG特徴量抽出
      strScrList.Add('def extract_hog_features(img):');
      strScrList.Add('    features = hog(img, orientations=9, pixels_per_cell=(4, 4), cells_per_block=(2, 2), block_norm="L2-Hys")');
      strScrList.Add('    return features');

      //UTF-8 パス対応の画像読み込み
      strScrList.Add('def imread_utf8(path):');
      strScrList.Add('    stream = np.fromfile(path, dtype=np.uint8)');
      strScrList.Add('    return cv2.imdecode(stream, cv2.IMREAD_COLOR)');

      //傾き補正
      strScrList.Add('def deskew(img):');
      strScrList.Add('    m = cv2.moments(img)');
      strScrList.Add('    if abs(m["mu02"]) < 1e-2:');
      strScrList.Add('        return img.copy()');
      strScrList.Add('    skew = m["mu11"] / m["mu02"]');
      strScrList.Add('    M = np.float32([[1, skew, -0.5 * 28 * skew], [0, 1, 0]])');
      strScrList.Add('    return cv2.warpAffine(img, M, (28, 28), flags=cv2.WARP_INVERSE_MAP, borderValue=255)');

      //ファイル名から数値を抽出（crop_Img12.png → 12）
      strScrList.Add('def extract_number(path):');
      strScrList.Add('    filename = os.path.basename(path)');
      strScrList.Add('    match = re.search(r"crop_Img(\d+)", filename)');
      strScrList.Add('    return int(match.group(1)) if match else float("inf")');

      //文字認識処理
      strScrList.Add('def predict_character(img, model):');
      strScrList.Add('    hog_features = extract_hog_features(img)');
      strScrList.Add('    label = model.predict([hog_features])[0]');
      strScrList.Add('    return CATEGORIES[label]');

      //モデル読み込み
      //カタカナラベル
      if (cmbAL.Text = 'ア') or (cmbAL.Text = 'イ') or (cmbAL.Text = 'ウ') or (cmbAL.Text = 'エ') or (cmbAL.Text = 'オ') then
      begin
        strScrList.Add('model_path = r".\Python39-32\katakana_hog_svm_model.pkl"');
      end;

      //○×ラベル
      if (cmbAL.Text = '○') or (cmbAL.Text = '×') then
      begin
        strScrList.Add('model_path = r".\Python39-32\mb_hog_svm_model.pkl"');
      end;

      strScrList.Add('if not os.path.exists(model_path):');
      strScrList.Add('    raise FileNotFoundError(f"モデルファイルが見つかりません: {model_path}")');
      strScrList.Add('model = joblib.load(model_path)');

      //入力・出力フォルダ
      //strScrList.Add('base_path = r".\imgAuto\src"');
      strScrList.Add('input_folder = r".\imgAuto\src"');
      //strScrList.Add('folder_path = os.path.join(base_path, CORRECT_LABEL)');
      strScrList.Add('output_folder = os.path.join(input_folder, "'+ cmbAL.Text +'")');
      strScrList.Add('os.makedirs(output_folder, exist_ok=True)');

      //対象画像を取得
      strScrList.Add('image_extensions = ["*.jpg", "*.jpeg", "*.png"]');
      strScrList.Add('image_files = []');
      strScrList.Add('for ext in image_extensions:');
      strScrList.Add('    image_files.extend(glob(os.path.join(input_folder, ext)))');
      strScrList.Add('image_files.sort(key=extract_number)');

      strScrList.Add('results = []');

      strScrList.Add('index = 1');
      strScrList.Add('for image_path in image_files:');
      strScrList.Add('    image = imread_utf8(image_path)');
      strScrList.Add('    if image is None:');
      strScrList.Add('        print(f"読み込めない画像: {image_path}")');
      strScrList.Add('        continue');

      strScrList.Add('    h, w = image.shape[:2]');
      strScrList.Add('    gray_for_line = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)');
      strScrList.Add('    edges = cv2.Canny(gray_for_line, 50, 150, apertureSize=3)');

      strScrList.Add('    raw_lines = cv2.HoughLinesP(edges, 1, np.pi / 180, threshold=100, minLineLength=min(w, h) // 3, maxLineGap=10)');
      strScrList.Add('    filtered_lines = []');
      strScrList.Add('    if raw_lines is not None:');
      strScrList.Add('        for line in raw_lines:');
      strScrList.Add('            x1, y1, x2, y2 = line[0]');
      strScrList.Add('            angle = abs(np.arctan2(y2 - y1, x2 - x1) * 180 / np.pi)');
      strScrList.Add('            length = np.hypot(x2 - x1, y2 - y1)');
      strScrList.Add('            if (angle < 10 or angle > 170) and length < w // 2:');
      strScrList.Add('                continue');
      strScrList.Add('            filtered_lines.append([[x1, y1, x2, y2]])');

      strScrList.Add('    if filtered_lines:');
      strScrList.Add('        for line in filtered_lines:');
      strScrList.Add('            x1, y1, x2, y2 = line[0]');
      strScrList.Add('            if abs(x2 - x1) < 10 or abs(y2 - y1) < 10:');
      strScrList.Add('                cv2.line(image, (x1, y1), (x2, y2), (255, 255, 255), thickness=3)');

      strScrList.Add('    if w > h:');
      strScrList.Add('        offset = w // 4');
      strScrList.Add('        cropped = image[:, offset:w - offset]');
      strScrList.Add('    else:');
      strScrList.Add('        offset = h // 4');
      strScrList.Add('        cropped = image[offset:h - offset, :]');

      strScrList.Add('    gray = cv2.cvtColor(cropped, cv2.COLOR_BGR2GRAY)');
      strScrList.Add('    _, thresh = cv2.threshold(gray, 200, 255, cv2.THRESH_BINARY_INV)');

      strScrList.Add('    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (10, 10))');
      strScrList.Add('    dilated = cv2.dilate(thresh, kernel, iterations=1)');
      strScrList.Add('    contours, _ = cv2.findContours(dilated, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)');

      strScrList.Add('    if contours:');
      strScrList.Add('        all_points = np.vstack(contours)');
      strScrList.Add('        x, y, w_box, h_box = cv2.boundingRect(all_points)');

      //strScrList.Add('        padding = 20');
      strScrList.Add('        padding = 5');
      strScrList.Add('        if w > h:');
      strScrList.Add('            x += offset');
      strScrList.Add('        else:');
      strScrList.Add('            y += offset');

      strScrList.Add('        x1 = max(0, x - padding)');
      strScrList.Add('        y1 = max(0, y - padding)');
      strScrList.Add('        x2 = min(w, x + w_box + padding)');
      strScrList.Add('        y2 = min(h, y + h_box + padding)');

      strScrList.Add('        trimmed = image[y1:y2, x1:x2]');
      strScrList.Add('        trimmed_gray = cv2.cvtColor(trimmed, cv2.COLOR_BGR2GRAY)');
      strScrList.Add('        trimmed_blur = cv2.GaussianBlur(trimmed_gray, (3, 3), 0)');

      strScrList.Add('        h_trim, w_trim = trimmed_blur.shape[:2]');
      strScrList.Add('        scale = 20.0 / max(h_trim, w_trim)');
      strScrList.Add('        new_w = int(w_trim * scale)');
      strScrList.Add('        new_h = int(h_trim * scale)');
      strScrList.Add('        resized = cv2.resize(trimmed_blur, (new_w, new_h), interpolation=cv2.INTER_AREA)');

      strScrList.Add('        canvas = np.full((28, 28), 255, dtype=np.uint8)');
      strScrList.Add('        x_offset = (28 - new_w) // 2');
      strScrList.Add('        y_offset = (28 - new_h) // 2');
      strScrList.Add('        canvas[y_offset:y_offset + new_h, x_offset:x_offset + new_w] = resized');

      strScrList.Add('        deskewed = deskew(canvas)');

      strScrList.Add('        M = cv2.moments(deskewed)');
      strScrList.Add('        if M["m00"] != 0:');
      strScrList.Add('            cx = int(M["m10"] / M["m00"])');
      strScrList.Add('            cy = int(M["m01"] / M["m00"])');
      strScrList.Add('            shift_x = 14 - cx');
      strScrList.Add('            shift_y = 14 - cy');
      strScrList.Add('            trans_mat = np.float32([[1, 0, shift_x], [0, 1, shift_y]])');
      strScrList.Add('            deskewed = cv2.warpAffine(deskewed, trans_mat, (28, 28), borderValue=255)');

      strScrList.Add('        canvas = deskewed');
      strScrList.Add('        predicted_char = predict_character(canvas, model)');
      strScrList.Add('        results.append(str(predicted_char))');
      strScrList.Add('    else:');
      strScrList.Add('        results.append("")');
      strScrList.Add('        canvas = np.full((28, 28), 255, dtype=np.uint8)');

      strScrList.Add('    save_path = os.path.join(output_folder, f"{index:04d}.png")');
      strScrList.Add('    is_success, encoded_img = cv2.imencode(".png", canvas)');
      strScrList.Add('    if is_success:');
      strScrList.Add('        encoded_img.tofile(save_path)');
      strScrList.Add('    index += 1');

      strScrList.Add('var1.Value = ";".join(results)');

      try
        PythonEngine1.ExecStrings(strScrList);
      except
        on E: Exception do
        begin
          ShowMessage('Pythonスクリプトの実行中にエラーが発生しました: ' + E.Message);
          Exit;
        end;
      end;

      strAnsList.Clear;

      if Assigned(PythonDelphiVar1) then
      begin
        s := PythonDelphiVar1.ValueAsString;
        if s <> '' then
        begin
          results := SplitString(s, ';');
          for s in results do
            strAnsList.Add(s);
        end else begin
          ShowMessage('sは空欄！');
        end;
      end else begin
        ShowMessage('PythonDelphiVar1 が未定義です');
      end;

      if Assigned(PythonDelphiVar1) then
      begin
        for j := 0 to strAnsList.Count - 1 do
        begin
          if cmbAL.Text = strAnsList[j] then
            StringGrid1.Cells[intCols,j+1] := cmbRendo.Text
          else
            StringGrid1.Cells[intCols,j+1] := '0';
        end;
      end else begin
        ShowMessage('PythonDelphiVar1 が未定義です');
        Exit;
      end;

    finally
      //StringListの解放
      strScrList.Free;
      strAnsList.Free;
    end;

    // ･･･ 略 ･･･
end;

エンエンと続く strScrList.Add( ) そう！ここに Python のスクリプトの１行１行をコピペして行くのです。20 行目くらいから、だんだん、まぶたが重くなり･･･、50 行目まで到達する頃には、意識が朦朧としてきて･･･、残り数行という段階で、~~ほぼ涅槃の境地~~に･･･

「涅槃」とは、「一切の煩悩から解脱した、不生不滅の高い境地」であり、「煩悩の火が消え、人間が持っている本能から解放され、心の安らぎを得た状態のこと」をいうのだそうです。

･･･

失礼しました。間違えました。僕のは単に眠くなり、もう何も考えられない状態になっただけです。

何はともあれ、いずれにしてもそのいちばん心が「無」になった状態で、最大の難関が待ち受けています。それは何かというと、Python 側から Delphi 側への判定結果の受け渡しの手続きの記述です。

元々の Python 側でのスクリプトは･･･

        predicted_char = predict_character(canvas, model)
        print(f"{os.path.basename(image_path)} → 認識結果: {predicted_char}")
    else:
        print(f"{os.path.basename(image_path)} → 文字が検出されませんでした。")

ここを、次のように書き換えます。※ results リストは予め空になるよう初期化しておきます。

      strScrList.Add('        predicted_char = predict_character(canvas, model)');
      strScrList.Add('        results.append(str(predicted_char))');
      strScrList.Add('    else:');
      strScrList.Add('        results.append("")');

最後に Delphi 側へ、プレゼント☆

      strScrList.Add('var1.Value = ";".join(results)');

で、Delphi 側では、results に保存されている認識結果を StringList で受け取って、StringGrid に得点を表示します。

      strAnsList.Clear;

      if Assigned(PythonDelphiVar1) then
      begin
        s := PythonDelphiVar1.ValueAsString;
        if s <> '' then
        begin
          results := SplitString(s, ';');
          for s in results do
            strAnsList.Add(s);
        end else begin
          ShowMessage('sは空欄！');
        end;
      end else begin
        ShowMessage('PythonDelphiVar1 が未定義です');
      end;

      if Assigned(PythonDelphiVar1) then
      begin
        for j := 0 to strAnsList.Count - 1 do
        begin
          if cmbAL.Text = strAnsList[j] then
            StringGrid1.Cells[intCols,j+1] := cmbRendo.Text  //得点を指定
          else
            StringGrid1.Cells[intCols,j+1] := '0';
        end;
      end else begin
        ShowMessage('PythonDelphiVar1 が未定義です');
        Exit;
      end;

もちろん、PATH も、exe のある階層が起点となるように修正して･･･

      //入力・出力フォルダ (cmbAL = ComboBox Answer Label)
      strScrList.Add('input_folder = r".\imgAuto\src"');
      strScrList.Add('output_folder = os.path.join(input_folder, "'+ cmbAL.Text +'")');
      strScrList.Add('os.makedirs(output_folder, exist_ok=True)');

こうして、なんとか、エラーを出さずに、プログラムが「動く」状態にまで仕上げました。

追記_20250421

ふと思ったのですが、Form に非表示の TMemo を１つおいて、そこに Python のスクリプトをコピペして、必要な部分のみ上記のように変更すれば、

もっとラクできたかな･･･

みたいな気が。

でも、「修行」には「修行」で、また、

別の意味と価値がある

ような･･･気も。

ただ、このプログラムの･･･究極の目的は、採点者が単に「ラクする」ためだけの･･･採点環境を実現することにある･･･という事実。

いや、それは「ヒトと機械との美しき協働」の穿った見方。

こんな相反する「矛盾」を、感じるのは作者である僕だけ？

まぁ、全部をまとめて言えば･･･

人生は必ず ± ０になる
ということでしょうか？

なお、Python4Delphi の設定と使い方の詳細は、次の過去記事をご参照ください。

How to use Python4Delphi

早速、冒頭に紹介したのと同じデータを読んで、動作確認。

Delphiへのスクリプト移植前に試行していたので、
あまりドキドキせずに「自動」ボタンをクリックすることができました！

ボタンの Caption は「自動」より、「実行」の方がよかったかな･･･？

気になっていた切り出し画像の縦横比も･･･

縦横比が変化しないようにスクリプトを修正できました！

前回は、正しく読めなかった「ウ」も、この通り読めています。

長かった･･･けれど、ここまで来ることができました☆
あきらめなくて、よかった･･･

イイ感じというか、エエ感じというか･･･

そして、Flattening 特徴量抽出で作成した学習モデルでは読めなかった「オ」･･･ですが、

HOG特徴量抽出で作成した学習モデルは、しっかり読んでくれました！

もちろん、「○・×」判定も･･･余裕でOK！
（何が余裕なのかは、僕自身、わかってないですが）

最初に正解ラベル「○」の場合、

自分的には、HOGで作った学習モデルへの「信頼感」みたいなモノが生まれてきました☆

次に、正解ラベル「×」の場合、

これなら販売できそうです。
まぁ買ってくれる人は、
いないと思いますが･･･ *(^_^)*♪

４．今後の抱負

テストとは、とても言えないような、ほんとうに取り急ぎの採点試行結果ですので、これだけを持って公開してOK！とは、とても思えません。実際の採点現場で性能を確認できたら、自作のデジタル採点ソフト AC_Reader のバージョンアップ版として、この blog の未来記事で公開したいと思います。

５．まとめ

手書き文字認識に scikit-learn を使って成功するためには･･･

（１）特徴量抽出前の学習データ作成を丁寧に行い、機械学習しやすい環境を整える。
（２）学習データが同じである場合、Flattening より HOG 特徴量抽出の方が良い結果を出せた。
（３）誤りがあれば必ず修正し、成功するまで、絶対にあきらめないこと。

６．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。記載した内容（プログラムコードを含む）を利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

デジタル採点　手書き　フリー　で検索したら

久しぶりに、上のキーワードで Google 検索して、びっくりしました。
なんと！検索結果の･･･いちばん上に！･･･僕のプログラムが、表示されてる･･･

(⊙_⊙)

正直。うれしいより先に

やばい！

・・・と、思いました。

（何ページ目くらいに表示されるのかなー☆ ）

本当に、それが、これまでに何度も、何回も繰り返した、僕の blog を Google 検索する時の想い。

（誰か、見てくれないかなー。読んでもらえたら、うれしいなー☆ ）

だから、３ページ目くらいに記事があると、「うん。うん。」って、安心してた･･･。

blog を書くこと自体が、自分の存在確認の行為に他ならないのだけれど･･･

これは本当に思い上がりとか、謙遜とか、そのどちらでもなく･･･

普通に考えて･･･

僕の blog とプログラムが
Google の検索結果で
トップに表示されるわけがない。

どう考えても、それが僕のいる世界の「本当」･･･のはず、なのに･･･
突然！目の前に表示された「画面」という現実を、それでもなお、信じられない気持ちで、眺めつつ。

夢なら覚めないでほしい

そう思ったのも、また、事実です。

この２年間の日々は、色々な意味で、ほんとうに、本当に、苦しかった･･･。

人の立場の違いは、その評価をも、真逆に変える。

あの日、拍手で歓迎されたプログラムが、ただのゴミ以下になる･･･

僕は、そのほんとうを･･･確かに、この目で、見ました。

失意のどん底にある僕を支えてくださった多くの方々に、心から感謝申し上げます。

だから、Google 先生の、僕の blog とプログラムへの評価は、世の中が僕の夢を応援してくれている証明のように思えて、「やばい」と思ったのは本当ですが、やはり、とても、うれしかったのです。

で、問題は「やばい」と感じた理由･･･そう、今回の記事を書くきっかけです。

２年前、同僚の要請に応えるかたちで、手書き答案をスキャンして得た画像から個々の解答欄画像を切り出して一括採点し、採点記号その他を付加して元の画像に書き戻すデジタル採点プログラムの最初のバージョンを書き、「表形式」の解答欄を読み取って処理するので「Answer Column Reader = AC_Reader」と名付けたのですが･･･

その時点で、プロの書いたデジタル採点システムにあって、僕のプログラムにないもの･･･

そう「○・×」、「ア・イ・ウ・エ・オ」、「A・B・C」、「１・２・３」みたいな記号・文字または数字１字の解答であれば自動採点できる機能を僕のプログラムにも搭載したいと、僕はごく自然な流れで考えたのです。

当時、年末・年始の休暇を含めて、ほぼ２か月間、手書き文字の認識に没頭した記憶があります。

その記録は当 blog の過去記事にある通りです。

Get first character from string in image

Recognize handwritten katakana characters

Recognize handwritten katakana characters No,2

Recognize handwritten katakana characters No,3

Recognize handwritten katakana characters No,4

いずれも、他人様の実験結果を、ただ真似しただけの、読むに値しない記事ですが･･･

生成 AI なんてまだなかったあの頃･･･（知らないところで、それは･･･ほぼ出来上がりつつあったのだろうけれど･･･。そう、考えると同時期にレベルの差はあれど、まったく同じ研究をやったと言うことで、たまらなく誇らしいような、いや、それはただの偶然の一致で･･･一方は AI というカタチで見事にモノになり、僕のは無駄な努力で終わり･･･もし、プログラムが当時のまま、今後進化しないのであれば･･･みたいな複雑な気持ちではありますが）、いずれにしても、その時、僕は Google 先生を頼りに『機械学習の真似事』を行い、右も、左も、わからないまま、結局 keras や Lobe のお近づきになれたよーな･･･なれなかったよーな･･･

日々を過ごしたことだけは、事実。（ 2022年、春）

で、結論だけ言うと、お遊び程度に使える自動採点機能を搭載したプログラムが書けました。･･･ただ、書けたことは書けたのですが、使用したライブラリが TensorFlow で、これには 32 ビット版がなく、仕方がないからプログラムは無理して 64 ビット化して作成。

その結果、 AC_Reader に同梱して使うその他のプログラム（ My マークシートリーダー = MS_Reader.exe 等）が 32 ビット版であること、つまり、内部で共通に呼び出して使っている Embeddable Python も 32 ビット版であることから、 AC_Reader と My マークシートリーダーとが共存するには Embeddable Python を共用しなければならないというところが大問題に。結局、64 ビット版の AC_Reader は使用を断念。版を 32 ビットに戻すと同時に、64 ビット版の AC_Reader に搭載した自動採点機能は、32 ビット版で泣く泣く削除。

あれから２年間。AC_Reader は、ほぼ、放置状態。

（表計算ソフトを使わずに、成績一覧表を出力できるようにする等、採点に伴う作業を軽減できるよう、付属的なプログラムを新たに作成すると言った、おまけ的な面で多少の改善は加えましたが、手書き答案の採点という、本業面での進化は、よく使う機能を集めてフローティングパネル化した程度）

そう、せっかく Google 先生が評価してくれたのに、プログラム本体が２年間まったく進化していないことが、心から「やばい」と感じた理由なのです。

苦しかった、この２年間を、その理由にしてはいけないのですが･･･

それでも、僕を支えてくださった方々の要望には、何としても応えたいという思いがあり･･･

必死の思いで、過去記事「組み合わせ採点を実現したい！」に書いた内容を組み込んだ答案返却用答案（？）を作成・印刷する新しいプログラムを書き、採点現場での実地テストを無事終え、そちらを「ReportCard_2025」として公開すべく、準備を進めていたのですが、先に書いた検索結果を目の当たりにして、こちらをいったん中止。

AC_Reader を２年ぶりに進化させることに決めました。
内容はもちろん、自動採点機能の搭載です。

【もくじ】

１．32ビット版で自動採点機能を搭載できないか？
２．Tesseract-OCR を使う
３．scikit_learnを使う
　(1) Embeddable Python へのインストール
　(2) 学習モデルを作成して認識テスト
４．とんでもない認識結果に驚愕する
５．まとめ
６．お願いとお断り

１．32ビット版で自動採点機能を搭載できないか？

Delphi もバージョン 12.3 では「 RAD Studio 12 ( 64-bit Initial Release ) 」がついに登場。機械学習の現場でも 64 ビット化はさらに加速しつつあり、今更、32 ビットにこだわる必要などないと自分でも思うし、64ビット化の流れに反対する気持ちなどまったくないのですが･･･

ただ、これまでに書いてきたプログラムをすべて64ビット化するのは大変だし、その前に、32 ビット版に今すぐできる改良があるなら、それを行えば、より良いものをユーザーに提供できる可能性が 32 ビット版のプログラムにも、まだ残されている気がして･･･

「より良いもの」･･･それこそが 32 ビット版 AC_Reader への自動採点機能の搭載だと思いました。

あれから２年経過して、手書き文字認識や機械学習のプログラム自体も相当進化しているのではないかと考え、まず、思い出したのは Tesseract-OCR です。

２．Tesseract-OCR を使う

他にも思い出せるモノはたくさんあったんだけど、機械学習系は手書き文字の認識の前に、大量のデータを集めてトレーニングして･･･といった学習（の手間）が必要なので、そういった手間のいらないところから搭載の可否を探ろうと思ったわけです。「寄らば大樹の陰･･･」みたいな。

手書き文字でない、既存の TrueType 日本語フォントに対してなら、Tesseract-OCR がどれほど素晴らしい性能を発揮するか、それは２年前に目の当たりにしています。ただ、残念ながら、手書き文字の認識といった部分では、２年前はお世辞にも良好とは言えなかったと記憶しています。

早速、最新版（？）をダウンロード（ tesseract-ocr-w32-setup-v5.3.0.20221214.exe ：これより新しい 32 bit版は探せなかった）して、実験してみました。日付が、ちょっと古いのが気になりましたが。もしかして、２年前もコレで実験した？みたいな感が･･･。

手書き文字は、次のような実験用サンプルを700個（すべて「ア」の画像）ほど用意。

実験に使った Python スクリプトは、コレ！
画像から抽出する文字は「アイウエオ」の中の１字。画像が「ア」であると判定すれば「ア」を出力、「アイウエオ」のいずれでもない（＝判定不能である）場合は「N」を出力する。

import cv2
import pytesseract
import re
import os

# Tesseract-OCRのパス設定
pytesseract.pytesseract.tesseract_cmd = r"C:\Python39-32\Tesseract-OCR\tesseract.exe"

def preprocess_image(image_path):
    """ 画像を前処理してOCRに適した状態にする """
    # グレースケール化
    image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
    # 二値化  
    _, binary = cv2.threshold(image, 128, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)  
    return binary

def extract_katakana(image):
    """ OCRでカタカナを認識する """
    custom_oem_psm = "--oem 3 --psm 10 -l jpn"
    text = pytesseract.image_to_string(image, config=custom_oem_psm)

    # カタカナ1文字のみを抽出
    # match = re.search(r'[アイウエオ]', text)
    return match.group(0) if match else "N"

def process_images_in_folder(folder_path):
    """ 指定フォルダ内のすべての画像を処理 """
    image_extensions = (".png", ".jpg", ".jpeg", ".bmp", ".tif", ".tiff")
    for filename in os.listdir(folder_path):
        # 画像ファイルのみ処理
        if filename.lower().endswith(image_extensions):  
            image_path = os.path.join(folder_path, filename)
            processed_image = preprocess_image(image_path)
            result = extract_katakana(processed_image)
            print(f"{filename}: OCR結果 -> {result}")

if __name__ == "__main__":
    # 画像が入っているフォルダのパス
    folder_path = "Images_Tegaki\img1_a"  
    process_images_in_folder(folder_path)

結果は次の通り。

画像は、全部カタカナの「ア」なんだけどなー。
「N」はともかく、なんで「イ」があるのかなー？

全体の集計では･･･

正解率は 23.3 ％･･･

ただ、「ウ・エ・オ」はありませんでした。そこで･･･

match = re.search(r'[ア]', text)

「ア」１文字で勝負してみました。結果はまったく同じでありました！

よくよく考えれば、同じ文字認識アルゴリズムで「ア」を判定しているのですから、これは当然です。

64 bit バージョンの方は最新版が「最近の日付」でしたから、これより良い結果が得られる可能性があるような気がしますが、僕が使いたい 32 bit バージョンに限っての話をしていますので、この時点で手書き文字の認識に Tesseract-OCR の 32 bit バージョンを使用するか、否か、という問題は、はっきり「否」と答えが出ました。

過去の記事にも書きましたが、これは「手書き文字の認識（それも「ア」１文字）」に限った話であり、他のカタカナ文字については実験もしておりませんし、これを持って、Tesseract-OCR 32 bit バージョンの総合的な「手書き文字」を認識する性能を否定する意図はまったくありません。

日本語 TrueType フォントの書体であれば、Tesseract-OCR は十分実用的な精度で文書をテキスト化してくれる素晴らしいプログラムです！！

３．scikit_learnを使う

(1) Embeddable Python へのインストール

次に思い出したのが keras だったのですが、２年前の実験における手書きカタカナ文字「アイウエオ」の認識率は 95 ～ 97 ％程度（文字によって差がある）で、これ以上はどう頑張ってもダメだった記憶が同時に蘇り･･･

AI に聞いてみると、「 keras も進化してます！」とのことでしたが、ここで、ふと、思い立ち、

「 32 bit で動作するプログラムで、手書き文字認識が可能な Python で動作するオープンソースの機械学習ライブラリは何？」と尋ねてみると･･･

scikit-learn です！

･･･との答えがトップに表示されました。

（ scikit-learn ･･･）

scikit-learn は２年前にも試していません。名前は聴いたことがあったような気がしますが･･･

AI の説明には、心揺さぶられるような文言が並び！！！

曰く、軽量で依存が少ない。
曰く、古いマシンでも動作しやすい。

さらに･･･

「SVM（サポートベクターマシン）などでの文字認識は、軽量で精度も悪くないです。」

とのこと。

サポートベクターマシンってのが、よくわからなかったので、さらに質問して見ると･･･

「サポートベクターマシン（SVM：Support Vector Machine）」は、分類や回帰に使える機械学習のアルゴリズムの一種で、scikit-learn が得意なことは、「はっきりと分けられる2つのクラス分類」であるとのこと。まさに「手書き文字認識」のためにあるようなライブラリ。何で２年前、scikit-learn を試さなかったのか･･･。後悔先に立たず。試さなかった事実は事実。それは認めるしかありません。でも、今、僕は、まだ、生きていて、あの頃は読めなかった AI のアドバイスを、今、読んでる･･･

「他のライブラリにほぼ依存せず、古いPCでも動き、軽量で、精度も悪くない。」

だんだん、だんだん、生成 AI の言うことを信じて、動かしてみたい気になってきました☆

※ ちなみに「回帰」もわからなかったので調べて見ると、「回帰（Regression）」は、予測したい結果が “数値” のときに使う機械学習の手法であるとのこと。「分類（Classification）とセットでよく出てくる」言葉なんだそうです。確かに、どこかで何度も目にしたことがあるような･･･。今、僕がやりたいのは「分類（Classification）」の方ですが、大変、勉強になりました！！

とりあえず、scikit-learn を入手して、それをインストールしなければ話は始まらない。

scikit-learn をインストールする予定の Embeddable Python を入れた Python39-32 フォルダをデジタル採点関係のプログラムを保存しているフォルダから、C:¥へコピーする。

ちなみに Python39-32 の 39 は Python のバージョン、32 は 32 bit 版という意味です。

なんでそんなことをしたかというと、Pathを短くするため。Python関連のプログラムをいじる時は、コマンドプロンプトで作業するのでPathが出来るだけ短い方が作業しやすいのです。

そうしておいて、AI の力を借りて、scikit-learn の 32 bit 版を探します。（実際にはここでかなりの時間を loss しているのですが）その結果わかったことは「通常の pip install scikit-learn でのインストールは 32ビット環境では失敗することが多い」ということ。なので、より確実にインストール可能なWindows用ホイールファイル（＝拡張子が whl のファイル）を探すことにしました。

【参考】Windows用ホイールファイル（.whl）
Pythonで使用されるパッケージ形式のひとつ。Pythonのライブラリやモジュールを効率的にインストールできるファイルで、次の特徴がある。

・事前にビルドされたパッケージなので、必要なコードや依存関係がすべて含まれている。
・ソースコードをビルドする必要がないため、Windows 環境でのインストールが簡単になる。
・pip でインストールできる。
 例: pip install scikit_learn-0.24.2-cp39-cp39-win32.whl

予想通り、世の中は 64 bit 版へ移行しつつあり、scikit-learn の 32 bit 版の最新版は「2021年4月28日」の日付がある「scikit_learn-0.24.2-cp39-cp39-win32.whl」のようです（違うかもしれません）。

以下、実際に僕が行ったインストール作業の様子です。

cp39 だから Python3.9.X に対応しており、win32 だから 32 bit 対応版であることがわかります。検索したらいちばん上に「 Pypl 」の「 scikit-learn 0.24.2 」が表示されました。リンクをたどって、https://pypi.org/project/scikit-learn/0.24.2/ へ行き、さらにページの左側にある「ファイルをダウンロード」をクリックしてダウンロードページへ行き、Built Distributions の上から２番目に目的の「scikit_learn-0.24.2-cp39-cp39-win32.whl」を発見。これをダウンロードして、Python39-32 フォルダへコピー。

コマンドプロンプトを起動していちばん最初に行うことは、この場合、pip のアップデートです。Embeddable Python に Numpy や OpenCV をインストールした時、Embeddable Python で pip を使う方法の詳細なメモを残しておいたので、それを見ながら作業を進めます。

C:\>cd Python39-32

C:\Python39-32>python -m pip install --upgrade pip
Requirement already satisfied: pip in c:\python39-32\lib\site-packages (22.3.1)
Collecting pip
  Using cached pip-25.0.1-py3-none-any.whl (1.8 MB)
Installing collected packages: pip
  Attempting uninstall: pip
    Found existing installation: pip 22.3.1
    Uninstalling pip-22.3.1:
      Successfully uninstalled pip-22.3.1
  WARNING: The scripts pip.exe, pip3.9.exe and pip3.exe are installed in 'C:\Python39-32\Scripts' which is not on PATH.
  Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.
Successfully installed pip-25.0.1

僕のはもう設定してあるから、次の作業は不要だけれど、必要な方がいるかもしれないので参考までに書くと･･･まずは、Embeddable Python で pip を使えるようにする方法。

デフォルトの python.exe では import site が無効になっているため、外部ライブラリをインポートできない。

解決策: python._pth を編集する
    python._pth（python.exe と同じフォルダにある）を開く
    #import site のコメントアウトを解除（# を削除）

# python36.zip
# ./DLLs
# ./Lib
# ./Lib/site-packages
import site  # ← コメントアウトを外す
# Uncomment to run site.main() automatically

さらに、pip を有効化するために次の作業も行う。

pip は Embeddable Python には入っていないので、次の方法で pip を使えるようにする。

(1) get-pip.py をダウンロード
    get-pip.py を 公式サイト（https://bootstrap.pypa.io/get-pip.py）からダウンロード
    C:\Python39-32（僕の場合） に配置

(2) pip をインストール
C:\Python39-32\python.exe get-pip.py

(3) pip でライブラリをインストール
C:\Python39-32\python.exe -m pip install requests

あと、環境変数を設定するには･･･

set PYTHONHOME=C:\Python39-32
set PYTHONPATH=C:\Python39-32\Lib
C:\Python-Embed\python.exe XXX.py  # <-Pythonスクリプトの実行

ここまで行えば、pip が使えるので、ダウンロードした scikit_learn-0.24.2-cp39-cp39-win32.whl のインストールが可能になる。

後で Python スクリプトも実行するので、環境変数の設定も行いつつ･･･

C:\Python39-32>set PYTHONHOME=C:\Python39-32
C:\Python39-32>set PYTHONPATH=C:\Python39-32\Lib
C:\Python39-32>set PYTHONPATH=C:\Python39-32\Scripts  # <-効いてない気がするが･･･

ただ、ここでいきなり scikit_learn をインストールしようとすると失敗します。

C:\Python39-32>python.exe -m pip install C:\Python39-32\scikit_learn-0.24.2-cp39-cp39-win32.whl
Processing c:\python39-32\scikit_learn-0.24.2-cp39-cp39-win32.whl
Requirement already satisfied: numpy>=1.13.3 in c:\python39-32\lib\site-packages (from scikit-learn==0.24.2) (1.21.5)
Collecting scipy>=0.19.1 (from scikit-learn==0.24.2)
  Using cached scipy-1.13.1.tar.gz (57.2 MB)
  Installing build dependencies ... done
  Getting requirements to build wheel ... done
ERROR: Exception:
Traceback (most recent call last):
  File "C:\Python39-32\lib\site-packages\pip\_internal\cli\base_command.py", line 106, in _run_wrapper
    status = _inner_run()
  File "C:\Python39-32\lib\site-packages\pip\_internal\cli\base_command.py", line 97, in _inner_run
    return self.run(options, args)
  File "C:\Python39-32\lib\site-packages\pip\_internal\cli\req_command.py", line 67, in wrapper
    return func(self, options, args)
  File "C:\Python39-32\lib\site-packages\pip\_internal\commands\install.py", line 386, in run
    requirement_set = resolver.resolve(
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\resolver.py", line 95, in resolve
    result = self._result = resolver.resolve(
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 546, in resolve
    state = resolution.resolve(requirements, max_rounds=max_rounds)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 427, in resolve
    failure_causes = self._attempt_to_pin_criterion(name)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 239, in _attempt_to_pin_criterion
    criteria = self._get_updated_criteria(candidate)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 230, in _get_updated_criteria
    self._add_to_criteria(criteria, requirement, parent=candidate)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 173, in _add_to_criteria
    if not criterion.candidates:
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\structs.py", line 156, in __bool__
    return bool(self._sequence)
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\found_candidates.py", line 174, in __bool__
    return any(self)
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\found_candidates.py", line 162, in <genexpr>
    return (c for c in iterator if id(c) not in self._incompatible_ids)
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\found_candidates.py", line 53, in _iter_built
    candidate = func()
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\factory.py", line 187, in _make_candidate_from_link
    base: Optional[BaseCandidate] = self._make_base_candidate_from_link(
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\factory.py", line 233, in _make_base_candidate_from_link
    self._link_candidate_cache[link] = LinkCandidate(
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\candidates.py", line 304, in __init__
    super().__init__(
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\candidates.py", line 159, in __init__
    self.dist = self._prepare()
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\candidates.py", line 236, in _prepare
    dist = self._prepare_distribution()
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\candidates.py", line 315, in _prepare_distribution
    return preparer.prepare_linked_requirement(self._ireq, parallel_builds=True)
  File "C:\Python39-32\lib\site-packages\pip\_internal\operations\prepare.py", line 527, in prepare_linked_requirement
    return self._prepare_linked_requirement(req, parallel_builds)
  File "C:\Python39-32\lib\site-packages\pip\_internal\operations\prepare.py", line 642, in _prepare_linked_requirement
    dist = _get_prepared_distribution(
  File "C:\Python39-32\lib\site-packages\pip\_internal\operations\prepare.py", line 72, in _get_prepared_distribution
    abstract_dist.prepare_distribution_metadata(
  File "C:\Python39-32\lib\site-packages\pip\_internal\distributions\sdist.py", line 56, in prepare_distribution_metadata
    self._install_build_reqs(finder)
  File "C:\Python39-32\lib\site-packages\pip\_internal\distributions\sdist.py", line 126, in _install_build_reqs
    build_reqs = self._get_build_requires_wheel()
  File "C:\Python39-32\lib\site-packages\pip\_internal\distributions\sdist.py", line 103, in _get_build_requires_wheel
    return backend.get_requires_for_build_wheel()
  File "C:\Python39-32\lib\site-packages\pip\_internal\utils\misc.py", line 702, in get_requires_for_build_wheel
    return super().get_requires_for_build_wheel(config_settings=cs)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\pyproject_hooks\_impl.py", line 196, in get_requires_for_build_wheel
    return self._call_hook(
  File "C:\Python39-32\lib\site-packages\pip\_vendor\pyproject_hooks\_impl.py", line 402, in _call_hook
    raise BackendUnavailable(
pip._vendor.pyproject_hooks._impl.BackendUnavailable: Cannot import 'mesonpy'

最初にコレを見たときはマジ泣きたくなりました･･･ T_T

いろいろ調べて見ると、どうやら最後に出てくる MesonPy に原因があるらしいことがわかりました。と、言うのは、scikit_learn と同時にインストールされる scipy には mesonpy というビルドツールが必要で、それが 32ビット環境では動作しないことがエラーの原因とのこと。どうやら MesonPy は 32 bit 版に対応していないようです。じゃあ、どうするかと言うと、最初に scipy を単体でインストールします。

次のサイトにアクセスし、Python 3.9 (32bit) 対応の scipy の .whl をダウンロードします。

https://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy

上のサイトに「scipy-1.9.0-cp39-cp39-win32.whl」があったので、これをダウンロードして、Python39-32 フォルダへコピー。で、pip を使ってインストールします。

C:\Python39-32>python.exe -m pip install C:\Python39-32\scipy-1.9.0-cp39-cp39-win32.whl
Processing c:\python39-32\scipy-1.9.0-cp39-cp39-win32.whl
Requirement already satisfied: numpy<1.25.0,>=1.18.5 in c:\python39-32\lib\site-packages (from scipy==1.9.0) (1.21.5)
Installing collected packages: scipy
Successfully installed scipy-1.9.0

次に scikit_learn をインストール。

C:\Python39-32>python.exe -m pip install C:\Python39-32\scikit_learn-0.24.2-cp39-cp39-win32.whl
Processing c:\python39-32\scikit_learn-0.24.2-cp39-cp39-win32.whl
Requirement already satisfied: numpy>=1.13.3 in c:\python39-32\lib\site-packages (from scikit-learn==0.24.2) (1.21.5)
Requirement already satisfied: scipy>=0.19.1 in c:\python39-32\lib\site-packages (from scikit-learn==0.24.2) (1.9.0)
Collecting joblib>=0.11 (from scikit-learn==0.24.2)
  Downloading joblib-1.4.2-py3-none-any.whl.metadata (5.4 kB)
Collecting threadpoolctl>=2.0.0 (from scikit-learn==0.24.2)
  Downloading threadpoolctl-3.6.0-py3-none-any.whl.metadata (13 kB)
Downloading joblib-1.4.2-py3-none-any.whl (301 kB)
Downloading threadpoolctl-3.6.0-py3-none-any.whl (18 kB)
Installing collected packages: threadpoolctl, joblib, scikit-learn
Successfully installed joblib-1.4.2 scikit-learn-0.24.2 threadpoolctl-3.6.0

ちょっとたいへんだったけど、これでなんとか、scikit_learn の 32 bit 版が Embeddable Python にインストールできました！！（ Python39-32 フォルダのサイズが 335 MB になっちゃったけど、これだけはもうどうにもならない。ちなみに Tesseract-OCR を入れた場合は、その倍くらいになりました！）

(2) 学習モデルを作成して認識テスト

２年前の手書きカタカナ文字認識チャレンジで使った手書きカタカナ文字の画像ファイルは、壊れたノートパソコンから取り外した SSD を専用ケースに入れて作った外付け SSD ドライブに保存してあります。

その SSD ドライブ内を検索し、テストで使えそうな画像ファイルを探すと、ア・イ・ウ・エ・オの各文字がほぼ 700 字ずつ、フォルダに分類されて保存されているのを見つけることができました。

（あった。コレだ ☆ ）

記憶では「水増し」して 3000 文字くらいずつ集めたフォルダもあったはずですが、文字数が増えれば増えるほどコピーに時間がかかります。それに、いきなり 3000 文字を機械学習させて結果が失敗だったら、その後、打つ手がなくなってしまう･･･。だから、とりあえず、この 700 字でテストしてみようと考えました。

２年前は手書きカタカナ文字の収集や整理に膨大な時間を要しましたが、今回は「それがない」から、何の苦労もなく仕事はスイスイ進みます。

scikit_learn の学習モデルを作成するスクリプトに合うよう、画像ファイルを入れたフォルダを準備して学習モデルを作成しました。そのスクリプトがコレです。

import cv2
import numpy as np
from sklearn import svm
from sklearn.model_selection import train_test_split
import os
import joblib  # モデルの保存と読み込みに使用

from sklearn.svm import SVC  # SVMにクラスの重みを追加することで、少数派クラスに対して重みを高く設定

# カタカナのクラス（修正: 「ア」を追加）
CATEGORIES = ["ア", "イ", "ウ", "エ", "オ"]

# Pathの中の日本語に対応
def imread(filename, flags=cv2.IMREAD_GRAYSCALE, dtype=np.uint8):
    try:
        n = np.fromfile(filename, dtype)
        img = cv2.imdecode(n, flags)
        return img
    except Exception as e:
        print(e)
        return None

# データセットの準備（28x28 の手書きカタカナ画像）
def load_images_from_folder(folder, categories):
    images = []
    labels = []
    for label, category in enumerate(categories):
        path = os.path.join(folder, category)  # パスの結合方法を修正
        print(f"Processing category: {category}, Path: {path}")  # デバッグ用に出力

        # ディレクトリが存在するか確認
        if not os.path.exists(path):
            print(f"Warning: Path does not exist: {path}")
            continue

        for file in os.listdir(path):
            # ファイルが画像であるかどうかを拡張子でチェック
            if file.lower().endswith(('.png', '.jpg', '.jpeg')):
                file_path = os.path.join(path, file)
                # print(f"Trying to load file: {file_path}")  # 読み込みファイルのパスを表示
                try:
                    # カタカナを含むパスが問題ないかを確認
                    # img = cv2.imread(file_path, cv2.IMREAD_GRAYSCALE)
                    img = imread(file_path)
                    if img is not None:
                        img = cv2.resize(img, (28, 28))
                        images.append(img.flatten())  # 1次元化
                        labels.append(label)
                    else:
                        print(f"Failed to load image: {file_path}")
                except Exception as e:
                    print(f"Error loading {file_path}: {e}")
            else:
                print(f"Skipping non-image file: {file}")
    print(f"Loaded {len(images)} images")
    return np.array(images), np.array(labels)

# データ読み込み
X, y = load_images_from_folder(r"C:\Python39-32\Images_tegaki\img_28", CATEGORIES)
X = X / 255.0  # 正規化

# データがロードされていない場合にエラーを出す
if len(X) == 0:
    raise ValueError("No images loaded. Please check the image files and paths.")

# 学習とテストの分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# SVM モデルの作成と学習
model = svm.SVC(kernel='linear')
model.fit(X_train, y_train)

# SVM モデルの作成と学習（クラスの重みを設定する）
# class_weights = {0: 1, 1: 2, 2: 2, 3: 1, 4: 1}  # イとウの重みを増やす
# model = SVC(kernel='linear', class_weight=class_weights)
# model.fit(X_train, y_train)

# モデルを保存する
joblib.dump(model, 'katakana_svm_model.pkl')
print("Model saved as 'katakana_svm_model.pkl'")

# 予測関数
def preprocess_image(image_path):
    img = imread(image_path)
    h, w = img.shape

    # 正方形になるように余白を追加
    size = max(h, w)
    square_img = np.full((size, size), 255, dtype=np.uint8)  # 背景を白に
    x_offset = (size - w) // 2
    y_offset = (size - h) // 2
    square_img[y_offset:y_offset + h, x_offset:x_offset + w] = img

    # 28x28 にリサイズ
    img_resized = cv2.resize(square_img, (28, 28))
    return img_resized.flatten() / 255.0

def predict_character(image_path):
    img = preprocess_image(image_path)
    model = joblib.load('katakana_svm_model.pkl')  # 学習したモデルをロード
    label = model.predict([img])[0]
    return CATEGORIES[label]

# テスト画像の認識ア
image_path = "katakana_sample_A.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

# テスト画像の認識イ
image_path = "katakana_sample_I.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

# テスト画像の認識ウ
image_path = "katakana_sample_U.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

# テスト画像の認識エ
image_path = "katakana_sample_E.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

# テスト画像の認識オ
image_path = "katakana_sample_O.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

このスクリプトで学習モデルを作成し、最後に別に用意したテスト画像を認識させてみました。

「ア・イ・オ」は、いっしょに暮らしている人が、
「エ・ウ」は、僕が書いた手書きカタカナ文字。

結果は、とても不思議なことに「ア・エ・オ」は正しく読み取りましたが、「イ・ウ」を間違えてしまって、なんだか Python に混乱が生じているような感じ。

そこで行ったことが学習する際の重み付けの変更。その跡が上のスクリプトの赤字となっています。

で、重み付けを変更して（イ・ウの重みを増加させて）新たに学習モデルを作成し、テストしてみましたが結果は第１回目と同様。「ア・エ・オ」は正しく読み取りますが、「イ・ウ」を間違えてしまいます。

何気なく「アイウエオ」の各文字を保存したフォルダを開けて見て、ようやく原因が判明。なんと「ウ」のフォルダ内に「ウ」はなく、「イ」が溢れかえって･･･

つまり、コピーする際、僕が間違えて･･･

うぎゃ！Zoräth ✷ fel∅, ∞’ka selenïv! ⧖ Trål’xon que！

(T▽T;) やっちまったぁ！！

手書きカタカナ文字を正しく分類し直して、再度、機械学習を実行し、学習モデルを作成。

今度は･･･

４．とんでもない認識結果に驚愕する

次に、学習用に使った「アイウエオ」各 700 文字で読み取りテストをやってみました。できれば、学習用に使ってない文字がよかったんだけど、残念ながらそれはないので、学習用素材でテストを強行。

各文字の認識率は、次の通り。

まず、「ア」

次、「イ」

次、「ウ」

次、「エ」

次、「オ」

事前に学習に使ってるから、ある意味「不正行為」と言えなくもないんだけど･･･

これなら手書き文字認識に
十分、使えるのでは
ないでしょうか？

さぁ AC_Reader の改造だ！

５．まとめ

・scikit-learn で作成した学習モデルは、宝物になりそうだ☆☆☆

６．お願いとお断り

観点別評価と評定の整合性をチェックする

高等学校における現行の教育課程では、３つの観点それぞれについて、A・B・Cで評価し、トリプルA（AAA）ならば評定は「５」というような成績評価を行っています。ほとんどの現場では、表計算ソフトを使って観点別評価を点数化し、その合計に応じて評定を自動的に計算する仕組みを導入しているのではないか？と思いますが、そうだとしても成績の最終的なチェックは絶対に必要。

そこで、観点別評価と評定を入力したファイル（ Excel Book の拡張子が xls, xlsx, xlsm いずれかのファイル）を任意のフォルダに入れ（もちろん、複数個入っていてもよい）、ここで紹介する「観点別評価と評定の整合性をチェックするプログラム」を起動、フォルダを選択するだけで、データのセル番地など、一切指定しなくても各々のファイルに入力された観点別評価と評定の整合性を全自動でチェック（整合性に問題がある場合、オプションで指定すれば観点別評価に基づいて評定を自動修正）してくれるプログラムを書いてみました。

実際に使ってもらい、「これはイイ！」と評価していただけましたので、ここでフリーソフトとして公開します。「 Excel Book に入力された観点別評価と評定の整合性をチェックするよい方法はないか？」と、悩んでいらっしゃる方にお使いいただけたら、何よりの幸いです。気がついた不具合はすべて解消してありますが、未発見のバグがまだどこかにあるかもしれません。このプログラムはあくまでも「素人」が、「趣味」で書いたものであり、思い込みや勘違いによる誤りを内包している可能性があります。大変、申し訳ないのですが、どうか、そこだけはご了承ください。

【もくじ】

１．観点別評価から評定への変換基準
２．ワークシートへのデータ入力方法
３．プログラムの使い方とダウンロード方法
４．まとめ
５．お願いとお断り

１．観点別評価から評定への変換基準

観点別評価から評定への変換基準は、次の通りです。

Aは６点、Bは４点、Cは１点に変換、その合計値が18ならば評定５、そうでない場合はその合計値が13点以上ならば評定４、そうでない場合はその合計値が９点以上ならば評定３、そうでない場合はその合計値が６点以上ならば評定２、そうでない場合は（合計値が３点ならば）評定１とする変換基準に基づいて、このプログラムは動作します。

観点別評価から評定を計算するのではなく、あくまでも、既存の成績データの整合性をチェックするプログラムであることに、どうか、ご留意ください。

【観点別評価と評定】
AAA ･･･５
ABA, BAA, AAB ･･･４
AAC, ACA, CAA ･･･４
ABB, BAB, BBA ･･･４
ABC, ACB, BAC, BCA, CAB, CBA ･･･３
BBB ･･･３
BBC, BCB, CBB ･･･３
ACC, CAC, CCA ･･･２
BCC, CBC, CCB ･･･２
CCC ･･･ 1

２．ワークシートへのデータ入力方法

次の２つのパターンに対応。

「まとめて入力」を選択した場合は、観点別評価がまとめて一つのセルに入力されているファイルをチェックし、「分けて入力」を選択した場合は、観点別評価がそれぞれ独立したセルに入力されているファイルをチェックします。

いずれの場合も観点別評価が文字列または文字データとして入力されたセルの「真」に右隣りのセルに「評定」の数値データが入力されていることが、プログラムが正常に動作するための必須条件。

プログラム完成後にセルに埋め込んだ計算式が表示する値であっても、上の動作条件を満たす形でデータが並んでいれば、プログラムは正しく動作することを一応確認しました、が･･･

評定を計算式で表示しているのであれば、こんなチェック・プログラムはいらないか、と･･･。

【重要な注意】

このプログラムは、任意の行のセルに入力された、文字列（または文字）の観点別評価と「真」に隣り合う列に、数値で入力されている評定がある箇所を見つけ、その整合性をチェックするものとして開発。

プログラムが正しく動作する入力例：

次の場合は動作しません！
ワークシートのセルに設定された計算式がある場合は、それを破壊します。

プログラムが正しく動作しない（どころかデータの破壊が生じる）入力例：

上の例のように、観点別評価と評定の入力セルの間に「非表示に設定された列」があり、その非表示に設定された列に観点別評価のA・B・Cを数値に変換する式が組まれているような場合、非表示の列があるため、見た目には観点別評価と評定が隣り合うセルにあるように見えても、プログラムは期待通りに動作しません。このようなファイルを自動修正機能を使用してチェックした場合、非表示の列内のセルに設定された計算式は確実に破壊され、失われます。くれぐれもご注意ください。

前述の通り、このように式で結果を表示している場合は、チェックする必要性などない気が･･･しますが、どうしてもチェックしたい場合は、ファイルのバックアップを取り、ワークシート全体を値複写で上書きしてから、不要な列を削除すれば、チェック可能に。

プログラムは、観点別評価が入力されているセルを自動的に探し、その「真」に右隣りに存在するセルに入力されている数値が期待されたものであるか・どうかをチェックするだけで、この並びに従わないその他のセルに入力されたデータ・計算式はすべて無視して動作します。

問題は、（私の）想定外の（プログラムが）無視できない「何か」に引っかかってしまった際の挙動ですが、重要な部分は try 文を使用して、何かあればエラーメッセージを表示するようにプログラミングしてあります。なので、プログラムがフリーズするようなことは、起きないはずです。

また、観点別評価が入力されていると判定されたセルの「真」に右隣りのセルに、（評定の入力がない）空白セルがあった場合は、エラーメッセージを表示します。動作確認作業を進める中で、そのことの必要性に気づき、プログラムに必要な修正を加えました。もちろん、空白セルの自動修正も可能です。ただし、観点別評価が不足している（３観点分がそろっていない）場合には、プログラムはそのようなセルをチェック対象としません。もちろん、エラーメッセージも表示されません。使用にあたっては、この点にも十分ご注意ください。

３．プログラムの使い方とダウンロード方法

チェックしたいファイルを任意のフォルダに保存します。

上のように、チェックしたいファイルを保存したフォルダ内にその他のフォルダやファイルがあっても問題なく動作します。

チェック・プログラムのアイコンをダブルクリックしてプログラムを起動します。

最初に、チェックしたいファイルの拡張子を選択します。

次に、観点別評価の入力形式を選択します。

次に、調査対象のファイルを入れたフォルダが exe と同じ場所にあれば「 EXE 位置」、そうでない場所にある場合は「指定なし」をクリックしてください。

次に、調査対象とするワークシートの番号を指定します。

Excelのワークシートコレクションのインデックス番号は「０」始まりではなく、「１」始まりであることに注意してください。１枚目のワークシートとは、次の図の「 Sheet1 」を意味します。このプログラムではワークシートの名称ではなく、その位置でチェック対象のシートを決めています。ですので、ワークシートの名称は問いません。

より詳細な案内表示や、評定の自動修正機能を使用したい場合は、チェックボックスにチェックを入れてください。デフォルトで「案内」は True、「自動修正」は False に設定してあります。

上で述べたように、「自動修正」は最悪の場合、ワークシートのセルに設定された計算式を破壊する可能性があるので、取扱いには十分注意する必要があります。いろいろ考えた末、やはりここはパスワードを入力しないと自動修正機能が有効にならないようにするのが万一の事故を防止するには最善と判断しました。なので、「自動修正」にチェックするとパスワード入力を求める自家製 InputQuery が表示されます。

次のパスワードを入力して、OKをクリックしてください。
最後に半角の「 ! 」がついています。コピペする際、お忘れにならないよう、ご注意願います。

Evaluate-Fix2025!

正しいパスワードが入力されていれば、次のメッセージが表示されるので、

よくよくよくよくよく
お読みいただき、
ご理解・ご了承いただけた場合のみ

「はい」をクリックしてください。万一にも、不安を感じた場合は「いいえ」を選んだ方が賢明です。

【参考】

ちなみに、「自動修正」にチェックが入っていなければ、ファイルは読み取り専用で開くようにして、不測の事故を防止しています。

  if cbAutoWrite.Checked then
  begin
    //ファイルを書込み可能な状態で開く
    Workbook := ExcelApp.Workbooks.Open(ListBox1.Items[i], EmptyParam, False, EmptyParam,
    EmptyParam, EmptyParam, EmptyParam, EmptyParam, EmptyParam, EmptyParam, EmptyParam, 
    EmptyParam, EmptyParam, False);
  end else begin
    //ファイルを読み取り専用で開くことで、編集のためにロックされることを防ぐことができる
    Workbook := ExcelApp.Workbooks.Open(ListBox1.Items[i], ReadOnly := True);
  end;

「はい」をクリックすると、案内のメッセージが表示されます。

準備が全て整ったら、「チェック開始」ボタンをクリックしてください。最初にチェックするファイルを保存したフォルダをクリックして選択し、OKをクリックします。チェックは自動的に始まります。

チェックが完了すると、次のメッセージが表示されます。それまでお待ちください。実測したわけではありませんがチェックするデータがワークシート１枚あたり1000セットあると、PCの性能にもよりますが 30 秒以上かかると思います。

なお、チェック中は、プログラム画面の下方にプログレスバーが表示され、緑の帯が作業の進行状況を示してくれます。

実際に、ある現場で使用しているプロが作成した業務用ファイルに対して実行してみた例。
１学年７クラス規模の場合、約400行 × 約80列程度のチェック範囲となっている。

チェックの結果、問題がなかった場合は「評価と評定の整合性に問題はありませんでした。」と表示されてチェック終了です。

整合性に問題があるデータを見つけた際は、その行・列位置を次のように表示します。

RはRow（行）、CはCol（列）を意味します。
（本番で、こんなに間違いがあることは、まず『ない』と思いますが･･･）

最も上の例で言えば「セル R2C3 」は、第２行目の第３列のセルのデータに問題があることを意味し、プログラムは、その問題の内容を右の（　）内に表示します。この場合は、「６」というあり得ない評定値が入力されていたことが問題の原因であることを示しています。

「自動修正」を有効化してチェックした場合は、次のように修正後の評定も表示されます。

これで、成績の付け間違いは完全に撲滅できると思ったのですが（確かに実際に撲滅できましたが）、現場でこのプログラムが発見したデータの誤りの中には、「評定が正しく、観点別評価の方が間違い」だった例がありました。ですので、整合性の問題を発見した際には、誤りが「観点別評価」にあるのか、それとも「評定」にあるのかを個別にチェックする必要があるようです。

なお、設定は ini ファイルに保存し、次回起動時に復元することができます。作者が勝手に設定した値になりますが、諸設定を初期化することもできます。

【プログラムのダウンロード】

ダウンロード要件に同意していただける場合のみ、ダウンロードできます。

ABC_Checker

1 ファイル 1.03 MB

ダウンロード

ダウンロード後、zip ファイルを展開していただき、ABC_Cheker.exe をダブルクリックしてプログラムを起動してください。同梱の TestData フォルダ内にテスト用データを入力済みのファイルがありますので、このファイルを利用してプログラムの動作をご確認ください。

なお、プログラムの初回起動時には、Windowsのセキュリティ機能であるSmartScreenにより「WindowsによってPCが保護されました」というメッセージが表示されると思います。

悪意のあるプログラムではありませんので、「詳細情報」をクリックすると表示される次の画面で「実行」を選択（クリック）し、プログラムを起動してください。２回目の実行からは、この警告画面は表示されなくなるはずです。

お手数をお掛けして申し訳ありませんが、信頼できる発行元になるために必要なデジタル署名を取得する費用等を考えますと、個人レベルで、その申請手続きを行うことは私の場合、無理と言わざるを得ません。開発に使用している IDE （ Delphi 12.3 ）のサブスクリプション費用の支払いだけは Object Pascal の発展を願う１ユーザーとしての気持ちからずっと続けていますが･･･。

なお、最初にアップロードした実行形式ファイルで「自動修正」を有効にした状態で設定を保存すると、次回起動時に Form が表示される前に自動修正を有効化する処理が行われてしまい、「無効/非表示ウィンドウにはフォーカスを設定できません。」というエラーメッセージが表示されてしまうバグがあることに気づき、「自動修正」を有効にした状態で設定を保存しても、次回起動時に Form の表示が完全に行われてから、自動修正を有効化する処理が実行されるように、プログラムを修正しました。

ただ、「自動修正」を常に有効化した状態で起動すると、毎回パスワードを入力する InputQuery が表示されることになってしまいます。そういう「仕様」ですので、これは仕方がありませんが、起動と同時にパスワードの入力を求められますので、ちょっとびっくりします。ですので、危険を防止する意味からも「自動修正」機能を常に有効化しておく設定での運用は避けた方がよろしいかと思います。

４．まとめ

・新教育課程の観点別評価と評定の整合性をチェックするプログラムができました。
・高等学校用です。
・無料でお使いいたけますが、サポート等は一切ありません。
・ヘルプファイルもありません（ここでの説明がすべてです）。
・作者が未発見の（大いなる）不具合がある可能性があります。

５．お願いとお断り

TSL205の修理

スノーシューの先端の、登山靴の爪先を固定する部品が、前回の山行で壊れてしまった。

雪の上に落ちた欠片を拾ってきた。
僕に修理できるとは思えなかったけれど、壊れた欠片を山のゴミにするわけにはいかない･･･

写真では３つに分断されたように見えるが、実は右側の部品のベルトを通す部分も破損していて、実際は４つに分断される形で壊れている。

この部品がなくても、靴の爪先を固定するベルトはまったく問題なく機能するので、ベルトと靴の摩擦で靴が早く傷むかな？･･･という心配以外には、何の問題もないような気もしたが。

Web 上に、このことに関して何か情報はないか･･･と検索してみると、これと同じ「部品が破損して、要修理状態ですが･･･」という但し書き付きで販売されている中古の TSL205 を複数発見。

プラスチック樹脂の経年劣化で、遅かれ、早かれ、この問題は必ず生じるのだろうな･･･と、ひとり納得する。

「最新型に買い替える」という手も、もちろん「あり」だが、新品の価格は２万数千円。毎日使用するならともかく、年に数回使うか、どうか、という「遊び道具（ただし、命にかかわる）」に、今、それだけのお金を支払う気にはなれない。

壊れたのは右足側だけで、左足側は現在のところ、何の問題もないし･･･

それに、いろんな最新型を見てみると、登山靴の固定方法がより一層便利な方向へ、一見「進化」しているように見えるのだけれど、（もし、山で、壊れたら･･･現場でリペアできる？）みたいな視点で考えると、ちょっと怖くなるような商品が大多数･･･。

山の先輩から教わった、いちばん、信頼できる靴の固定方法は「ベルトで締め付ける」タイプ。
単純で、簡単で、万一、不具合が生じても、現場で修理できるカタチがベスト。

このいちばん単純な固定方法であっても、氷点下の環境で、締め付けベルトが凍結＆結氷し、手指もかじかんで、自由な運動がままならない状況では、脱着にとてつもなく苦労したりするのだ。

これは実際に、僕が雪山で経験して得た教訓。だから、いい加減な妥協は、絶対にできない。
何かを結ぶ・固定するには「紐・ベルトがいちばん良い」という先輩の言葉を、僕は心から信じる。

修理と言うか、とりあえず、（上の写真の通り）壊れた部品だけ外して、登山靴の爪先を固定するベルトはまったく問題なく使用できるから、そのまま使おうか･･･と思っていたら･･･

スノーシューが壊れた山行を共にした、僕の大好きな先輩が･･･後日、やってきて･･･

手持ちの細引きと100均で購入してきたベルトで、壊れた僕のスノーシューを修理してくださった･･･。

「あのスノーシュー、ある？」って、先輩が言うから、「はい、あります。」って返事して、先輩に壊れたスノーシューを手渡したら･･･、その１０分後。

まるで、これがオリジナル状態かと思うほどの出来栄え･･･

実際に登山靴を装着してみたところ･･･

先輩曰く。

「ベルトと紐が、いちばん確実なんだ。」

「擦り切れたら、予備と交換するだけで、直る。」

「だから･･･これは、もう片方が壊れた時の分な･･･」

そう言って、予備の細引きとベルトを、僕に渡してくださった･･･。

さらに･･･

「電車にも乗るし、ザックにそのまま付けて歩くわけにもいかんだろう」と･･･

先輩は、スノーシューを入れるバッグとザックに付けるためのベルトも用意してくださっていた･･･

ただ、ただ、先輩に感謝。

先輩から借りたトレッキングポール２本を左手に束ねて持ち、右手にスノーシューを入れたバッグをぶら下げて、ザックを背負い、嬉々として僕は先輩と雪山へ･･･。

思えば･･･

もう、何十年も登っていなかった山に、「一緒に登ろう！」って誘ってくれたのも、この人だった。

「お近づきのしるしに･･･」って、先輩がプレゼントしてくれたメスティンで、先輩からもらったパエリアのもとを入れ、ドキドキしながら庭で炊飯して食べたごはんは、涙がこぼれるほど美味しかった。

「時間を見て、引き返せ」ってアドバイスをもらった山行では、日本でいちばん高い山を間近に見て大興奮。あまりのうれしさに時の経過を忘れ、無理な登山を強行。登頂は果たしたものの、下山途中でグリコーゲンが尽き、たどり着いたテント場では疲労困憊のため、空腹であるにも関わらず、食事すら摂れない状態に･･･。そのことを帰りの電車から先輩に報告したメールは、僕の山行の復活の証だ。

いつも、こんな僕のことを、先輩は気にかけてくれて･･･

ネットで「これは、きみのアイゼン」って勝手に決めて、勝手に購入して、本当は高価な良い品を格安で譲ってくれたり･･･

僕がルートを間違えた時も、いち早く、その誤りに気づき、谷底に降りてはいけない理由や、その怖さを実地に諭し･･･、雪に覆われた川の渡り方を、僕に教え･･･「こっちだ。」って、先輩の言う通りの方向へ進んで正しいルートに戻れたことも･･･。

また、ある山行では、悪化する天候を予測。登頂を断念して引き返す「勇気」の大切さを、教わり･･･

山での食事の際は、いつも食後の紅茶やコーヒーを皆に。

そして、ここ、いちばんのシーンで、ザイルを肩に断崖に立つ、その姿は･･･数万の敵を睥睨して一歩も引かない、古代ローマの戦士のようにも、見えた･･･。

修理したスノーシューは、実際に、２０～３０ｃｍほどの新雪に覆われたこの雪山で丸一日使用。修理してくれた先輩と一緒に、標高差約１０００ｍを登って降りた。行動中に、締め付けベルトはもちろん凍結し（左右とも）、山頂で昼食を作る際の脱着にはそれなりに苦労したが、行動そのものには「何の問題もなし」。

登山前日に降ったばかりのフカフカの新雪で、スノーシューを履いていても一歩踏み出すごとに足が数十センチは雪に潜り、スノーシュー無しで一緒に登ったアイゼン組のメンバーからは「二度と行きたくない山ナンバーワン（もちろん冗談。それくらいキツかったということ？）」との感想も出た中で、僕は筋肉痛すら出ず（先輩に勧められて食べたサラダチキンの効用も多分にあり？）。もちろん、先輩の修理により、見事復活した My スノーシューは、終日、外れる気配すらなし。

左右のトレッキングポールの刺さり方から、フカフカの新雪であることが伝わるでしょうか？
先輩が貸してくれたトレッキングポールのバスケットは、もちろん雪山用の大きいタイプ。

もちろん、締め付けベルトは、カチン・コチンに凍った･･･が、１日で登って降りるというハードな山行をスノーシューはしっかりサポート。

今や、積雪期の山行に、なくてはならないアイテムとなった My Snowshoe.

ただ、ひとつだけ、妙に気になったことがあって･･･。

僕らのクライミング・リーダーである先輩は、なんと･･･

スノーシューを持ってない！

僕にスノーシューの購入を勧め、破損した際には、こんなにも素晴らしい修理を施してくれた先輩は、なぜ、スノーシューを履かないのか？

先輩曰く。

『 オレ、一度も履いたことない。 』

そこだけは、謎。

謎だが、そこがまた、先輩の不思議な魅力であることに、間違いはなく。

破損した TSL205 の修理で困っていらっしゃる方に、この記事が少しでも参考になれば、それは何よりの喜びです。*(^_^)*♪

【お願いとお断り】

このサイトの内容を利用される場合は、自己責任でお願いします。記載した内容を利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。特に、登山用品は自らの命を預けるものです。そのメンテナンスについては、自己の責任のもと、常に万全を期す必要があります。今回、記載した記事は、自己流の修理を奨励・推奨するものでは決してありません。

【追記】

登攀する際は、TSL205 の後部のロック（留め金）を解除して、太い針金状の部品（ヒールリフターと言うらしい）を前に倒し、かかとの位置を上げることで、足の負担がかなり軽減される。

いちばん最初にヒールリフターを試した際は、ストッパーでしっかり固定された可動部のあまりの固さに、この太い針金状の金属部品を無理して持ち上げるとスノーシューが壊れるのではないか？と、かなり心配したが、慎重にゆっくり持ち上げれば大丈夫のようだ。

実際、登りでヒールリフターを使用してみたが、使用していない状態よりも、使用した方がはるかにラクに登れた。ご参考まで。

雪と、空と、僕と･･･

心に決めたタイムリミットまで、あと 20 分。
胸に思い描いた、ピークが･･･ついに、見えた。

そうだ･･･。あの頂きに立ちたくて、僕はここへ来た。
高度にして･･･あと 100 m ･･･と、ほんの少し･･･の･･･はずだ。

高度計の示度は、2300 m。

補正していないから、正確な値ではないが、真の高度に近い値であることは間違いない。

天候は快晴。
風力０。

リミットと決めた時まで･･･残り 20 分。

残り 20 分の距離にしては、少しだけ、遠すぎる･･･気がする･･･
せめて･･･、あと、30分。　あれば･･･

ただ、幸いなことに足元の雪は･･･固く、しまっている。
スノーシューの力を借りれば、潜るようなことはない。

おそらく、この辺りが森林限界だ。
もしかしたら、視界が広がったことで、そう感じるのかも･･･しれないが。

今は、とにかく、前へ、前へ、進む。
トレッキングポールの有難みを痛いほど、感じる。
普段、平地を歩くときは、その必要性など感じないが、斜面を登攀する際は、いつの間にか、なくてはならないアイテムになったトレッキングポール。

今日使っているのは、先輩に借りた雪面用のバスケットの大きいタイプだ。
だから体重をかけても、ポールが雪面に潜るようなことはない。

腕の力を使い、言わば 4WD 的に運動できることで、足の負担は相当に軽くなる。

ザック　サク･･･

雪を踏みしめる音と、トレッキングポールが雪面を刺す音が交互に響く。

登りが少し急になり、呼吸も次第に荒くなる。
歩幅を小さくして、低い階段を登るように細目にステップを切って進む。

汗が目に沁みて痛い。

（この斜面を越えたら、ザックからタオルを出そう）

そう思いながら登ること、しばし。
ようやく、急な斜面を超える。

ザックを雪面に降ろし、上部のポケットからタオルを取り出して、汗を拭く。
背に心地よい冷気を感じるが、それはザックを降ろした今、この瞬間だけだろう･･･。

気温はわからないが、ザックのハーネスに付けたペットボトルの水の冷たさがそれを教えてくれる。
滴り落ちる汗に反して、それは凍り付くように冷たい。

荒くなった呼吸を、少しでも落ちつけたくて、
乾きを感じないままに、ひとくち、ふたくち、みくち、
ペットボトルを傾ける。

時計を見る。
心に決めたリミットまで、まだ数分ある。

自らに、問う。
行くか、戻るか･･･を。

今、ここにいるのは僕だけだ。

歩みを止めた瞬間に、感じた･･･恐ろしいくらいの「静寂」
雪が、空が、すべての音を吸い込んで･･･聴覚から得られるものが･･･何もない。

遥かに、北アルプスが見える･･･
初めて、白馬岳の山頂に立った時、僕はまだ･･･16歳だった･･･

ほんとうに、なにも･･･なんにも、聴こえない･･･。
風がないと、山はこんなにも･･･恐ろしいくらいに、静か･･･なのか。

振り返り、もう一度、目指すピークを見る。
雪と、空と、僕と･･･

ピーク。

そうだ。胸に、思い描いた、約束の場所。

（･･･）

周囲の木立には、吹雪の爪痕が残されている。
昨夜の風の形、そのままに。

大丈夫。
この先、数時間、天候の急変はまずない。

ならば･･･

（行くぞ！）

決心した僕は･･･
ピークへの新しい一歩を、踏み出した。

時計が、心に決めたリミットを告げている･･･
でも、ピークは、もう、すぐそこだ。

（登ったら、日没までに、高低差約 1000ｍを駆け降りる力だけ残っていれば、大丈夫。）

そう思いつつ、足元を見ると･･･
右足に履いたスノーシューの、靴のつま先を覆うプラスチック部品が壊れている。
だがスノーシューの結束バンドは、靴の爪先をしっかり捉えている。

（大丈夫。外れはしない。）

そう自分に言い聞かせ、雪を踏みしめる。

あぁ･･･遠く、月だけが、僕を見てる･･･
あと、もう少し･･･だ。

ここまで登っても、月まではまだ 38 万kmもある。しかし、頂きまでは･･･あと10ｍだ。

約束の場所からは、美しすぎる風景が、見えた･･･

見える全てを、胸に刻む。

ただ･･･

登ったら、降りなきゃいけない。
それが、山との約束だ。

登ったら･･･その想いを噛みしめている時間は、いつも、余りにも、短い。

陽は傾き、すでに時は心に決めたリミットを過ぎている。
これから日没までに 1000ｍ以上、降りねばならない。

（もう少しだけ、ここにいたい･･･）

それが、ほんとうの気持ちだが･･･。
でも、もう時間がない。

もし、日が暮れたら、ライトはあっても、樹々に結ばれたルートを示すピンクのリボンを見つけるのは至難の業だ。どんなことがあっても、自己責任で日没までに人の住む世界へ降りなければならない。

ピークを示す山頂標識の上に誰かが置いたスノーマンに無言で別れを告げ、
僕は下りの一歩を踏み出した。

遥かなる麓へ･･･。

刻々と迫る日没。麓を見れば、山陰の雪は、白銀から、うす青く、その暗さを増しつつある。
気持ちは駆けているのだが、斜面を転がるように下降する僕は、実際はどう見えただろう･･･？

正直、下りが苦手だ。
これまでの山行で、そのことを嫌と言うほど思い知らされるシーンが何度もあった。

バレーボールなど、足の屈伸を繰り返すスポーツを過去に経験した人は、鍛えに鍛えたその足のバネを生かして、ほんとうに軽やかに、まるで舞うように山を駆け降りて行く。

（無理だ。追いつけない。待ってくれないか･･･）

そう感じたことは、１度や２度ではない。実際、下山のタイムリミットが決まっている、つまり、帰りの電車やバスの発車時刻が「絶対に遅れてはならないリミット」として下山予定時刻に組み込まれている場合など、心底、泣きたい気持ちを味わった山行もあった。

ただ、この差は普通のトレーニングでは、そう簡単には埋まらない。
なので僕は、グループで登山した際の下山では、いちばん遅い人の後ろを定位置に決めて、グループの最後尾を歩き、自分だけが遅れて全体の行動に迷惑をかけることがないようにしてきた。

でも、今日の山行は違う。
日没を別にすれば、下山予定時刻のリミットもない。

このように、気持ちがラクだったせいなのかもしれないが･･･。
今日の僕は、降りに、降りた。

日没が近くなり、気温がさらに下がったためか、木陰に入ると染み入るような寒さを感じる。
若干、風も出てきたようだ。正面から吹いてくるから･･･風向きは、西風か･･･

雪面はさらに固く締まり、スノーシューから登りの時とは明らかに異なる感覚が伝わってくる。それは「ザクッ」ではなく、「バリッ」･･･と、その表面を割るような感覚だ。

一方、日当たりのよい場所は雪がクサっていて、スノーシューが大きく滑り、何度か転んで雪まみれになる･･･が、しかし、樹林帯の中などでは雪は程よく締まっていて、そのような心配はなく、いつもなら躊躇するような急斜面も、そのすべてをジャンプを繰り返すようにして通過する。

それは、正直、降りたって言うより、
落ちたって感覚だった･･･。

そして、麓に日没が訪れた頃･･･

僕は、目標地点まで、無事、下山することができた。

「人は、なぜ、山に登るのか･･･？」

ふと、そう思い、答えを探せなくて、苦笑する。

答えは･･･、人、それぞれでいい。

僕に限って言えば、答えはなくてもいい。

振り返れば、空に、その白さを増した月が見えた。

月が微笑んでくれた、気がした･･･

38 万km 彼方で。

僕は、いつまでも、きっと･･･この景色を忘れないだろう･･･。

もしか、したら･･･

それが、僕が山に登る「理由」かな？

僕に限って言えば･･･

うん･･･。

答えなど、なくてもいいのだけれど･･･

僕を包む、すべてに･･･

そう･･･。

答えなど･･･

何一つ、なくてもいいのだけれど･･･。

１０より大きいマークを使うマークシートの作り方

以前、文書作成ソフト（ Word ）や表計算ソフト（ Excel ）を使用してオリジナルのマークシートを作成する我流も我流、はたしてこんなんでいいのか？まぁ、実際に使えるから、いいか･･･みたいな記事をいくつか書いた。

書いた本人が言うのだから間違いないであろう、過去のいい加減な記事の数々･･･

Supports Zero-Starting!

１００選択肢に対応したマークシートリーダー

塗りつぶさないマークシート

で、今回はナニをしたかと言うと、数学用マークシート処理プログラムの改良版を作成するにあたり、マークシートそのものも改良（と本人は思っている）し、プログラムもあらかたできた（と本人は思っている）ので、「実際の試験でテストしたいなー」と思ったわけですが･･･

「実際の試験でテストする」って言い方もヘンですが。

「実際のテストで試験する」って言っても、やっぱりヘンですが。

・逆もまた真なり？　どっちもヘン

　まぁ、なんでもイイです。

いきなり数学の先生に「試しに使ってみてください」というお願いをするのもナンだし･･･

万一どころか、使って初めて気づく
バグ満載のプログラムであることは「間違いない」自信だけはあり･･･

（なら自分で、こっそり）

プログラムのテストを決行することに決めました。

決めたのはいいんですが、使用するマークシートが問題で、数学用途のシートは個人的な問題から使用できないため、マークが「－（マイナス記号）から始まり、ｄで終わる」数学用のシートではなく、それと見た目が同じ（大問番号や設問記号及び枠の大きさが同じ）で、ただマークのみ「１から始まり16で終わる」カタチに変更したマークシートを作成し、これで新しい採点処理プログラムをテストしようと思ったワケです。

しかーし、ここで大問題が二つ発生！

大問題その１：
・私の技量では表計算ソフトで、１０以上のマークが作成できない！

大問題その２：
・文書作成ソフトで、マークシートを修正する方法を全部忘れた！！

その１は純粋に技術的な問題で、「今後の学び＆創意工夫」により改善が見込めるからまだイイとしても、あろうことか、その２は青天の霹靂・悲惨の極み・驚天動地・寝耳に水・予期せぬ不意打ちなどなど、日本語ではいろいろな表現が可能だが、まぁ最も適切なのは「痛恨の一事」か･･･

なんで全部忘れるのオレ？

ってか、修正方法をもともと知りませんでした☆　ぎゃはは

･･･というわけで、たとえこのように七転八倒と運命づけられた人生であっても、まだあきらめる気がしない（ここにメモしておけば、また忘れても必ず思い出せる＆万一にも同じ志を抱く、どなた様かのお役に立てれば･･･それこそ幸い的な思いもあり）、今回のテーマは「１０より大きいマークを使うマークシートの作り方」です。

【もくじ】

１．（私には）表計算ソフトで１０以上のマークが作れない！
２．マークの修正方法を全部忘れてることに気づく
３．イチから出直します
４．まとめ
５．お願いとお断り

１．（私には）表計算ソフトで１０以上のマークが作れない！

自身が最も多用するのは、１ブロックが 25 行で、１設問あたり８選択肢、合計４ブロックの全 100 問対応の A4 横置き型マークシート。（My 用途では、実はコレでほんとに十分なのですが･･･）

~~あれもしたい、これもしたい、みたいな、欲に目が眩んで~~、というか、思いつくままにマーク読み取りプログラムの機能を拡張したくなり、このシートを元にして作成した発展形の一つである数学用は、１ブロックが 25 行で、１設問あたり 16 選択肢、合計３ブロックの全 75 問対応の A4 横置き型マークシート。１枚で大問３個しか設定できないので、２枚を組み合わせて採点することで大問６個に対応。

選択肢は、-・±・０～９・a・b・c・d の16個（文書作成ソフトで作成）。
実は、マークとマークの間隔が狭いところ等を直したいって、ずっと思っていた。

現在、この数学用マークシートを改良して、B4 縦置きの用紙にB5横置きを縦に２枚並べて印刷し、半分に折りたたんだ状態で試験を実施、シート回収後、マークの読み取りと採点処理を実行できるプログラムを書いている。

この新しいプログラムをテストするにあたり、いろいろ直したかったところが満載だった数学用マークシートそのものも改良したくなり、反省点を元に作成したのがコレ（図は設計時の画面）。

反省点とは何かというと、

（１）マーク読み取り範囲の設定方法がわかりにくかった（と思う）ので、まず、これを改良。

旧版では、左上の「｜」マークを目印に読み取り枠を設定した。

新版は、枠線があるので、読み取り範囲の設定が少しはラクになった？
同時に、マークの間隔もより広めに設定し、受験者が多少大きめに塗りつぶしても誤判定が出にくく改良（したつもり･･･テストしていないので、現時点では効果のほどは？）。

なので、読み取り範囲の設定は、枠線を利用して実行できるようになった。

（２）１ブロックあたりの行数を 25 → 30 行に増やした。これで大問１個について、30 設問の設定が可能になった。

ア・カ・サ・タ・ナ・ハ行で１ブロック30行
つまり、大問１個について、30設問を設定可能とした。

（３）旧版の A3 縦（ A4 横置き×２）ではなく、B4 縦（ B5 横置き×２）へ用紙サイズを変更した。

A3 サイズのシートも作成してみたのだが、A3 サイズだとインクジェット複合機を利用して印刷（輪転機での印刷はマークの濃度が濃くなり、誤判定が出やすくなることから非推奨･･･というか、ユーザーには禁止と案内している）する時間が B4 サイズのそれより明らかに遅くなる、スキャナーでの読み取り処理にも時間がかかる等、いろいろ問題があり、少々マークの文字は小さくなるが A 版に比べて何かとメリットが多い B 版の用紙を使うことに決定。

もちろん、国際的にはやはり A 版だと思うが、欧米文化圏で My マークシートリーダーが使われるシーンはさすがに想像できない。できないが、今年、いちばんの夢は英語バージョンを作成することだ。これは新年早々に思いつき、数学用シートの処理プログラムが完成したら、今年の次のチャレンジ・イベントはそれだと思っている。

で、話を本題へ。

この表計算ソフトで作成した数学用マークシートのマークを「1」から「16」に変更しようとしたのだが、どうがんばってもそれが出来ない！

実際のシーンを再現。

表計算ソフトを起動して、全行・全列のセルの高さと大きさを適当なサイズに設定し、挿入 ⇨ 図形から楕円を１つ、セル内ちょうどおさまるように描画、このオブジェクトを右クリックして表示されるサブメニューから、「テキストの編集」を選択（クリック）して半角数字で「1」を入力。オブジェクトの色は灰色に設定する。

次にマークのオブジェクトが入っているセルを選択し、オートフィルの機能を使って右へドラッグしてコピーする。

ここまでは、実にイイ感じ♪

左から２つめのマークの数字部分をクリックして編集状態にし、半角数字の「2」を入力。

これを３、４、５、・・・、９まで繰り返して、10を作成すると･･･

おい、ちょっと待て・・・

しかも、フォーカスを外すと･･･

ヘイ　バカターレ！
８、９、１じゃないよー！！

楕円のオブジェクトの幅を変えるわけにはいかないから、フォントサイズを小さくして修正。

ハイ
不採用決定。（T_T）

このまま、あきらめるのはどーしてもイヤだったので、ジタバタしてみることにする。
どーせ、他にすることないし。実はあったかもだけど、したくないし･･･

しばし、沈思黙考

(-_-)zzZ

寝るなー！！

オブジェクトの中に数字を描画するのがイケナイのかと思ひ･･･、楕円オブジェクトは「塗りつぶしなし」に設定して、テキストはセルに直接入力してみる。

ちょっと、微妙に違和感がないこともないが、なんとか使えるかな･･･という程度にはなったか？
２桁数字の方が、なんとなく、下がって見える･･･　色も濃い？（同じ灰色でも面積の関係か？）

試しに、印刷プレビューしてみると･･･

２桁数字のインパクトが強すぎ！！

（塗りつぶし面積も、実用的にはもっと狭い方が好ましい）

こんなマークシートでは、存在感の薄い「1」～「9」にマークするには、余程の勇気が必要です！

ハイ
不採用決定。（T_T）

上の例なんてまだ良いほうで、実際には、もっとイロイロやってみたが、使えないマークシートをひたすら量産する結果に。（元々ない）知恵の限りを尽くしても、状況は改善する兆しすらなく･･･

少なくても現在の私の技能では、表計算ソフトを用いて「実際に使いたいと感じるレベルの品質」を維持した「10以上の数値を表示するマークを作成することは不可能」と悟ったのであった。

２．マークの修正方法を全部忘れてることに気づく

まだ、すべてが終わったわけではない。そうだ。文書作成ソフトを使って再チャレンジする方法が残されている。以前、教科「情報」用のゼロ始まりのマークシートを作ったじゃないか。あの時は特に問題なく、０、１、２、･･･、１４、１５まで計１６個の丸囲み数字を作成できたはずだ。

そう思い、保存してあった教科「情報」用のファイルを開き、それを改良しようとしたのだが･･･

ヤバイ！

いじれない！！

修正方法、全部、忘れた！！！

･･･ってか、よく考えたら、もともと知らない。
コレ、作り直した方が早くね？？？　みたいな･･･

３．イチから出直します

既存のファイルはいじれそうにない。･･･となれば、残された道はただひとつ。

白紙状態から全部書く！
それしかない！！

あの日、近所の国道を爆走していた緑色の大型トラックの運転席の後ろに力いっぱい掲げられた看板にも、「イチから出直します！」って、確かに書いてあった。･･･あの時、感動で魂が震えたな･･･

実際、ナニがあったのか、わかりませんが･･･

My ふぇーばりっと Car の運転席から思わず叫んでました☆

運転手さん、がんばって！！

･･･ということで走召有名な！あの文書作成ソフトを起動し、新規作成で用紙を「 B5 横置き」に設定。余白は最小値（My環境では 0.3 mm）にする（行数・列数共に詰め込みたくて、この設定にしています。実際のシーンではもう少し余裕マージンを取り、あまり攻めすぎない方が良いと思います）。

「レイアウト」タブをクリックして、「ページ設定」リボンの中の「段組み」アイコンをクリックし、表示されるサブメニューから「３段」を選択する。

これだけだと何も表示がなく、段組みの状況がわかりにくいので、再度同じ操作を行い、今度はいちばん下の「段組みの詳細設定」をクリック。

画面に境界線が描かれる（最終的に消しますが･･･）。

「タイトル・大問番号・OpenCV用のマーカー画像」を１～３行目に入力。

４行目にカーソルを置き、「挿入」タブをクリックして「表」リボンの「表」をクリックして表示される「表の挿入」の枠をドラッグして１行×７列の表を挿入する。

画面右下の「ズーム」のスライダーを右へドラッグし、画面の拡大率を大きくして･･･

表内の任意の場所をクリックすると表示される「表の移動ハンドル」をクリックすると、表全体が選択されるので、「テーブルレイアウト」タブをクリックして表示される「配置」リボンの「中央揃え」をクリックする。これで表への入力値はすべて中央揃えで表示される。

表の例えば一番右のセルを右クリックして、表示されるサブメニューから「挿入」をクリック、さらに表示されるサブメニューの「右に列を挿入」をクリック。表の列が１つ増えるので、Ctrl＋Y を繰り返し実行して表の列数を 17 列にする。

画面はこんな感じになる。

いちばん左のセルに半角カタカナの「ｱ」を入力し、左から２番目のセルに丸囲みの１（＝ ① ）を入力する。以降、セルを右へ移動しながら順次丸囲みの数字を 16 まで入力する。

【注意：解答欄の番号・記号について】

「ｱ」としたのは、自作のマークシートリーダーで使用している数学用シートの流用型として使用するため。数学用とマークシートでは、大問１のｱ、ｲ、ｳ、･･･、大問２のｱ、ｲ、ｳ、･･･、大問３のｱ、ｲ、ｳ、･･･、これで解答用紙 A 面（第１面：１枚目）が終了、続けて B 面（第２面：２枚目）へ移動し、大問４のｱ、ｲ、ｳ、･･･、大問５のｱ、ｲ、ｳ、･･･、大問６のｱ、ｲ、ｳ、･･･のように設問を設定している。

もちろん、ここは「1」から連番で作成しても構わないのだが、自分的には「２枚１セットで使用する予定の数学用マークシートの採点処理を行う新しいプログラムが、実際の採点現場で正しく動くことを確認する」ために今回は行動しているので、採点プログラムのデータ入力欄との整合性等も考えると、シートの変更点は解答欄のマークのみに留めたかったので、この仕様とした。

ちなみに動作テストを予定している新しい採点処理プログラムの採点データ等の入力画面は、こんな感じ。数学用途の採点の場合、設問の欄は数値の連番ではなく、解答用紙に合わせてカタカナ表記としている。ここが数値の連番だと、正解他のデータが入力しづらい。CMS は「組み合わせ採点」、NPO は「順不同採点」の実施の有無を見分けるフラグ（ここが１ならば順不同採点「有」）として利用する。特に「組み合わせ採点」は、数学用途では必須の機能なので、ここを念入りにテストしたいと考えた。

組み合わせ採点を実施（＝CMS列の番号が同じ行）する場合、
配点は組み合わせ採点を実施する範囲内の任意の１行に入力し、他は０を入力。
かつ、組み合わせ採点を実施する範囲の観点別評価の種類は必ず一致させる。

解答を要しない（＝使用しない）解答欄を見分けるフラグは「－1」としている。

表の任意のセルを再びクリックし、表の左上に表示される「表の移動ハンドル」をクリックして、表全体を選択。「テーブルレイアウト」タブをクリックして、「配置」リボンの「セルの配置」をクリック、表示される「表のオプション」ダイアログの「既定のセルの余白」の左と右の値を０（ゼロ）に設定して OK 。

この設定方法は、これまで知らなかった！

あれこれ、設定を弄り倒す中で、先日、偶然発見 *(^_^)*♪

表はこうなる。

次に表の ① ～ ⑯ セルをドラッグして選択し、

「ホーム」タブをクリックし、「段落」リボンの「拡張書式」をクリック、表示されるサブメニューの「文字の拡大/縮小」をクリック、さらに表示されるサブメニューの「66％」をクリックする。

表はこうなる。

気分は Good! Goooder!! Goooodest!!!

あとは不要な罫線を消し、罫線とフォントの色をごく薄い灰色に設定するのみ。

罫線の色を変更するには、表全体を選択して、表中で右クリック。表示されるサブメニューから「表のプロパティ」を選択（クリック）。

表のプロパティが表示されたら、「罫線と網かけ」をクリック。

「色」と「線の太さ」を変更して、「プレビュー」の必要箇所をクリックしてOK。

表はこうなる。

今度は、もう一度表を全選択し、選択範囲内で右クリックして表のプロパティをもう一度表示し、「罫線と網かけ」をクリックして、線の色を「白」に設定、表内の縦罫線を表示しない設定にする。

最後に「ｱ」のセルのみ選択して、上と同様の操作を実行し、「ｱ」の右に灰色・ 0.25 ポイントの太さで縦罫線を引く。最終的な画面はこうなる。

あとは、この１行を全選択し、選択範囲内で右クリック、表示されたサブメニューの「挿入」をクリックして、さらに表示されるサブメニューの「下に行を挿入」を選択（クリック）。

結果は、こうなる。

追加した行に１行目の内容をコピーしてもよいし、Ctrl＋Y で直前の操作を繰り返して必要な行数分、行を作成してもよい。とにかく、行を増やして、そこに１行目のマークを貼り付けて行く。罫線は消えたら消えたで最後にまとめて設定すればよい。

もし、行数が足りない場合は･･･

Ctrl＋A でオブジェクトを全て選択して、選択範囲内で右クリックし、下の図の赤い枠で囲んだ部分のチェックをすべて外して OK をクリックすると、行の高さが小さくなる（はず）。

次に表のみ、上から下までドラッグ等して選択し、選択範囲内で右クリックして表のプロパティを表示して、「行」タブをクリック。高さを「固定値」として、最適な数値を入力してOKをクリックして行の高さを修正する。

【注意】

理由は定かでないが、この方法で行の高さを「修正できる」場合と、「出来ない」場合があった。

他にも、表のみ全選択するところは同じだが、「テーブルレイアウト」タブの「セルのサイズ」リボンの「高さ」でも同じことができる（こともある？）。

【注意】

理由は定かでないが、やはり、この方法で行の高さを「修正できる」場合と、「出来ない」場合があった。出来ない場合は、Ctrl＋Z（元に戻す）で、修正できる場合の直後のところまで戻して実行すると変更が適用された。原因は私にはわからない。

最終的に、１設問あたりの選択肢数は 16 個、１ブロック 30 行、全３ブロックの B5 横置きのマークシートが完成。

上の図は、「レイアウト」タブをクリックして、「ページ設定」リボンの「段組み」をクリックして表示されるサブメニューから「段組みの詳細設定」をクリックしてダイアログを表示し、「境界線を引く」のチェックを OFF にした状態の印刷プレビュー。

冷静になって考えると、ヒトはわずかながらでも、進歩し続ける生き物らしい。
以前、出来なかったことが、今は、できるようになった。

きっと、「イチから出直します」トラックの運転手さんのお陰です。

ほんとに、こころから、ありがとう！！

ここには掲載できないけれど、あの日撮った、爆走トラックの写真。

生涯、宝物にします！

４．まとめ

（１）表計算ソフトでは、10 以上の数値を表示するマークの制作は（私には）難しい。
（２）文書作成ソフトなら、比較的簡単に10 以上の数値を表示するマークが（私にも）作成可能。
（３）文書作成ソフトの行の高さの修正は、出来る場合と出来ない場合があった。理由は不明。
（４）イチから出直すことも、より良い人生を歩むためには必要になることがあるカモです☆
（５）大型トラックの看板からは深い学びを得ることがあります。

５．お願いとお断り

ファイル名が連番であることを確認したい！

自作のマークシートリーダーでは、Windows 用の OpenCV に加え、Python 用の OpenCV も利用して、マークの読み取りを高速化している。

この Python 用の OpenCV を動かすには Python4Delphi（P4D）が必要だ。P4D 使用時はプログラムの仕様として、読み取り対象のマークシート画像ファイル名の末尾は「数値化したら連番として読み取れる半角３桁の数字」でなければならない（例：X_001.jpgなど、MS_Reader.exe Version 1.1.5 から）。

そのことを、つい忘れて実行すると･･･

【コンパイル済みの exe を実行した場合】

さらに、

OKをクリックすると、もう一度、

んで･･･

泣きたい気持ち T_T で OK をクリックすると･･･

うわーん T_T

【実行（F9）では？】

エラーメッセージの形式こそ、違え･･･

ファイル名が「プログラムの仕様と異なっている」ために起きるエラーであるという、言わば「確実に発生を予見できるエラー」なのに、

どうして今まで、
何とかしようと思わなかったのか？

以前から、なんとなく、気づいてはいたけれど･･･

オレはもしかして、
自分で思ってる以上に
バカなんじゃないか？

あらためて、そう思ったのであります。みなさん･･･

そこで、この ~~犯罪に近い~~ プログラムの挙動をなんとかするべく、ようやくと言いますか、今更ではありますが立ち上がり･･･　悪戦苦闘すること幾年月（実際、半日くらいです）。なので、今回は、このふと思い立ったちいさな夢を実現するまでの お読みいただく価値などまったくない 苦闘の成果の記録です。

【もくじ】

１．そして、悲劇は繰り返される
２．連鎖の終止符は？
３．まとめ
４．お願いとお断り

１．そして、悲劇は繰り返される

人間は、いろいろなことを忘れる生き物です。

むかーし、サーフィンに夢中だった頃、台風の海で大波と一緒に落ちてきたサーフボードが脳天を直撃。溺れて、死ななかったのはよかったけれど、とにかく砂浜までなんとか生還後、確かに見覚えのある風景を感じはするし、自分の名前も、家の住所も思い出せるのに、「僕のおうちまでの帰り道がどうしても思い出せません！」みたいな･･･。うぎゃー

（この道、見覚えだけはあるんだけどなー。はたして、おうちは右だっけ？　左だっけ？）

（家の玄関の風景も覚えてるんだけどなー。そこへの行き方がまったくわかりましぇん T_T ）

あの時はやばかった･･･　まぁ、あの時ほど、困るわけではないが、それでも半年に２回くらい、My マークシートリーダーを使っていて、ファイル名の命名規則をド忘れし、今回、冒頭で紹介したエラーメッセージをくり返し登場させてしまう･･･。

その都度、あわてふためき、もう二度とするまいと固く心に誓い、反省し、失敗の原因の記録まで書き、クラウドにはそのバックアップまでとり、それでも、七転び八起きではなく、七転八倒を身上とするかのごとき私は、果てしない後悔の輪廻、そう苦しみと迷いの連鎖の中で、なお、その悲劇を執拗なまでに繰り返してきたのであった。

そもそも、X_01A.jpg、X_01B.jpg みたいな、連番と紛らわしいファイル名を付けるプログラムを作ったのも、私なので、やはり、この負の連鎖は、自分自身に問題の深すぎる根っこが･･･

ぞーぉさん
ぞーぉさん
おーなかがデカいのね･･･

なんかちがう、みたいな･･･

ファイル名が連番でなければ読めないマークシートリーダーであるとわかっているのに、しかも、作ったのが他ならぬ自分自身であるにも関わらず、なぜか、「 X-01A.jpg, X-01B.jpg, x-02A.jpg, X-02B.jpg ･･･」のような、準連番的な？名前の付いたファイルだと、つい安心して、P4D モードで（しつこいようですが、作者である私自身が）マークの読み取りを実行してしまう･･･ T_T

その場合、プログラムの仕様だから当然のごとく、読み取りエラーが発生し･･･

（このエラー、なに？）

･･･みたいな･･･、決まって毎回、「驚きと焦り」の方が先走って脳内を占拠、「エラーの真の原因＝ファイル名が連番でないこと」に、作者である自分自身がなかなか気づかない･･･

だから、バカだと、さっき

さすがに最近はそんなことはないが、以前はコレでさんざん悩んだこともあったのです･･･みなさん。

その My マークシートリーダーで、数学の解答用紙を読み取り、別プログラムで処理（受験者に返却する答案や資料を作成）する方向で、現在、既存のプログラムを改良しているのですが･･･

とある休日の朝、シャワーを浴びながら、なぜか、ふと

（そうだ。この際、アレも何とかしておこう）

と、ようやく思い立ったのです。みなさん。

アレとは、もちろん、P4D 使用時に「ファイル名が連番でないとエラーになること」であります。みなさん。

エラーになって（なぜか？毎回のようにその真の原因を忘れ）あわてふためく前に、予め、読み取り指定フォルダ内の拡張子を小文字に変換すると「jpg」or 「jpeg」になるファイルだけ抽出して、そのファイル名の末尾３桁の半角数字が完全に連番であるか・どうかを調べ、もし、問題がある場合はユーザーに通知して、エラーを未然に防止する、そんなプログラムは･･･ぎゃはは、Delphi さえあれば、わーらっちゃうくらいカンタンに･･･

（すぐ出来る･･･）

そう軽く考えて、朝から始めた「ファイル名が完全に連番であることを確認する関数」作りに、なんと半日以上、費やしてしまったのであります。みなさん。

たぁーくさんサンプルがあると思ってあちこち調べてみたが（私が調べた範囲では）、Web上にその方法を解説している資料も、サンプル・プログラムも、ついに見つけることができなかったのであります。みなさん。

（もしかして･･･そんな関数作りは「カンタンすぎる」から、サンプルがないのかなー？）

･･･などと思いつつ、でも、実際にそれを書くとなると、誰も話題にしてないって･･･なんで？　いや、それにしちゃ、なんだかんだ、結構･･･それなりに難しいぞ、と半日ほど、あーでもない・こーでもないをくり返して･･･なんとか、自分の環境では、期待通りに動作するものが書けたので、もしかしたら、将来、同じことを実現したくて悩んでおられる方の参考になるかも？しれないと思い、ここに書いておくことにしたわけであります。みなさん。

まず、どなたの役にも立たないカモ･･･ですが。とりあえず、核心部分は、次の通り。

implementation

uses
  //  （略）
  System.RegularExpressions,
  Generics.Collections;

  //System.RegularExpressionsはP4D使用時にファイル名が連番であるかどうかを確認するために追加
  //Generics.Collectionsは上と同じ目的でTListを使うために追加

上記ライブラリを２つ、uses しておいて、プログラム全体で使いまわすわけではないので、Formのメンバーにせず、マークシート画像ファイルを読みだす手続き内から呼び出して使う形で次の関数を記述。

procedure TFormMSReader.ProcDataRead(Sender: TObject);
var
  //  （略）
  strMsg:string;
  Ext1, Ext2: string;
  Extension:string;

  //jpg とjpeg が同一フォルダ内に混在していないことを確認する_20250302追加
  function HasMixedExtensions(const FolderPath: string): Boolean;
  var
    SearchRec: TSearchRec;
    JPGFound, JPEGFound: Boolean;
  begin
    JPGFound := False;
    JPEGFound := False;

    if FindFirst(FolderPath + '\*.jpg', faAnyFile, SearchRec) = 0 then
    begin
      JPGFound := True;
      FindClose(SearchRec);
    end;

    if FindFirst(FolderPath + '\*.jpeg', faAnyFile, SearchRec) = 0 then
    begin
      JPEGFound := True;
      FindClose(SearchRec);
    end;

    Result := JPGFound and JPEGFound;
  end;

  //ファイル名が連番であるかどうか、確認
  function IsSequentialFileNames(const DirPath: String;
    var Extension1, Extension2: String): Boolean;
  var
    FileList: TStringList;
    FileNumbers: TList<Integer>;
    i, j, numStart: Integer;
    tempFileName, fileName, fileNum: string;
  begin

    //Falseで初期化
    Result := False;

    //指定されたディレクトリ内から、指定された拡張子のファイル名を抽出する
    FileList := TStringList.Create;
    FileNumbers := TList<Integer>.Create;

    try

      for j := 0 to 1 do
      begin

        //小文字に変換して拡張子を指定
        case j of
          0:Extension:= LowerCase(Extension1);
          1:Extension:= LowerCase(Extension2);
        end;

        for tempFileName in TDirectory.GetFiles(DirPath, '*' + Extension) do
        begin
          // ファイル名からパスと拡張子を除去
          fileName := TPath.GetFileNameWithoutExtension(tempFileName);
          //数値部分を抽出
          numStart := TRegEx.Match(fileName, '\d+$').Index;
          if numStart <= 0 then
            Exit; // 数値部分がない場合はFalseを返す
          fileNum := Copy(fileName, numStart, Length(fileName) - numStart + 1);
          if TryStrToInt(fileNum, i) then
            FileNumbers.Add(i);
        end;

        //数値部分があるファイルのみ抽出し、比較する
        if FileNumbers.Count > 0 then
        begin
          FileNumbers.Sort;
          for i := 1 to FileNumbers.Count - 1 do
          begin
            if FileNumbers[i] <> FileNumbers[i - 1] + 1 then
              Exit; //連番でない場合はFalseを返す
          end;
          Result := True; //連番である場合はTrueを返す
        end;

      end;

    finally
      FileList.Free;
      FileNumbers.Free;
    end;

  end;

begin

  //文字列型変数 Path に画像ファイルを入れたフォルダへのパスを指定する

  //jpg とjpeg が同一フォルダ内に混在していないことを確認する_20250302追加
  if HasMixedExtensions(Path) then
  begin
    strMsg:='jpg とjpeg の２種類の拡張子が混在しています。'+#13#10+
      '拡張子はjpg か jpeg のどちらかに統一してください。'+#13#10+
      '処理を中止します。';
    Application.MessageBox(PChar(strMsg), PChar('エラー'), MB_ICONERROR);
    Exit;
  end else begin
    //確認用
    //strMsg:='拡張子の混在はありません！';
    //Application.MessageBox(PChar(strMsg), PChar('エラー'), MB_ICONERROR);
  end;

  //画像ファイルを読み込む処理でファイル名が連番であるかどうか、確認する
  try
    Ext1:='jpg';
    Ext2:='jpeg';
    if IsSequentialFileNames(Path, Ext1, Ext2) then
    begin
      //確認用
      //strMsg:='ファイル番号は連番です！';
      //Application.MessageBox(PChar(strMsg), PChar('情報'), MB_ICONINFORMATION);
      //Blog用に実験
      //raise Exception.Create('T_T');
    end else begin
      strMsg:='ファイル番号が連番ではありません！';
      Application.MessageBox(PChar(strMsg), PChar('エラー'), MB_ICONERROR);
      Exit;
    end;
  except
    on E: Exception do
    begin
      strMsg:='大変です。本物のエラーが発生しました: ' + E.Message;
      Application.MessageBox(PChar(strMsg), PChar('エラー'), MB_ICONERROR);
    end;
  end;

end;

なんで、こんなイイことに今まで気づかなかったのか？？？

だから、バカだと、さっき

*(^_^)*♪

２．連鎖の終止符は？

任意のフォルダに連番でないファイル名を付けたマークシート画像を入れてテスト。

MS_Reader.exe を起動して、プログラムが期待通りに動作するか、確認。

読み込む画像が入ったフォルダとして、上の「連番じゃない画像フォルダ」を指定し、画像ファイルを読み込もうとすると･･･

MS_Reader.exe が、この世に誕生して５年（くらいかな？）。
ようやく、悲しみの連鎖に終止符が打たれたのであります。みなさん。

あとは、正真正銘のエラーが発生しないことを祈るのみであります。みなさん。

これだけは見たくないのであります。
みなさん。

でも、よく考えたら（考えなくても）
エラーの連鎖を断ち切るためのメッセージが、

エラーメッセージだった

･･･ということは、

連鎖が断ち切れてるどころか、
これは、むしろ、立派な連鎖ではないでしょうか。みなさん。

私は、
ここに、運命を感じたのであります。
みなさん。

僕のじんせいはー　*(^_^)*♪

３．まとめ

一部、変数の宣言が足りないカモですが、フォルダを開く処理まで入れた一連のプログラムコードは、次の通りです。

procedure TFormMSReader.ProcDataRead(Sender: TObject);
const
  //ディレクトリ(フォルダ)の存在を確認 -> なければ作成する
  DataPath='ProcData';
var
  iStartFolder: string;
  iDirectories: TArray<string>;
  Path: string;
  SearchPattern: string;
  Option: TSearchOption;
  FileNames:TStringDynArray;
  FileName:string;
  strFN, strCheckFolder:string;
  strMsg:string;
  Ext1, Ext2: string;
  Extension:string;

  //jpg とjpeg が同一フォルダ内に混在していないことを確認する_20250302追加
  function HasMixedExtensions(const FolderPath: string): Boolean;
  var
    SearchRec: TSearchRec;
    JPGFound, JPEGFound: Boolean;
  begin
    JPGFound := False;
    JPEGFound := False;

    if FindFirst(FolderPath + '\*.jpg', faAnyFile, SearchRec) = 0 then
    begin
      JPGFound := True;
      FindClose(SearchRec);
    end;

    if FindFirst(FolderPath + '\*.jpeg', faAnyFile, SearchRec) = 0 then
    begin
      JPEGFound := True;
      FindClose(SearchRec);
    end;

    Result := JPGFound and JPEGFound;
  end;

  //ファイル名が連番であるかどうか、確認
  function IsSequentialFileNames(const DirPath: String;
    var Extension1, Extension2: String): Boolean;
  var
    FileList: TStringList;
    FileNumbers: TList<Integer>;
    i, j, numStart: Integer;
    tempFileName, fileName, fileNum: string;
  begin

    //Falseで初期化
    Result := False;

    //指定されたディレクトリ内から、指定された拡張子のファイル名を抽出する
    FileList := TStringList.Create;
    FileNumbers := TList<Integer>.Create;

    try

      for j := 0 to 1 do
      begin

        //小文字に変換して拡張子を指定
        case j of
          0:Extension:= LowerCase(Extension1);
          1:Extension:= LowerCase(Extension2);
        end;

        for tempFileName in TDirectory.GetFiles(DirPath, '*' + Extension) do
        begin
          // ファイル名からパスと拡張子を除去
          fileName := TPath.GetFileNameWithoutExtension(tempFileName);

          //数値部分を抽出
          numStart := TRegEx.Match(fileName, '\d+$').Index;
          if numStart <= 0 then
            Exit; // 数値部分がない場合はFalseを返す

          fileNum := Copy(fileName, numStart, Length(fileName) - numStart + 1);
          if TryStrToInt(fileNum, i) then
            FileNumbers.Add(i);

        end;

        //数値部分があるファイルのみ抽出し、比較する
        if FileNumbers.Count > 0 then
        begin
          FileNumbers.Sort;
          for i := 1 to FileNumbers.Count - 1 do
          begin
            if FileNumbers[i] <> FileNumbers[i - 1] + 1 then
              Exit; //連番でない場合はFalseを返す
          end;
          Result := True; //連番である場合はTrueを返す
        end;
      end;
    finally
      FileList.Free;
      FileNumbers.Free;
    end;
  end;

begin

  try

    //読み込むファイルの存在するフォルダを選択

    //Win10のフォルダ選択Dialogを使用する
    iStartFolder := ExpandFileName('.\ProcData');
    if SelectDirectory(iStartFolder, iDirectories,
      [sdHidePinnedPlaces, sdNoDereferenceLinks, sdForceShowHidden,
      sdAllowMultiselect], 'フォルダを選択してください', 'Folder', 'Ok') then
    begin

      //カーソルを待機状態に設定
      Screen.Cursor := crHourGlass;

      //読み込むデータのあるフォルダへのPathを取得
      Path:=iDirectories[0];

      //jpg とjpeg が同一フォルダ内に混在していないことを確認する_20250302追加
      if HasMixedExtensions(Path) then
      begin
        strMsg:='jpg とjpeg の２種類の拡張子が混在しています。'+#13#10+
          '拡張子はjpg か jpeg のどちらかに統一してください。'+#13#10+
          '処理を中止します。';
        Application.MessageBox(PChar(strMsg), PChar('エラー'), MB_ICONERROR);
        Exit;
      end else begin
        //確認用
        //strMsg:='拡張子の混在はありません！';
        //Application.MessageBox(PChar(strMsg), PChar('エラー'), MB_ICONERROR);
      end;

      //ファイル名が連番であるかどうか、確認
      try
        Ext1:='jpg';
        Ext2:='jpeg';
        if IsSequentialFileNames(Path, Ext1, Ext2) then
        begin
          //確認用
          //strMsg:='ファイル番号は連番です！';
          //Application.MessageBox(PChar(strMsg), PChar('情報'), MB_ICONINFORMATION);
          //Blog用に実験
          //raise Exception.Create('T_T');
        end else begin
          strMsg:='ファイル番号が連番ではありません！';
          Application.MessageBox(PChar(strMsg), PChar('エラー'), MB_ICONERROR);
          Exit;
        end;
      except
        on E: Exception do
        begin
          strMsg:='大変です。本物のエラーが発生しました: ' + E.Message;
          Application.MessageBox(PChar(strMsg), PChar('エラー'), MB_ICONERROR);
        end;
      end;

      // （省略）

    end;
  finally
    Screen.Cursor := crDefault;
  end;

end;

４．お願いとお断り

今回掲載したプログラムは、拡張子が jpg と jpeg の画像が同一フォルダ内に混在していないことを正常動作の前提にしています。この点には十分、ご注意・ご留意いただけますよう、お願い申し上げます。

【もくじ】

１．プログラムを起動します

２．キャプチャします！

３．同じ大きさの矩形内に画像を入れて、矩形内の画像のみ保存します！

４．お願いとお断り

【もくじ】

本プログラムの私的仕様の詳細です！

１．きっかけ

２．表示フォントの指定方法

３．チェックしても何も起きない？ CheckBox

４．そのうちに消せない絵文字も出てくるカモ？です。

５．プログラム終了時に Beep 音？

６．お願いとお断り

スタートは海抜０ｍ

大平への道

輝かな 風景

７１１米峰

ブナ林とガンバレ岩

水場

【もくじ】

０．基本的な使い方と名称について

・名称について

１．追加機能①「開く」

２．追加機能②「円形選択と保存・送信を可能に」

３．追加機能③「ぼかし処理」

４．追加機能④「モザイク処理」

５．追加機能⑤「白色化処理」

【追記_20251006】

【追記_20251007】

【追記_20251009】

【追記_2025_1012-1025】

【追記_2025_1109】

６．プログラムのダウンロード

７．まとめ

８．お願いとお断り

【追記_20251005】

【推奨動作環境】

【もくじ】

１．手作りの『それ』が必要になった理由

２．使い方

【使い方】

（１）ショートカットキー（ Shift + Ctrl + S ）で保存

（２）アプリ本体の「Save」ボタンをクリックして保存

（３）アプリ本体で範囲を指定して保存

【終了方法】

３．☆ここではまりました☆

神さまボクには信じることと思い込むことの違いがよくわかりません。

信じるものは救われると聞きましたが、思い込むものは救われないのでしょうか？

父からは、いつか･･･『大丈夫。天国の黒板にはあなたの名前が書いてある。』と

ものすごいことを聞きましたが、あっ。いえ、その･･･決して「ついでに」という訳ではありませんが、それも ほんとう でしょうか？

やった！ やった！！

これでようやく夢が全部叶いました！

４．ダウンロードはこちらから

【追記_20251109】

５．お願いとお断り

【もくじ】

１．GUIが使いやすくなりました！

２．画像の傾きに強くなりました！

３．ほぼ採点する順番に解答欄を検出できるようになりました！

４．マウスのアイコンがデフォルト状態に戻るようになりました！

５．必要なフォルダがない場合には警告を表示するようになりました！

６．常に最大化して実行する設定にしてやっぱりやめました！

７．最大化から非最大化した際に画面中央にフォームを表示します！

８．ダウンロードのご案内

９．まとめ

１０．お願いとお断り

【もくじ】

１．高 DPI 設定の変更方法 その１（exe のプロパティを表示）

２．高 DPI 設定の変更方法 その２（高DPI設定を変更）

３．高 DPI 設定の変更方法 その３（アプリケーションを起動して確認）

４．補足（ DPI 非依存の設計でも発生する問題と対応方法）

５．お願いとお断り

【もくじ】

１．PDFtk Server

２．GUI と Path の表示

３．ShellExecute で回転を実行

４．Path の表示方法を改良

５．CreateProcess で回転を実行

６．回転の実際

７．プログラムのダウンロード

輝かな風景

神さま
ボクには信じることと
思い込むことの違いが
よくわかりません。

信じるものは救われると
聞きましたが、
思い込むものは
救われないのでしょうか？

父からは、いつか･･･
『大丈夫。天国の黒板にはあなたの名前が書いてある。』と

ものすごいことを聞きましたが、
あっ。いえ、その･･･
決して「ついでに」という訳ではありませんが、
それもほんとうでしょうか？

やった！やった！！

これでようやく
夢が全部叶いました！

１．高 DPI 設定の変更方法その１（exe のプロパティを表示）

２．高 DPI 設定の変更方法その２（高DPI設定を変更）

３．高 DPI 設定の変更方法その３（アプリケーションを起動して確認）