「Embeddable Python」カテゴリーアーカイブ

埋め込みPython環境のダウンロードやライブラリのインストール、活用方法

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！

今回ご紹介するプログラムで、自動採点できるかもしれない（？）手書き答案の解答は･･･

カタカナ「ア・イ・ウ・エ・オ」のいずれか１文字、それから
数字の「１・２・３・４・５」のいずれか１つ、そして
記号の「〇・ × 」のどちらかです。

この･･･わずか 12 個の、文字・数字・記号に限定したお話ですが、僕が行ったテストでは各種パラメータの微調整を行うことなく、デフォルト設定のまま、テストデータ（少ないですが）をほぼ正しく推論できました。※ 制作の最終段階での検証結果です。

「自己責任・サポート無し」という条件付きですが、もし、よかったら、お試しください。

どなたにもお待ちいただいておりませんが、２年ぶりにバージョンアップした解答欄リーダーです。

【もくじ】

０．注意事項
１．論より証拠
２．自動採点機能の使い方
３．推論用画像データの確認
４．プログラムのダウンロード
５．お願いとお断り

【注意事項】

初回の自動採点実行時にPCがフリーズしたような状態になることがあります（正しく動作している状態であっても、Python Engine の初期化には数秒を要します）。特に、ダウンロードした Zip ファイルを展開（解凍）した直後の初めての実行時や、インターネット接続が切れた状態で使用した場合、この初期化作業にかなりの時間を要する場合があることを実際に確認しました（常に、この現象が起きるわけではありません）。この現象発生時に、内部的に呼び出して実行している組み込み Python 環境はエラーメッセージを出しません。つまり、プログラムは単に PythonEngine の初期化等、何らかの作業の完了を待つ「待機状態」であることは明らかなのです･･･が、「プログラムで使用しているどのライブラリがこの待機状態を作り出しているのか」という、はっきりした原因の特定まで現在至っておりません。

この現象は、自動採点実行時、最初の１回に限って発生します。２回目以降は、採点終了まで滞りなく（素人が作ったプログラムなので実行速度は遅いですが）動作すると思います。

お試しいただける方には、たいへん申し訳ありませんが、そのような現象が発生することをご理解いただいた上で、ご試用いただけますよう、伏してお願い申し上げます。

【追記_20250823】

上記の現象について調査した結果、これは「 Windows Defender や McAfee などの Anti-Virus Software または Antivirus Software : AV による『未知バイナリの初回スキャン』により発生している可能性が極めて高い」ことがわかりました。

このプログラムでは、内部的に（バックグラウンドで）PythonForDelphi（P4D）を通じて Python 環境を利用し、自動採点処理を実行しています。ですので、自動採点実行時には、cv2.pyd や numpy 及び scikit-image の HOG や LBP に関連する pyd （ Python Dynamic Module の略＝ Python の拡張モジュール）が必ず読み込まれます（これらの pyd ファイルは、内部的にはネイティブ DLL と同等に扱われるようです）。

AV は「初めて見る未知の DLL」をロードしようとした時に、ファイル全体をディスクから読み込み、サンドボックス（外部と隔離された仮想環境：ITやセキュリティの分野では、主に怪しいプログラムを安全に試すための実験室として使われる）や、クラウドサービスに投げて解析（インターネット接続が出来ない環境である場合には、一定時間のタイムアウトを設け、その後ローカル判定にフォールバックする：なのでインターネット接続環境がないPCで実行してもいつまでもフリーズしたような状態が続くわけではない → 待機時間は Windows Defender の場合、既定で数秒～数十秒程度）し、ハッシュをキャッシュに登録という処理を行うため、この「初回スキャン」が終わるまで、DLL ロードは OS レベルでブロックされてしまい、アプリケーション側から見るとフリーズ、すなわち「固まった」ようにしか見えない状態になるわけです。一度、このスキャンを通過すれば「このファイルは安全」とキャッシュされるので、以後は高速にロードできるようになります。

自動採点の初回実行時のみ PC がフリーズしたようになり、２回目以降は何の問題もなかったかのように動作するのは、このスキャンが実行されている証拠だと思われます（このスキャンが実行されていることを直接確認する方法はないようです： AV が検査状態を外部に直接公開すると、逆にマルウェアに悪用される可能性が高まるため）。

さらに「実行形式ファイルを別の場所にコピーすると再びフリーズする」のは、 AV によってはファイルパスや場所ごとにキャッシュが分かれるためです（同じファイルでもデスクトップに置いたら「未知扱い」になる）。

この問題への対策として、セキュリティソフトを無効化するのは論外ですし、また、それが真の原因とわかったわけではなく、現段階ではその可能性が極めて高いと思われるということなので、次の実験を試行して、結果を後日、こちらに記載させていただきます。

（１）「ウォームアップ import」をアプリ起動時にバックグラウンドで実行。
（２）バックグラウンドスレッドで AV スキャンを監視し、UI に進捗状況を表示。

（追記_20250823 ここまで）

【追記_20250825】

ここで紹介している AC_Reader をはじめ、この Blog の過去記事に掲載したアプリケーションはすべてディスプレイ解像度が 1366 × 768 の環境で実行することを前提として開発しています。高解像度ディスプレイで実行される場合、次のリンク先の記事にあります「高 DPI 設定の変更」を行ってから実行していただけますようお願い申し上げます。

高解像度画面で使いやすくするには？

（追記_20250825 ここまで）

【追記_20250826】

ユーザー体験を少しでも向上させるべく、以下の順番で AV のスキャンによる待機状態の改善を目標にプログラムの見直しを図りました。

（１）「ウォームアップ import」をアプリ起動時に~~バックグラウンドで~~実行。
（２）バックグラウンドスレッドで AV スキャンを監視し、UI に進捗状況を表示。

（１）については、まず、バックグラウンドで実行はやめることにしました。理由は、バックグラウンドで実行してしまうと、AV のスキャンが完了しないうちにメインスレッド側で Python モジュールが使われてしまう可能性があることに気づいたためです。そこで、スキャン対象となる .pyd ファイルをアプリケーション起動時に全て読み込み、スプラッシュフォームの表示中にAnti-Virus Software による『未知バイナリの初回スキャン』を強制的に実行、この処理が確実に完了するまで待機して、安心安全な状態でアプリケーションを実行し、かつ自動採点機能等 Python のモジュールを使用中に発生する待機状態が極力短くなるよう、プログラムを修正しました。コードは以下の通りです。

procedure TFormCollaboration.LoadAllPythonModules;
var
  PyCode: TStringList;
begin
  PyCode := TStringList.Create;
  try
    //スキャン対象となるモジュール
    PyCode.Add('import cv2');
    PyCode.Add('import numpy');
    PyCode.Add('from skimage.feature import hog, local_binary_pattern');
    //その他 Python モジュール
    //スキャン対象ではないモジュールも読み込んでおく
    //初期化の待機時間短縮やエラー回避のため preload
    PyCode.Add('import os');
    PyCode.Add('import glob');
    PyCode.Add('import re');
    PyCode.Add('import joblib');
    // 実行
    PythonEngine1.ExecStrings(PyCode);
  finally
    PyCode.Free;
  end;
end;

procedure TFormCollaboration.FormCreate(Sender: TObject);
var
  ･･･ 省略 ･･･
begin
  //embPythonの存在の有無を調査（条件コンパイル）
  {$IFDEF WIN32}
    //32bit環境での処理
    AppDataDir:=ExtractFilePath(Application.ExeName)+'Python39-32';
  {$ELSE}
    //64bit環境での処理
    AppDataDir:=ExtractFilePath(Application.ExeName)+'Python39-64';
  {$ENDIF}

  if DirectoryExists(AppDataDir) then
  begin
    //フォルダが存在したときの処理
    PythonEngine1.AutoLoad:=True;
    PythonEngine1.IO:=PythonGUIInputOutput1;
    PythonEngine1.DllPath:=AppDataDir;
    PythonEngine1.SetPythonHome(PythonEngine1.DllPath);
    PythonEngine1.LoadDll;
    //PythonDelphiVar1のOnSeDataイベントを利用する
    PythonDelphiVar1.Engine:=PythonEngine1;
    PythonDelphiVar1.VarName:=AnsiString('var1');
    //初期化
    PythonEngine1.Py_Initialize;
  end else begin
    PythonEngine1.AutoLoad:=False;
  end;

  //Splashフォームを表示
  theSplashForm:=TSplashForm.Create(Application);
  try
    theSplashForm.Show;
    theSplashForm.Refresh;
    theSplashForm.TimeLabel.Caption :=
      'ライブラリをロード中...(スキャンにより数分かかる場合があります)';
    theSplashForm.Update;
    Sleep(1500);
    LoadAllPythonModules;  //Pythonのモジュールを読み込み
    theSplashForm.TimeLabel.Caption := '準備が整いました！';
    theSplashForm.Update;
    Sleep(500);
    FadeOutForm(theSplashForm);
    theSplashForm.Close;
  finally
    theSplashForm.Free;
  end;
  ･･･ 省略 ･･･
end;

上記コードを実行した結果、初回起動時、私の環境では約２分５秒間 PC が待機状態になりました。また、自動採点機能の初回使用時は、私の環境では 15 秒間待機状態が続きました。２回目のアプリケーション起動時、自動採点実行時は、いずれも待機時間は大幅に短縮され、ほとんど気にならないレベル（個人差はあると思いますが）になりました。

（２）について

（１）ではユーザーへの案内が「’ライブラリをロード中…(スキャンにより数分かかる場合があります)’」のみとなってしまい、処理の経過状況がうまく伝わらない可能性があると考え、当初、別スレッドで AV スキャンを監視し、UI （theSplashForm.TimeLabel.Caption）に進捗状況を表示できないかと考えました。そこで、.pyd ファイル（＝Python モジュール）のロードと同時に監視を自動で開始し、スキャンが収束するまで待機するユーティリティ関数を作成してみたのですが、PC の環境によりインストールされている AV は異なっていて当然ですので、この AV プロセスをどうすれば確実に取得できるかという部分が、まず大きな問題となりました。

const
  AVList: array[0..4] of TAVInfo = (
    (Name: 'MsMpEng'; Path: 'C:\Program Files\･･･\MsMpEng.exe'),
    (Name: 'McShield'; Path: 'C:\Program Files\･･･\McShield.exe'),
    (Name: 'savservice'; Path: 'C:\Program Files\･･･\XXX.exe'),
    (Name: 'ccSvcHst'; Path: 'C:\Program Files (x86)\･･･\YYY.exe'),
    (Name: 'avp'; Path: 'C:\Program Files\･･･\ZZZ.exe')
  );

PC 環境が異なっても上記 Path を確実に取得できるよう、次のようにしたり･･･

type
  TAVInfo = record
    Name: string;
    Path: string;
  end;

function DetectAVProcesses: TArray<TAVInfo>;

implementation

const
  AVCandidates: array[0..4] of TAVInfo = (
    (Name: 'MsMpEng'; Path: '') //動的に取得する
  );

function GetProcessPath(const ProcName: string): string;
var
  Snapshot: THandle;
  ProcEntry: TProcessEntry32;
  hProcess: THandle;
  PathBuffer: array[0..MAX_PATH - 1] of Char;
begin
  Result := '';
  Snapshot := CreateToolhelp32Snapshot(TH32CS_SNAPPROCESS, 0);
  if Snapshot = INVALID_HANDLE_VALUE then Exit;

  ProcEntry.dwSize := SizeOf(TProcessEntry32);
  if Process32First(Snapshot, ProcEntry) then
  begin
    repeat
      if SameText(ProcEntry.szExeFile, ProcName + '.exe') then
      begin
        hProcess := OpenProcess(PROCESS_QUERY_INFORMATION or PROCESS_VM_READ, False, ProcEntry.th32ProcessID);
        if hProcess <> 0 then
        begin
          if GetModuleFileNameEx(hProcess, 0, PathBuffer, Length(PathBuffer)) > 0 then
            Result := PathBuffer;
          CloseHandle(hProcess);
        end;
        Break;
      end;
    until not Process32Next(Snapshot, ProcEntry);
  end;
  CloseHandle(Snapshot);
end;

function DetectAVProcesses: TArray<TAVInfo>;
var
  i: Integer;
  L: TList<TAVInfo>;
  Path: string;
  Info: TAVInfo;
begin
  L := TList<TAVInfo>.Create;
  try
    for i := Low(AVCandidates) to High(AVCandidates) do
    begin
      Path := GetProcessPath(AVCandidates[i].Name);
      if Path <> '' then
      begin
        Info := AVCandidates[i];
        Info.Path := Path;
        L.Add(Info);
      end;
    end;
    Result := L.ToArray;
  finally
    L.Free;
  end;
end;

さまざまに頑張ってみたのですが･･･、最終的に、どうやっても「’対象AVが見つかりません’」という表示が消えません･･･。つまり、AV プロセスを取得することが私の技術では出来ませんでした (ToT)

var
  AVProcesses: TArray<string>;
begin
  theSplashForm.TimeLabel.Caption := 'AV監視開始…';

  AVProcesses := DetectAVProcesses;
  if Length(AVProcesses) = 0 then
  begin
    theSplashForm.TimeLabel.Caption := '対象AVが見つかりません';
    Exit;
  end;

  AVThread := TAVScanThread.Create(
    AVProcesses, 10, 3, 60000,
    procedure(const Msg: string)
    begin
      theSplashForm.TimeLabel.Caption := Msg;
    end
  );

  AVThread.Start;
end;

（１）「ウォームアップ import」をアプリ起動時に実行だけで十分な気がしてきました！

なので、ここは潔く･･･

撤退します！

（追記_20250825 ここまで）

【追記_20250924】

ユーザーの方から、「手書き答案の採点補助プログラム（ AC_Reader ）を使用していると、突然、白紙のメッセージがたくさん出て止まるんだけど･･･」という不具合発生の報告をいただきました。

私が動作確認した際には経験しなかった現象なので、具体的に「ナニを・どうすると・それが起きるのか」が当初まったくわからず、はたして不具合を解消できるかどうか、大いに不安でしたが、年齢層で言うとかなり高めの方からの不具合の報告であったことを念頭に置き、得点の「入力」、採点結果の「書込」、採点対象答案の「移動」あたりのボタンクリックに関する問題なのではないかと推測して、不具合の再現を図ったところ、予想が的中し、「書込」ボタンを連打すると PC がフリーズしてプログラムが落ちることを確認しました。

Delphi の VCL の Button コントロールには、最初からダブルクリックを受け付ける機能そのものがありません（ = OnDblClick イベントが存在しない）。これは考えてみれば当然のことで、ダブルクリックイベントを許可すれば、意図しない二重実行が発生しまくるからです。

ただ、人間ですから、何かの拍子に、つい！ボタンを連打してしまうことはあって当然のことですので、ここはプログラム側できちんと連続クリックを受け取らないよう、対策しておく必要があります。

プログラマなら誰もが最初に考えることは、OnClick イベントの先頭に Button1.Enabled := False; を記述することだと思います。しかし、これでは対応できませんでした。連続クリックするとボタンが操作不可能になる前に、ボタンはクリックを拾ってしまいます。

そこで、FIsSaving: Boolean; のようなグローバル変数を設けて、ボタンクリックイベントの先頭行で、if FIsSaving then Exit; 次の行に FIsSaving := True を記述して連続クリックを阻止しようと考えました。しかし、この方法でも連続クリックの２回目以降を受け取らないようにすることはできませんでした。やはり、ボタンは連続クリックを拾ってしまうのです。

そこで、次のようにして、

Button1.Enabled := False;
Application.ProcessMessages;

これなら上手く行くかと思いましたが、これもダメです。例え Button1.Enabled := False を設定しても、すでにクリックメッセージが処理順番待ち行列（キュー）に積まれていると（具体的には早打ちした WM_LBUTTONDOWN / WM_LBUTTONUP が複数積まれていると？）、OnClick イベントが複数回呼ばれてしまい、Application.ProcessMessages はそれらを即座に処理しますから、再入が発生し、データの保存（書込み）処理が複数回、同時実行されてしまうようです。

この同時実行によって、競合や例外が発生し、プログラムが落ちるわけです。

これはたいへんなコトになったと思いました。ボタンが連続クリックを拾ってしまうことを私の知識では止められない以上、別の方向性をとらざるを得ません。ですので途中から方針を変更し、連続クリックされても「クリックそのものは受け取って、同じ処理を繰り返し実行」、しかし、「プログラムは落ちない」方向で問題を解決（･･･というか、問題に対応？）することに決め、保存処理の実行ではプログレスバー以外の UI に一切触らず、エラー発生の原因となる保存手続き中の Application.ProcessMessages; はすべて削除して、手続きの外部へ移し、さらにボタンの OnClick イベントの直接呼出し等の処理は全部止めるよう見直しを図った結果、次のコードにたどり着くことができました。びっくりするくらいシンプルなコードです。書いた本人も驚きでした･･･　DoSaveData; 手続き内に保存の処理は全部詰め込んであります。

相変わらず、連続クリックそのものは、阻止できていませんが･･･プログラムは落ちなくなりました。

procedure TForm1.Button1Click(Sender: TObject);
begin
  Button1.Enabled := False;
  try
    DoSaveData;
    Application.ProcessMessages;
  finally
    Button1.Enabled := True;
  end;
end;

で、DoSaveData 手続き側では、グローバル変数を利用し、さらなる安全策をとりましたが、これもやはり全然、はい。まったく！効いていませんが、プログラムはとにかく落ちません。少なくとも、私の環境では連続クリックに対応できるようになりました。

procedure TForm1.DoSaveData;
var
  i:integer;
begin
  if FIsSaving then Exit; // 多重実行防止
  FIsSaving := True;
  ･･･ 省略 ･･･
end;

なお、自動採点機能もどきを搭載した Version 3 の修正作業を行っているうちに、私の周囲では、旧版の Version 2 の方が手に馴染むと、そちらを使い続けてくださっている方が複数いることを思い出し、Version 3 に行ったものと同等の修正（今回の修正に加えて、高 DPI 環境下でのスケーリング問題への対応や、メモリーリークを防止するため、設定画面が表示されている際には「閉じる」ボタンを無効化する処理等）を Version 2 にも同様に施して、Version 3 側を「 AC_Reader_AutoGrading.exe 」、Version 2 側を「 AC_Reader_NoneAutoGrading.exe 」として、上記リンクからダウンロードできる「デジタル採点 All in One.zip 」に同梱しました。

自動採点機能もどきを搭載した Version 3 は、初回起動時に必ず実行される Windows Defender や McAfee などの Anti-Virus Software : AV による『未知バイナリの初回スキャン』の対象ファイルが多いため、実行環境を別ディレクトリに移動した際等、必ずこの処理が走り、長い待機状態が発生します。自動採点機能が不要の場合は、それがなく、『未知バイナリの初回スキャン』の対象ファイルが少ない「 AC_Reader_NoneAutoGrading.exe 」をお試しいただいた方がいいかもしれません。

AI に確認したところ、『多くのAVは、過去にスキャン済みのファイル情報をキャッシュしており、安全と判断したファイルはスキャン対象から外すようにしているが、そのキャッシュには有効期限があるため、検査後一定時間が経過すると「再評価が必要」と判断され、再スキャンが実行される』とのことです（私の環境下では、たとえディレクトリ構成を変えていない場合でも、前回起動時からひと月ほど経過？していたりするとプログラム起動時に待機状態が長く続く現象を確認しました。なので、間違いなくキャッシュには有効期限があるようです）。この他にも『スケジュールされた定期スキャン』や『アイドル時スキャン（ ScanOnlyIfIdle ）』の実行時、さらに『ウイルス定義ファイル更新後に再評価対象とされた場合』等にも再スキャンされる可能性があるとのことです。安全のためには仕方のないこととは言え、もう少しスキャン時間が短くなるとありがたいのですが･･･。

（追記_20250924 ここまで）

また、このプログラムの動作には「Microsoft Visual C ++ ランタイムライブラリ」のインストールが必要です。お使いのPCに「Microsoft Visual C ++ ランタイムライブラリ」が入っていない場合は、下記 Web サイトから「VisualCppRedist_AIO_x86_x64.exe」をダウンロードし、ダウンロードしたプログラムを管理者権限で実行し、動作に必要なライブラリをPCにインストールしてください。なお、インストール時には Windows のユーザーアカウント制御（UAC）が起動し、管理者用のID とパスワードの入力を求められます。インストールでは、exe の名称からわかるように 32 ビット版と 64 ビット版それぞれの VC++ランタイムライブラリがお使いの PC にセットアップされます。なお、インストール後は（僕のPC環境では）再起動なしで、そのまますぐに AC_Reader.exe を実行できました。

「VisualCppRedist_AIO_x86_x64.exe」の入手先：

https://www.majorgeeks.com/files/details/visual_c_redistributable_runtimes_aio_repack.html

2025年６月11日現在、バージョンは「0.91.0」でした。上記 Web サイトの Download (64-Bit EXE) というリンクをクリックすればインストールプログラムをダウンロードできます。

１．論より証拠

自動採点実行時の画面のハードコピーを以下に示します。なお、テスト用データの手書き「文字・数字・記号」は、すべて「お手本」を参照しながら、僕自身が「お手本」を真似て書いたものです。

まず、最初にカタカナの「アイウエオ」５文字の推論結果です。

正解ラベル：「ア」の場合です。（全体を表示するため、解答欄画像は縮小表示しています）

正解ラベル：「イ」の場合です。

正解ラベル：「ウ」の場合です。

正解ラベル：「エ」の場合です。

No,1とNo,12の画像に縦方向の直線状の汚れがありますが、推論用画像作成の前段階の処理でその除去に成功しています（これを除去しておかないと、例えばNo,12の画像の推論用データは空白の画像ではなく縦線「｜」が入った画像になり、学習モデルは間違いなくこれを「1」と推論してしまうはずです）。

解答欄の切り出し直後の画像では、No,1とNo,12の画像の左側に薄い灰色の直線状の汚れがあります。

推論用データ（文字の輪郭を検出して縦横28ピクセルの画像として解答欄の画像から切り出す）を作成する前段階で、これらの汚れを除去する処理を入れています。

この「文字を消さずに汚れのみ除去する」処理はけっこう苦労しました。が、なんとか工夫を重ねて実現できました。「エ」の構成部品である「｜」を消さずに、左側の汚れの「｜」のみ除去するのは大変でしたが、線状の汚れと判断する基準にその高さ（長さ）を採用して、それが画像の高さとほぼ等しい場合は汚れと見なすことで、この問題はクリアできました。

以下、そのスクリプトです（ご参考まで）。

# 画像内の灰色の直線状汚れを除去

import cv2
import numpy as np
import os
from glob import glob

folder = r".\GrayLine"
image_extensions = ["*.png", "*.jpg", "*.jpeg"]
image_paths = []
for ext in image_extensions:
    image_paths.extend(glob(os.path.join(folder, ext)))

tolerance = 20  # 画像の高さとの誤差許容範囲（ピクセル単位）

for image_path in image_paths:
    image = cv2.imdecode(np.fromfile(image_path, dtype=np.uint8), cv2.IMREAD_COLOR)
    if image is None:
        continue
    height, width = image.shape[:2]
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    edges = cv2.Canny(gray, threshold1=20, threshold2=80, apertureSize=3)
    lines = cv2.HoughLinesP(edges, rho=1, theta=np.pi / 180, threshold=50, minLineLength=50, maxLineGap=5)

    if lines is not None:
        for line in lines:
            x1, y1, x2, y2 = line[0]
            angle = np.degrees(np.arctan2(y2 - y1, x2 - x1))
            line_length = np.hypot(x2 - x1, y2 - y1)

            # 垂直線かつ画像の高さとほぼ同じ長さのみ除去
            if (abs(angle - 90) < 1 or abs(angle + 90) < 1) and abs(line_length - height) < tolerance:
                cv2.rectangle(image, (x1-5, 0), (x2+5, height), (255, 255, 255), 2)
                cv2.rectangle(image, (x1-4, min(y1, y2)-5), (x2+4, max(y1, y2)+5), (255, 255, 255), -1)

    cv2.imencode(".png", image)[1].tofile(image_path)

正解ラベル：「オ」の場合です。

カタカナ「アイウエオ」の５文字は間違えずに推論できました。イイ感じです。
次は数字の「１２３４５」。何となくイケそうな気がしてきました☆

正解ラベル：「１」の場合です。

あ・れ・？

なんで「2」に〇が･･･

夢なら覚めてくれ･･･ T_T

一瞬。そう思いましたが･･･

大丈夫。転ぶのには慣れています。これまでだってさんざん･･･、

ここまで来て、あきらめるなんて、そっちの方が無理です。

急いで推論用の画像を確認。

･･･ということは、学習データに問題があったってコトか？

左へ微妙に傾いているように見えます･･･

よくよく考えてみると、このような左に傾いた「2」は、利き腕が右の場合、なんとなく書きにくいような気もします。このことから、つまり、推論をミスした原因は、学習用データとして用意した画像の中に、左に傾いた「2」が少なかったため（？）ではないかと思えてきました。

見たところ、この「2」の画像には極端なシミも汚れもなく、色の濃さも十分、形状もちょっと縦に伸びてるかなって感じもしますが、まぁ、これは一般的にどう見ても「2」です。輪郭検出にも間違いなく成功して期待通りに切り出せている以上、やはり推論ミスの原因は「その傾きにある」としか思えません。

そこで･･･ナニをしたかというと、

取りあえず、1～20°の範囲で、0.5°ずつ傾きに変化をつけ、推論をミスした「2」を左に回転させた画像を上のように50枚用意（処理する際に名称は関係ないので、ファイル名に一貫性はありません）して、さらに「2」の学習データは全体で約7000枚あるので、その１割にあたる700枚を抜き出し、ランダムに5°、10°、15°、20°のいずれかの角度で左に回転させ、先に用意した50枚と合わせて水増し学習データを合計750枚作りました。

「水増し」なんて言うと（文脈にもよりますが）どちらかと言えばネガティブな意味を含むことが多く、なんだか、とてもずる賢い・よからぬことをしているように感じますが、機械学習で使われる「水増し」という言葉は、データ拡張（Data Augmentation）という概念を表すもので、基本的に悪い意味はないようです。むしろ、このテクニックは、モデルの汎化性能を向上させ、過学習（Overfitting）^※を防ぐために重要な技術とされているようです。十分な学習データがない場合に、画像の回転・拡大・ぼかし・ノイズ追加などを行うことで、実質的にデータ数を増やせますし（＝過学習の防止という意味でもこれは有効）、既存の学習用データに回転（やりすぎは禁物！）や、サイズ変更して作成した水増し学習用データを加えて学習モデルを作れば、異なる角度やサイズの文字にも対応できる、より頑健なモデルにすることができます。

※ 過学習（Overfitting）：学習用データが少なかったりすると、学習モデルがそのデータに最適化されすぎてしまい、汎化性能が低下してしまうことを言うそうです。つまり、見たことがあるデータしか、推論に成功しなくなる（見たことがないデータに対して非常に弱くなる）わけですね。

こうして作成した水増し学習用データをを元の約7000枚に追加し、画像をランダムに並び替えて、連番の名前を付け直し、約7800枚の「2」の画像データを作り、そのうち1/3のデータは余白「4」、1/3のデータは余白「5」、1/3のデータは余白「6」を設定（余白の取り方を変更してモデルの汎用性を高めるため）して再学習用の縦横28ピクセルの画像データに変換し、１、３、４、５の各学習用データと合わせて、カタカナ「アイウエオ」の学習モデルを再度構築し直しました。

実際は、再度ではなく、再々々々・・・度の「構築し直し」ですが。
夢は、きっと、叶えるために、あります。

基本的な考え方としては（間違っているかもしれませんが）、学習用データの余白分布が4～6ピクセルであれば、モデルはその範囲内の「平均的」な状態、すなわち中央値に近い値（つまり5ピクセル）に合わせた特徴抽出を学習する（＝最も代表的な状態に合わせて内部の重みが調整される）と仮定して･･･

（推論用データの余白の設定を中央値にすると正解率が良いように経験的に感じたのです）

この仮定がもし正しければ、推論用の画像データはそのすべてを「検出した輪郭の周囲に余白5を指定して作成」することで、モデルは最も慣れている条件下で推論動作を行える＝最も良い正解率を示すはずだと･･･

実は、この輪郭検出（＝文字認識）後、その周囲にどの程度の余白を設定するかについて最初は適当に「8」とか指定していたのですが、モデルの汎用性を高めるためには、学習データの余白の設定は一律に同じ設定としない方が良いはずなので、ある時、ふとその1/3に余白「8」、1/3に余白「9」、1/3に余白「10」を設定して学習モデルを作成し、推論の成否を確認していたところ、推論用データの余白を「9」に設定した場合に正解率がよくなるように感じました（正確に統計をとったわけではありません）。それと最終的には、学習用データ・推論用データともに縦横28ピクセルの画像とすることから、中央に配置した文字が実質縦横20ピクセル程度の領域に入る余白「4・5・6」あたりが最も適当であろうと考えたわけです。MNISTの作りを見ても、この考えは正しいように思われました。

もちろん、学習用データの余白を3・4・5として、推論用データの余白を中央値の4とする設定も考えましたが、余白が3ピクセルではさすがに小さすぎるのではないかと思い直し･･･つまり、ちょっとした輪郭抽出のズレでも、文字がフレームに近づきすぎて、文字の上下左右の位置のバラつきが大きくなり、モデルが位置変動に過敏になる可能性が大きいと考えました。

逆に余白が6ピクセルと大きい方が、余白を3ピクセルとした場合よりも、文字が中央に安定しやすく、多少のズレがあっても特徴が大きく変わらなくなるはずです（機械学習においては、機械が覚え込んだ特徴量に近い特徴量を示す推論対象が正解とされるわけですから、このことは非常に重要です）。解答欄画像から輪郭検出を行って推論用データを作成する際の余白の設定を様々に変えて試行している際に、わずか1ピクセル、余白の設定を変更しただけで、正解になったり、不正解になったりする事実（プログラムのテストを繰り返す中で、この現象に気づいた当初は本当に不思議に感じました）は、まさにこの推測が正しいことの証明ではないかと思われました。

最終的には、すべて縦横28ピクセルの画像データとするわけですから、このあたりの判断がコトの成否を分ける、言わば「運命の分岐点」であったと、今、ここまでの歩みを振り返って思います。

また、この各数字の画像が約7000枚ずつあるというのは、僕の制作環境においては学習モデルを作成可能な制限ギリギリの値であったようで、学習モデル作成にあたってはまずPCそのものを再起動し、他のアプリが一切動作していない（メモリが十分に空いている）状態を作ってから、学習モデルを作成するスクリプトを実行する必要がありました。

ちなみに僕のPC環境（仕様）は、以下の通りです。

【デバイスの仕様】
プロセッサ	11th Gen Intel(R) Core(TM) i7-1185G7 @ 3.00GHz   3.00 GHz
実装 RAM	32.0 GB (31.7 GB 使用可能)
システムの種類	64 ビット オペレーティング システム、x64 ベース プロセッサ
ペンとタッチ	10 タッチ ポイントでのペンとタッチのサポート

【Windowsの仕様】
エディション	Windows 11 Pro
バージョン	24H2
インストール日	‎2024/‎10/‎05
OS ビルド	26100.4351
エクスペリエンス	Windows 機能エクスペリエンス パック 1000.26100.107.0

様々なアプリを使用した後や、Webブラウザを開いたままの状態で学習モデルを作成するスクリプトを実行すると、必ず「メモリが足りません！」というエラーメッセージが表示され、学習モデルの作成に失敗してしまうので、「再起動直後に実行する」という手を思いつく前は、「もはやこれまで」とせっかく作った学習データを減らそうかと思ったりもしました。

誰も教えてくれる人はいませんので、すべてが手探り状態で、後から考えれば実に様々な「それくらい最初から気がつけよ！」みたいな「プロから見れば当たり前のこと」に気づくまでに、試行錯誤を繰り返し、膨大な時間を費やしつつ、一歩一歩前進するしかありません。

昼間は仕事があるし･･･、夜はあたまの回転がトロくなるし･･･、なんや・かんやで、
だいたい日付が変わる頃に目を覚まし、あとは朝が来るまで、ちいさな灯りをともして･･･
僕の人生の中で、いちばん充実した「時」を過ごします･･･

自動採点を、あきらめない以上は･･･その時々で、僕に出来る最善を尽くすのみです。

何はともあれ、左に傾いた「2」を新しく学習したモデルが出来ました！

このモデルを用いて「1」の推論に再チャレンジした結果です。

やった！　やった！！

なせばなる！！！

もちろん、余白の設定は「5」としてあります。

正解ラベル：「2」の場合です。

No,10の画像の「2」が正解となっていることもうれしいことです。
実は、No,11の画像は、検証用にわざと誤りのデータを他の画像から切り貼りして作成したものです。
つまり、正解ラベル「1」のNo,11の「2」と、上のNo,10の「2」は同じデータと思われます。

正解ラベル：「3」の場合です。

正解ラベル：「4」の場合です。

正解ラベル：「5」の場合です。

数字も正しく読めるようになりました☆

次は、記号の「 ○ と × 」です。

正解ラベル：「 ○ 」の場合です。

正解ラベル：「 × 」の場合です。

・・･･･・・

2025 年 6 月 15 日午前４時
とうとう・・・
夢がかないました！

とても静か・・・

まだみんな
眠っています。

これも夢かもしれません。

夢なら、どうか・・・
覚めないでください。

２．自動採点機能の使い方

ダウンロードした zip ファイルを展開すれば、すぐにお試しいただけるよう、次に紹介する採点サンプルデータを同梱してあります。記事の説明を参照しながら、操作していただけますよう、お願い申し上げます。

この記事の冒頭にも書きましたが、プログラムの動作には「Microsoft Visual C ++ ランタイムライブラリ」のインストールが必要です。お使いのPCに「Microsoft Visual C ++ ランタイムライブラリ」が入っていない場合は、下記 Web サイトから「VisualCppRedist_AIO_x86_x64.exe」をダウンロードし、ダウンロードしたプログラムを管理者権限で実行し、動作に必要なライブラリをPCにインストールしてください。なお、インストール時には Windows のユーザーアカウント制御（UAC）が起動し、管理者用のID とパスワードの入力を求められます。インストールでは、exe の名称からわかるように 32 ビット版と 64 ビット版それぞれの VC++ランタイムライブラリがお使いの PC にセットアップされます。なお、インストール後は（僕のPC環境では）再起動なしで、そのまますぐに AC_Reader.exe を実行できました。

「VisualCppRedist_AIO_x86_x64.exe」の入手先：

https://www.majorgeeks.com/files/details/visual_c_redistributable_runtimes_aio_repack.html

【採点の準備】

AC_Reader.exe をダブルクリックしてプログラムを起動したら、「採点作業」ボタンをクリックします。ここで「Windows によって PC が保護されました」と書かれた青い画面が表示された場合は、当 blog の過去記事に対応方法の詳細な説明を載せてありますので、そちらをご参照ください。

無料で使える手書き答案採点補助プログラム

この青い画面（ Windows Defender SmartScreen ）に関するより詳細な説明は、次の過去記事にも掲載しています。もし、よろしければ合わせてご参照ください。

マウスだけで操作可能な画面の拡大表示ツール “KindLens” のご紹介

「採点作業」ボタンをクリックすると、次のメッセージが表示されます。

「はい」をクリックすると、既存の採点設定を選択できるようになります。

採点設定ファイルを選択するには、ComboBox の右側の ∨ マークをクリックします。すると候補の選択肢として採点サンプルファイルが１つだけ表示されますので、これをクリックして選びます。

案内メッセージが表示されます。

「フォルダ選択」用のダイアログが表示されますので、解答用紙画像の入っている「フォルダを選択」してから OK をクリックしてください。

【重要】 選択するのは「フォルダ」であって、「ファイル」ではありません！

案内メッセージが表示されます。よく読んで OK をクリックしてください。

【採点設定ファイルとフォルダの関係】

最初に選んだ「採点設定ファイル」は、試験で使用した解答用紙の解答欄の座標他が登録されています。ですので、同じ解答用紙を使用して行った試験であれば、すべて同一の採点設定ファイルで採点作業を行うことができます。

通常、テストは「クラス単位」で実施されますが、採点設定ファイルはどのクラスに対しても共通で利用しますので、クラス名を入れない名称を付けて保存（例：R7_考査①_数学Ⅰ）するよう、ユーザーの皆さまにはご案内しています。

解答用紙の画像は、通常であれば「クラス名を付けたフォルダ（例：R7_考査①_数学Ⅰ_1A）」に保存するのが一般的であると思います。

ですので、このプログラムの実際の運用に当たっては、「採点設定ファイルにはクラス名を入れず、解答用紙の画像を保存するフォルダにはクラス名を含めた名前を付けてください。」とユーザーの皆さまへご案内しております。

【採点方法】

自動採点は、次の GUI で行います（僕は「フローティングパネル」と呼んでいます）。いろいろ考えてデザインしましたが、使い勝手がよくないと感じられる方もいらっしゃるかもしれません。そうだったら、ほんとに、ごめんなさい。

上部のタイトルバーに相当する部分を左クリックして、
そのまま（左ボタンを押したまま）ドラッグすると、
フローティングパネルを任意の位置へ移動できます。
（閉じるボタンは無効化してあります）

まず、現在、採点しようとしている設問への配点を設定します。

以下、手動採点時の採点方法の説明です。

手動採点時には、このまま、配点設定欄の下にある入力ボタンをクリックすると、配点設定欄が「０」であれば、現在表示されているすべての解答欄に不正解の「×」が、配点設定欄が「１以上」であれば、現在表示されているすべての解答欄に正解の「○」が（設定によっては配点の数字も）自動で入力されます。

これは、つまり、手動採点時には、初めに解答欄全体の出来栄えを見て、全体的によく出来ているような場合は一括して正解とし、不正解の解答欄だけを手動で採点、逆に全体的に出来がよくない場合には、一括して不正解とし、正解の解答欄だけを手動で採点した方が、効率よく採点できると考えて、このような仕様としました。

もちろん、自動採点時には、この入力ボタンをクリックする必要はありません。

また、配点を設定する ComboBox の右隣りの CheckBox「□する」にチェックを入れると、手動採点時に入力ボタンをクリックして、一括採点操作が行われる前に確認メッセージが表示されるようになります（誤入力を防ぎたいという、ユーザーからの要望で追加した機能です）。

【ここから自動採点の実行方法の説明です】

配点を入力後、自動採点を行う場合は、「□自動採点」にチェックを入れます。
次に、その下にある ComboBox からその設問の正解を選び、実行ボタンをクリックします。

正解として指定できるのは･･･

・カタカナの「ア・イ・ウ・エ・オ」のいずれか１文字、
・記号の「○・×」のどちらか１つ、
・数字の「１・２・３・４・５」のいずれか１つです。

これ以外のカタカナ（例えば「カ」）、記号（例えば「△」）、数字（例えば「６以上の数字」）は指定できません（決まりとして指定できないだけで、正解ラベルとしてComboBoxの入力欄に入力することはできます･･･が、正しく採点することは絶対に不可能です）。ただ、数字のゼロは、たぶん記号の「○」で代用が可能かと思われます･･･ので、数字については、もしかしたら「０・１・２・３・４・５」の６種類が採点可能かも？しれません（試していませんが）。

また、正解ラベルに指定する文字・記号・数字は、直接入力せず、ComboBox の選択肢から選択してください。記号の「○：まる」に誤って漢数字の「ゼロ：〇」を指定しないようご注意願います。漢数字のゼロは「まる」の変換でも IME の変換候補の選択肢に表示されるので十分注意してください。

採点が完了すると、解答欄の画像の左上に、採点記号（自動採点を利用した場合は、○ or × のいずれか）と、先に設定した配点が赤く表示されます（表示位置は任意の位置に変更できます。変更方法は上で紹介しました当 blog の過去記事をご参照ください）。

【お願い】
ここで、全ての解答欄について、機械の採点結果を目視で必ず確認してください。

※ このプログラムは、添付した学習モデルの性能が及ぶ範囲で「正解・不正解」のいずれかを判定する自動採点を実行しますが、自動採点結果について、それが常に 100 ％「正しい」ことを保証するものではありません。自動採点を行った結果につきましては、必ず、ご自身の責任で、直接、目視によって、その成否をご確認いただけますよう、お願い申し上げます。この使用条件に完全に同意し、かつ確実に目視による確認作業を実行していただける方のみ、このプログラムをお使いいただけますことを申し添えます。このプログラムに搭載した手動及び自動の採点機能を利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

【修正が必要な場合】

もし、修正が必要な場合は、修正対象の解答欄の画像をまずクリックします。

・正解に修正する場合は、配点に相当する数字キー（その設問の配点が「２」なら「２」のキー）を押下げします。

・不正解に修正する場合は、「B」キーを押下げします。ちなみに「B」は「 ×：Batsu 」の頭文字で、右手でマウス・左手で手動採点する際に「B」キーは押しやすい位置にあり、また、機能を覚えやすいんじゃないかと考え、「B」を不正解の入力キーとしました。

【採点結果の保存方法】

採点結果を保存（＝書込み）しないと、次の解答欄を表示することはできません。実行の左隣にある「書込」ボタンをクリックしてください。採点結果が保存されます。

３．推論用画像データの確認

プログラム設計時の動作検証用に作成した機能ですが、解答用紙画像から切り出した解答欄画像と、その解答欄画像から切り出した推論用画像データの状態を確認することが出来ます。

【解答欄画像の確認方法】

まず、次のように、正解ラベルが「空欄」の状態で確認作業を実行した場合、解答用紙画像から切り出した解答欄画像を確認することが出来ます。

正解ラベルが「空欄」のままであることを確認した後、「設定」→「推論用画像を確認する」の順にクリックしてください（元々、開発時に推論用画像を確認するために設けた機能なので、ボタンの名称が「解答欄･･･」ではありません）。

【重要】設定画面表示中は、Form の「閉じる」ボタンは無効化されます。

解答欄画像が表示されます。

解答用紙から切り出した解答欄画像のクリーニングは、採点作業補助用の GUI （フローティングパネル）の CheckBox 「□自動採点する」をチェックして、さらに正解ラベルが空欄ではない状態で、実行ボタンをクリックすると行われる（ように設定してある）ので、クリーニング前の状態を確認したい場合は、自動採点を実行する前の段階、すなわち、「◀」もしくは「▶」ボタンをクリックした直後の、まだ「□自動採点する」をチェックせず、正解ラベルも指定していない状態で、「設定」ボタンをクリックして、「推論用画像を確認する」^※をクリックすれば（クリーニング前の解答欄画像を）表示できます。

^※リリース版では、上のプロトタイプの状態にさらに画像のクリーニング機能を追加、パラメータが増えたため、ボタンのキャプションは単に「推論用画像」としています。

採点エンジンは２系統あります。
Version1 を選択した場合は、各パラメータを調整できます。
（デフォルト設定は、パラメータを調整済みの Version2 としてあります）

プログラムは、「実行」ボタンをクリックすると、まず、解答用紙から切り出した解答欄画像のクリーニングを行って、それから自動採点を行います。初回のみならず、２度目、３度目の見直し採点時であっても、プログラムは「修正等を一切加えていない無加工の解答用紙画像」から解答欄を切り抜いて解答欄画像として表示しているので、汚れのある解答欄が毎回表示されます。クリーニングが行われるのは、実行ボタンをクリックした後であることにご留意ください。

【点状汚れの除去の例】

クリーニング後の画像は･･･

よーく見ると、微かにうすいシミが残っていますが･･･まぁ、消えたと言えるんじゃないかと。
（ここは後日、さらに改良してより白くなるように修正しました）

【線状汚れの除去の例】

クリーニング後の画像は･･･

【推論用画像の確認方法】

自動採点を実行すれば、推論用に解答欄画像から切り出した、縦横28ピクセルの推論用画像を確認できます。自動採点時、実際に機械が見ているのは、この推論用画像になります。

上の図のような状態で、「実行」ボタンをクリックした後で、「設定」→「推論用画像」の順にクリックします。

縦横28ピクセルの、この小さな画像を思った通りに切り出せるようになるまで、いったいどれくらいの試行錯誤を繰り返したか、今はもうそのすべてを思い出せませんが、自分の中に「あきらめる」という選択肢だけはなかったように思います。

これまでの経験から、ただひとつだけ言えることは、機械学習の成否はこの機械が見る（機械に見せる）画像にあるということです。

学習用データとまったく同じ手法で作成した推論用画像を自分では「ブレない画像」と呼んでいますが、画像中の汚れ・シミ等も含めて輪郭検出した部分の面積を計算し、その大きな部分を組み合わせた範囲を文字として切り抜き、中心位置を計算し、最適な余白を設け、汚れ・シミを除去し、白い部分はより白く、逆に薄い灰色は黒く（濃く）する等、文字の特徴量抽出を阻害する要素をできるだけ取り除いた、わずか縦横28ピクセルの、このちいさな文字。その「作り方」として、僕のとった方法が正解であったかどうかの答えを AC_Reader が出してくれると信じています。

もりろん、手書き文字にひとつとして同じ文字はありませんから、そのような意味で「正しいア」は存在しません。ただ、これまでの経緯から、特徴量抽出で機械が学んだ「ア」こそ、もしかしたら「正しいア」に最も近い「ア」なのではないかと思うようになりました。

ひとことで言えば、「正解がないのに、正解を探す旅」それが今、僕が思う機械学習のイメージです。

４．プログラムのダウンロード

この記事で紹介した「手書き答案の採点補助プログラム AC_Reader.exe」他、この Blog の過去記事に掲載しましたデジタル採点関連のプログラム一式を同梱した DigitalSaiten_All_in_One.zip を次のリンク先からダウンロードできます。なお、ダウンロードとご使用にあたっては、免責事項及び使用条件への同意が必要です。免責事項及び使用条件の詳細は付属の License.txt をご覧ください。

デジタル採点 All in One !

【更新履歴】

・2024年9月29日　初版公開
・2025年8月25日　不具合の修正及び新機能を追加したバージョンアップ版に更新
・2025年8月26日　Anti-Virus Software による『未知バイナリの初回スキャン』の待機状態を改善
・2025年9月22日　連続ボタンクリックで落ちる問題を改善／自動採点機能無し版も同梱

５．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。記載した内容（プログラムを含む）を利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

追記_返却用答案の印刷方法について

元々、この AC_Reader には簡易的な合計点の計算と返却用答案の印刷機能があったのですが、高等学校現場における観点別評価の導入に伴い、返却用答案の印刷プログラムは、マークシートリーダーと共用の別プログラム（ReportCard_2024.exe）としました。

AC_Reader.exe から ReportCard_2024.exe を呼び出して実行できます。ReportCard_2024.exe の操作方法は、当ブログの過去記事をご参照ください。

マークシートの採点結果通知（個票）及び成績一覧表の作成

こちらの過去記事にも ReportCard_2024.exe の操作方法の解説があります。上の記事と合わせてご参照ください。

デジタル採点 All in One !

デジタル採点手書きフリーで検索したら、その後

前回の記事を書いてから、scikit-learn を使った機械学習による手書きカタカナ文字「ア・イ・ウ・エ・オ」及び記号「○・×」の認識用学習モデル作成について、さらに勉強しました☆

今回は、その記録と、今後の抱負です。

【もくじ】

１．さらに勉強した理由
２．HOGを知る
３．気分は「写経」
４．今後の抱負
５．まとめ
６．お願いとお断り

１．さらに勉強した理由

なぜ、さらに勉強したかというと、前回の記事では、画像のピクセル値をそのまま利用する Flattening という特徴量抽出の手法を用いて学習モデルを作成したのですが、前回の記事にある通り、既知の（＝学習に利用した）カタカナ文字については、アイウエオ各文字ともに 98 ％正しく判定できたという好結果に力を得て、Delphi で GUI を作成した手書き答案の採点補助プログラムから、Python の文字認識スクリプトを実行できるよう、新しくプログラムを書いて実験してみた結果、期待に反して１回も見たことのない新規の文字については、正しく判定できないことがありました。特に「オ」は全滅･･･

以下、かるーくやってみた実験の結果です。

「ア」はふたつとも読めた･･･

記入位置の探索も、上手く行えてるようです･･･

ふたつめの「ウ」の方が、典型的な「ウ」により近い？気がするけど･･･

「エ」は得意なのかな･･･

この「オ」の認識結果を見て、正直、これはダメだと思いました。また、失敗です。T_T

ちなみに「○・×」は･･･

なにか書いてあれば･･･「○」だと思ってる･･･
（空欄を識別しているのは、うれしい限りですが）

「○ or ×」認識テストの結果は、「オ」の場合よりさらにダメです。まぁ上の「オ」の場合の「ア」についても確信を持って見分けて「×」を付けているのか、どうか、この結果を見てだいぶ怪しくなってきました。（果たして、あの「オ」や「ア」をどう読んだのか･･･、それを確認する気力も失せました･･･）

さらに、お見せしたくないのが、「×」が正解ラベルの場合です。

THE END.
その想いで胸がいっぱいに！

実装が超シンプルで、かつ高速で軽量、文字画像のピクセル値（28×28）をそのまま利用する Flattening という手法では、これが限界なのでしょうか？

学習用データをさらに増やせば、もっと良い結果が得られるのではないか･･･とも考えましたが、手元にその学習用データがありません。新規に学習用データを集めるには莫大な手間と時間が必要です。

ただ･･･失敗の中でも唯一救いに感じたのは、２年前の文字認識チャレンジでどうしてもクリア出来なかった解答欄中の文字が書かれている位置を正しく認識することに成功し、意図した通りに文字画像を取得出来ていることです。

プログラムはその記入位置を正確に見つけ出し、28×28の矩形画像への切り出しに成功しています。

実は、この Blog の過去の記事で「失敗の記録」として掲載した手書き文字認識チャレンジの試行錯誤の記事を書いた当時、文字の認識に失敗した最大の原因は「正しく文字を切り出せなかった」ことにありました。今回、テストしたのは、たった３枚の画像ですが、いずれも問題なく文字が記入されている位置をプログラムは特定し、その正確な切り出しに成功しています。

切り出した画像の縦横比が、元の画像と変化していることに、画像を見て気づきました！
ここは出来れば改善したいところです。

２年前の僕の技術では、例えば「ア」について、文字を構成する線がすべて繋がっている場合は「ア」という文字１文字だと正しく認識できても、「つ」部分と「ノ」部分が離れている場合は、「ア」ではなく「つ」と「ノ」に分解して認識してしまうミスをどうしても防げなかったのです。今回のチャレンジでは、この問題を無事クリアできました。

２年前の僕の技術では、３つめの「ア」は「つ」と「ノ」になってしまいましたが･･･

今回のプログラムは、ちゃんと「ア」として切り出しています。
ただ、やはり縦横比が･･･気になりますので、ここは何とかします！

さらに、解答欄から切り出した文字の位置が切り出し画像の中央にあることも、長い間ずっと･･･この胸に思い描いた夢の通りです。

文字の縦横比は変わっていますが、文字位置の特定には何の問題もなく、成功しています☆
さらに、解答欄左にある（５）のような解答欄の番号を無視することにも成功しています☆☆
２年前にどうしてもクリア出来なかった複数の問題を、今回はすべてクリア出来ました☆☆☆

総合的な意味では今回も失敗でしたが、自分にとって、前回、クリア出来なかった幾つもの問題を解決できたことは、本当に大きな前進でした。だから、総合的には失敗でも、☆５つが完全な成功だとしたら、自分的には ☆☆☆ です。

また、今回、Flattening による学習モデル作成方法を学ぶことで、Python に 32 ビット環境の scikit-learn ライブラリを導入する手法を完全に理解できました。機械学習そのものが現在 64 ビット環境へ移行しつつある中で、32 ビット環境の最後の輝きを、今、僕は目の当たりにしている･･･そんな気がしてなりませんでした。

２．HOGを知る

Flattening の欠点に気づいたのは、Python 環境で作成した学習モデルを Delphi の Object Pascal から操作できるようにプログラミングを終えた段階（上の画像は、その段階での試行の様子）だったので、･･･結果的に Delphi 側の最も重要なプログラムを最初から組み直すことにはなりましたが･･･ここで僕は、エッジや輪郭の方向に強く、ノイズの影響も受けにくい HOG（Histogram of Oriented Gradients）という特徴量を抽出する手法があることを知ります。HOG を勉強してみたところ、こちらの手法の方が画像のピクセル値のそのまま利用する Flattening より、文字の識別精度が高いのではないかと思えてきました。

そこで HOG を用いて文字の特徴量を抽出して学習モデルを作成するスクリプトを書きました。最初に、ごく基本的なコードを書き、そこに必要な様々な処理を追加して行く方法で一歩一歩確実に進んだ結果、文字の認識能力が Flattening 特徴量抽出手法を使ったそれよりは高いのではないか？と、確かに思える学習モデルを作成することができました。HOG 特徴量抽出手法を使った学習モデルは、Delphi に組み込む前に、Python スクリプトを使って行った試行で、上の「オ」を２つともサラっと認識してくれたのです！

試行の様子がこちらです。

解答用紙から切り出した解答欄の矩形画像

さらに解答欄の中の文字部分を探索して、切り抜いて･･･

解答欄から切り出した28×28ピクセルの矩形画像
（新しいプログラムではファイル名のIndexは１始まりにしました）

Delphi に埋め込む前に、Python 用のスクリプトで読んでみます･･･

やった！　ちゃんと読めた！！　「オ」だけじゃなく「ア」も正しく読めています！！！

以下、HOG特徴量抽出手法を適用した学習モデル作成に必要な、学習用の文字データを作成するために使用したスクリプトです（使用を推奨するものではありません。あくまでもご参考まで）。

このスクリプトは、輪郭検出と文字切り出し、周囲パディングを均一化して、文字を画像の中心に配置、GaussianBlurによるノイズ除去、傾き補正、28×28ピクセルに正規化して保存･･･と言った機能を備えています。万一、コピペして試される場合は PATH をご自身の環境に合わせて変更してください。

import cv2
import numpy as np
import os
from glob import glob
import re

# UTF-8 パス対応の画像読み込み
def imread_utf8(path):
    stream = np.fromfile(path, dtype=np.uint8)
    return cv2.imdecode(stream, cv2.IMREAD_COLOR)

# 傾き補正（修正: warpAffine に補間法と白背景を明示）
def deskew(img):
    m = cv2.moments(img)
    if abs(m['mu02']) < 1e-2:
        return img.copy()
    skew = m['mu11'] / m['mu02']
    M = np.float32([[1, skew, -0.5 * 28 * skew], [0, 1, 0]])
    return cv2.warpAffine(img, M, (28, 28), flags=cv2.INTER_NEAREST | cv2.WARP_INVERSE_MAP, borderValue=255)

# ファイル名から数値を抽出（img12.png → 12）
def extract_number(path):
    filename = os.path.basename(path)
    match = re.search(r'img(\d+)', filename)
    return int(match.group(1)) if match else float("inf")

# 入力・出力フォルダ（パスに全角文字が含まれていてもOK）
input_folder = r"C:\Python39-32\Images_tegaki\aiueo\ア"
output_folder = os.path.join(input_folder, "Trimed")
os.makedirs(output_folder, exist_ok=True)

# 対象画像拡張子
image_extensions = ['*.jpg', '*.jpeg', '*.png']
image_files = []
for ext in image_extensions:
    image_files.extend(glob(os.path.join(input_folder, ext)))

# 並べ替え（img番号順）
image_files.sort(key=extract_number)

index = 1
for image_path in image_files:
    image = imread_utf8(image_path)
    if image is None:
        print(f"読み込めない画像: {image_path}")
        continue

    h, w = image.shape[:2]
    gray_for_line = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    edges = cv2.Canny(gray_for_line, 50, 150, apertureSize=3)

    raw_lines = cv2.HoughLinesP(edges, 1, np.pi / 180, threshold=100,
                                minLineLength=min(w, h) // 3, maxLineGap=10)
    filtered_lines = []
    if raw_lines is not None:
        for line in raw_lines:
            x1, y1, x2, y2 = line[0]
            angle = abs(np.arctan2(y2 - y1, x2 - x1) * 180 / np.pi)
            length = np.hypot(x2 - x1, y2 - y1)
            if (angle < 10 or angle > 170) and length < w // 2:
                continue
            filtered_lines.append([[x1, y1, x2, y2]])

    if filtered_lines:
        for line in filtered_lines:
            x1, y1, x2, y2 = line[0]
            if abs(x2 - x1) < 10 or abs(y2 - y1) < 10:
                cv2.line(image, (x1, y1), (x2, y2), (255, 255, 255), thickness=3)

    if w > h:
        offset = w // 4
        cropped = image[:, offset:w - offset]
    else:
        offset = h // 4
        cropped = image[offset:h - offset, :]

    gray = cv2.cvtColor(cropped, cv2.COLOR_BGR2GRAY)
    _, thresh = cv2.threshold(gray, 200, 255, cv2.THRESH_BINARY_INV)

    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (10, 10))
    dilated = cv2.dilate(thresh, kernel, iterations=1)
    contours, _ = cv2.findContours(dilated, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    if contours:
        all_points = np.vstack(contours)
        x, y, w_box, h_box = cv2.boundingRect(all_points)
        padding = 20  # この値は、切り抜き画像を確認しつつ、適宜調整してください。
        if w > h:
            x += offset
        else:
            y += offset

        x1 = max(0, x - padding)
        y1 = max(0, y - padding)
        x2 = min(w, x + w_box + padding)
        y2 = min(h, y + h_box + padding)

        trimmed = image[y1:y2, x1:x2]
        trimmed_gray = cv2.cvtColor(trimmed, cv2.COLOR_BGR2GRAY)
        trimmed_blur = cv2.GaussianBlur(trimmed_gray, (3, 3), 0)

        h_trim, w_trim = trimmed_blur.shape[:2]
        scale = 20.0 / max(h_trim, w_trim)
        new_w = int(w_trim * scale)
        new_h = int(h_trim * scale)
        # resized = cv2.resize(trimmed_blur, (new_w, new_h), interpolation=cv2.INTER_AREA)
        resized = cv2.resize(trimmed_blur, (new_w, new_h), interpolation=cv2.INTER_NEAREST)

        canvas = np.full((28, 28), 255, dtype=np.uint8)
        x_offset = (28 - new_w) // 2
        y_offset = (28 - new_h) // 2
        canvas[y_offset:y_offset + new_h, x_offset:x_offset + new_w] = resized        

        deskewed = deskew(canvas)

        # モーメントで中心を合わせる（修正: warpAffine に補間法と白背景を明示）
        M = cv2.moments(deskewed)
        if M['m00'] != 0:
            cx = int(M['m10'] / M['m00'])
            cy = int(M['m01'] / M['m00'])
            shift_x = 14 - cx
            shift_y = 14 - cy
            trans_mat = np.float32([[1, 0, shift_x], [0, 1, shift_y]])
            deskewed = cv2.warpAffine(deskewed, trans_mat, (28, 28), flags=cv2.INTER_NEAREST, borderValue=255)

        canvas = deskewed
    else:
        print(f"文字が検出されませんでした: {os.path.basename(image_path)}")
        canvas = np.full((28, 28), 255, dtype=np.uint8)

    # 保存（全角パスにも対応）
    save_path = os.path.join(output_folder, f"{index:04d}.png")
    is_success, encoded_img = cv2.imencode('.png', canvas)
    if is_success:
        encoded_img.tofile(save_path)
        print(f"{save_path} を保存しました。")
    else:
        print(f"{save_path} の保存に失敗しました。")

    index += 1

print("すべての画像の処理が完了しました。")

上のスクリプトで 28×28 ピクセルに整形して保存した大量の学習用データ画像を、次のスクリプトで処理して学習モデルを生成します。こちらについても、万一、コピペして試される場合は PATH をご自身の環境に合わせて変更してください（こちらも使用を推奨するものではありません。あくまでもご参考まで）。

import cv2
import numpy as np
from sklearn import svm
from sklearn.model_selection import train_test_split
import os
import joblib  # モデルの保存と読み込みに使用
from skimage.feature import hog
from sklearn.svm import SVC

# カタカナのクラス
CATEGORIES = ["ア", "イ", "ウ", "エ", "オ"]

# Pathの中の日本語に対応
def imread(filename, flags=cv2.IMREAD_GRAYSCALE, dtype=np.uint8):
    try:
        n = np.fromfile(filename, dtype)
        img = cv2.imdecode(n, flags)
        return img
    except Exception as e:
        print(e)
        return None

# HOG特徴量を抽出する関数
def extract_hog_features(img):
    # 画像はすでに28x28の想定
    features = hog(img,
                   orientations=9,
                   pixels_per_cell=(4, 4),
                   cells_per_block=(2, 2),
                   block_norm='L2-Hys')
    return features

# データセットの準備（28x28 の手書きカタカナ画像）
def load_images_from_folder(folder, categories):
    images = []
    labels = []
    for label, category in enumerate(categories):
        path = os.path.join(folder, category)
        print(f"Processing category: {category}, Path: {path}")

        if not os.path.exists(path):
            print(f"Warning: Path does not exist: {path}")
            continue

        for file in os.listdir(path):
            if file.lower().endswith(('.png', '.jpg', '.jpeg')):
                file_path = os.path.join(path, file)
                try:
                    img = imread(file_path)
                    if img is not None:
                        img = cv2.resize(img, (28, 28))
                        hog_features = extract_hog_features(img)
                        images.append(hog_features)
                        labels.append(label)
                    else:
                        print(f"Failed to load image: {file_path}")
                except Exception as e:
                    print(f"Error loading {file_path}: {e}")
            else:
                print(f"Skipping non-image file: {file}")
    print(f"Loaded {len(images)} images")
    return np.array(images), np.array(labels)

# データ読み込み
X, y = load_images_from_folder(r"C:\Python39-32\Images_tegaki\aiueo\Trimed", CATEGORIES)

if len(X) == 0:
    raise ValueError("No images loaded. Please check the image files and paths.")

# 学習とテストの分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# SVM モデルの作成と学習
model = svm.SVC(kernel='linear')
model.fit(X_train, y_train)

# モデルを保存する
joblib.dump(model, 'katakana_hog_svm_model.pkl')
print("Model saved as 'katakana_hog_svm_model.pkl'")

# 予測用前処理（HOG版）
def preprocess_image(image_path):
    img = imread(image_path)
    h, w = img.shape

    size = max(h, w)
    square_img = np.full((size, size), 255, dtype=np.uint8)
    x_offset = (size - w) // 2
    y_offset = (size - h) // 2
    square_img[y_offset:y_offset + h, x_offset:x_offset + w] = img

    img_resized = cv2.resize(square_img, (28, 28))
    hog_features = extract_hog_features(img_resized)
    return hog_features

def predict_character(image_path):
    img = preprocess_image(image_path)
    model = joblib.load('katakana_hog_svm_model.pkl')
    label = model.predict([img])[0]
    return CATEGORIES[label]

# テスト画像の認識（テスト用の画像は実行中のスクリプトと同じフォルダに用意・保存する）
for image_path in [
    "katakana_sample_a.jpg",
    "katakana_sample_i.jpg",
    "katakana_sample_u.jpg",
    "katakana_sample_e.jpg",
    "katakana_sample_o.jpg"
]:
    result = predict_character(image_path)
    print(f"{os.path.basename(image_path)} の認識結果: {result}")

テストに使用した画像は、次の通りです。文字の太さはテスト用に変化のあるものを選びました。

上記、学習モデルを作成するスクリプトの実行結果です。

３．気分は「写経」

次は、完成した学習モデルをDelphiから使えるようにすれば OK なのですが、この作業は毎回「写経」を行っているような気持ちを感じる作業です。･･･と、言う僕自身、写経の経験は皆無ですが･･･この業界で一般的に使用される「写経」的意味合いと、ここでのそれは異なり、感覚的にはむしろ「修行」に近いものです。

次のコードを見ていただければ、なぜ「修行」なのか、ご理解いただけると思います。

procedure TFormCollaboration.btnAutoClick(Sender: TObject);
var
  strScrList:TStringList;
  strAnsList:TStringList;
  j:integer;
  intCols:integer;
  results: TArray<string>;
  s: string;
begin
  // ･･･ 略 ･･･
  try

    //Scriptを入れるStringList
    strScrList:=TStringList.Create;

    //手書き文字の認識結果
    strAnsList:=TStringList.Create;

    try

      strScrList.Add('import cv2');
      strScrList.Add('import numpy as np');
      strScrList.Add('import os');
      strScrList.Add('from glob import glob');
      strScrList.Add('import re');
      strScrList.Add('from skimage.feature import hog');
      strScrList.Add('import joblib');

      //カタカナラベル
      if (cmbAL.Text = 'ア') or (cmbAL.Text = 'イ') or (cmbAL.Text = 'ウ') or (cmbAL.Text = 'エ') or (cmbAL.Text = 'オ') then
      begin
        strScrList.Add('CATEGORIES = ["ア", "イ", "ウ", "エ", "オ"]');
      end;

      //○×ラベル
      if (cmbAL.Text = '○') or (cmbAL.Text = '×') then
      begin
        strScrList.Add('CATEGORIES = ["○", "×"]');
      end;

      //HOG特徴量抽出
      strScrList.Add('def extract_hog_features(img):');
      strScrList.Add('    features = hog(img, orientations=9, pixels_per_cell=(4, 4), cells_per_block=(2, 2), block_norm="L2-Hys")');
      strScrList.Add('    return features');

      //UTF-8 パス対応の画像読み込み
      strScrList.Add('def imread_utf8(path):');
      strScrList.Add('    stream = np.fromfile(path, dtype=np.uint8)');
      strScrList.Add('    return cv2.imdecode(stream, cv2.IMREAD_COLOR)');

      //傾き補正
      strScrList.Add('def deskew(img):');
      strScrList.Add('    m = cv2.moments(img)');
      strScrList.Add('    if abs(m["mu02"]) < 1e-2:');
      strScrList.Add('        return img.copy()');
      strScrList.Add('    skew = m["mu11"] / m["mu02"]');
      strScrList.Add('    M = np.float32([[1, skew, -0.5 * 28 * skew], [0, 1, 0]])');
      strScrList.Add('    return cv2.warpAffine(img, M, (28, 28), flags=cv2.WARP_INVERSE_MAP, borderValue=255)');

      //ファイル名から数値を抽出（crop_Img12.png → 12）
      strScrList.Add('def extract_number(path):');
      strScrList.Add('    filename = os.path.basename(path)');
      strScrList.Add('    match = re.search(r"crop_Img(\d+)", filename)');
      strScrList.Add('    return int(match.group(1)) if match else float("inf")');

      //文字認識処理
      strScrList.Add('def predict_character(img, model):');
      strScrList.Add('    hog_features = extract_hog_features(img)');
      strScrList.Add('    label = model.predict([hog_features])[0]');
      strScrList.Add('    return CATEGORIES[label]');

      //モデル読み込み
      //カタカナラベル
      if (cmbAL.Text = 'ア') or (cmbAL.Text = 'イ') or (cmbAL.Text = 'ウ') or (cmbAL.Text = 'エ') or (cmbAL.Text = 'オ') then
      begin
        strScrList.Add('model_path = r".\Python39-32\katakana_hog_svm_model.pkl"');
      end;

      //○×ラベル
      if (cmbAL.Text = '○') or (cmbAL.Text = '×') then
      begin
        strScrList.Add('model_path = r".\Python39-32\mb_hog_svm_model.pkl"');
      end;

      strScrList.Add('if not os.path.exists(model_path):');
      strScrList.Add('    raise FileNotFoundError(f"モデルファイルが見つかりません: {model_path}")');
      strScrList.Add('model = joblib.load(model_path)');

      //入力・出力フォルダ
      //strScrList.Add('base_path = r".\imgAuto\src"');
      strScrList.Add('input_folder = r".\imgAuto\src"');
      //strScrList.Add('folder_path = os.path.join(base_path, CORRECT_LABEL)');
      strScrList.Add('output_folder = os.path.join(input_folder, "'+ cmbAL.Text +'")');
      strScrList.Add('os.makedirs(output_folder, exist_ok=True)');

      //対象画像を取得
      strScrList.Add('image_extensions = ["*.jpg", "*.jpeg", "*.png"]');
      strScrList.Add('image_files = []');
      strScrList.Add('for ext in image_extensions:');
      strScrList.Add('    image_files.extend(glob(os.path.join(input_folder, ext)))');
      strScrList.Add('image_files.sort(key=extract_number)');

      strScrList.Add('results = []');

      strScrList.Add('index = 1');
      strScrList.Add('for image_path in image_files:');
      strScrList.Add('    image = imread_utf8(image_path)');
      strScrList.Add('    if image is None:');
      strScrList.Add('        print(f"読み込めない画像: {image_path}")');
      strScrList.Add('        continue');

      strScrList.Add('    h, w = image.shape[:2]');
      strScrList.Add('    gray_for_line = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)');
      strScrList.Add('    edges = cv2.Canny(gray_for_line, 50, 150, apertureSize=3)');

      strScrList.Add('    raw_lines = cv2.HoughLinesP(edges, 1, np.pi / 180, threshold=100, minLineLength=min(w, h) // 3, maxLineGap=10)');
      strScrList.Add('    filtered_lines = []');
      strScrList.Add('    if raw_lines is not None:');
      strScrList.Add('        for line in raw_lines:');
      strScrList.Add('            x1, y1, x2, y2 = line[0]');
      strScrList.Add('            angle = abs(np.arctan2(y2 - y1, x2 - x1) * 180 / np.pi)');
      strScrList.Add('            length = np.hypot(x2 - x1, y2 - y1)');
      strScrList.Add('            if (angle < 10 or angle > 170) and length < w // 2:');
      strScrList.Add('                continue');
      strScrList.Add('            filtered_lines.append([[x1, y1, x2, y2]])');

      strScrList.Add('    if filtered_lines:');
      strScrList.Add('        for line in filtered_lines:');
      strScrList.Add('            x1, y1, x2, y2 = line[0]');
      strScrList.Add('            if abs(x2 - x1) < 10 or abs(y2 - y1) < 10:');
      strScrList.Add('                cv2.line(image, (x1, y1), (x2, y2), (255, 255, 255), thickness=3)');

      strScrList.Add('    if w > h:');
      strScrList.Add('        offset = w // 4');
      strScrList.Add('        cropped = image[:, offset:w - offset]');
      strScrList.Add('    else:');
      strScrList.Add('        offset = h // 4');
      strScrList.Add('        cropped = image[offset:h - offset, :]');

      strScrList.Add('    gray = cv2.cvtColor(cropped, cv2.COLOR_BGR2GRAY)');
      strScrList.Add('    _, thresh = cv2.threshold(gray, 200, 255, cv2.THRESH_BINARY_INV)');

      strScrList.Add('    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (10, 10))');
      strScrList.Add('    dilated = cv2.dilate(thresh, kernel, iterations=1)');
      strScrList.Add('    contours, _ = cv2.findContours(dilated, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)');

      strScrList.Add('    if contours:');
      strScrList.Add('        all_points = np.vstack(contours)');
      strScrList.Add('        x, y, w_box, h_box = cv2.boundingRect(all_points)');

      //strScrList.Add('        padding = 20');
      strScrList.Add('        padding = 5');
      strScrList.Add('        if w > h:');
      strScrList.Add('            x += offset');
      strScrList.Add('        else:');
      strScrList.Add('            y += offset');

      strScrList.Add('        x1 = max(0, x - padding)');
      strScrList.Add('        y1 = max(0, y - padding)');
      strScrList.Add('        x2 = min(w, x + w_box + padding)');
      strScrList.Add('        y2 = min(h, y + h_box + padding)');

      strScrList.Add('        trimmed = image[y1:y2, x1:x2]');
      strScrList.Add('        trimmed_gray = cv2.cvtColor(trimmed, cv2.COLOR_BGR2GRAY)');
      strScrList.Add('        trimmed_blur = cv2.GaussianBlur(trimmed_gray, (3, 3), 0)');

      strScrList.Add('        h_trim, w_trim = trimmed_blur.shape[:2]');
      strScrList.Add('        scale = 20.0 / max(h_trim, w_trim)');
      strScrList.Add('        new_w = int(w_trim * scale)');
      strScrList.Add('        new_h = int(h_trim * scale)');
      strScrList.Add('        resized = cv2.resize(trimmed_blur, (new_w, new_h), interpolation=cv2.INTER_AREA)');

      strScrList.Add('        canvas = np.full((28, 28), 255, dtype=np.uint8)');
      strScrList.Add('        x_offset = (28 - new_w) // 2');
      strScrList.Add('        y_offset = (28 - new_h) // 2');
      strScrList.Add('        canvas[y_offset:y_offset + new_h, x_offset:x_offset + new_w] = resized');

      strScrList.Add('        deskewed = deskew(canvas)');

      strScrList.Add('        M = cv2.moments(deskewed)');
      strScrList.Add('        if M["m00"] != 0:');
      strScrList.Add('            cx = int(M["m10"] / M["m00"])');
      strScrList.Add('            cy = int(M["m01"] / M["m00"])');
      strScrList.Add('            shift_x = 14 - cx');
      strScrList.Add('            shift_y = 14 - cy');
      strScrList.Add('            trans_mat = np.float32([[1, 0, shift_x], [0, 1, shift_y]])');
      strScrList.Add('            deskewed = cv2.warpAffine(deskewed, trans_mat, (28, 28), borderValue=255)');

      strScrList.Add('        canvas = deskewed');
      strScrList.Add('        predicted_char = predict_character(canvas, model)');
      strScrList.Add('        results.append(str(predicted_char))');
      strScrList.Add('    else:');
      strScrList.Add('        results.append("")');
      strScrList.Add('        canvas = np.full((28, 28), 255, dtype=np.uint8)');

      strScrList.Add('    save_path = os.path.join(output_folder, f"{index:04d}.png")');
      strScrList.Add('    is_success, encoded_img = cv2.imencode(".png", canvas)');
      strScrList.Add('    if is_success:');
      strScrList.Add('        encoded_img.tofile(save_path)');
      strScrList.Add('    index += 1');

      strScrList.Add('var1.Value = ";".join(results)');

      try
        PythonEngine1.ExecStrings(strScrList);
      except
        on E: Exception do
        begin
          ShowMessage('Pythonスクリプトの実行中にエラーが発生しました: ' + E.Message);
          Exit;
        end;
      end;

      strAnsList.Clear;

      if Assigned(PythonDelphiVar1) then
      begin
        s := PythonDelphiVar1.ValueAsString;
        if s <> '' then
        begin
          results := SplitString(s, ';');
          for s in results do
            strAnsList.Add(s);
        end else begin
          ShowMessage('sは空欄！');
        end;
      end else begin
        ShowMessage('PythonDelphiVar1 が未定義です');
      end;

      if Assigned(PythonDelphiVar1) then
      begin
        for j := 0 to strAnsList.Count - 1 do
        begin
          if cmbAL.Text = strAnsList[j] then
            StringGrid1.Cells[intCols,j+1] := cmbRendo.Text
          else
            StringGrid1.Cells[intCols,j+1] := '0';
        end;
      end else begin
        ShowMessage('PythonDelphiVar1 が未定義です');
        Exit;
      end;

    finally
      //StringListの解放
      strScrList.Free;
      strAnsList.Free;
    end;

    // ･･･ 略 ･･･
end;

エンエンと続く strScrList.Add( ) そう！ここに Python のスクリプトの１行１行をコピペして行くのです。20 行目くらいから、だんだん、まぶたが重くなり･･･、50 行目まで到達する頃には、意識が朦朧としてきて･･･、残り数行という段階で、~~ほぼ涅槃の境地~~に･･･

「涅槃」とは、「一切の煩悩から解脱した、不生不滅の高い境地」であり、「煩悩の火が消え、人間が持っている本能から解放され、心の安らぎを得た状態のこと」をいうのだそうです。

･･･

失礼しました。間違えました。僕のは単に眠くなり、もう何も考えられない状態になっただけです。

何はともあれ、いずれにしてもそのいちばん心が「無」になった状態で、最大の難関が待ち受けています。それは何かというと、Python 側から Delphi 側への判定結果の受け渡しの手続きの記述です。

元々の Python 側でのスクリプトは･･･

        predicted_char = predict_character(canvas, model)
        print(f"{os.path.basename(image_path)} → 認識結果: {predicted_char}")
    else:
        print(f"{os.path.basename(image_path)} → 文字が検出されませんでした。")

ここを、次のように書き換えます。※ results リストは予め空になるよう初期化しておきます。

      strScrList.Add('        predicted_char = predict_character(canvas, model)');
      strScrList.Add('        results.append(str(predicted_char))');
      strScrList.Add('    else:');
      strScrList.Add('        results.append("")');

最後に Delphi 側へ、プレゼント☆

      strScrList.Add('var1.Value = ";".join(results)');

で、Delphi 側では、results に保存されている認識結果を StringList で受け取って、StringGrid に得点を表示します。

      strAnsList.Clear;

      if Assigned(PythonDelphiVar1) then
      begin
        s := PythonDelphiVar1.ValueAsString;
        if s <> '' then
        begin
          results := SplitString(s, ';');
          for s in results do
            strAnsList.Add(s);
        end else begin
          ShowMessage('sは空欄！');
        end;
      end else begin
        ShowMessage('PythonDelphiVar1 が未定義です');
      end;

      if Assigned(PythonDelphiVar1) then
      begin
        for j := 0 to strAnsList.Count - 1 do
        begin
          if cmbAL.Text = strAnsList[j] then
            StringGrid1.Cells[intCols,j+1] := cmbRendo.Text  //得点を指定
          else
            StringGrid1.Cells[intCols,j+1] := '0';
        end;
      end else begin
        ShowMessage('PythonDelphiVar1 が未定義です');
        Exit;
      end;

もちろん、PATH も、exe のある階層が起点となるように修正して･･･

      //入力・出力フォルダ (cmbAL = ComboBox Answer Label)
      strScrList.Add('input_folder = r".\imgAuto\src"');
      strScrList.Add('output_folder = os.path.join(input_folder, "'+ cmbAL.Text +'")');
      strScrList.Add('os.makedirs(output_folder, exist_ok=True)');

こうして、なんとか、エラーを出さずに、プログラムが「動く」状態にまで仕上げました。

追記_20250421

ふと思ったのですが、Form に非表示の TMemo を１つおいて、そこに Python のスクリプトをコピペして、必要な部分のみ上記のように変更すれば、

もっとラクできたかな･･･

みたいな気が。

でも、「修行」には「修行」で、また、

別の意味と価値がある

ような･･･気も。

ただ、このプログラムの･･･究極の目的は、採点者が単に「ラクする」ためだけの･･･採点環境を実現することにある･･･という事実。

いや、それは「ヒトと機械との美しき協働」の穿った見方。

こんな相反する「矛盾」を、感じるのは作者である僕だけ？

まぁ、全部をまとめて言えば･･･

人生は必ず ± ０になる
ということでしょうか？

なお、Python4Delphi の設定と使い方の詳細は、次の過去記事をご参照ください。

How to use Python4Delphi

早速、冒頭に紹介したのと同じデータを読んで、動作確認。

Delphiへのスクリプト移植前に試行していたので、
あまりドキドキせずに「自動」ボタンをクリックすることができました！

ボタンの Caption は「自動」より、「実行」の方がよかったかな･･･？

気になっていた切り出し画像の縦横比も･･･

縦横比が変化しないようにスクリプトを修正できました！

前回は、正しく読めなかった「ウ」も、この通り読めています。

長かった･･･けれど、ここまで来ることができました☆
あきらめなくて、よかった･･･

イイ感じというか、エエ感じというか･･･

そして、Flattening 特徴量抽出で作成した学習モデルでは読めなかった「オ」･･･ですが、

HOG特徴量抽出で作成した学習モデルは、しっかり読んでくれました！

もちろん、「○・×」判定も･･･余裕でOK！
（何が余裕なのかは、僕自身、わかってないですが）

最初に正解ラベル「○」の場合、

自分的には、HOGで作った学習モデルへの「信頼感」みたいなモノが生まれてきました☆

次に、正解ラベル「×」の場合、

これなら販売できそうです。
まぁ買ってくれる人は、
いないと思いますが･･･ *(^_^)*♪

４．今後の抱負

テストとは、とても言えないような、ほんとうに取り急ぎの採点試行結果ですので、これだけを持って公開してOK！とは、とても思えません。実際の採点現場で性能を確認できたら、自作のデジタル採点ソフト AC_Reader のバージョンアップ版として、この blog の未来記事で公開したいと思います。

５．まとめ

手書き文字認識に scikit-learn を使って成功するためには･･･

（１）特徴量抽出前の学習データ作成を丁寧に行い、機械学習しやすい環境を整える。
（２）学習データが同じである場合、Flattening より HOG 特徴量抽出の方が良い結果を出せた。
（３）誤りがあれば必ず修正し、成功するまで、絶対にあきらめないこと。

６．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。記載した内容（プログラムコードを含む）を利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

デジタル採点　手書き　フリー　で検索したら

久しぶりに、上のキーワードで Google 検索して、びっくりしました。
なんと！検索結果の･･･いちばん上に！･･･僕のプログラムが、表示されてる･･･

(⊙_⊙)

正直。うれしいより先に

やばい！

・・・と、思いました。

（何ページ目くらいに表示されるのかなー☆ ）

本当に、それが、これまでに何度も、何回も繰り返した、僕の blog を Google 検索する時の想い。

（誰か、見てくれないかなー。読んでもらえたら、うれしいなー☆ ）

だから、３ページ目くらいに記事があると、「うん。うん。」って、安心してた･･･。

blog を書くこと自体が、自分の存在確認の行為に他ならないのだけれど･･･

これは本当に思い上がりとか、謙遜とか、そのどちらでもなく･･･

普通に考えて･･･

僕の blog とプログラムが
Google の検索結果で
トップに表示されるわけがない。

どう考えても、それが僕のいる世界の「本当」･･･のはず、なのに･･･
突然！目の前に表示された「画面」という現実を、それでもなお、信じられない気持ちで、眺めつつ。

夢なら覚めないでほしい

そう思ったのも、また、事実です。

この２年間の日々は、色々な意味で、ほんとうに、本当に、苦しかった･･･。

人の立場の違いは、その評価をも、真逆に変える。

あの日、拍手で歓迎されたプログラムが、ただのゴミ以下になる･･･

僕は、そのほんとうを･･･確かに、この目で、見ました。

失意のどん底にある僕を支えてくださった多くの方々に、心から感謝申し上げます。

だから、Google 先生の、僕の blog とプログラムへの評価は、世の中が僕の夢を応援してくれている証明のように思えて、「やばい」と思ったのは本当ですが、やはり、とても、うれしかったのです。

で、問題は「やばい」と感じた理由･･･そう、今回の記事を書くきっかけです。

２年前、同僚の要請に応えるかたちで、手書き答案をスキャンして得た画像から個々の解答欄画像を切り出して一括採点し、採点記号その他を付加して元の画像に書き戻すデジタル採点プログラムの最初のバージョンを書き、「表形式」の解答欄を読み取って処理するので「Answer Column Reader = AC_Reader」と名付けたのですが･･･

その時点で、プロの書いたデジタル採点システムにあって、僕のプログラムにないもの･･･

そう「○・×」、「ア・イ・ウ・エ・オ」、「A・B・C」、「１・２・３」みたいな記号・文字または数字１字の解答であれば自動採点できる機能を僕のプログラムにも搭載したいと、僕はごく自然な流れで考えたのです。

当時、年末・年始の休暇を含めて、ほぼ２か月間、手書き文字の認識に没頭した記憶があります。

その記録は当 blog の過去記事にある通りです。

Get first character from string in image

Recognize handwritten katakana characters

Recognize handwritten katakana characters No,2

Recognize handwritten katakana characters No,3

Recognize handwritten katakana characters No,4

いずれも、他人様の実験結果を、ただ真似しただけの、読むに値しない記事ですが･･･

生成 AI なんてまだなかったあの頃･･･（知らないところで、それは･･･ほぼ出来上がりつつあったのだろうけれど･･･。そう、考えると同時期にレベルの差はあれど、まったく同じ研究をやったと言うことで、たまらなく誇らしいような、いや、それはただの偶然の一致で･･･一方は AI というカタチで見事にモノになり、僕のは無駄な努力で終わり･･･もし、プログラムが当時のまま、今後進化しないのであれば･･･みたいな複雑な気持ちではありますが）、いずれにしても、その時、僕は Google 先生を頼りに『機械学習の真似事』を行い、右も、左も、わからないまま、結局 keras や Lobe のお近づきになれたよーな･･･なれなかったよーな･･･

日々を過ごしたことだけは、事実。（ 2022年、春）

で、結論だけ言うと、お遊び程度に使える自動採点機能を搭載したプログラムが書けました。･･･ただ、書けたことは書けたのですが、使用したライブラリが TensorFlow で、これには 32 ビット版がなく、仕方がないからプログラムは無理して 64 ビット化して作成。

その結果、 AC_Reader に同梱して使うその他のプログラム（ My マークシートリーダー = MS_Reader.exe 等）が 32 ビット版であること、つまり、内部で共通に呼び出して使っている Embeddable Python も 32 ビット版であることから、 AC_Reader と My マークシートリーダーとが共存するには Embeddable Python を共用しなければならないというところが大問題に。結局、64 ビット版の AC_Reader は使用を断念。版を 32 ビットに戻すと同時に、64 ビット版の AC_Reader に搭載した自動採点機能は、32 ビット版で泣く泣く削除。

あれから２年間。AC_Reader は、ほぼ、放置状態。

（表計算ソフトを使わずに、成績一覧表を出力できるようにする等、採点に伴う作業を軽減できるよう、付属的なプログラムを新たに作成すると言った、おまけ的な面で多少の改善は加えましたが、手書き答案の採点という、本業面での進化は、よく使う機能を集めてフローティングパネル化した程度）

そう、せっかく Google 先生が評価してくれたのに、プログラム本体が２年間まったく進化していないことが、心から「やばい」と感じた理由なのです。

苦しかった、この２年間を、その理由にしてはいけないのですが･･･

それでも、僕を支えてくださった方々の要望には、何としても応えたいという思いがあり･･･

必死の思いで、過去記事「組み合わせ採点を実現したい！」に書いた内容を組み込んだ答案返却用答案（？）を作成・印刷する新しいプログラムを書き、採点現場での実地テストを無事終え、そちらを「ReportCard_2025」として公開すべく、準備を進めていたのですが、先に書いた検索結果を目の当たりにして、こちらをいったん中止。

AC_Reader を２年ぶりに進化させることに決めました。
内容はもちろん、自動採点機能の搭載です。

【もくじ】

１．32ビット版で自動採点機能を搭載できないか？
２．Tesseract-OCR を使う
３．scikit_learnを使う
　(1) Embeddable Python へのインストール
　(2) 学習モデルを作成して認識テスト
４．とんでもない認識結果に驚愕する
５．まとめ
６．お願いとお断り

１．32ビット版で自動採点機能を搭載できないか？

Delphi もバージョン 12.3 では「 RAD Studio 12 ( 64-bit Initial Release ) 」がついに登場。機械学習の現場でも 64 ビット化はさらに加速しつつあり、今更、32 ビットにこだわる必要などないと自分でも思うし、64ビット化の流れに反対する気持ちなどまったくないのですが･･･

ただ、これまでに書いてきたプログラムをすべて64ビット化するのは大変だし、その前に、32 ビット版に今すぐできる改良があるなら、それを行えば、より良いものをユーザーに提供できる可能性が 32 ビット版のプログラムにも、まだ残されている気がして･･･

「より良いもの」･･･それこそが 32 ビット版 AC_Reader への自動採点機能の搭載だと思いました。

あれから２年経過して、手書き文字認識や機械学習のプログラム自体も相当進化しているのではないかと考え、まず、思い出したのは Tesseract-OCR です。

２．Tesseract-OCR を使う

他にも思い出せるモノはたくさんあったんだけど、機械学習系は手書き文字の認識の前に、大量のデータを集めてトレーニングして･･･といった学習（の手間）が必要なので、そういった手間のいらないところから搭載の可否を探ろうと思ったわけです。「寄らば大樹の陰･･･」みたいな。

手書き文字でない、既存の TrueType 日本語フォントに対してなら、Tesseract-OCR がどれほど素晴らしい性能を発揮するか、それは２年前に目の当たりにしています。ただ、残念ながら、手書き文字の認識といった部分では、２年前はお世辞にも良好とは言えなかったと記憶しています。

早速、最新版（？）をダウンロード（ tesseract-ocr-w32-setup-v5.3.0.20221214.exe ：これより新しい 32 bit版は探せなかった）して、実験してみました。日付が、ちょっと古いのが気になりましたが。もしかして、２年前もコレで実験した？みたいな感が･･･。

手書き文字は、次のような実験用サンプルを700個（すべて「ア」の画像）ほど用意。

実験に使った Python スクリプトは、コレ！
画像から抽出する文字は「アイウエオ」の中の１字。画像が「ア」であると判定すれば「ア」を出力、「アイウエオ」のいずれでもない（＝判定不能である）場合は「N」を出力する。

import cv2
import pytesseract
import re
import os

# Tesseract-OCRのパス設定
pytesseract.pytesseract.tesseract_cmd = r"C:\Python39-32\Tesseract-OCR\tesseract.exe"

def preprocess_image(image_path):
    """ 画像を前処理してOCRに適した状態にする """
    # グレースケール化
    image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
    # 二値化  
    _, binary = cv2.threshold(image, 128, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)  
    return binary

def extract_katakana(image):
    """ OCRでカタカナを認識する """
    custom_oem_psm = "--oem 3 --psm 10 -l jpn"
    text = pytesseract.image_to_string(image, config=custom_oem_psm)

    # カタカナ1文字のみを抽出
    # match = re.search(r'[アイウエオ]', text)
    return match.group(0) if match else "N"

def process_images_in_folder(folder_path):
    """ 指定フォルダ内のすべての画像を処理 """
    image_extensions = (".png", ".jpg", ".jpeg", ".bmp", ".tif", ".tiff")
    for filename in os.listdir(folder_path):
        # 画像ファイルのみ処理
        if filename.lower().endswith(image_extensions):  
            image_path = os.path.join(folder_path, filename)
            processed_image = preprocess_image(image_path)
            result = extract_katakana(processed_image)
            print(f"{filename}: OCR結果 -> {result}")

if __name__ == "__main__":
    # 画像が入っているフォルダのパス
    folder_path = "Images_Tegaki\img1_a"  
    process_images_in_folder(folder_path)

結果は次の通り。

画像は、全部カタカナの「ア」なんだけどなー。
「N」はともかく、なんで「イ」があるのかなー？

全体の集計では･･･

正解率は 23.3 ％･･･

ただ、「ウ・エ・オ」はありませんでした。そこで･･･

match = re.search(r'[ア]', text)

「ア」１文字で勝負してみました。結果はまったく同じでありました！

よくよく考えれば、同じ文字認識アルゴリズムで「ア」を判定しているのですから、これは当然です。

64 bit バージョンの方は最新版が「最近の日付」でしたから、これより良い結果が得られる可能性があるような気がしますが、僕が使いたい 32 bit バージョンに限っての話をしていますので、この時点で手書き文字の認識に Tesseract-OCR の 32 bit バージョンを使用するか、否か、という問題は、はっきり「否」と答えが出ました。

過去の記事にも書きましたが、これは「手書き文字の認識（それも「ア」１文字）」に限った話であり、他のカタカナ文字については実験もしておりませんし、これを持って、Tesseract-OCR 32 bit バージョンの総合的な「手書き文字」を認識する性能を否定する意図はまったくありません。

日本語 TrueType フォントの書体であれば、Tesseract-OCR は十分実用的な精度で文書をテキスト化してくれる素晴らしいプログラムです！！

３．scikit_learnを使う

(1) Embeddable Python へのインストール

次に思い出したのが keras だったのですが、２年前の実験における手書きカタカナ文字「アイウエオ」の認識率は 95 ～ 97 ％程度（文字によって差がある）で、これ以上はどう頑張ってもダメだった記憶が同時に蘇り･･･

AI に聞いてみると、「 keras も進化してます！」とのことでしたが、ここで、ふと、思い立ち、

「 32 bit で動作するプログラムで、手書き文字認識が可能な Python で動作するオープンソースの機械学習ライブラリは何？」と尋ねてみると･･･

scikit-learn です！

･･･との答えがトップに表示されました。

（ scikit-learn ･･･）

scikit-learn は２年前にも試していません。名前は聴いたことがあったような気がしますが･･･

AI の説明には、心揺さぶられるような文言が並び！！！

曰く、軽量で依存が少ない。
曰く、古いマシンでも動作しやすい。

さらに･･･

「SVM（サポートベクターマシン）などでの文字認識は、軽量で精度も悪くないです。」

とのこと。

サポートベクターマシンってのが、よくわからなかったので、さらに質問して見ると･･･

「サポートベクターマシン（SVM：Support Vector Machine）」は、分類や回帰に使える機械学習のアルゴリズムの一種で、scikit-learn が得意なことは、「はっきりと分けられる2つのクラス分類」であるとのこと。まさに「手書き文字認識」のためにあるようなライブラリ。何で２年前、scikit-learn を試さなかったのか･･･。後悔先に立たず。試さなかった事実は事実。それは認めるしかありません。でも、今、僕は、まだ、生きていて、あの頃は読めなかった AI のアドバイスを、今、読んでる･･･

「他のライブラリにほぼ依存せず、古いPCでも動き、軽量で、精度も悪くない。」

だんだん、だんだん、生成 AI の言うことを信じて、動かしてみたい気になってきました☆

※ ちなみに「回帰」もわからなかったので調べて見ると、「回帰（Regression）」は、予測したい結果が “数値” のときに使う機械学習の手法であるとのこと。「分類（Classification）とセットでよく出てくる」言葉なんだそうです。確かに、どこかで何度も目にしたことがあるような･･･。今、僕がやりたいのは「分類（Classification）」の方ですが、大変、勉強になりました！！

とりあえず、scikit-learn を入手して、それをインストールしなければ話は始まらない。

scikit-learn をインストールする予定の Embeddable Python を入れた Python39-32 フォルダをデジタル採点関係のプログラムを保存しているフォルダから、C:¥へコピーする。

ちなみに Python39-32 の 39 は Python のバージョン、32 は 32 bit 版という意味です。

なんでそんなことをしたかというと、Pathを短くするため。Python関連のプログラムをいじる時は、コマンドプロンプトで作業するのでPathが出来るだけ短い方が作業しやすいのです。

そうしておいて、AI の力を借りて、scikit-learn の 32 bit 版を探します。（実際にはここでかなりの時間を loss しているのですが）その結果わかったことは「通常の pip install scikit-learn でのインストールは 32ビット環境では失敗することが多い」ということ。なので、より確実にインストール可能なWindows用ホイールファイル（＝拡張子が whl のファイル）を探すことにしました。

【参考】Windows用ホイールファイル（.whl）
Pythonで使用されるパッケージ形式のひとつ。Pythonのライブラリやモジュールを効率的にインストールできるファイルで、次の特徴がある。

・事前にビルドされたパッケージなので、必要なコードや依存関係がすべて含まれている。
・ソースコードをビルドする必要がないため、Windows 環境でのインストールが簡単になる。
・pip でインストールできる。
 例: pip install scikit_learn-0.24.2-cp39-cp39-win32.whl

予想通り、世の中は 64 bit 版へ移行しつつあり、scikit-learn の 32 bit 版の最新版は「2021年4月28日」の日付がある「scikit_learn-0.24.2-cp39-cp39-win32.whl」のようです（違うかもしれません）。

以下、実際に僕が行ったインストール作業の様子です。

cp39 だから Python3.9.X に対応しており、win32 だから 32 bit 対応版であることがわかります。検索したらいちばん上に「 Pypl 」の「 scikit-learn 0.24.2 」が表示されました。リンクをたどって、https://pypi.org/project/scikit-learn/0.24.2/ へ行き、さらにページの左側にある「ファイルをダウンロード」をクリックしてダウンロードページへ行き、Built Distributions の上から２番目に目的の「scikit_learn-0.24.2-cp39-cp39-win32.whl」を発見。これをダウンロードして、Python39-32 フォルダへコピー。

コマンドプロンプトを起動していちばん最初に行うことは、この場合、pip のアップデートです。Embeddable Python に Numpy や OpenCV をインストールした時、Embeddable Python で pip を使う方法の詳細なメモを残しておいたので、それを見ながら作業を進めます。

C:\>cd Python39-32

C:\Python39-32>python -m pip install --upgrade pip
Requirement already satisfied: pip in c:\python39-32\lib\site-packages (22.3.1)
Collecting pip
  Using cached pip-25.0.1-py3-none-any.whl (1.8 MB)
Installing collected packages: pip
  Attempting uninstall: pip
    Found existing installation: pip 22.3.1
    Uninstalling pip-22.3.1:
      Successfully uninstalled pip-22.3.1
  WARNING: The scripts pip.exe, pip3.9.exe and pip3.exe are installed in 'C:\Python39-32\Scripts' which is not on PATH.
  Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.
Successfully installed pip-25.0.1

僕のはもう設定してあるから、次の作業は不要だけれど、必要な方がいるかもしれないので参考までに書くと･･･まずは、Embeddable Python で pip を使えるようにする方法。

デフォルトの python.exe では import site が無効になっているため、外部ライブラリをインポートできない。

解決策: python._pth を編集する
    python._pth（python.exe と同じフォルダにある）を開く
    #import site のコメントアウトを解除（# を削除）

# python36.zip
# ./DLLs
# ./Lib
# ./Lib/site-packages
import site  # ← コメントアウトを外す
# Uncomment to run site.main() automatically

さらに、pip を有効化するために次の作業も行う。

pip は Embeddable Python には入っていないので、次の方法で pip を使えるようにする。

(1) get-pip.py をダウンロード
    get-pip.py を 公式サイト（https://bootstrap.pypa.io/get-pip.py）からダウンロード
    C:\Python39-32（僕の場合） に配置

(2) pip をインストール
C:\Python39-32\python.exe get-pip.py

(3) pip でライブラリをインストール
C:\Python39-32\python.exe -m pip install requests

あと、環境変数を設定するには･･･

set PYTHONHOME=C:\Python39-32
set PYTHONPATH=C:\Python39-32\Lib
C:\Python-Embed\python.exe XXX.py  # <-Pythonスクリプトの実行

ここまで行えば、pip が使えるので、ダウンロードした scikit_learn-0.24.2-cp39-cp39-win32.whl のインストールが可能になる。

後で Python スクリプトも実行するので、環境変数の設定も行いつつ･･･

C:\Python39-32>set PYTHONHOME=C:\Python39-32
C:\Python39-32>set PYTHONPATH=C:\Python39-32\Lib
C:\Python39-32>set PYTHONPATH=C:\Python39-32\Scripts  # <-効いてない気がするが･･･

ただ、ここでいきなり scikit_learn をインストールしようとすると失敗します。

C:\Python39-32>python.exe -m pip install C:\Python39-32\scikit_learn-0.24.2-cp39-cp39-win32.whl
Processing c:\python39-32\scikit_learn-0.24.2-cp39-cp39-win32.whl
Requirement already satisfied: numpy>=1.13.3 in c:\python39-32\lib\site-packages (from scikit-learn==0.24.2) (1.21.5)
Collecting scipy>=0.19.1 (from scikit-learn==0.24.2)
  Using cached scipy-1.13.1.tar.gz (57.2 MB)
  Installing build dependencies ... done
  Getting requirements to build wheel ... done
ERROR: Exception:
Traceback (most recent call last):
  File "C:\Python39-32\lib\site-packages\pip\_internal\cli\base_command.py", line 106, in _run_wrapper
    status = _inner_run()
  File "C:\Python39-32\lib\site-packages\pip\_internal\cli\base_command.py", line 97, in _inner_run
    return self.run(options, args)
  File "C:\Python39-32\lib\site-packages\pip\_internal\cli\req_command.py", line 67, in wrapper
    return func(self, options, args)
  File "C:\Python39-32\lib\site-packages\pip\_internal\commands\install.py", line 386, in run
    requirement_set = resolver.resolve(
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\resolver.py", line 95, in resolve
    result = self._result = resolver.resolve(
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 546, in resolve
    state = resolution.resolve(requirements, max_rounds=max_rounds)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 427, in resolve
    failure_causes = self._attempt_to_pin_criterion(name)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 239, in _attempt_to_pin_criterion
    criteria = self._get_updated_criteria(candidate)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 230, in _get_updated_criteria
    self._add_to_criteria(criteria, requirement, parent=candidate)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\resolvers.py", line 173, in _add_to_criteria
    if not criterion.candidates:
  File "C:\Python39-32\lib\site-packages\pip\_vendor\resolvelib\structs.py", line 156, in __bool__
    return bool(self._sequence)
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\found_candidates.py", line 174, in __bool__
    return any(self)
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\found_candidates.py", line 162, in <genexpr>
    return (c for c in iterator if id(c) not in self._incompatible_ids)
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\found_candidates.py", line 53, in _iter_built
    candidate = func()
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\factory.py", line 187, in _make_candidate_from_link
    base: Optional[BaseCandidate] = self._make_base_candidate_from_link(
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\factory.py", line 233, in _make_base_candidate_from_link
    self._link_candidate_cache[link] = LinkCandidate(
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\candidates.py", line 304, in __init__
    super().__init__(
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\candidates.py", line 159, in __init__
    self.dist = self._prepare()
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\candidates.py", line 236, in _prepare
    dist = self._prepare_distribution()
  File "C:\Python39-32\lib\site-packages\pip\_internal\resolution\resolvelib\candidates.py", line 315, in _prepare_distribution
    return preparer.prepare_linked_requirement(self._ireq, parallel_builds=True)
  File "C:\Python39-32\lib\site-packages\pip\_internal\operations\prepare.py", line 527, in prepare_linked_requirement
    return self._prepare_linked_requirement(req, parallel_builds)
  File "C:\Python39-32\lib\site-packages\pip\_internal\operations\prepare.py", line 642, in _prepare_linked_requirement
    dist = _get_prepared_distribution(
  File "C:\Python39-32\lib\site-packages\pip\_internal\operations\prepare.py", line 72, in _get_prepared_distribution
    abstract_dist.prepare_distribution_metadata(
  File "C:\Python39-32\lib\site-packages\pip\_internal\distributions\sdist.py", line 56, in prepare_distribution_metadata
    self._install_build_reqs(finder)
  File "C:\Python39-32\lib\site-packages\pip\_internal\distributions\sdist.py", line 126, in _install_build_reqs
    build_reqs = self._get_build_requires_wheel()
  File "C:\Python39-32\lib\site-packages\pip\_internal\distributions\sdist.py", line 103, in _get_build_requires_wheel
    return backend.get_requires_for_build_wheel()
  File "C:\Python39-32\lib\site-packages\pip\_internal\utils\misc.py", line 702, in get_requires_for_build_wheel
    return super().get_requires_for_build_wheel(config_settings=cs)
  File "C:\Python39-32\lib\site-packages\pip\_vendor\pyproject_hooks\_impl.py", line 196, in get_requires_for_build_wheel
    return self._call_hook(
  File "C:\Python39-32\lib\site-packages\pip\_vendor\pyproject_hooks\_impl.py", line 402, in _call_hook
    raise BackendUnavailable(
pip._vendor.pyproject_hooks._impl.BackendUnavailable: Cannot import 'mesonpy'

最初にコレを見たときはマジ泣きたくなりました･･･ T_T

いろいろ調べて見ると、どうやら最後に出てくる MesonPy に原因があるらしいことがわかりました。と、言うのは、scikit_learn と同時にインストールされる scipy には mesonpy というビルドツールが必要で、それが 32ビット環境では動作しないことがエラーの原因とのこと。どうやら MesonPy は 32 bit 版に対応していないようです。じゃあ、どうするかと言うと、最初に scipy を単体でインストールします。

次のサイトにアクセスし、Python 3.9 (32bit) 対応の scipy の .whl をダウンロードします。

https://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy

上のサイトに「scipy-1.9.0-cp39-cp39-win32.whl」があったので、これをダウンロードして、Python39-32 フォルダへコピー。で、pip を使ってインストールします。

C:\Python39-32>python.exe -m pip install C:\Python39-32\scipy-1.9.0-cp39-cp39-win32.whl
Processing c:\python39-32\scipy-1.9.0-cp39-cp39-win32.whl
Requirement already satisfied: numpy<1.25.0,>=1.18.5 in c:\python39-32\lib\site-packages (from scipy==1.9.0) (1.21.5)
Installing collected packages: scipy
Successfully installed scipy-1.9.0

次に scikit_learn をインストール。

C:\Python39-32>python.exe -m pip install C:\Python39-32\scikit_learn-0.24.2-cp39-cp39-win32.whl
Processing c:\python39-32\scikit_learn-0.24.2-cp39-cp39-win32.whl
Requirement already satisfied: numpy>=1.13.3 in c:\python39-32\lib\site-packages (from scikit-learn==0.24.2) (1.21.5)
Requirement already satisfied: scipy>=0.19.1 in c:\python39-32\lib\site-packages (from scikit-learn==0.24.2) (1.9.0)
Collecting joblib>=0.11 (from scikit-learn==0.24.2)
  Downloading joblib-1.4.2-py3-none-any.whl.metadata (5.4 kB)
Collecting threadpoolctl>=2.0.0 (from scikit-learn==0.24.2)
  Downloading threadpoolctl-3.6.0-py3-none-any.whl.metadata (13 kB)
Downloading joblib-1.4.2-py3-none-any.whl (301 kB)
Downloading threadpoolctl-3.6.0-py3-none-any.whl (18 kB)
Installing collected packages: threadpoolctl, joblib, scikit-learn
Successfully installed joblib-1.4.2 scikit-learn-0.24.2 threadpoolctl-3.6.0

ちょっとたいへんだったけど、これでなんとか、scikit_learn の 32 bit 版が Embeddable Python にインストールできました！！（ Python39-32 フォルダのサイズが 335 MB になっちゃったけど、これだけはもうどうにもならない。ちなみに Tesseract-OCR を入れた場合は、その倍くらいになりました！）

(2) 学習モデルを作成して認識テスト

２年前の手書きカタカナ文字認識チャレンジで使った手書きカタカナ文字の画像ファイルは、壊れたノートパソコンから取り外した SSD を専用ケースに入れて作った外付け SSD ドライブに保存してあります。

その SSD ドライブ内を検索し、テストで使えそうな画像ファイルを探すと、ア・イ・ウ・エ・オの各文字がほぼ 700 字ずつ、フォルダに分類されて保存されているのを見つけることができました。

（あった。コレだ ☆ ）

記憶では「水増し」して 3000 文字くらいずつ集めたフォルダもあったはずですが、文字数が増えれば増えるほどコピーに時間がかかります。それに、いきなり 3000 文字を機械学習させて結果が失敗だったら、その後、打つ手がなくなってしまう･･･。だから、とりあえず、この 700 字でテストしてみようと考えました。

２年前は手書きカタカナ文字の収集や整理に膨大な時間を要しましたが、今回は「それがない」から、何の苦労もなく仕事はスイスイ進みます。

scikit_learn の学習モデルを作成するスクリプトに合うよう、画像ファイルを入れたフォルダを準備して学習モデルを作成しました。そのスクリプトがコレです。

import cv2
import numpy as np
from sklearn import svm
from sklearn.model_selection import train_test_split
import os
import joblib  # モデルの保存と読み込みに使用

from sklearn.svm import SVC  # SVMにクラスの重みを追加することで、少数派クラスに対して重みを高く設定

# カタカナのクラス（修正: 「ア」を追加）
CATEGORIES = ["ア", "イ", "ウ", "エ", "オ"]

# Pathの中の日本語に対応
def imread(filename, flags=cv2.IMREAD_GRAYSCALE, dtype=np.uint8):
    try:
        n = np.fromfile(filename, dtype)
        img = cv2.imdecode(n, flags)
        return img
    except Exception as e:
        print(e)
        return None

# データセットの準備（28x28 の手書きカタカナ画像）
def load_images_from_folder(folder, categories):
    images = []
    labels = []
    for label, category in enumerate(categories):
        path = os.path.join(folder, category)  # パスの結合方法を修正
        print(f"Processing category: {category}, Path: {path}")  # デバッグ用に出力

        # ディレクトリが存在するか確認
        if not os.path.exists(path):
            print(f"Warning: Path does not exist: {path}")
            continue

        for file in os.listdir(path):
            # ファイルが画像であるかどうかを拡張子でチェック
            if file.lower().endswith(('.png', '.jpg', '.jpeg')):
                file_path = os.path.join(path, file)
                # print(f"Trying to load file: {file_path}")  # 読み込みファイルのパスを表示
                try:
                    # カタカナを含むパスが問題ないかを確認
                    # img = cv2.imread(file_path, cv2.IMREAD_GRAYSCALE)
                    img = imread(file_path)
                    if img is not None:
                        img = cv2.resize(img, (28, 28))
                        images.append(img.flatten())  # 1次元化
                        labels.append(label)
                    else:
                        print(f"Failed to load image: {file_path}")
                except Exception as e:
                    print(f"Error loading {file_path}: {e}")
            else:
                print(f"Skipping non-image file: {file}")
    print(f"Loaded {len(images)} images")
    return np.array(images), np.array(labels)

# データ読み込み
X, y = load_images_from_folder(r"C:\Python39-32\Images_tegaki\img_28", CATEGORIES)
X = X / 255.0  # 正規化

# データがロードされていない場合にエラーを出す
if len(X) == 0:
    raise ValueError("No images loaded. Please check the image files and paths.")

# 学習とテストの分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# SVM モデルの作成と学習
model = svm.SVC(kernel='linear')
model.fit(X_train, y_train)

# SVM モデルの作成と学習（クラスの重みを設定する）
# class_weights = {0: 1, 1: 2, 2: 2, 3: 1, 4: 1}  # イとウの重みを増やす
# model = SVC(kernel='linear', class_weight=class_weights)
# model.fit(X_train, y_train)

# モデルを保存する
joblib.dump(model, 'katakana_svm_model.pkl')
print("Model saved as 'katakana_svm_model.pkl'")

# 予測関数
def preprocess_image(image_path):
    img = imread(image_path)
    h, w = img.shape

    # 正方形になるように余白を追加
    size = max(h, w)
    square_img = np.full((size, size), 255, dtype=np.uint8)  # 背景を白に
    x_offset = (size - w) // 2
    y_offset = (size - h) // 2
    square_img[y_offset:y_offset + h, x_offset:x_offset + w] = img

    # 28x28 にリサイズ
    img_resized = cv2.resize(square_img, (28, 28))
    return img_resized.flatten() / 255.0

def predict_character(image_path):
    img = preprocess_image(image_path)
    model = joblib.load('katakana_svm_model.pkl')  # 学習したモデルをロード
    label = model.predict([img])[0]
    return CATEGORIES[label]

# テスト画像の認識ア
image_path = "katakana_sample_A.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

# テスト画像の認識イ
image_path = "katakana_sample_I.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

# テスト画像の認識ウ
image_path = "katakana_sample_U.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

# テスト画像の認識エ
image_path = "katakana_sample_E.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

# テスト画像の認識オ
image_path = "katakana_sample_O.jpg"
result = predict_character(image_path)
print(f"認識結果: {result}")

このスクリプトで学習モデルを作成し、最後に別に用意したテスト画像を認識させてみました。

「ア・イ・オ」は、いっしょに暮らしている人が、
「エ・ウ」は、僕が書いた手書きカタカナ文字。

結果は、とても不思議なことに「ア・エ・オ」は正しく読み取りましたが、「イ・ウ」を間違えてしまって、なんだか Python に混乱が生じているような感じ。

そこで行ったことが学習する際の重み付けの変更。その跡が上のスクリプトの赤字となっています。

で、重み付けを変更して（イ・ウの重みを増加させて）新たに学習モデルを作成し、テストしてみましたが結果は第１回目と同様。「ア・エ・オ」は正しく読み取りますが、「イ・ウ」を間違えてしまいます。

何気なく「アイウエオ」の各文字を保存したフォルダを開けて見て、ようやく原因が判明。なんと「ウ」のフォルダ内に「ウ」はなく、「イ」が溢れかえって･･･

つまり、コピーする際、僕が間違えて･･･

うぎゃ！Zoräth ✷ fel∅, ∞’ka selenïv! ⧖ Trål’xon que！

(T▽T;) やっちまったぁ！！

手書きカタカナ文字を正しく分類し直して、再度、機械学習を実行し、学習モデルを作成。

今度は･･･

４．とんでもない認識結果に驚愕する

次に、学習用に使った「アイウエオ」各 700 文字で読み取りテストをやってみました。できれば、学習用に使ってない文字がよかったんだけど、残念ながらそれはないので、学習用素材でテストを強行。

各文字の認識率は、次の通り。

まず、「ア」

次、「イ」

次、「ウ」

次、「エ」

次、「オ」

事前に学習に使ってるから、ある意味「不正行為」と言えなくもないんだけど･･･

これなら手書き文字認識に
十分、使えるのでは
ないでしょうか？

さぁ AC_Reader の改造だ！

５．まとめ

・scikit-learn で作成した学習モデルは、宝物になりそうだ☆☆☆

６．お願いとお断り

デジタル採点 All in One !

これまでに書いてきたデジタル採点プログラムをひとつにまとめました！

「AC_Reader」は、手書き答案のデジタル採点に、「MS_Reader」は、マークシート形式の試験のデジタル採点に、それぞれ使用します。

「ReportCard_2024」は、「AC_Reader.exe」及び「MS_Reader.exe」と連携して動作するプログラムで、受験者へのデジタル採点の採点結果を通知する個票及び採点者用の成績一覧表を作成することが出来ます。

「デジタル採点 All in One! 」では、３通りのデジタル採点の実行と、受験者に採点結果を通知する個票及び成績一覧表の作成が可能です。その概要は次の通りです。

１．マークシートの読み取りとデジタル採点
２．手書き答案のデジタル採点（縦書き・横書き、両方の答案に対応）
　　・Version 3.0.0 より自動採点機能を追加（最新版は Version 3.1.1）
３．マークシートと手書きを併用した試験のデジタル採点

ただ、プログラミングには素人である筆者が作成したプログラムですので、使いにくいのはもちろんのこと、未発見の不具合もまだきっとあると思います･･･が、掲載したプログラムはすべて「実際に採点の現場で使用」し、動作確認を行ったもので、その際に発見できた不具合はすべて修正してあります。したがって、筆者の想定する範囲内での運用であれば、確実に動作するはずですが、ご使用に際しては事前に必要十分な試行・動作確認を行っていただけますよう、心からお願い申し上げます。

掲載したプログラムは、何の保証もサポートもありませんが、すべて無料でお使いいただけます。ただし、ご使用に際しては、完全に自己責任での運用をお願いいたします。ここに記載した内容及びダウンロードしたプログラムを利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

プログラムは今後も改良し続け、掲載したプログラムは随時改良版に更新する予定です。
見た目も、内容も不出来なプログラムですが、万一にでも、使ってくださった方の採点業務のご負担の軽減に貢献できましたなら、私にとって、それは何よりの喜びです。

プログラムのダウンロード（ZIPファイル）

デジタル採点 All in One !

1 ファイル 108.52 MB

ダウンロード

【更新履歴】

【ご案内】

アプリケーション（特に手書き答案の採点補助プログラム： AC_Reader.exe ）の初回起動時、Anti-Virus Software による『未知バイナリの初回スキャン』が OS 側で実行されます。このため、初回起動時に限り、２～３分程度（私の環境での実測値は２分５秒） PC が待機状態になります。また、自動採点機能の初回使用時にも十数秒程度（私の環境での実測値は15秒）の待機状態が発生します。

2025年8月26日のアップデートでは、ユーザー体験を向上させるため、スキャン対象となる .pyd ファイルをアプリケーション起動時に全て読み込み、スプラッシュフォームの表示中にAnti-Virus Software による『未知バイナリの初回スキャン』を強制的に実行・完了させて、アプリケーション使用中に発生する待機状態が極力短くなるよう、プログラムを修正しました。

この現象は初回起動時（自動採点は初回実行時）にのみ発生し、同じディレクトリ（＝フォルダ階層）からの２回目以降の起動・実行時は、初期化に必要な時間は大幅に短縮されます。初回起動・実行時に発生する待機状態はプログラムの不具合ではありませんので、ご安心ください。OS 側のスキャンが完了するまで、何もしないでお待ちいただけますようお願い申し上げます。このことについては、この Blog の別の記事に詳しい説明があります。こちらの記事をご参照ください。

プログラムのダウンロード後、zip ファイルを任意の場所に展開してください。なお、ご使用にあたっては、免責事項及び使用条件への同意が必要です。免責事項の詳細は付属のマニュアル及び License.txt をご覧ください。

【心からのお詫び】

2025年3月29日に「観点別評価と評定の整合性をチェックする」という記事を公開した際、誤ってこちらのダウンロードリンク先のファイルを削除し、そこに「観点別評価と評定の整合性をチェックするプログラム：ABC_Checker.exe」を置いてしまいました。そのため、2025年3月29日午前5時すぎから、2025年4月1日午後6時頃まで「DigitalSaiten_All_in_One.zip」がダウンロードできない状況でありましたこと、心よりお詫び申し上げます。ほんとうに、こころから、ごめんなさいです。

【追記_20250825】

ここで紹介しているアプリケーションをはじめ、この Blog の過去記事に掲載したアプリケーションはすべてディスプレイ解像度が 1366 × 768 の環境で実行することを前提として開発しています。高解像度ディスプレイで実行される場合、次のリンク先の記事にあります「高 DPI 設定の変更」を行ってから実行していただけますようお願い申し上げます。

高解像度画面で使いやすくするには？

2025年8月25日更新版に含まれている「手書き答案採点補助プログラム AC_Reader Version 3.1.0 ）には自動採点機能が新しく追加で搭載されています。プログラムのダウンロード＆展開後、初めてこの自動採点機能を実行する際に、Windows Defender や McAfee などの Anti-Virus Software : AV による『未知バイナリの初回スキャン』が行われるようです。このため２～３分間程度 PC は待機状態になります（２回目以降はスムース？に動作します）。また、実行形式ファイルの PC 内での位置が変わった場合にも AV によっては再度『未知バイナリの初回スキャン』が行われ、初回同様の待機状態となる場合があります。このことについては、この Blog の別の記事に詳しい説明があります。下記リンク先の記事をご参照ください。

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！

2025年8月25日の更新版には、解答欄矩形の検出プログラムも機能を大幅に修正した更新版が含まれています。修正内容の詳細は、下記リンク先をご参照ください。

解答欄（矩形）検出器を改良しました！

（追記_20250825 ここまで）

【追記_20250922】

そこで、次のようにして、

Button1.Enabled := False;
Application.ProcessMessages;

この同時実行によって、競合や例外が発生し、プログラムが落ちるわけです。

相変わらず、連続クリックそのものは、阻止できていませんが･･･プログラムは落ちなくなりました。

procedure TForm1.Button1Click(Sender: TObject);
begin
  Button1.Enabled := False;
  try
    DoSaveData;
    Application.ProcessMessages;
  finally
    Button1.Enabled := True;
  end;
end;

procedure TForm1.DoSaveData;
var
  i:integer;
begin
  if FIsSaving then Exit; // 多重実行防止
  FIsSaving := True;
  ･･･ 省略 ･･･
end;

（追記_20250922 ここまで）

【もくじの前書き】

今回の記事では、採点プログラムそれぞれについて、ダウンロードしていただいたZIPファイルを展開すればすぐに試せる簡単な試用方法をご紹介しています。

実際の試験においては、スキャナーを使用してマークシートや手書き答案の画像化処理を行ったり、専用プログラムを使用して、マークシートや手書き答案の解答欄の座標を取得する等、採点の事前準備作業が必要です。

ダウンロード後展開していただいたZIPファイル内のファイルやフォルダの構成及び以下の説明の内容は、それらの必要な事前準備作業を終えた段階以降の『実際の採点作業部分のみ』を手軽にお試しいただけるように作成してあります。それぞれ、説明の通りに操作していただけたら幸いです。

操作に際し、予期しないエラーが出た場合の対処方法や、実際の試験の採点に必要な事前準備作業の詳細は、以下の説明の中でご紹介する「過去記事のご案内」リンク先の各採点プログラムの取扱い説明記事をご参照ください。

【もくじ】

１．マークシートの読み取り
２．手書き答案のデジタル採点
３．マークシートと手書きを併用した試験のデジタル採点
４．採点結果通知の作成
５．お願いとお断り

１．マークシートの読み取り

【スクリーンショット】

マークシートは、市販のものでなく、再生コピー用紙にインクジェットプリンタで印刷したものを使用します。輪転機で印刷するとマークが濃く印刷されてしまい、「複数マークあり」の誤判定が出やすくなります。ですので、マークシートの印刷には、インクジェットプリンタを使用してください。

シートの左上には特徴点（例：■■■）が必要です。プログラムはマーク読み取り時に、まずシート内の特徴点を探し、そこからの距離情報をもとに一つ一つのマークを切り出して塗りつぶし面積を計算、マークの有無を判定しています。

マークシートの画像は、複合機等のスキャナーで200dpiの解像度でスキャンして作成してください。解像度を大きくしても読み取り処理に必要な時間が大幅に増加するだけでメリットは何一つありません。

デジタル採点の現場で実際に使用した様々な形式のマークシートを添付しましたので、こちらを印刷してお試しください。オリジナルマークシートの作成方法は、添付したPDFファイル「01_マークシートリーダーご利用の手引き」の「７マークシートの作り方」をご参照ください。

【添付したマークシート】

・１列25行×４列（100設問まで対応）、選択肢は１始まりで８選択肢（A4横R25C04S08）
・１列25行×３列（75設問まで対応）、選択肢は１始まりで10選択肢（A4横R25C03S10）
・１列25行×２列（50設問まで対応）、１始まりで８選択肢。右余白は手書きの解答欄に使用。
・１列25行×３列（大問３個に対応）、16選択肢の数学用（２枚１セットで大問６個に対応）
・１列25行×３列（75設問まで対応）、選択肢は０始まりで16選択肢の教科「情報」用
・~~１列25行×４列（100設問まで対応）、大語群（選択肢番号は０～99まで使用可能）マーク試験用~~
　 ↑ マークの間隔が狭いため、粗くマークされると誤判定が多くなります。おすすめしません。

マークシートのサンプル①

一般的な塗りつぶす形式のマークシートです。実際の試験の現場で過去５年以上使用しています。読み取り精度が問題になったことは一度もありません。

マークシートのサンプル②

線でマークすれば、大語群を使用する試験で解答に要する時間を大幅に短縮できます。ちなみに、芯の太さ0.9mm、硬さ・濃さ２Bのシャープペンシルを使用してマークし、読み取りテストを行ったところ、読み取りパラメータの設定はデフォルト値のまま、すべてのマークを正しく読むことができました。

MS_Reader.exe の詳しい使い方は、当Blogの過去記事をご参照ください。
（プログラムを動かすために必要な諸設定についての情報も記載しています）

【過去記事のご案内】

マークシートリーダー

マークシートリーダーをP4Dで高速化

１００選択肢に対応したマークシートリーダー

マークシートリーダーを教科「情報」用に設定

マークシートリーダーを数学用に設定

重要　数学採点用途で使用される場合は、当Blogの過去記事「マークシートリーダーを数学用に設定」にあります使用方法を必ずご確認ください。

今回掲載したプログラムには、すぐにお試しいただけますよう、マークシート情報設定済みのサンプルを添付してあります。ファイルのダウンロード及び展開に時間がかかるデメリットはありますが、マーク読み取りを圧倒的に高速化するPython4Delphi（＝P4D環境）も今回は、ダウンロードサイズと展開時間を顧みず、敢えて同梱しました。ですので、ここでご紹介する筆者作のマークシートリーダーは自動的にPython環境を使用する高速読み取りモードで起動します。

以下、Zipファイルのダウンロード後、ファイルを任意のフォルダに展開した後の、筆者作マークシートリーダーの試用方法です。

（１）MS_Reader を起動

MS_Reader.exe をダブルクリックして、MS_Reader を起動します。MSはもちろんマークシートの略ですが、筆者のイニシャルが M.S なので、それにもかけてあります。

ここで発生すると思われる不具合とエラーの解決方法は、当Blogの次の過去記事をご参照ください。

マークシートリーダー

（２）マークシートの情報を記録したテンプレートを選択

画面左上のメニューの「２テンプレート」をクリックすると表示されるサブメニューの「テンプレートの選択」をクリックします。

（３）リストボックスに表示された候補から「N_R25C04S08」をクリックして選択し、「決定」ボタンをクリックします。

ちなみに、テンプレート名の N は、解像度200dpiでスキャンした際の画像ファイルの大きさをノーマルと考えて画像サイズから自動で付けています。

その後ろのR、C、D、Sはそれぞれ次のような意味です。

RはRow、すなわち「行」です。R25なら１列あたり25行のマークシートを意味します。
CはCol、すなわち「列」です。C04なら４列で構成されたマークシートを意味します。
DはDouble、複数マーク可能なマークシートを意味（19選択肢のシートのみ設定可能）。
SはSingle & Select、複数マーク不可で、S08なら選択肢の数は８個のシートを意味します。

（４）表示されるメッセージを読んで、「はい」をクリックします。

（５）「Sample_Data_01_一般用」フォルダをクリックして選択し、「OK」をクリックします。

（６）正しくプログラムが動作していれば、画面は次のようになります。

バックグラウンドで動作するPython環境のOpenCVが特徴点画像（■■■）を探し出し、赤枠の矩形でそれを囲んで表示します。同時に、Delphi側のプログラムでテンプレートに記録したマークシートの座標情報を読み込み、最も左側の列の第１行目の選択肢欄を赤枠で囲んで表示します。これでマークシートの読み取り準備が出来ました！

（７）操作方法を案内するバルーンが表示されますので、その先にある「読む」ボタンをクリックしてください。プログラムがマークシートのマークを読み取り、結果をグリッドコントロール上に表示します。

筆者のPCでは、Python4Delphi（P4D）を利用した状態で、１枚100設問（800マーク）×３枚で合計2400マークを986ミリ秒で読み取り、結果を表示しました。１マーク2.43ミリ秒、１枚329ミリ秒で読み取っていますので、この形式（25行×４列・８選択肢）のマークシートを使用した場合、筆者の環境では平均的な１クラス分（40名）を約13.2秒で読むものと推測できますが、使用するPCの性能によりこの値は変化します。

（８）「Check!」ボタンをクリックして、読み取り結果をヒトの目でチェックします。次の例のように、読み取り結果の確認（修正）が必要と思われる箇所で赤枠を表示してチェックプログラムは一時停止します。

【空欄（マークなし）と判定した場合】

【複数マークありと判定した場合】

読み取り結果の確認・修正後、再度「Check!」ボタンをクリックすると、一時停止が解除され、チェックが続行されます。次のメッセージが表示されたら、読み取り結果のチェックは終了です。

（９）読み取り結果の書き出しを実行

マークの読み取り結果はCSV形式でファイルに出力できます。表計算ソフトを利用して読み取り結果を処理する場合はもちろんですが、筆者が作成した「ReportCard_2024.exe」を用いて、採点結果を受験者に通知する個票を作成する場合は、必ずここで読み取り結果をCSVファイルに書き出す作業を行ってください。

同梱の「ReportCard_2024.exe」を用いて、採点結果通知を作成できます。こちらのプログラムの使用方法は後述します。

「ReportCard_2024.exe」を用いた採点結果通知の作成例です。

設問ごとに採点結果と観点別評価の区分及び正解マークを表示できます。
また、任意の位置に得点を表示できます。

（10）その他の機能

MS_Reader には、マーク読み取りに加え、読み取り結果の音声読み上げ機能や、チェックのスキップ機能など、筆者が必要と考えた機能を搭載してあります。使い方の詳細は、当Blogの過去記事（上のリンク先）にありますので、必要に応じてご参照ください。

２．手書き答案のデジタル採点

【スクリーンショット】

採点する答案は、横書き・縦書きを問いません。どちらの形式の答案でも採点可能です。また、複合機のスキャナーで読み取り可能な大きさであれば、解答用紙のサイズも問いません（ただし、採点する答案すべてのサイズと解答欄の形式は同じである必要があります）。前述のマークシートでは、解答用紙の左上に特徴点（■■■）が必要でしたが、こちらの手書き答案の採点補助プログラムでは必要ありません。

答案画像は複合機のスキャナー等を用いて、解像度200dpiでスキャンしたカラー画像を使用してください。解答欄矩形は、採点準備作業時に、別に作成した矩形検出プログラムを用いて解答用紙画像より検出・座標データを取得してiniファイルに保存します。手書き答案の採点プログラムは、この座標データをもとに解答欄矩形を答案画像から切り出して、切り出した解答欄を画面に並べて表示します。

解答用紙の解答欄を作成する際は、矩形検出されたくない部分を点線で作成していただく必要がありますが、これさえ守っていただければ、かなりスムーズに解答欄矩形の検出作業（座標データ化）が行えると思います。実際に採点に入るまでに必要な採点準備作業の詳細は、当Blogの過去記事をご参照ください。

解答欄の作成例：矩形検出されたくない部分の罫線は点線を使用します。
これにより設問番号を含んだ解答欄矩形の切り出しや、
字数を指定しての解答欄作成が可能になります。

【過去記事のご案内】

解答欄矩形を検出するプログラムの操作方法も、こちらで詳しく解説しています。

無料で使える手書き答案採点補助プログラム

今回掲載したプログラムには、すぐにお試しいただけますよう、採点準備作業を行ってあるサンプルを添付してあります。以下、手書き答案採点補助プログラムの試用方法です。

（１）AC_Readerを起動

AC_Reader.exe をダブルクリックしてプログラムを起動します。AC は Answer Column（解答欄）の略です。プログラム起動時（初回）に次のメッセージが表示されます。

PCのボリューム設定値が０より大きい場合に表示されるメッセージです。

採点作業内容の確認メッセージです。

「いいえ」をクリックすると、次のメッセージが表示されますが、これは表計算ソフトを使用して採点結果通知を作成していた頃の名残りで、表計算ソフトを使用せずに採点結果通知の作成ができるようになった現在はどちらから採点を始めていただいても問題は生じません。

試用される場合、次のメッセージには「いいえ」を選択（クリック）してください。

初回起動時には複数のメッセージが表示されますが、次回起動時からこれを表示しない設定にすることができます。お好きな方のボタンをクリックしてください。

あらゆるケースを想定した場合、このようなメッセージも必要と判断しました･･･。
（確か、採点結果通知の個票作成プログラムで、合計点を計算するコードを書いていた際に「何か」問題が起きて、このメッセージを表示することにしたような記憶があります）

お断りしたように不出来なプログラムですので、こちらの注意も必ずお守りください。

同じく、こちらの注意も必ずお守りください。

採点方法のご案内です。複数のユーザーより、「前回の採点から２～３か月も経過すると忘れてしまう！」との指摘がありましたので起動時に採点方法を案内するメッセージを表示するようにしました。

このメッセージは、プログラムの画面右下にある「入力方法のご案内」ボタンをクリックすれば、いつでも表示することができます。

（２）既存の採点設定を選択

試用に際しては、筆者が設定・保存した採点設定をお使いください。
画面右上にある「採点作業」ボタンをクリックします。

次のメッセージが表示されますので、「はい」をクリックしてください。

採点設定ファイルの選択を促す案内バルーンが表示されます。
ComboBox右端の∨をクリックしてください。

表示された選択肢の「テスト採点.ini」をクリックして選択します。

（３）続けて採点したいクラス／講座の答案画像が保存されているフォルダを選択します。

上のメッセージの「OK」をクリックすると、フォルダの選択ダイアログが表示されます。

「Sample_Data_04_Markと横手書併用」フォルダをクリックして、「OK」をクリック

（４）採点を実行

最初にフローティング状態のパネルを適切な位置へ移動します。

点数を一括入力する場合は、「入力と確認」のComboBoxから入力したい値を選択して「入力」ボタンをクリックします。選択した値がすべての解答欄に設定されますが、入力値が「０」であれば×、そうでない場合は○と得点が表示されます。

個々の採点は、採点したい解答欄の中央付近をクリックして、採点方法の案内にあった方法で採点します。

（５）採点結果の保存

採点結果を答案画像に書き込むには、フローティングパネルの「書込」ボタンをクリックします。

重要　作業の状態は「書込」ボタンをクリックしたところまでが保存されます。「書込」ボタンをクリック後はいつでも終了できます。

重要　採点は何度でもやり直すことができます。

何設問目まで採点したかについては、答案画像を表示して確認できます。

「返却用答案を表示」にチェックを入れると、現在採点している答案画像が表示されます。

◀ボタンや▶ボタンをクリックして表示する答案を変更することができます。

（６）返却用答案及び成績一覧表の作成

手書き答案の採点プログラムには、単独で受験者に返却する答案の印刷や教科担任用の成績一覧表を作成する機能があったのですが、今回、新しく採点結果通知作成プログラムを作成しましたので、独自に返却用答案を作成する機能はCut（正確には非表示に）してあります。

今回、新しく作成した採点結果を通知する個票及び教科・科目担任用に成績一覧表を作成するプログラム「ReportCard_2024」は、「返却用答案＆成績一覧作成」をクリックすると起動できます。

「ReportCard_2024」の使い方は、この後の説明をお読みください。

３．マークシートと手書きを併用した試験のデジタル採点

次のような解答用紙を用いて、マークシートと手書きを併用した試験を実施・採点することも可能です。

採点は、マークシート部分のマークの読み取りはMS_Readerで、手書き解答欄の採点はAC_Readerでそれぞれ行ってください。

MS_Readerを用いてマークの読み取りを行った後はCSVファイルに読み取り結果を出力、AC_Readerを用いて手書き答案の採点を行った後は採点結果を「書込み」ボタンをクリックして自動保存（保存先ファイル等を指定していただく必要はありません）していただければ、採点結果通知の作成準備も内部的に完了します。

どちらの採点を先に行うかについて、その作業順は問いませんが、マークシートの採点→手書き答案の採点という流れの方がプログラムが表示するメッセージの内容に矛盾を感じることなく作業できると思います。

採点終了後、次にご案内する採点結果通知を作成するプログラムで、それぞれの試験の合計得点を計算します。

４．採点結果通知の作成

【スクリーンショット①】

【スクリーンショット②】

採点者用の成績一覧表の作成例
氏名データは架空のものです。また、得点データが２件しかないのは添付した試用サンプルを用いて作成したためです。

ReportCard_2024の使い方

（１）起動

ReportCard_2024.exe をダブルクリックしてプログラムを起動します。PCのボリューム設定値が０でない場合は、Beep音を消音するかどうかを確認するメッセージが表示されます。

（２）採点作業を選択します。

（３）採点対象の答案画像を保存したフォルダを選択します。

採点対象の答案画像を保存したフォルダを選択します。

（４）採点設定がある場合

既存の採点設定がGridコントロールに表示され、採点できる状態になります。

マークシートの採点の場合、形式の確認メッセージが表示されます。

マークシートの採点の場合、使用したテンプレートを指定します。

採点結果は次のように表示されます。

【マークシート部分①】

デフォルト設定では、左から「採点記号・配点・観点別評価の区分」がそれぞれ表示されます。

【マークシート部分②】

空欄もしくは誤りがある設問には正解の選択肢が数字で示されます（デフォルト設定を利用した場合）。

【手書き答案部分】

観点別評価の区分を表示することはできませんので、受験者に口頭で区分を説明する必要があります。

得点は下の例のように表示されます。得点の表示位置は任意の位置を選択・設定を保存できます。

手書き答案部分には「採点記号と得点」が表示されます。
（観点別評価の区分を表示することはできません）

（５）採点設定がない場合

次のメッセージが表示されます。内容をよく読んで「OK」をクリックしてください。

設問数を入力し、「入力完了」をチェックしてください。

操作方法を案内するメッセージが表示されます。

入力をクリックします。

デフォルトの配点を設定します。入力は半角数字で整数を入力し、「OK」をクリックしてください。

マークシート用の採点設定には「正解の選択肢の番号」・「配点」・「観点別評価の区分」をそれぞれ入力してください。また、手書き答案用の採点設定には「配点」・「観点別評価の区分」を入力してください。

採点設定を入力後、「保存」ボタンをクリックして、設定を保存してください。

採点設定の保存が完了すると、採点の「実行」ボタンがクリックできる状態になります。

（６）採点結果通知個票の印刷

「印刷」ボタンをクリックしてください。

出力先プリンタ・用紙・印刷の向きを指定して「OK」をクリックしてください。
元々の答案のサイズがA3やB4であっても、用紙サイズでA4を指定すれば縮小印刷されます。

答案すべてを印刷するか、個別に印刷するか、いずれかを指定してください。

「いいえ」（個別印刷を選択）を選んだ場合は、印刷したい答案の番号を指定してください。

印刷例です。

（７）成績一覧表の作成と印刷

成績一覧表の作成の「講座名票」ボタンをクリックします。

受験者の氏名等のデータを保存したCSVファイルを選択します。

予めsNameフォルダ内にクラス・講座の氏名データを所定の様式で作成・保存してください。

【参考：氏名データの様式】

クラス・出席番号は「半角」で入力、氏名・よみがな・性別は「全角」でそれぞれ入力し、CSV形式でsNameフォルダ内に保存してください。

平均点を正しく計算するため、試験を欠席した受験者を計算対象から除く処理を行います。
「欠席者をチェック」のCheckBoxをチェックしてください。

得点の合計が「０」の受験者について、平均点の計算処理の対象とするか・しないかを指定します。「はい」をクリックした場合は、成績は「空欄」扱いとなり、平均点の計算対象からは除かれます。
「いいえ」をクリックした場合は、その受験者の得点合計は０点であったものとして平均点を計算します。

印刷プレビューを表示します。「PreView」ボタンをクリックしてください。

添付したファイルのデータはすべて架空のものです。

「印刷」ボタンをクリックして印刷します。「CSV出力」ボタンをクリックすれば、CSVファイルに出力することも可能です。表計算ソフトを利用した追加の処理にお役立てください。

CSVファイルのファイル名は自動的に設定されます。また、CSVファイルは処理対象の答案画像があるフォルダ内に出力されます。

保存処理が完了すると、次のメッセージが表示されます。

「はい」をクリックした場合、エクスプローラーが起動し、保存先フォルダを開きます。
「いいえ」をクリックした場合は、CSVファイルの保存先を示すメッセージが表示されます。

５．お願いとお断り

追記（20250702）

100選択肢用のマークシートを使って試験を行ったユーザーの方から、『マークの塗りつぶし面積が大きいと誤判定が出やすい』とのご指摘をいただきました。確認すると、受験者は「濃く・丁寧に」マークを塗りつぶしたことがマークシートから伝わってくるのですが、100選択肢用のA4横サイズのマークシートは･･･やはり、と言うか、どうしてもマークそのものが小さく、受験者によっては「きちんとマークすること＝大きくマークすること」と、感じて（？）、選択肢番号の外枠の楕円「０」部分を上下左右に大きくはみ出して隣のマークの領域範囲まで塗りつぶしてしまい、結果的に、その受験者のマークシートは複数マーク判定だらけになることがわかりました。

対策として、『選択肢番号の外枠の楕円「０」部分をはみ出さないようにマークする』よう注意を徹底することをお願いしたのですが、それだけでは根本的な解決とならないように感じ、マークとマークの間隔が狭いためにこの問題が起きていることは明白ですから、1設問について100選択肢に対応を維持しつつ、1列25行×4列で100設問まで対応という現在のマークシート構成を見直し（マーク間の幅を広げるため列数を減らし）、1列33行×3列で99設問まで対応可能というマークシートを作成しました。また、50分という試験時間を考えると80設問あれば十分というご意見も頂戴しましたので、1列30行×3列で90設問まで対応可能なマークシートや、1列25行×3列で75設問まで対応可能なマークシートを作成し、これらのマークシートを１つの Excel Book にまとめました。以下のリンクからダウンロードできます。

100選択肢に対応した設問数75～99（３列）のマークシート

1 ファイル 506.31 KB

ダウンロード

１００選択肢対応マークシートを使用した試験の実施方法

自作マークシートリーダーのプログラムを書き替え、大語群（使用できる選択肢の番号は 0～99）の使用に対応したマークシートを Excel で作成した。

今回は、このマークシートを用いた試験を実施する方法です。

【もくじ】

１．事前の準備と受験者への注意事項
２．スキャナーでマークシートをスキャンしてJpeg画像に変換
３．指定のフォルダ内にフォルダを作成してスキャンした画像をコピー
４．採点専用画像に変換
５．テンプレートとして登録
６．マーク読み取りを実行
７．マーク読み取り結果のチェック
８．CSV形式で出力
９．採点結果通知シートの作成方法
10．お願いとお断り

追記（20240929）

当Blogで紹介してきた自作のデジタル採点プログラムを一つにまとめました。次のリンク先にその紹介とダウンロードリンクがあります。マークシートも、ここに紹介した形式の他、様々なタイプのものを同梱しています。

デジタル採点 All in One !

追記（20250702）

100選択肢に対応した設問数75～99（３列）のマークシート

1 ファイル 506.31 KB

ダウンロード

１．事前の準備と受験者への注意事項

（１）マークシートの印刷

プログラムに添付した R25C04D19.xlsx をダブルクリックして開き、必要な枚数をインクジェットプリンタで印刷します。印刷設定はA4・横に設定済みです。用紙はホームセンター等で購入できるコピー用紙を使用してください（読み取りパラメータの設定とマークの読み取りテストは再生コピー用紙を使用して行っています）。マークや罫線枠が設定よりも濃く印刷される輪転機での印刷はお止めください。

100選択肢（0～99）に対応した、複数選択可能なマークシート「R25C04D19.xlsx」

（２）受験者への注意事項

試験を実施する前にHB以上の濃さの鉛筆とプラスチック消しゴムを用意するよう、受験者全員に連絡してください。可能であれば、シャープペンシルの使用は禁止した方がよいと思います。

※追記（20240924）
どうしてもシャープペンシルを使用したい場合は、硬さ・濃さは「２B」で、芯の太さは「0.9mm」以上のものであれば使用可とするような「条件付き許可」とした方がよろしいかと思います。

問題冊子の表紙には、次の注意事項を印刷してください。

上記注意事項のサンプルをダウンロードできます。

受験上の注意事項のサンプル

1 ファイル 111.20 KB

ダウンロード

２．スキャナーでマークシートをスキャンしてJpeg画像に変換

（１）スキャンの準備

解答用紙（マークシート）をスキャナーでスキャンする前に、解答用紙が裏返しだったり、逆さまになっていないかどうか等の確認に加え、次のことを必ず実行してください。

・解答用紙に付着している消しゴムの屑をしっかり落とす。
・受験番号（出席番号）が昇順になるよう、解答用紙の並び順を２回以上確認する。
・欠席者がいる場合は、未使用の解答用紙を該当箇所に挿入する。

（２）スキャナーの設定

解答用紙（マークシート）をスキャンする際の読み取り解像度は 200dpi で十分です（解像度を大きく設定しても、MS_Reader.exe での利用に関する限り、メリットは何一つありません）。また、画質は「カラー」を指定し、出力先はPDFファイルではなく、Jpeg画像を指定してください。

３．指定のフォルダ内にフォルダを作成してスキャンした画像をコピー

スキャンしたJpeg画像は、MS_Reader.exeと同じ階層にあるScanDataフォルダ内に適切な名称のフォルダを作成し、そこに保存してください。

【利用できるフォルダ構造】

〇：ScanData￥1年A組

【利用できないフォルダ構造】

×：ScanData￥1年￥A組

ScanData フォルダ内に新規にフォルダを作成し、さらにそのフォルダ内に新規にフォルダを作成して、そこにスキャンした Jpeg 画像を保存するような使い方は出来ません。ご注意ください。

４．採点専用画像に変換

ScanData フォルダ内に新規に作成したフォルダにスキャンしたJpeg画像が用意できたら、次にこの画像をマークシートリーダーで読むための専用画像に変換します。その理由はいくつかありますが、主なものは次の三つです。

（１）読み取り原本は、オリジナル状態のまま残しておく。
（２）マーク読み取り後に人の眼でチェックする際、作業しやすい大きさに整える。
（３）Loop 処理するため、画像の名称を統一し、１から始まる連番の番号を付ける。

具体的な方法は次の通りです。

（１）ダウンロードした Zip ファイルを展開したフォルダ内にある MS_Reader を起動します。

（２）画面左上のメニューの「１画像変換」をクリックします。

（３）表示されたサブメニューの「専用画像を作成」をクリックします。

（４）次のフォームが表示されます。画面右上の「選択」ボタンをクリックします。

（５）ScanDataフォルダの内容が表示されます。マークの読み取り処理を行いたいJpeg画像を保存したフォルダをクリックして選択します。選択したフォルダ名が下の「Folder」部分に表示されていることを確認して「OK」をクリックしてください。

【重要】選択するのは「フォルダ」で、「ファイル」ではありません！

（６）画面は次のようになります。画面の中央左に表示されたサムネイル画像を参考にして、画像の回転の有無及び回転方向を選択し、続けて、リサイズの有無と縮小率を指定します。読み取り解像度が200 dpi ・A4横形式で、マークシートの列が４列ある場合は、「80％に縮小」してください。

（７）変換処理を行った画像データの出力先（書き出し先）フォルダを指定します。「参照」ボタンをクリックしてください。再びフォルダの選択ダイアログが表示されます。

（８）プログラムは、（５）で指定されたScanDataフォルダ内のフォルダと同じ名前のフォルダをProcDataフォルダ内に自動的に作成します。フォルダをクリックして選択し（下のFolder部分に選択したフォルダ名が表示されたことを確認）、OKをクリックしてください。

【参考】ProcData は、Processed（加工済み）の意味です。短くしすぎカモですが･･･

（９）ProcDataに続くPathを確認し、「変換実行」ボタンをクリックします。

〇：ProcData￥（自動的に作成されたスキャンした画像を保存したフォルダと同名のフォルダ）

×：ProcData￥AAA￥BBB￥CCC

（10）次のメッセージが表示されます。MS_Readerは、筆者が別に作成した手書き答案の採点プログラムと併用して使用することもできますが、今回の処理ではそのような形では運用しませんので「いいえ」ボタンをクリックしてください。

（11）専用画像の作成が完了すると、次のメッセージが表示されます。OKをクリックしてください。

（12）「終了」ボタンをクリックして、変換作業を終了します（画面下・中央の「画面の初期化」ボタンをクリックすれば、続けて他のクラス／講座の画像を同様に処理することも可能･･･なようにプログラミングしたのですが、「画面の初期化」ボタンのクリックでは「初期化されない何か」が残ってしまうバグが発現することがあるようです。意図した通りに変換されない状況を１度、経験しました）。なので、他のクラス／講座の画像を処理する際は、一旦終了してから再度このプロセスを呼び出していただいた方がよろしいかと思います。

ド素人が書いたプログラムであります。内在する不具合につきまして、もし、それが発現するようなことがありましたならば、ただ、ただ、伏してお詫び申し上げます。不具合がありましたら、一旦「終了」をクリックして、再度、画像変換処理を呼び出していただけますよう、お願い申し上げます。

変換後のファイル名はProcDataフォルダ内に作成した変換先フォルダの名称＋01から始まる連番となります。

５．テンプレートとして登録

筆者の作成したマークシートリーダーでは、マークの読み取りに際し、まず特徴点（マークシート画像内のトリプルドット：■■■ ）をコンピュータの眼である OpenCV を用いて探し出し、三つの ■ のうち最も左の ■ の左上隅を座標原点（０，０）として、ここからの距離情報を利用してマークシートの第１列を画像として切り出し、二値化・色の反転処理を行って、さらにそこから１行ずつ「行の画像」を切り出し、この「行の画像」を選択肢数個に切り分けて白面積を計算、それが大きい場合に「マークあり」と判定しています。

このため最初にマークシートの特徴点の位置と各列の左上隅及び右下隅の位置を座標として登録し、これをそのマークシート形式の定型フォーマット（＝テンプレート）として利用できるように名前を付けて登録する処理を行います。

テンプレートの名前の意味は、次の通りです。

例：R25C04D19

１列あたりの行数・全列数・選択肢の形式と選択肢数を「行・列・選択肢」順に並べています。
R は Row （＝行）、すなわち１列 25 行より成ること、
C は Column （＝列）、すなわち４列あること、
D は Double 型、すなわち複数マーク対応で、１行あたりの選択肢数は 19 個。
（ここが S の場合は Single 型、複数マーク不可）

Word や Excel で作成したマークシートを、同じインクジェットプリンタで印刷して使用しているので、試験を実施する度にテンプレートを登録する必要はないはずなのですが、筆者はなんとなく不安で、毎回新しくテンプレートを登録し直して作業しています･･･

テンプレートの登録方法は、次の通りです。

（１）「２テンプレート」をクリックして表示されるサブメニューから「テンプレートの新規登録」をクリックして選択します。

（２）別のWindowが開き、次の画面が表示されます。画面右上の「取得」ボタンをクリックします。

（３）ファイル選択ダイアログが表示されます。任意のマークシート画像を１枚選んでクリックして選択してください。下のファイル名欄にクリックした画像の名称が表示されていることを確認して、「開く」ボタンをクリックします。

（４）選択したマークシートが表示されます。画面右上の「マーカー」オプションボタンをクリックしてください。

（５）画像左上の特徴点部分が３倍の大きさで拡大表示されます。特徴点画像の左上位置をポイント（マウスのカーソル：＋の中心を合わせる）してクリックしたらそのまま指を離さずに特徴点画像の右下へドラッグしてください。ドラッグ中は黒い太い枠線（＝ラバーバンド）が表示されます。

赤枠の中、ラバーバンドの様子がよくわかるように、特徴点画像より少し大きめにドラッグしています。

実際は、次の図のように、ラバーバンドが特徴点画像の外側をぴったり包む（両者の幅と高さが同じになる）ようにドラッグします。

（６）ドラッグ終了時に矩形選択された部分が特徴点画像としてコピーされ、下の図のように表示されます。照合手法は自動的に設定されますので、変更しないでください。続けてコンピュータの眼である OpenCV がマークシート画像内の特徴点を見つけることができるか、どうかのテストを実行します。

「マーカー画像の読み取りテスト」ボタンをクリックしてください。

（７）OpenCVが発見した特徴点画像の位置が赤い矩形で表示されます。特徴点画像を完全に一致していることを確認し、表示されるメッセージを読んでOKをクリックしてください。

（８）選択対象グループの「解答欄」オプションボタンをクリックすると、案内バルーンが表示されます。マークシートの１列あたりの行数と、マークシート全体の列数、１行あたりの選択肢数をコンボボックスの選択肢から選んで順に設定します。

（９）次の図は、複数選択可能なマークシートの設定例で、行数・列数・選択肢数をそれぞれ入力した直後の状態です。複数マークを許可するか、どうかの設定を行います。

【重要】
複数マークを許可する場合は「複数マークによる採点を実施」チェックボックスをクリックして、チェックが入った状態にしてください！！

GUIのデザインが悪いためか、作った本人でも！この設定の操作を時々忘れます。複数選択可能なマークシートのテンプレート設定を行う場合は、くれぐれも注意してください。

（10）マークシートの１列目から順に、その座標を取得します。１列ラベルの左のオプションボタンをクリックしてください。マウスカーソルの形状が＋になります。

次の図に示したように、まずマークシートのマーク欄枠の左上をクリックし、そのまま指を離さずに、第１列めの右下隅へ向かってドラッグしてください。なお、ドラッグ中は、細い点線のラバーバンド矩形が表示されます。

設問番号欄を含めないようにご注意願います。
必要な座標は、マークシート欄の座標です！

列の右下隅までドラッグした状態を示します。

ドラッグを終了する（マウスの左ボタンから指を離す）と、選択範囲が赤の矩形で囲まれます。取得できた第１列目の座標が画面右のラベルに表示されます。

【重要】
この作業にマーク読み取りの成否がかかっています！
くれぐれも慎重に、正確に、作業してください。

うまく列を選択できなかった場合は、「再範囲選択」ボタンをクリックして作業をやり直すことができます。

（11）以降、４列目まで同じように作業します。４列目の座標を取得できたら、「保存」ボタンをクリックして取得した座標を ini ファイルに保存します。

（12）最後に「終了」ボタンをクリックして、テンプレート作成の画面を閉じます。

ボタンは画面右下隅にあります。

これでマークシートを読む準備ができました！

６．マーク読み取りを実行

（１）最初に使用するテンプレートを選択します。

「２テンプレート」をクリックするとサブメニューが表示されます。
「テンプレートの選択」を選んでください。

（２）テンプレートの選択画面が開きます。使用したいテンプレート名をクリックして反転表示させ、「決定」ボタンをクリックしてください。

【参考】テンプレートの削除方法
必要のなくなったテンプレート名をクリックして選択、「テンプレートの削除」チェックボックスをチェック、「実行」ボタンをクリックすれば不要なテンプレートを削除できます。削除したテンプレートを元に戻すことはできません。テンプレートを削除する際は、その要不要に十分ご注意ください。

（３）次のメッセージが表示されます。これはメニューの「３作業フォルダ」をクリックすると表示されるサブメニューの「作業フォルダの選択」をクリックした際に表示されるメッセージと同じものです。「はい」ボタンをクリックしてください。

（４）フォルダの選択ダイアログが表示されます。ProcData フォルダ内の読み取りたいマークシート画像のあるフォルダをクリックして選択してください。下のFoleder部分に選択したフォルダ名が表示されたことを確認して、「OK」ボタンをクリックしてください。

（５）テンプレート名と関連付けて保存されている特徴点画像が見つかった場合は、それを赤の矩形で囲んで表示します。また、特徴点画像からの距離座標を用いてマークシート欄第１列の１行目がどこにあるのかを計算し、その位置をこちらも赤い矩形で囲って表示します。

【参考】PCによっては、ここで Python Engine の初期化に時間がかかることがあります！

次の図のように表示されれば、マークの読み取り準備は完了です。

諸設定が意図した通りに反映され、OpenCVが正しく動作していることを確認したら、
「OK」ボタンをクリックしてください。

（６）マークの読み取りを実行します。案内バルーンが表示されますので、その下にある「読む」ボタンをクリックしてください。

Python4Delphi が使用できる環境（組み込みPython環境を入れた Python39-32 フォルダが MS_Reader.exe と同じフォルダにある場合）ならば、P4D チェックボックスに自動的にチェックが入り、Python 用のOpenCVを用いてプログラムは動作します。

マークシートリーダーをP4Dで高速化

Python4Delphi が利用できない場合、プログラムはDelphi用のOpenCVを利用して動作します。

画面下に表示されている Grid コントロールにすべてのマークシート画像の読み取り結果が表示されたら、マークの読み取りは完了です。通常の動作モードでは、マークの読み取り完了を知らせるメッセージは表示されません。

複数選択可能なマークシートの場合、空欄や３個以上マークされている等、
読み取り結果に何らかの問題がある場合は「999」と表示されます。

【重要】二値化閾値の修正方法（20240707追加）

マークが「うすい」場合、これを正しく読み取ることができず、「空欄」と判定して「999」と表示される場合があります。同じ理由で、複数マークされた解答欄の「１の位」が読めなかった場合も、読み取り判定は「マークの状態に問題あり」となり、「999」と表示されます。

これらの場合は、この後、実行する「読み取り結果のチェック」時に、該当箇所の解答欄が赤枠で囲まれて表示されますので、マークの状態をヒトの眼で確認し、読み取り結果を修正できます。

最も困るのが、複数マークされた解答欄の「10の位」のマークは薄くて読めなかったが、「１の位」のマークの読み取りには成功している場合です。この場合は正しく読み取れた「１の位」のマークが読み取り結果として表示されてしまいます。大変申し訳ないのですが、MS_Reader.exe のチェックプログラムは、この誤読を見つけることができません！！（これは原理的な問題なので、チェックする方法がありません）

この事故を防ぐには、事前に読み取りテストを十分に行って、読み取りパラメータを調整するしか方法がありません。具体的には、最もマークの濃度が薄い受験者のマークシートが正しく読めるようになるまで、閾値の値を１ずつ大きくして読み取りテストを実行します。筆者の行ったテストでは、デフォルト設定の閾値（180）では正しく読めなかったマークも、閾値を大きくすれば読めるようになりました。

「塗りつぶす」方式でなく、より簡易な「線を引く」方式でマークするシートを用いて行った読み取りテストの例

「64」と読むべき箇所の「10の位」を「空欄」と判定、「１の位」は正しく読めた場合、プログラムは読み取り結果を「４」と表示してしまう。

閾値を「１」大きくすると･･･

ごく薄いマークも正しく読めるようになるまで、この操作をくり返します。筆者の行ったテストでは、閾値を１ずつ大きくすることで、指示通り普通の濃さ（マーク箇所の数字が読めなくなる濃さ）でマークされたシートであれば、最終的にすべてのマークを正しく読めるようになりました（上記のマークシートを使用して行った実験では、最終的にすべてのマークを正しく読めた段階で、二値化の閾値の値は「184」でした。なお、このマークシートは後日公開する予定です）。

ただ、あまりにもマークの濃さが薄い場合は「原理的に読めません」ので、「対応不可」としてヒトの眼で読むしかないと思います･･･。

そのような事態にならないよう、予め受験者に対し「薄いマークは読み取れない」旨の注意を徹底しておく必要があります。マークシートを用いた試験では、これが最も重要なことかもしれません。

【参考】Grid コントロールの高さを変更する方法

Grid コントロールの高さは自由に変更できます。マークシート画像と Grid コントロールの境界部分にマウスカーソルを持って行く（ポイントする）と、＝の上と下に上下向きの矢印のついたポインタ形状に変化する場所があります。この部分を上下にドラッグすることで、Grid コントロールの高さを変更することができます。

７．マーク読み取り結果のチェック方法

（１）マークの読み取りが完了したら、結果をチェックします。設問数が100である場合はそのまま「Check!」ボタンをクリックしてください。

Check! ボタンをクリックして、読み取り結果を確認します。

設問数が100 未満の場合、空欄その他の判定フラグである「999」が多数入力されていますので、チェック時にそれらのチェックを省略する設定を行います。

例えば、設問数が「80」である場合、４列目の設問「81」以降の「999」はチェックの必要性がありませんから、Skip チェックボックスにチェックして、４列目のコンボボックスに選択肢から「81」を選択します。「覚」ボタンをクリックすると、この設定を記憶します（他のクラス／講座のマークシートを読み取る場合は記憶させてください）。この設定を行ってから、Check! ボタンをクリックして読み取り結果のチェックを実行してください。

（２）読み取り結果に問題があると判定された場合は、次のように「問題あり」と判定された箇所が赤い矩形で囲まれて表示されます。（この場合は、マークが横に長すぎて隣のマークの領域に入ってしまっているのだと思います）

実際の画面では、14 設問目の「999」は青く反転表示されています。
（画面をキャプチャーした際、青の反転表示が消えてしまいました）

確認を行った結果、マークが「15」であり、正解と見なせる場合は Grid コントロールの「999」を消して「15」と入力し、読み取り結果を修正することができます。

ちなみにこのような場合、「P4Dを使用」のチェックを外し、判定領域をマーク画像の中心付近のみに設定して読み直せば正しく読めるようになります。（ただし、動作速度は遅くなります）

読み取りパラメータを上のように変更して再度マーク読み取りを実行した場合、

（３）再度「Check!」ボタンをクリックして、チェックを続行します。

10の位に二つマークがある場合等、不正解と見なせる場合は、「999」を修正せず、チェックを続行します。
続けて「Check!」をクリックしてください。

次のメッセージが表示されたらチェックは完了です。

８．CSV形式で出力

マークの読み取り結果の確認作業が完了したら、Grid コントロールに表示されているデータをCSV形式でファイルに出力できます。このCSVファイルは筆者作の採点結果通知作成プログラムから読み込んで採点結果通知票の作成に利用できます。Excel Book にもこのデータを書き出すことができますが、複数マーク対応の採点結果通知を作成できる Excel のワークシートは作成しておりませんので、ここではその処理方法の詳細は説明しません。

CSV形式で出力する方法は、次の通りです。

画面右下の「ファイルへ出力」グループの CSV オプションボタンをクリックして選択し、「書き出し」ボタンをクリックします。

書込みが完了すると、次のメッセージが表示されます。

表計算ソフトその他を用い、ご自身で採点結果を処理される場合は、出力先をメモしてください。

出力されたCSVの内容は、次の通りです。

９．採点結果通知シートの作成方法

採点結果通知の作成方法は、当Blogの過去記事をご参照下さい。

マークシートの採点結果通知（個票）及び成績一覧表の作成

10．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。記載した内容及びダウンロードしたプログラムを利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

１００選択肢に対応したマークシートリーダー

追記（20240929）

デジタル採点 All in One !

当Blogで紹介したデジタル採点プログラムのすべてをまとめました！

追記（20250913）

下記ダウンロードリンク先に置きました「 R25-33C03D19.xlsx 」の75設問用マークシートですが、列幅が１～25設問目までと、26～50設問目及び51～75設問目までが異なっておりました。列幅が異なったまま使用しても MS_Reader を利用してのマーク読み取りに支障は生じませんが、このマークシートを使用した場合、マークの有無等のチェック機能使用時に表示されるチェック対象の解答マーク欄を囲む赤枠の矩形の幅が26～50設問目及び51～75設問目までで解答欄より短くなること（表示のみの問題でマークは正しく読み取ります）、また、添付の ReportCard_2024.exe を使用して採点結果通知表を作成した際に、26～50設問目及び51～75設問目までの正答表示位置が左へずれる問題が発生します。

利用された皆さまには、大変なご迷惑をおかけし、誠に申し訳ありませんでした。一昨日（2025年９月11日）、この問題に初めて気づき、当初は MS_Reader のバグと考え、コードを見直す中で、プログラムではなく、マークシート側の列幅の設定ミスと気が付いた次第です。

本日、誤りを修正した新しいファイルをアップロードしました。75設問、90設問、99設問用の各マークシートとも読み取りテスト済みですが、75設問用は読み取りテストに加え、実際の採点現場で実地運用し、汚れやシミがなければ正しくマークの読み取りに成功することを確認済みであることを申し添えます。

追記（20250702）

100選択肢に対応した設問数75～99（３列）のマークシート

1 ファイル 506.31 KB

ダウンロード

【追記追加前の記事の本文はここからです！】

先日、電車にゆられていたら先輩が。

「選択肢がたくさんあると、マークシート使うの、難しいかなー？」って。

なんかおもしろいこと、ないかなー☆って、毎日、ひまなんだもん。

すぐに出来そうな気がしたので、さっそく大語群に対応したマークシートリーダー作成にチャレンジ。

今までのは数学や教科「情報」の試験用に作成した１６選択肢が最大だったが。

数学の試験用に作成したマークシート（マーク部分は－記号）
マークの色が濃いのは、開発初期のマークシートの画像であるため。

教科「情報」の試験用に作成したマークシート（選択肢の番号はゼロ始まり）
経験を積む中で、誤判定を防止するため、マークの色はどんどん薄くなった。

今回、作成したマークシート（最終的なかたち・Excel で作成）。

正直、思ったほど、かんたんではありませんでした！！

【もくじ】

１．最初に作ったのはB4縦型のマークシート
２．次に作ったのはA4横型のマークシート
３．Excel でマークシート作成に挑戦
４．マークシートを最適化
５．読み取りプログラムも修正
６．発見した問題点と解決策
７．まとめにならないまとめ
８．プログラムのダウンロード
９．お願いとお断り

１．最初に作ったのはB4縦型のマークシート

選択肢の数が多いことを、ここでは『大語群』と呼ぶことにする。この大語群に対応したマークシートを作るにあたり、最初に決めておくべきことはもちろん選択肢の最大数。３０個もあれば十分な気もしたが、「大きいことはいいことだ！」とも言うし、どうせ作るなら１００個まで対応できるようにしようと決心。

数年前にマークシートリーダーを作ったとき、選択肢数５０個に対応した複数マーク読み取り可能なプログラムを書いた記憶があり、１０の位と１の位を分けてマークする次のような形式のマークシートがすぐに思い浮かぶ。１行あたり、２個までのマークを読み取れるようにコードを修正すれば、このマークシートで選択肢の番号を０－９９として、計１００個の大語群を使った試験にも対応できるはずだ。

このイメージを実現するにあたり、差し当たって問題になるのはマークシート用紙の基本サイズ。さすがにA3サイズの用紙は、マークシートとして使うには巨大すぎる気がする･･･が、１行あたり１０の位のマークに①～⑨で９個、１の位のマークに⓪～⑨で１０個、合計１９個のマークを用意して、得点設定は１設問１点で合計１００点とするためには、当然１００設問分の行を用意しなければならない。

１列５０行で２列作成するとなると･･･、やっぱり、B4版で、縦置きか？

これまでのマークシートは Word で作成していたので、今回も Word を利用。･･･と言うか、本当は印刷設定の自由度が大きい Excel を使いたいのだが、Excel で縦楕円の丸囲み数字を上手に作成する方法がわからない。そこで縦楕円の丸囲み数字が簡単に作成できる Word を利用した･･･というのが正直なところ。

ちなみに Word で縦楕円の丸囲み数字（＝「囲い文字」というらしい）を作成する方法は･･･

Word なら、Font は「メイリオ」を選択（フォントサイズを大きくしない場合）、丸囲みしたい数字を半角で入力、入力した数字をマウスでドラッグして選択してから、フォントリボンの「囲い文字」アイコンをクリックすると･･･

赤い枠で囲んだのが「囲い文字」を作成するアイコン。
数字を入力して、ドラッグして選択したのち、これをクリック。

ダイアログが表示されるので、スタイルを設定して･･･

さらに数字の選択状態は解除しないまま、段落リボンの「拡張書式」をクリックして、表示されるサブメニューのいちばん下にある「文字の拡大/縮小」をクリックして、さらに表示されるサブメニューの「６６％」をクリックすれば･･･

思った通りの囲い文字が完成！

あとはマークシート用途に利用できるよう、色の設定を薄めに変更する等して、必要な選択肢の数だけこれを作成すればいいんだけど･･･

これを Excel で実現する方法がわからない･･･

そのような理由から、とりあえず Word で作成してみたB4版・縦置き型のマークシート。
思ったより巨大で、マークするのがたいへんな気が。

読み取り実験用に設問番号１から順に、読み取りデータが設問番号と同じになるようマークしてみる。
１００個目は１の位の「０：ゼロ」をマーク。これで１から９９と０（ゼロ）で、合計１００の選択肢が使える大語群対応型マークシートが完成･･･したと思ったんだけど。

複数マークの読み取りを可能にするため、リーダーのプログラムを少し変更。

Delphiを起動して、マークシートリーダーのプロジェクトファイル一式をコピーして、新たな複数マークの読み取りに対応したプロジェクトを作成。

マーク読み取り手続き部分のコードを次のように変更。最初に手直ししたのは、P4Dを使ったスクリプト部分。

      //複数マークの読み取り方法
      if (Copy(strMS_Type,10,2)='19') and (chk_MultipleMarks.Checked) then
      begin
        //選択肢数が19で、複数マーク許可であった場合
        StrList.Add('                var1.Value = str(res)');
      end else begin
        //複数マークは不許可であった場合
        StrList.Add('                var1.Value = "99"');
      end;

Python側で読み取った値をDelphi側で処理する部分も変更（一部を抜粋）。

//選択肢の始まりは「ゼロ」
  if (Copy(strMS_Type,10,2)='19') and (chk_MultipleMarks.Checked) then
  begin
    //複数マークに対応
    //strAnsList[intSG_k]の文字数を調査
    strCount:=ElementToCharLen(strAnsList[intSG_k],Length(strAnsList[intSG_k]));

    //チェック内容は、以下の通り
    {
    文字数が２文字の場合、末尾の１文字を取得する
    10 -> 0
    11 -> 1
    19 -> 9
    末尾１文字がマークした選択肢の番号になる

    文字数が５文字の場合、
     1 10 -> ２文字目が1、末尾２文字が10 -> 10
     2 11 -> ２文字目が2、末尾２文字が11 -> 21
     3 12 -> ２文字目が3、末尾２文字が12 -> 32
    （２文字目×10）＋（末尾２文字 - 10）がマークした選択肢の番号になる
    }

    case strCount of
      2:begin
        //２文字の場合は、末尾１文字が選択した選択肢の番号
        StringGrid1.Cells[intSG_Col,intSG_Row]:=RightStr(strAnsList[intSG_k],1);
      end;
      3:begin
        //空欄と判定された場合
        if strAnsList[intSG_k]='999' then
        begin
          StringGrid1.Cells[intSG_Col,intSG_Row]:=strAnsList[intSG_k];
        end;
      end;
      5:begin
        //（２文字目×10）＋（末尾２文字 - 10）がマークした選択肢の番号
        StringGrid1.Cells[intSG_Col,intSG_Row]:=IntToStr(
          (StrToInt(Copy(strAnsList[intSG_k],2,1)) * 10) +
          (StrToInt(RightStr(strAnsList[intSG_k],2))) - 10);
      end;
    end;
  end else begin

次に、P4Dを使用しないDelphi用のOpenCVを利用したマーク読み取り部分のコードも変更（一部を抜粋）。

  //１行につき選択肢数分Loopする_複数選択肢に対応（New）_20240614
  if (Copy(strMS_Type,10,2)='19') and (chk_MultipleMarks.Checked) then
  begin
    //複数選択可能な場合_選択肢の数だけLoopする
    for p := 0 to intCol-1 do
    begin
      //対象値pが平均値の3倍より大きいか、どうかでマークありと判定
      if AryVal[p]>dblAvg * intKeisu then
      begin
        //マークありとした判定の数を記録
        q:=q+1;
        //マークした番号（記号）を記録
        //intMark:=p+1;
        //10の位(0-8)
        case p of
          0:strMark_A:='1';
          1:strMark_A:='2';
          2:strMark_A:='3';
          3:strMark_A:='4';
          4:strMark_A:='5';
          5:strMark_A:='6';
          6:strMark_A:='7';
          7:strMark_A:='8';
          8:strMark_A:='9';
        end;
        //1の位
        case p of
           9:strMark_B:='0';
          10:strMark_B:='1';
          11:strMark_B:='2';
          12:strMark_B:='3';
          13:strMark_B:='4';
          14:strMark_B:='5';
          15:strMark_B:='6';
          16:strMark_B:='7';
          17:strMark_B:='8';
          18:strMark_B:='9';
        end;
      end;
    end;
    //Loop終了時にマーク数を判定
    if q=0 then
    begin
      //マークした番号がない場合
      iArr[i,Rep]:=999;
    end else begin
      //マークした番号があり、それが一の位である場合
      if (q=1) and (strMark_A='') then
      begin
        //マーク数が１、かつ十の位が空欄であったら
        iArr[i,Rep]:=StrToInt(strMark_B);
      end else begin
        //マーク数は１だが、それが十の位であったら
        iArr[i,Rep]:=100;
      end;
      if (q=2) and (strMark_A<>'') and (strMark_B<>'') then
      begin
        //マーク数が２、かつ十の位と一の位がともに空欄でなかったら
        strMark:=strMark_A+strMark_B;
        iArr[i,Rep]:=StrToInt(strMark);
      end;
      if q>2 then
      begin
        //トリプル以上のマーク数を見分けるフラグは100
        iArr[i,Rep]:=100;
      end;
    end;
  end else begin

Delphiでマークシートリーダーを作成する方法の基本は過去記事をご参照ください。

Mark Sheet Reader (Basic version)

マークの読み取りそのものは「絶対成功する」自信があった（？）ので、複数マークの読み取り処理を既存のプログラムに追加すれば、速度的なことも含めて楽勝でプログラムは完成するはず･･･だったんだけれど。

実際に上のB4版・縦置き型マークシートをスキャンして読み取りテストを行ってみると･･･

P4D利用時の読み取り結果は期待した通り、100 ％正確にマークの読み取りに成功するが、P4Dを利用しない場合に不具合が発生。50設問目は正しくは「2」と読み取らなければならないはずなのに、読み取り結果の表示には、なぜかトリプルマークの判定結果である「100」が表示されている。

※ この時点では、必要数以上にマークがあった場合の表示フラグとして「100」を使用していた。
※ 最終的に、読み取れない解答欄は全て空欄の表示フラグ「999」で示すようプログラムを修正した。

さらに、よく見てみると 100 設問目もヘン。91、92、･･･、97、98、99 と順調に読み取って、最後は「 0：ゼロ」とくるはず！なのに、読み取り結果はトリプルマーク以上の判定結果である「100」がここにも登場。ヒトならともかく、機械が勢い余るはずもなく、誤認識の原因はまったくもって不明。

今までさんざんテストして、読み取りパラメータ設定も変更の必要が「ない」ところまで煮詰めたと思っていたのに、この結果には唖然とするしかなく、悪夢を見ているのではないかと思ったが。

現実は現実。

変更したコードを見直してみるが、おかしなところは見当たらない（ように思う）。
実際、大多数のマークは「ちゃんと読み取ってる」し･･･

なんで、部分的に読めない箇所があるのか？？？

読めないなら読めないで、「全部」間違うのが機械だと思うんだけど。

仕方がないから、パラメータ設定をいじってみるが･･･

これがデフォルトのパラメータ設定。
（自分的には、変更の必要がないと思えるところまで、さんざん修正を繰り返して決めた値）

パラメータをどう設定しても、一部のデータを誤って読んでしまう･･･。

例えば、閾値を「200」、判定領域を「20」に変更した場合、

47、48、49ときて、次は２のはずなのになぜか「42」
機械のクセに、勢い余ってるとしか思えない･･･。

こんなプログラムは使えない！！

２．次に作ったのはA4横型のマークシート

誰も助けてくれる人なんていないから、問題は自分で解決するしかない。まぁ、問題そのものを自分で作り出しているとも言えるわけで、自業自得と言えばそれまでのこと。自分以外の誰も困ってないし、それを幸いにあきらめてしまうのがいちばん簡単なことだが、それは最終手段。

原因はわからないが、今まで起きたことのないことが起きている、つまり、今までと違うことをしてるから、そこに問題の発生する原因そのものがあるはずだ。何が違うのか、そこを考えてみる。

今までと違うのは、まず、マークシートのサイズそのもの。B4版なんて使ったことがない。もしかしてそれが原因か？　判定プログラムでは行を図として切り出して、さらにマーク１つずつに分解し、二値化して「白」面積が大きいものを「マークあり」と判定しているから、二値化の閾値の設定にもよるが面積的な部分にも誤認識の原因があるような気もしてきた。そうでなくても、実際に使ってみて、やはりB4サイズは「マークシートとして大きすぎる」気がしたのは、ほんとう･･･。

もし、マークの読み取りプログラムそのものに誤りがあるなら、全てのマークを正しく読めないはずだが、ほとんど正しく読めているから、読み取りプログラムそのものに致命的な問題はない･･･はず。

そこで、これまでに正しく読み取れたものとサイズ的に同じ「A4版・横置き型」のマークシートを作成して実験してみることにする。

そう思って作成したのがこちらのマークシート。縦置きにしなかったのは、「今までと同じにする」という部分にあくまでもこだわった結果。

さすがにA4版・横置き型で１列５０行のマークシートは（自分の技術では）Word で作成できず、作成にあたっては（念願の？）Excel を使用。Excel で作成した際の画面はこんな感じ。

縦に長い楕円の囲い文字の作り方がわからず、仕方がないから丸囲みの番号でマークを作成
どこか、なにかが「チープな感じ」で、出来栄えもいまいち。

これで実験すると･･･、P4Dを使った場合からして

高速読み取り処理が可能なP4D環境で正しく動作しなかった時点で（これはダメだ）と思ったが、とりあえず非P4Dモードで動かしてみると･･･

B4版使用時は「唖然」とする思いであったが、今度は「暗澹たる」思いが。

この結果を目の当たりにしたときは、驚愕のあまり、言葉を失い、ついでにやる気もほぼ全部失い、PCの蓋を閉じて（この表現でいいのか？）、火酒を求めてバイクで現実から逃走･･･

あの土曜日の夜は、まじで、つらかった。

ひー（こころの声）

今、冷静になって考えると、P4Dモードでほとんど読み取れてないのはおそらくマークシートの罫線に問題があり（太すぎ）、これが複数マークの判定につながったのではないかと思えてならないが、最初からマークシートの作り自体が気に入らなかったこともあり、自分史的には･･･この実験自体を「なかった」ことにして、心のバランスを保つことに決定。

ただ、まだ「あきらめる」という気持ちには到底なれないので、このピンチをまたとないチャンスと前向きに捉え、Excel で縦長楕円の丸囲み文字を作成するところからチャレンジを再開。

あきらめられない以上、自分も、プログラムも良くなるしか「ない」。
それが嫌なら、はじめからこんなこと、しないほうがイイ。

このチャレンジは、僕にある唯一の「自由」なんだ。
暗澹たる思いなんかで、終わりにはしたくない。

３．Excel でマークシート作成に挑戦

Excel を起動し、何も入力されていない白い画面をじっと見つめて考える。

（縦長の楕円で、囲い文字をつくるには･･･）

経験から唯一思いつく方法は、図形（楕円）をセル内に収まるように挿入して右クリック、テキストの編集を選択して、中に数字を入力する方法だ。楕円の挿入方法は次の通り。

まずは、準備作業。

（楕円を挿入するより先に）あとあと作業しやすいよう、画面右下の「ズーム」で画面表示を拡大（238％くらいにした）して、全セルを選択（下図を参照）。で、列幅を28ピクセル、行の高さを32ピクセルくらいに設定。

B2のセルに収まるよう、楕円を挿入（ズーム300％）。

挿入した楕円を右クリックして、表示されたサブメニューから「テキストの編集」を選択（左クリック）。

半角で１と入れてみた。

ホームタブをクリックして、配置リボンにある「上下中央揃え」と、その下の「中央揃え」をクリック。

あとはマークシートのマークらしくするため、楕円をクリックして選択すると表示される図形の書式タブをクリックし、図形のスタイルリボンのコマンドを使い、楕円の中を白くして、囲いを灰色に設定。

フォントの色も灰色に変更。

で、セル内での図形オブジェクトの位置を微調整。

できた！

スキャナーで実際にスキャンしてみた結果から言うと、
実際に使用するマークシートではもう１段階濃い灰色を選んだほうがよさそう

あとは、コレを等間隔で上下の位置もそろえて並べれば･･･いい･･･んだが、その方法がわからない。

藁にも縋る思いで、Google先生に訊ねると･･･

単に「楕円を挿入したセルをクリックして選択し、オートフィルの機能を使って右方向へコピー」するだけ！だよって。

半信半疑で、やってみた。

表示された緑の枠の右下隅にあるハンドルをクリックして選択して、そのまま右へドラッグ。
すると･･･

マウスのボタンを離すと、表示されたのは･･･

これだ。これ！
これを待っていたんだ。

Google先生、ありがとう！

あとは数字を変更すれば･･･

こうして得た知識をベースに、これまでの経験を加えて Excel で作成したマークシートがこちら（枠の線の設定状態がよくわかるように、枠線の表示はONに設定した状態）

ページレイアウトタブの配置リボンの「配置」をクリックして、「枠線の表示」をオフに設定。

先の実験では、罫線の太さで痛い思いをした（？）ので、再びその轍を踏まないよう、罫線はいちばん細いものを選び、色もオレンジに設定。こうしておけば二値化する際に、罫線は完全に消えるはずだ。

注意：この時点では、そう、考えて罫線の色を設定しましたが、以下で述べる通り、いちばん細い罫線に対する色の設定は、印刷時に無効になり、印刷色は必ず黒になります！

で、罫線の色も文字の色（＝マークの色）と同じ薄い灰色に設定して試しに印刷してみると、なにか違和感を感じる印刷物がプリンターから排出された。よく見ると罫線の色が濃い！指定した灰色でなく、普通の黒のような気がしてならない。他の灰色を選んでも、印刷すると罫線の色は「まったく変わっていない」ように見える。もしかして、色の濃さの設定が反映されていない？

（オレンジ色にしてみるか？）

早速、設定 ⇨ 印刷を実行して確認 ⇨ 結果は「黒いまま！」

再び、Google先生にお伺いをたてて知った驚愕の事実。

「Excel はその仕様のため、いちばん細い罫線は印刷時に必ず黒で印刷されてしまう」とのこと。

まじですか？　まったく知りませんでした！！

あわてて２番目に細い罫線に変更。色はオレンジ色を指定（この色がなぜか、すーぱー気に入った）。

そうこうして、ようやく、これなら大丈夫と思えるマークシートが完成。

上記の方法で枠線の表示はOFFに設定した状態の画面。
自分的には、満足できる出来栄え。

４．マークシートを最適化

完成したマークシートの全体のイメージはこんな感じ。

１列あたり25行×４列、１行について19選択肢（10の位：1-9、１の位：0-9）、A4版・横置き、
最大１００設問に対応

ちょっとマークが小さいような気もしたが、数学・情報用に作成した１行あたり１６選択肢のマークシート同等に、隣り合うマークどうしの間隔もあけることが出来た気がする。これが近すぎると乱暴にマークされた場合、「複数マークあり」と判定してしまう危険性が高まってしまう。

また、１列あたり25行の設定としたことで、上下のマークの間隔も十分広くなった。B4版・縦置きの１列50行やA4版・横置きの１列50行よりも遥かに圧迫感は減少している気がする。

でも、試しに100設問分ぬってみたら、やっぱり、疲れた･･･。100設問分マークするってことは、その約２倍マークしなければならないから、疲れて当然と言えば、当然。

上のマークシートを、実際にスキャナーでスキャンしてJpeg画像に変換し、マークの読み取り処理を行ってみた。結果はPython環境を使っても、使わなくても、読み取り成功率は100％、ようやく期待通りに動くようになってきた。でも、途中、マークシート作成作業での失敗がなければ、Excel を使って（縦長楕円の囲い文字で）マークシートを作る技術は習得できなかった。「失敗は成功のもと」というけれど、今回あらためて諺の重みを実感。

次はマークシートの印刷の濃度の調整（最終仕上げ）。･･･と言うのも、実はマークの読み取り結果をExcel で処理して採点結果の通知シートを作ってる時は全く問題にならなかったことが、読み取ったマークシート画像に直接〇や × 、個々の設問の得点や配点、合計点等を入力して返却するように処理系全体を改良したら、これまで思っても見なかったことが重大な問題となってきたのだ。

次の画像を見れば、それは一目瞭然。

マークシートの印刷濃度を薄くしすぎると、スキャナーで読み取る際に枠やマークが本当に薄くなってほとんど見えなくなってしまうのだ。単にマークの有無を読み取るだけなら、■■■ からの距離でマークを切り出して二値化し、白面積を計算しているだけだからマーク以外の画像は真っ白でも何の問題もない（むしろ、それくらいの画像の方がより確実にマークを読み取れる）のだが、スキャンした画像そのものを採点結果通知に再利用するとなると、枠やマークがある程度は「見える・読める」ようにスキャンしなければならない。

マークシートのマークや罫線枠の灰色の濃度を少し濃く（下図を参照）して画像をスキャン、どの程度見えるようになったか、確認してみる。

１段階濃い灰色を指定（実際には Ctrl + A でオブジェクトをすべて選択してから設定）

スキャンして画像を表示してみると･･･

罫線の色をオレンジ色に設定したら、それがとても気に入ってしまったのだが、残念ながらスキャンすると罫線枠はほとんど消えて見えなくなってしまう（マークの有無のみを正確に読み取るという意味では、それは実に理想的なのだが）。ただ、マークシート情報の取得プログラムでは、マークひとつひとつを切り出すために罫線の枠の座標を利用しているから、罫線枠の左上隅と右下隅は座標を取得する場面では確実に見えるようにしておきたい。そこで、罫線枠の左上隅と右下隅だけは線の色を灰色にすることにした。（実は、上の画像はそれがほどこしてある画像）

まず、左上隅を設定。

同様に、右下隅も設定。

マークシートの情報を取得する際に、罫線枠が十分よく見えることを確認。

５．読み取りプログラムも修正

最終的に実用上問題のないプログラムにするため、思いつく様々なパターンで（誤りを含む）マークを作成し、これをプログラムがどのように判定するか、テストしてみた。

テスト用に、次のマークシートを作成。

動作検証用に作成したマークシート
（スキャンしたら、画像中央やや上に横線が入っていた。原因は不明。）

マークシートのスキャンに使っているスキャナーでスキャンすると、時々、黒い線の入ったJpeg画像が生成される。しかも、この黒い線はマークの読み取り判定になぜか？影響を与えない。

上半分だけ塗りつぶしたマークでも、正しく「４」と読んでいる。
複数マークありと判定されないのはなぜ？

この不思議な現象の原因はまったくわからないが、判定に影響を与えないから、これまでは（まぁいいか）としてきたが･･･。

いずれにしろ、このマークシートを使って動作検証を行った結果、先に記した判定プログラムでは対応できない問題が複数あることが判明。検証をくり返し実行して、一つ一つの問題に対応。最終的に完成したのが次のコード。

  //選択肢の始まりは「ゼロ」（１の位を基準）
  if (Copy(strMS_Type,10,2)='19') and (chk_MultipleMarks.Checked) then
  begin
    //strAnsList[intSG_k]の文字数を調査
    strCount:=ElementToCharLen(strAnsList[intSG_k],Length(strAnsList[intSG_k]));

    //チェック内容は、以下の通り
    {
    文字数が２文字の場合、末尾の１文字を取得する
    10 -> 0
    11 -> 1
    19 -> 9
    末尾１文字がマークした選択肢の番号になる

    文字数が５文字の場合、
     1 10 -> ２文字目が1、末尾２文字が10 -> 10
     2 11 -> ２文字目が2、末尾２文字が11 -> 21
     3 12 -> ２文字目が3、末尾２文字が12 -> 32
    （２文字目×10）＋（末尾２文字 - 10）がマークした選択肢の番号になる
    }

    case strCount of
      1:begin
        if StrToInt(strAnsList[intSG_k])<10 then
        begin
          StringGrid1.Cells[intSG_Col,intSG_Row]:='100';
        end;
      end;
      2:begin
        //２文字の場合は、末尾１文字が選択した選択肢の番号
        StringGrid1.Cells[intSG_Col,intSG_Row]:=RightStr(strAnsList[intSG_k],1);
      end;
      3:begin
        //空欄と判定された場合
        if strAnsList[intSG_k]='999' then
        begin
          StringGrid1.Cells[intSG_Col,intSG_Row]:=strAnsList[intSG_k];
        end;
        //３文字と判定された場合、十の位の１~９のダブルマークの場合、
        //２文字目は必ず半角の空欄になる
        if Copy(strAnsList[intSG_k],2,1)=' ' then
        begin
          StringGrid1.Cells[intSG_Col,intSG_Row]:='999';
        end;
      end;
      5:begin
        //文字列の置き換え（先頭２文字を抽出＆半角スペースを削除する）
        strData:=StringReplace(Copy(strAnsList[intSG_k],1,2),
          ' ', '', [rfReplaceAll, rfIgnoreCase]);
        //Case 5で先頭２文字が10である場合はダブル以上のマークあり
        if StrToInt(strData) > 9 then
        begin
          StringGrid1.Cells[intSG_Col,intSG_Row]:='999';
        end else begin
          //２文字目が半角スペースでなければ処理可能
          if Copy(strAnsList[intSG_k],2,1)=' ' then
          begin
            StringGrid1.Cells[intSG_Col,intSG_Row]:='999';
          end else begin
            //（２文字目×10）＋（末尾２文字 - 10）がマークした選択肢の番号
            StringGrid1.Cells[intSG_Col,intSG_Row]:=IntToStr(
              (StrToInt(Copy(strAnsList[intSG_k],2,1)) * 10) +
              (StrToInt(RightStr(strAnsList[intSG_k],2))) - 10);
          end;
        end;
      end;
      6..99:begin
        StringGrid1.Cells[intSG_Col,intSG_Row]:='999';
      end;
    end;
  end else begin

    //複数選択を許可しないマークシートの処理

  end;

end;

ここでいちばん困ったのは、必要以上にマークされていた場合の処理。

複数マークを容認しないプログラムなら、１行について２個以上マークされていた場合は「複数マークあり」を意味するフラグとして「99」、マークなしの場合（＝空欄）は「999」というフラグを用意して対応したが、今回のように複数マークを許可し、読み取り結果を 0 – 99 の100分類で表示する場合、空欄すなわち「マークなし」を「999」と表示するのは同じでよいとしても、十の位や一の位のマーク欄それぞれに２つ、ないし、３つ以上マークされていた場合のフラグをどうしたらいいのか？最適と思われる答えが見つからずにかなり悩んだ。

出来れば、既存かつ（プログラムによっては）数年をかけて動作検証済みの、読み取り結果のチェックプログラムや、採点結果通知のプログラムを修正せずに、それらをこの複数マーク対応採点システムにもそのまま適用できるように、処理の流れを作りたい。

必要数以上のマークがあった場合、当初、選択肢としては決して使うことのない「000」、「100」、「XXX」等をフラグとして利用することも、かなり真剣に考えたが、これらのフラグを新規に採用した場合、これまでに書いてきたマークシートの読み取り結果を記録したCSVファイルを利用して動作するプログラムをことごとく修正しなければならない。そして、それは新しいバグを生むことに、間違いなく直結する。それだけは、どうしても避けたい。

この際、読み取りエラーをすべて「999」で処理すれば、これまでの経験から、読み取り結果のチェックプログラムは確実に「空欄」＝「999」位置を教えてくれるし、もし、それが本当に「空欄」である場合は、人が見ればそれは一目瞭然、もし、それが空欄でない場合は、それを見た「人」に、マークの有無 or 空欄 or その他複数マークの判断を委ねればいい。そしてもし、「人」が見て、マークが正しければプログラムの判定結果を正しく修正、そうでなく、マークが「空欄でない」・「必要数以上にマークされていた」場合は、そのまま「空欄として処理（999）」してもらえば、採点結果には一切影響を与えないはずだ。

そう考えて、「トリプル以上のマークあり」をユーザーに伝えるフラグは用意せず、10の位に1つ、１の位に1つ以外のマークがあった場合はすべて同一に「空欄」フラグの「999」で処理することにした。

６．発見した問題点と解決策

上記動作検証用に作成したマークシートで、実際に動作確認を行った結果、ひとつだけ気になった点があった。それは、マークから横にはみ出て（横に広く）マークされると「トリプル以上のマークあり」という判定が出やすいこと。

「12」を読み取れていない。
おそらく１の位の「2」の横棒マークが「1」の領域に侵入している？

マークとマークの間隔を、これ以上広くするのはさすがに困難。１行19選択肢＋行番号というマークシートの形式そのものに起因する問題だから、これは試験の問題用紙の表紙に図付きで「横棒型の塗りつぶし禁止」＆「なるべく横に広がらないようマークする」注意を載せて、読み取り不能の「999」判定がなるべく出ないようにすることくらいしか、対策を思いつかなかった。

（縦に長い四角形、もしくは縦型の [ ] で数字を囲うことも考えたが、実際には試していない）

Python環境を利用しない場合は、判定領域をマークの中心付近のみに狭めることで読み取り精度を上げることができる。ただし、読み取り速度はかなり遅くなってしまう。

Python環境を使わず、判定領域を70→50に狭くして、実行すれば上の読み取りエラーは解消できる。

マークシートリーダー作成の初期、まだPython環境を利用できなかった頃、少しでも読み取り速度を早くできないかといろいろ考え、二値化後の白面積の計算領域をマークの中心付近のみとすれば、読み取り速度を向上させることができるのではないかと思って作った機能が思わぬところで役に立った！

以上が、解決策とは言えない対策と、読み取り速度を気にしなければ使える解決策。

７．まとめにならないまとめ

（１）実用的ではないかもしれないが、大語群（100選択肢）に対応したマークシートリーダー完成
（２）Excel を使って１行19選択肢で25行４列、A4横置きのマークシートを作成して試験を実施
（３）採点結果通知は付属の ReportCard.exe で作成

ReportCard.exe の使い方は、下のリンク先をご参照ください。

デジタル採点 All in One !

上のリンク先から、デジタル採点プログラム一式をダウンロードできます。

マークシートの採点結果通知（個票）及び成績一覧表の作成

ただし、選択可能な採点オプションの指定は「採点のみ」or「採点と配点」のみとなります。観点別評価の区分を含めて表示するオプションを選択しても、プログラムは複数マークに対応していないバージョンの流用なので、正解マークの位置を正しく表示できません。少なくても観点別評価の区分は表示できるよう、今後プログラムを改良する予定です。

追記　改良したプログラムに更新しました（20240625）

複数選択可能なマークシートについても、観点別評価の区分や正解マークの位置を表示できるよう、プログラムを更新しました。

この大語群専用マークシートを使用した試験の実施方法と、試験後の処理方法について次回の記事で詳細を説明する予定です。よろしければ、そちらの記事もご参照ください。

１００選択肢対応マークシートを使用した試験の実施方法

この記事で作成方法を説明した大語群専用マークシートを利用した試験の実施方法です。

マークを塗りつぶす時間を少しでも短縮できないかと考え、作成したマークシートもあります。

塗りつぶさないマークシート

「線を引く」方式でマークする、複数マーク対応型のシートをダウンロードできます。

８．プログラムのダウンロード

大語群に対応したマークシートリーダーは、下のリンク先からダウンロードできます。
なお、バックグラウンドでPython環境を利用し、より高速にマークの読み取り処理を実行するには、別途Python環境の組み込みが必要です。動作に必要なライブラリをインストール済みのPython環境は、当Blogの過去記事へのリンクからダウンロードできます。

Python環境の組み込みはカンタンです。ダウンロードしたZipファイルをダウンロードした後、任意のフォルダに展開、生成されたPython39-32フォルダを、そのまま MS_Reader.exe があるフォルダにコピーするだけです。

こちらの大語群に対応したマークシートリーダーは、当ブログの過去記事に掲載した複数選択不可のマークシートリーダーを、複数選択を前提として設計された専用マークシートのマーク読み取りに特化させたバージョン、いわば派生版です。複数選択不可のマークシートの読み取りにも使用できると思いますがテストは行っておりませんので、ダウンロードしたZipファイルを展開して出来る MS_Reader.exe は複数選択可能なマークシートの読み取り処理専用にお使いください。

この記事で紹介した通り、様々な要因から、マークシートによっては（基本設計が同じであっても）マークを正しく読み取れないことがあります。
また、添付した動作検証済みのマークシートをご利用いただいた場合でも、その印刷方法（輪転機使用等でマークが濃く印刷されていた場合）によっては、マークを正しく読み取れないことがあります。印刷用紙は再生コピー用紙で十分ですが、印刷には 必ずインクジェットプリンタを使用 し、スキャンしたJpeg画像において、マークや罫線枠がうっすらと判別できる程度の濃さで印刷していただく必要があります。

以下、読み取りテスト実行時の環境です。

・A4用紙は、（白くない）再生コピー用紙
・スキャナーは有名メーカー製複合機のスキャナー（カラー／読み取り解像度200 dpi）
・PCはPanasonic製Let’s Note CF-QV
・スキャンした画像をこのプログラム用に変換する際の倍率は80％を指定

「１画像変換」をクリックすると表示されるサブメニューの「専用画像を作成」をクリック

上記の環境で、筆者がテストした結果を記事としてここに掲載しました。発見した不具合も正直に書きましたが、筆者が発見していない不具合が他にまだあるかもしれません。ですので、ダウンロードしたマークシートリーダーのご使用はあくまでも自己責任でお願いします。

また、派生版であるため、プログラムには Excel Book に読み取り結果を出力する機能がありますが、大語群に対応した採点結果通知作成用の Excel ファイルは、Zipファイルを展開後、 eFile フォルダ内にあるテンプレートから生成できる Excel ファイルをマクロ有効な Excel Book として保存し、これを元にご自身で作成していただく必要があります。※ Zip ファイルに添付した Excel Book は、大語群マークシートに対応しておりません。

採点結果通知が必要な場合、Zipファイルに同梱した ReportCard.exe をお試しください。こちらは「まとめ」で紹介した通り、動作検証済みです。同梱の ReportCard.exe は選択肢が「ゼロ」から始まる教科「情報」用のマークシートにも対応したものです。

※ お使いのPC環境により、Python Engine の初期化に異様に時間がかかったり、おまけの機能である成績一覧表作成時に、罫線位置が誤って描画される不具合があります。罫線の描画に問題がある場合は、罫線機能をOFFにしてデータのみを出力してください。こちらの成績一覧表はメモ程度にお使いください。

なお、大語群対応のマークシートリーダーでは、マークの読み取り結果を最後に一括して表示する速度優先モード及び読み取り結果の音声読み上げ機能は使用できません。

本記事で紹介したマークシートを同梱しました。Zipファイル展開後に作成されるSample_MarkSheet フォルダ内にある R25C04D19.xlsx をご参照ください。

塗りつぶし形式のマークシートは、解答に時間がかかります！
「塗りつぶさないマークシート」の改良版が上記リンク先からダウンロードできます。こちらもあわせてお試しください。

次のリンク先からマークの高速読み取りを可能にする Python 環境を含めたデジタル採点プログラム一式をダウンロードできます。マークシートも、ここに紹介した形式の他、様々なタイプのものを同梱しています。

デジタル採点 All in One !

この記事で紹介した100選択肢対応マークシートリーダーの使い方は、次の記事をご参照ください。

１００選択肢対応マークシートを使用した試験の実施方法

９．お願いとお断り

無料で使える手書き答案採点補助プログラム

Answer Column Reader

スキャナーで読み取った手書き答案のJpeg画像から、大問１の設問（１）なら（１）のみを抽出、一覧表示してイッキに採点。採点記号（〇・△・× ）＆得点付きで元の答案画像に書き戻し、最後に得点合計を自動計算、指定位置に描画して、返却用答案画像（A4サイズに統一／縦・横の指定は可能）を印刷できる無料の手書き答案採点補助プログラムです。

一般的な横書き答案に加え、国語で使用される縦書き答案の採点も可能です。

新教育課程の観点別評価にも対応。もちろん、表計算ソフトを使わずに成績一覧表の作成・印刷・CSVファイルへの出力が可能です（ただし、成績一覧表の出来栄えは、メモ程度）。

画像処理に使用しているPython用OpenCV関連のファイルサイズが巨大ですが、このファイルサイズを許容していただければ、採点現場で十分使えると（複数の高校で使用中）評価していただけました！

もちろん、完全無料。ただし、動作保証は一切ありません。作成者（僕）は開発環境のDelphi（Object Pascal）の大ファンで、この他にも自作のマークシートリーダーなどを開発・このblogの過去記事で公開していますが、学問領域で評価の対象となるようなプログラミングに関しては全くの素人です。ですから、このプログラムのご使用に際しては、あくまでも素人が趣味で作ったものであるということを十分にご理解いただき、ダウンロードから展開・実行までALL自己責任でお願いします（有償販売禁止の他は、それが唯一の使用条件です）。発見できた不具合はすべて改良改善しましたが、取り切れていない未発見の不具合もまだきっとあると思います。それでも、もし、よろしければお使いください。僕の夢のカタチ、Answer Column Reader。

手書き答案採点補助プログラム、名付けて AC_Reader です。

追記（20250825）

当Blogで紹介してきた自作のデジタル採点プログラムを一つにまとめました。次のリンク先にその紹介とダウンロードリンクがあります。この記事で紹介している手書き答案のデジタル採点プログラムAC_Reader Version 2.1.1 と、AC_Reader Version 2.1.1 に自動採点機能を追加で搭載した Version 3.1.1 がプログラムセットに同梱されています。

デジタル採点 All in One !

【更新履歴】

高解像度画面で使いやすくするには？

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！

解答欄（矩形）検出器を改良しました！

（追記_20250825 ここまで

追記（20250707）

ここで紹介している手書き答案のデジタル採点補助プログラム AC_Reader に自動採点機能みたいなモノを搭載しました。

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！

【もくじ】

１．使い方
（１）zipファイルを展開
（２）プログラムを起動
（３）スキャンした答案の画像を準備
（４）採点用画像の準備
（５）解答欄の座標を取得
　・【座標データを追加したい場合は？】
　・【字数制限のある解答欄座標の簡単な取得方法は？】
　・【機械が認識しやすい解答欄】
　・【生徒の番号・氏名も解答横に表示して採点したい】
（６）採点
　・【全員正解を入力】
　・【全員不正解を入力】
　・【個別に採点】
　・【次の設問を採点】
　・【定型文を入力】
　・【入力した定型文の削除・消去方法】
（７）採点状況の確認
（８）返却用答案の印刷
（９）成績一覧表の作成・印刷
２．まとめ
３．お願いとお断り

１．使い方

もくじへ戻る

（１）zipファイルを展開

ダウンロードしたzipファイルをデスクトップ上に展開します（任意の場所に置いても動作すると思いますが）。PCによっては展開（解凍）に20分程度かかることがあるようです。

もくじへ戻る

（２）プログラムを起動

展開されたフォルダ内に「AC_Reader.exe」があります。これをダブルクリックしてプログラムを起動します。

初回起動時には、次のメッセージが表示されると思います。その場合は「詳細情報」（画像中、赤い枠で囲んで示した部分）をクリックします（プログラムの発行元が不明である場合に、Windows のDefender機能である SmartScreen がこの表示を出すそうです。自分の責任で実行すれば、次回からこのメッセージは表示されなくなります）。

すると、次の画面が表示されます。「実行」（画像中、赤い枠で囲んで示した部分）をクリックしてプログラムを起動してください。

プログラムの起動時に、次のメッセージが表示されます。「はい」・「いいえ」のいずれかを選択してください。

Excelの採点シートを使って処理する場合は、拙作マークシートリーダーとこの手書き答案採点補助プログラムを併用することも可能です（その方法についての説明は、今回は行いません）。

マークシート方式と併用することも可能ですが、今回は「はい」をクリックしてください。

国語の試験では縦書きの解答用紙が使われますので、この手書き答案採点補助プログラムも縦書き答案の採点が出来るよう設計しました。デフォルト設定の答案書式は「横書き」です。国語の縦書き答案を採点したい場合はここで設定画面を開き、縦書きを指定してください。

ちなみに「はい」を選んだ場合は･･･

答案の書式の設定変更を起動時に問われなくするよう設定できます。

試験は毎日行われているわけではなく、定期考査として２～３か月に１回実施されるのが普通です。これくらい間が空くと、△の付け方などをどうしても忘れてしまいます。「忘れた！」と毎回のように質問がありましたので、プログラムの起動時にメッセージとして、採点方法を表示することにしました。

この入力方法の案内は、画面右下の「終了」ボタンのとなりにある「入力方法のご案内」ボタンをクリックすれば、いつでも再表示できます。

入力方法はいつでも確認できます。

もくじへ戻る

（３）スキャンした答案の画像を準備

答案の画像は必ず「解像度200dpi程度」でスキャンし、「Jpeg画像として保存」してください。

重要　白黒の二値化画像としてスキャンしないでください。

なお、答案をスキャンする際は、次のことにご注意ください。

・答案が出席番号順に並んでいることを必ず確認してください。
・答案の向きは問いませんが、上下が揃っていることを必ず確認してください。
・試験を欠席した生徒がいる場合は、そこに未使用の解答用紙を挿入しておきます。
・消しゴムの屑等はよく払い落としておきます。
・一度に採点できる枚数は100枚を想定しています。
・答案に折り目がある場合は、なるべく平らになるよう折り戻しておきます。

スキャンした答案の画像は、科目名とクラス・講座名がわかるよう適切な名前をつけたフォルダ内に保存し、このフォルダをAC_Reader.exeがあるフォルダの「ScanData」フォルダにコピーしてください。

重要　スキャンした画像は、必ず「ScanData」フォルダ内にフォルダを作成し、保存してください。

重要　ScanDataフォルダ内のフォルダに階層構造を作らないでください。

よい例：

ScanData￥数学Ⅰ_１A

わるい例：

ScanData￥１年￥数学Ⅰ_１A

もくじへ戻る

（４）採点用画像の準備

上記の手順で、スキャンした答案のJpeg画像を所定の場所に準備したものとして説明します。

プログラムの画面右上にある「画像変換」ボタンをクリックします。

重要　採点用画像には、必ずこの画像変換プログラムが生成したJpeg画像を使ってください。それ以外の方法で作成した画像は使用できません！

次のWindowが開きます。「選択」をクリックしてください。

ScanDataフォルダ内に用意した「答案画像を入れたフォルダ」をクリックして選択します。
練習では予め用意されているSampleフォルダを選択してください。

重要　選択するのは「フォルダ」で、「ファイル」ではありません。

採点したい答案画像のあるフォルダをクリックすればOKです。
（ダブルクリックして開ける必要はありません）

サムネイル表示を見て、画像の回転の有無・回転方向を指定します。Sampleの画像で練習する場合は「なし」を指定してください。

次に画像のリサイズの有無を指定します。複合機のスキャナーを使用し、解像度200dpiでスキャンした画像の場合、80％程度に縮小すると採点しやすいと思います。答案画像をプレビューして縮小率を確認しながら作業することができます。

画像のリサイズ設定を行ったら、次に採点用画像の保存先を指定します。「参照」ボタンをクリックしてください。画像の保存先を選択するWindowが表示されます。

採点用画像の保存先は、ScanDataフォルダ内ではなく、「ProcData」フォルダです。

Procはprocessed（処理済み）の略です。

重要　ProcDataフォルダ以外の場所は、作業フォルダに出来ません！

画像の変換元として選んだScanDataフォルダ内のフォルダと同じ名前のフォルダを、プログラムはProcDataフォルダ内に自動的に作成します。ここでは、この自動的に作成されたSampleフォルダをクリックして選択し、OKをクリックしてください。

「変換実行」ボタンをクリックすると採点用にリサイズされた画像が上で指定したフォルダ内に作成されます。この処理はGDI+で書きましたので、それなりに高速だと思いますが、答案の枚数が多く、回転を伴う場合は少し時間がかかります。処理が完了するまでしばらくお待ちください。

この処理では用途の異なる２種類の画像を作成します。一つは採点マークのない各解答欄画像の読み取り元として利用する画像、もう一つは採点マークその他必要事項を上書きした返却用答案画像として利用する画像です。このようにすることで、何度でも採点のやり直しができる仕組みを実現しています。

注意していただきたいのは（めったにないことですが）、採点結果を答案画像に書き戻している最中に何らかの原因でプログラムが落ちた（クラッシュ／フリーズ）場合です。プログラムは採点結果を数値データとしてCSVファイルに書き込むと同時に、採点マークを付けて返却用答案画像にも書き込みます。CSVファイルへのデータの書き込みは一瞬ですが、返却用答案画像への書き込みには少し時間がかかります。したがって、この書き込み処理の最中にプログラムが落ちると、確かに採点した（採点データを保存したCSVファイルが存在する）のに、採点結果が正しく書き込まれていない答案画像が出来てしまうといった現象が起こります（過去１回だけ、この現象を確認しました）。このような場合には、それを発見した時点で採点済みのデータを読み込んで、再度（画像への）「書き込み」処理を実行すれば不具合を解消できます。

変換が終了すると、そのことを知らせるメッセージが表示されます。メッセージのOKをクリックすると注意のメッセージが表示されます。この注意のメッセージを確認した後、「終了」ボタンをクリックして、画像変換処理を終了してください。

メッセージの「OK」をクリックすると表示されるメッセージです。

画像のリサイズを行った場合は、その際設定した縮小率を試験で使用した解答用紙の残部などに必ずメモしてください。複数クラスで様式の異なる解答用紙を使って試験を行い、それぞれに74％、87％など細かな値を指定した場合は２日も経てばかなりの確率でその値を忘れます。この値を忘れた場合には、採点設定作業をすべてやり直すことになります。十分注意してください。

もくじへ戻る

（５）解答欄の座標を取得

次に解答欄の座標を取得します。その際、重大な注意事項があります。

重要　実際に試験で使用した解答用紙の画像を使用する

わるい例：
・輪転機で大量に印刷した解答用紙でなく、PCからプリンターに出力した解答用紙を使用

上のわるい例のように、実際に試験で使用した解答用紙とは異なる印刷環境で作成した解答用紙は、解答欄座標の取得には使用しないでください。見た目はほとんど同じでも、ほんのわずかな印刷位置のずれが採点作業のすべてに悪影響を及ぼします。この点には、どうか十分にご注意願います。

最初に開発したバージョンでは、拙作マークシートリーダーと同じように解答用紙に座標原点とするマーカー画像を設け、OpenCVのテンプレートマッチングの機能を利用して、マーカー画像からの距離で解答欄の座標を記録し、解答欄矩形の選択に利用していましたが、解答欄矩形を自動的に認識する方法を学んでからは、マーカー画像を利用し、手動で一つ一つ解答欄矩形を指定するよりも、解答欄矩形を自動認識して採点対象とする矩形の座標データのみを取捨選択して保存した方が、実際の採点に入るまでの準備作業時間を大幅に短縮できることがわかりました。また、輪転機を使用して印刷した解答用紙自体に解答欄の印刷位置のずれはほとんど生じないことも、マーカー画像を利用した解答欄座標の取得から、解答欄矩形を自動認識する方向へ設計を変更する大きな要因となりました。

以上の理由からご理解いただけると思うのですが、この手書き答案採点補助プログラムで使用する解答用紙は「解答欄の印刷位置がすべて揃っているもの」でなければなりません。

前置きが長くなりましたが、その具体的な方法は次の通りです。

最初に画面右上の「採点作業」ボタンをクリックしてください。

以前に使用した採点設定ファイルが見当たらない場合は、次のメッセージが表示されます。

以前に使用した採点設定ファイルがある場合は、次のメッセージが表示されます。

使用する採点作業の入力欄に下の例のように入力します。

例：R06_考査①_物理基礎

前の方が見えませんが･･･

重要　採点作業の名称にはクラス名を入れないでください。

同じ採点作業の設定を複数クラスに適用する際、採点作業名に特定のクラスの名称が入っていると、なんとなく違和感を感じませんか？（僕は違和感を感じました）

このプログラムでは、（同一問題で実施した）試験の答案をクラス・講座毎のフォルダに準備して、同じ（一つの）採点設定をそれぞれのクラス・講座に適用して採点します。したがって、採点作業の名称には「クラス名を入れない」ことが望ましいわけです。※ クラス名が入っていても採点作業に使えないわけではありません。

採点作業名を付けたら、入力欄の右側にある「Auto」ボタンをクリックしてください。

ほんとうは「解答欄矩形の自動選択」のような名称にしたかったのですが、スペースが･･･

次のメッセージが表示されます。よく読んでOKをクリックしてください。

AC_Readerとは別に、解答欄矩形を見分けて自動選択するプログラムが起動します。このプログラムもObject Pascal に埋め込んだ Python Script で Python 用の OpenCV の機能を利用して動作します。

重要　RectangleDetector.exeを直接起動しないでください

重要　矩形検出機能はAC_Readerから呼び出して使ってください

解答欄矩形を認識するプログラムの名称は「Rectangle Detector（長方形検出器）」です。最初に画面左下にある「画像選択」ボタンをクリックしてください。

ここではフォルダではなく、「ファイルを選択」するダイアログボックスが表示されます。どれでもよいのですが、欠席者がいる場合は、解答欄に何も書き込まれていない欠席者分の解答用紙の画像を選択した方が、誤検出は明らかに減ると思います。ファイルを選択したら「開く」ボタンをクリックしてください。

重要　ここではフォルダではなく、ファイルを選択します。

重要　実際の試験で使用した解答用紙の画像で作業します。

解答用紙の画像が表示されます。上下のスクロールバーを操作して、図のように解答用紙の解答欄の直線部分とRectangleDetectorの画面枠の二つを見比べやすい位置に画像を上下に動かして、解答用紙が大きく傾いていないことを確認します。

スキャナーによっては、その機材特有の「クセ」のようなものがあり、どれほどきちんと解答用紙をセットしても必ず0.3～0.4°くらい読み取った画像が傾いてしまう場合があります。サービスマンの方に相談したところ、「答案に付着した消しゴムの屑がローラー等に詰まって、読み取り結果に悪影響を及ぼしているのではないか？」との意見をいただき、実際、スキャナーの可動部をきれいに清掃して試したところ、読み取り結果が改善された経験があります。しかし、その後、またすぐにその機材で読み取った画像は同じ方向に傾くようになりましたので、毎回クリーニングする必要があるのかもしれません。ただ、可動部をクリーニングしなくても、ほとんど傾かずに読み取ることもあり、結局、「これは運だ！」と割り切って、プログラム側で傾きがあった場合は修正できるよう、傾き補正の機能を追加しました。

傾き補正の機能を追加する際に気づいたのですが、回転させた画像をさらに回転させると、画像の質が著しく劣化し、これを繰り返すほどに全体がぼやけて、解答の読み取りに支障をきたす恐れがあるように感じました。そこで、画像の初期状態を保存しておき、回転は必ず初期状態のものに対して行うようプログラミングしました。「なぜ、少しずつ連続して回転させることができないのだろう？」と疑問に思われる方もいらっしゃるかもしれませんが、これがその疑問への回答です。

上の画像のような状態であれば、傾きの補正は必要ありません。オプションボタンは「実行」をクリックして選択してください。また、あまりにも小さな矩形は「解答欄ではない」と判断できるよう、矩形の面積閾値を設定してあります。こちらはデフォルト設定700のままでお試しください。

傾きの修正が必要な場合は「試行」を選択し、修正量を確認してください。
修正量を確認後、その値で傾きの補正を「実行」してください。
（「試行」を選択した場合は、最終的なデータの保存ができません）

続けて答案の「横書き・縦書き」を指定します。Sampleは横書き答案ですので、オプションボタンは「横書き」をクリックして選択してください。

ブロックというのは（表現に苦しんだのですが）、「解答欄の集合をブロックとして見分けられるか・どうか」という意味です。下の図のような解答用紙の場合、１ブロックと表現しています。

ちなみに、次のような場合が２ブロックです。ご理解いただけましたでしょうか？

傾きの修正が必要な場合は、次のGUIで操作してください。「傾き修正」に✅を入れて、▲は修正値を増やす（回転方向は時計回り）、▼は修正値を減らす（回転方向は反時計回り）、「適用」は回転の実行、「やり直し」は画像を初期状態に戻します。

解答欄を取得する準備が整ったら、「解答欄取得」ボタンをクリックしてください。

誠に心苦しいのですが、PCによっては初回実行時、Python Engineの初期化に異常に時間がかかることがあります（職場のPCでは４分程度）。自分のPC（Panasonic製 Let’s note CF-QV）では数秒で終了する処理がなんでPCによってはとんでもない時間を要する処理になるのか？その理由は未だにわかりません。

とにかく、マウスカーソルが砂時計？表示になっていればプログラムは正常に機能していると思われますので、５分程度お待ちください。いったんPython Engineの初期化に成功すれば、プログラムを終了しない限り、２回目以降の実行は何の問題もなく、ほんの数秒で解答欄座標の取得が完了するはずです。

【追記_20250826】

初回起動時に待機状態が長く続く原因が判明しました！
原因はアンチウイルスソフトの未知のDLLスキャンでした。このことについての詳しい解説は次のリンク先の記事をご参照ください。

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！

参考　横書き答案の場合、解答欄矩形の座標はｘ軸方向については左から右へ、Y軸方向については上から下へという順番で読み取ります。

参考　縦書き答案の場合、解答欄矩形の座標はｘ軸方向については右から左へ、Y軸方向については上から下へという順番で読み取ります。

ただし、解答用紙の画像が右肩上がりに傾いていた場合、Y軸（上下）方向の座標の上下関係から、より値の小さな（座標原点0,0は解答用紙画像の左上であるため）上の方をプログラムは先に読み取ってしまいます。そのため、横書き答案であっても解答欄矩形の読み取り順が右から左になる現象が発生します。こうなると解答欄矩形の座標の選択作業が著しく煩雑になってしまいます（解答欄矩形の座標自体は読み取れていますから作業ができないわけではありません）。これを防止するために、最初に答案画像の全てに対し、傾きの修正を行う必要があります。

解答欄座標の取得が完了すると、次の図にあるように解答用紙上に赤い矩形が描画されます。小さくてわかりづらいかもしれませんが、画面右上の解答欄座標の値が表示されている部分で、カーソルがある（カーソルが点滅している位置の）解答欄座標が赤の矩形で示されています。ここから必要な座標と、いらない座標を取捨選択する作業を行ってください。

上の図で示されている矩形（座標）は採点には不要です。このまま無視して次へ進んでも構いませんし、面倒でなければ不要な座標は削除することもできます。

「編集」ボタンをクリックすると、キャプションが「編集中」に変わり、カーソル位置の座標が選択された状態になります。DELキーを押し下げして、不要な座標を削除します。

次の図は（削除作業を行わずに）上の図の状態から↓矢印キーを１回押し下げして、カーソルを２行目に移動させた状態を表しています。不要な解答欄座標の削除作業を行った場合は、自動的にこの状態になります（１行目にあった不要な座標は当然消えています）。

２行目の座標が示す矩形はまさに解答欄ですから、これは必要な座標ということになります。このような座標は「移動」ボタンをクリックして、必要な座標ばかり集めたメモの方へ移動させます。次の図は２行目の座標を移動させた直後の状態です。

下向きの矢印キーを押す。必要な座標であれば「移動」ボタンで下のメモに移動する。この作業を繰り返して採点する順番になるよう、解答欄の座標をすべて取得します。次の図は一通り、解答欄の座標を取得した状態です。

続いて正しく解答欄座標が取得できていることを確認します。上の図の移動済み解答欄座標が表示されているメモ（赤枠内）の先頭の座標データをクリックしてください。メモは必要であれば上にスクロールしてください。メモの先頭の座標データをクリックしたら、答案の画像も上にスクロールしてください。画面は、次の図のようになります。

このまま、下向きの矢印キーを次々に押し下げして、赤枠で示される解答欄矩形が必要数あるか・どうか、及び、採点順に並んでいるか・どうかを確認して行きます。

もくじへ戻る

【座標データを追加したい場合は？】

様々な事情から、座標データを後から追加・変更したい場合もあるかと思います。例えば、次の図のように青枠で囲った解答欄AとBを抱き合わせて採点（両方正解で〇等）したい場合です。

このような場合は、該当の座標データの「末尾」にフォーカスした状態で（＝座標データの末尾にカーソルを置いて）、「移動」ボタンの隣にある「追加」ボタンをクリックし、さらにEnterキーを１回押し下げして改行します。次の図は、その状態を示します。

次に、画面の真ん中よりやや右にある追加ボタンをクリックします。

答案画像の上に赤枠の矩形が表示されます。この矩形を新しく解答欄座標を取得したい解答欄に重なるように移動・変形してください。矩形を移動させたい時は、矩形の上の横線中央よりやや右の位置をポイント（マウスのカーソルを載せる）すると、マウスカーソルが上下左右の白い矢印に変わり、ドラッグアンドドロップできる状態になります。

抱き合わせて採点したい解答欄を矩形で囲んだら（下の図のような状態）、キャプションが「取得」に変わったボタンをクリックします。すると、ボタンの右側に、現在表示されている矩形の座標が表示されます。同時に、この矩形データはクリップボードにも送信されています。

続けて、右側のメモ内の先ほど改行して空行になっている箇所をクリックしてCtrlキーを押しながらVキーを押す（右クリックして表示されるサブメニューから「貼り付け」を選択）等して、取得した座標データを付け加えます。正しくメモに追加できたら、メモの上の「追加中」ボタンをクリックして、キャプションを「追加」に戻します。

上下の矢印キーを押して、解答欄Aの座標を探し、「追加」ボタンをクリックして、メモを編集可能な状態に変更、データを削除します。削除後、編集が終了したことをPCに伝えるため、「追加中」ボタンをクリックして「追加」に切り替えます。

解答欄Bの座標も、解答欄Aと同様に作業してメモから消去します。

注意　「追加中」状態で作業しないとエラーが発生します！

もくじへ戻る

【字数制限のある解答欄座標の簡単な取得方法は？】

例えば、次のような多数の細かい枠で構成された字数制限のある解答欄がある場合、このまま矩形座標の自動取得処理を実行すると一つ一つのマス目の座標をもれなく取得・表示してしまいます。

このような場合は、解答欄を作成する段階で、外枠のみ実線で描き、内部の枠はすべて「点線」で描くようにします。点線は、色が薄く、間隔の狭い、細い点線でなく、次の図に示すように、色が濃く、間隔が広い、太い点線を使用してください。

解答欄内部の枠を「点線」で描くとプログラムは外側の枠のみを解答欄座標として認識します。

実は、最初の段階からこの「字数制限のある解答欄の認識処理をどうするか？」という問題は大変気になっていたのですが、親しい国語の教員が作成した解答用紙をスキャンして、解答欄の座標を自動取得する作業を手伝った際、解答用紙の点線部分をプログラムが認識しないことを偶然発見、大喜びしたというのが本当です。最初から、僕に、そのような知識があったわけではありません。

偶然とは言え、僕の不出来なプログラムの動作を信じて、それでも使いたいと言ってくれた彼女に、心から、ほんとうに、こころから、「ありがとう」です。巡り合ってから、もう、30年になりますが、Sさん、ほんとうに、ありがとう！あなたがいてくれて、ほんとうに、よかった！！

ただし、これは「諸刃の剣」で、何らかの原因で解答欄の枠線の一部が途切れていると、プログラムは正直にその部分は「矩形ではない」と判断して、座標データの取得対象から除外します。ですので、解答用紙を印刷する際は、解答欄が完全に実線で囲まれているか・どうかを、よく確認してから印刷する必要があります。

もくじへ戻る

【機械が認識しやすい解答欄】

解答欄を構成する矩形は必要最小限度に留めるのが、解答欄座標を自動認識・取得する作業を効率よく進めるための何よりのポイントです。

もくじへ戻る

【生徒の番号・氏名も解答横に表示して採点したい】

重要　横書き答案の採点時のみに利用できる機能です。

こちらは同僚からの要望があって付け加えた機能です。解答用紙の氏名欄の画像を取得して、採点時に該当生徒の解答欄の横（位置の指定も可能）に、試験を受けた生徒の出席番号や氏名を表示できます。「追加」ボタンをクリックして赤枠の矩形を描画・適切な位置へ移動後、解答欄矩形としての「取得」の代わりに、「氏名欄取得」のボタンをクリックして、次の図に示すようなかたちで解答用紙の氏名欄の座標を取得してください。ただし、指定する矩形の高さは、解答用紙の解答欄の高さの最小値を超えないよう、十分注意してください。

重要　「解答欄の高さの最小値を超えない高さ」で範囲指定してください。

最後に、取得した解答欄の座標を保存して作業は終了です。画面右にある「保存」ボタンをクリックしてください。

次の確認メッセージが表示されます。

採点作業名として設定した名称で、イニシャライズファイルが作成されています。この採点作業名をクリックするとダイアログの下のファイル名が採点作業の名称に変化します。この状態で「保存」ボタンをクリックしてください。

採点作業名を設定した際にiniファイルも作成されています。
解答用紙の種類に合致するファイルをクリックして選択・上書き保存します。

次のメッセージが表示されます。「はい」をクリックしてください。

解答欄の数によっては、少し（数秒程度）時間が必要です。保存作業が完了すると次のメッセージが表示されます。このメッセージが表示されるまで、何もしないでそのままお待ちください。

画面右下隅にある「閉じる」ボタンをクリックしてプログラムを終了します。解答欄矩形の座標の候補を表示する上のメモにデータがある場合は、「閉じる」をクリックすると、次の確認メッセージが表示されます。「はい」をクリックしてプログラムを終了させてください。

以上で、解答欄の座標の取得作業は完了です。

【追記_20250825】

上で紹介した矩形検出プログラムを全面的に改良しました。気が付いた（気になっていた）不具合は全て改善できたと思います。不具合の改善他、改良された矩形検出プログラムの詳細は、次のリンク先記事をご参照ください。

解答欄（矩形）検出器を改良しました！

この Blog でご紹介したデジタル採点プログラムの最新版を１つにまとめた zip ファイルを次のリンク先からダウンロードできます。サポートなし・完全自己責任でという使用条件ですが、もちろん無料でお使いいただけます。

デジタル採点 All in One !

もくじへ戻る

（６）採点

解答欄座標取得後、すぐに採点を実施する場合は、タスクバーにAC_Readerが眠っていますので、クリックして起こしてください。そうでない場合は、AC_Readerを起動してください。

解答欄矩形取得直後、AC_Readerはタスクバーに眠っています。
タスクバーにある上のアイコンをクリックしてください。
AC_Readerが目覚めます！

画面の右上にある「採点作業」ボタンをクリックしてください。

次のメッセージが表示されます。既存の採点設定を利用して採点しますので「はい」をクリックしてください。

バルーン型のヒントが表示されます。V マークをクリックして表示される選択肢から採点設定ファイルを選んでください。

採点設定ファイルを選んだ直後の状態です。

画面中央には、次のメッセージが表示されます。OKをクリックするとフォルダの選択ダイアログが表示されます。

採点したいクラスのフォルダを選択してOKをクリックしてください。

採点結果を記録したCSVファイル（場所はユーザーに提示しません）がない場合には、次のメッセージが表示されます。

画面は次のようになります。

画面上方、中央よりやや右に、どこにもドッキングしないフローティング状態の必要最小限の採点機能をまとめたパネルがあります。このパネルのタイトルバーの部分を左クリックしてドラッグ＆ドロップすると任意の位置へ移動できます。採点しやすい位置へ移動してお使いください。

もくじへ戻る

【全員正解を入力】

解答をざっと見て、過半数が正解であるような場合は、全員に正解を入力し、後から不正解の解答のみチェックして、採点を × に変更します。

ComboBoxの選択肢に「２」を指定して、「入力」ボタンを

設定画面から、採点記号の表示位置や大きさなど、各種設定を変更・保存できます。

もくじへ戻る

【全員不正解を入力】

フローティングパネルの得点欄に０を設定して、入力をクリックすれば、全員不正解となります。

０（ゼロ）は〇（まる）と見間違える可能性があるため、
デフォルト設定では、不正解の場合、得点０を表示しません。

もくじへ戻る

【個別に採点】

重要　左手で入力作業、右手は選択作業（クリックに専念）

・正解〇を入力

まず、個別に採点する際の正解入力は、次のように行います。

解答欄に採点記号〇と得点が描画されます。

・不正解 × を入力

不正解を入力する場合は、次のように操作してください。

もちろん、数字キーの０（ゼロ）でも × を入力できます。ただ、０はちょっと位置が遠い･･･

・部分点あり △ を入力

部分点ありの場合は、採点記号△と部分点を入力します。方法は、次の通りです。

「部分点あり」のフラグは「－」記号の有無です。
プログラムは負の数の入力を部分点ありと判定しています。
（合計点は絶対値で計算するので、問題ありません）

重要　最後に「書込」を忘れずにクリックします。

もくじへ戻る

【次の設問を採点】

右向きの三角マークをクリックすると、次の設問の解答欄が表示されます。

右側の操作パネルからも同じ操作を実行することができます。

もくじへ戻る

【定型文を入力】

記述式の設問等で「ここまで何点」のような定型文を記録しておいて適宜入力できます。

「設定」をクリックして、「入力定型文の編集」にチェックを入れます。

画面左上に次の表示が出ますので、内容を編集します。「記録」ボタンをクリックすると編集内容が保存されます。保存後、「入力定型文の編集」のチェックを外し、編集欄を非表示にします。

定型文を入力したい設問の解答欄を採点します。採点後、定型文を入力したい箇所の左上隅あたりにマウスのカーソルを持ってきて右クリックします。表示されるサブメニューから「定型文入力」を選択（クリック）してください。

重要　採点しないと定型文入力はできません！

編集済みの定型文が指定位置に入力されます。

もくじへ戻る

【入力した定型文の削除・消去方法】

入力済みの定型文を削除・消去するには、まず、定型文を削除・消去したい解答欄の真ん中付近をクリックします。次に、右側のGridコントロールの青く反転表示された数値を消去して、Enterキーを押してください。

もくじへ戻る

（７）採点状況の確認

現在の採点状況を、解答用紙全体の画像を表示して確認することができます。次のように操作してください。

画面右側の中ほどにある「返却答案を表示」をクリックします。画面は現在選択されている生徒の解答用紙が表示されます。画面をスクロールして、採点状況を確認してください。

移動のボタンで、別の生徒の答案も確認することができます。

左のボタンで「一枚前へ」、右のボタンで「次へ」移動します。

もくじへ戻る

（８）返却用答案の印刷

採点が終了したら、返却用の答案を印刷します。まず、画面右下のプリンタの選択肢から、出力先のプリンタを選択します。次に「合計の印刷」の有無を指定します。「有」を選択した場合は、次の案内が表示されます。

印刷は採点終了後、最後に実行するので、採点と印刷の処理をお互いに行ったり来たりすることは「ない」と判断し、印刷実行後はプログラムの終了のみ可能となっています。

「いいえ」をクリックした場合は、採点処理が継続されます。「はい」をクリックした場合は、次の案内が表示されます。

「はい」を選択すると、次に合計点の印刷処理の案内が表示されます。

フォントサイズは、40～50程度が適切な場合が多いように思います。半角の数字で入力してOKをクリックしてください。

OKをクリックすると、次の案内が表示されます。

OKをクリックして、合計点印刷位置を指定します。

クリックした瞬間に自動計算された合計点が指定位置に表示され、次のメッセージが表示されます。

よろしければ「はい」を、位置の指定をやり直す場合は「いいえ」をクリックします。「いいえ」をクリックした場合は、再度、合計点を印刷する位置の指定をやり直してください。その際、前回に指定した位置にゴーストというか、残像のようなものが残りますが、実際の印刷時にはゴースト・残像は印刷されません。

「はい」をクリックした場合は、次のメッセージが表示されます。

画面右下の「印刷」ボタンをクリックしてください。

「印刷」をクリックすると、次のメッセージが表示されます。

OKをクリックすると、プリンタの設定画面が表示されます。この画面はお使いのプリンタにより異なりますが、重要なチェックポイントは次の３点です。

重要　印刷する用紙がA4版であることを確認する

重要　印刷用紙の縦・横指定を答案に合わせて指定する

重要　両面印刷は必ずOFFに設定する

設定画面を閉じると、次のメッセージが表示されます。

「はい」をクリックした場合は、全員分の返却用答案がプリンタへ出力され、次のメッセージが表示されます。

「いいえ」をクリックした場合は、次のインプットボックスが表示されます。

答案の通し番号を入力してOKをクリックしてください。
採点対象がクラスであれば、出席番号となります。

OKをクリックするとプリンタへ印刷データを送信後、次のメッセージが表示されます。

「はい」をクリックすると、再びインプットボックスが表示され、引き続き単票の印刷処理が継続して行われます。「いいえ」をクリックした場合は印刷処理を終了します。画面右下の「終了」ボタンをクリックして、プログラムを終了してください。その際、次の案内が表示されます。

もくじへ戻る

（９）成績一覧表の作成・印刷

画面右にある「成績一覧表を作成」の「Excelを使わずに作成します！」をクリックします。

画面は成績一覧表作成モードになります。クラス単位の採点である場合は、学年・クラスを指定（選択）します。

重要　予めsNameフォルダに生徒氏名データを用意しておきます。

重要　講座単位の処理の場合も、講座名等で氏名データを準備しておきます。

重要　氏名データの並び順は、答案の並び順と一致させてください。

クラスを指定する場合は、直接入力してください。

講座を指定する場合は、学年・組は「空欄」のまま、「観点区分入力」に進んでください。

観点別評価の区分を入力後、「保存」をクリックしてください。

保存後、「採点結果表示」をクリックして、採点結果の一覧を表示します。

学年・組を「空欄」で処理していた場合は、ここで「講座等」の名票を選択します。

次に、合計点が０の生徒について、欠席者であるか（平均点の計算から除きます）・真に０点であるのかを指定する処理を行います。「欠席者を除外」をチェックしてください。

合計点が０の生徒がいる場合は、次のメッセージが表示されます。

試験を欠席していた場合は「はい」を、０点であった場合は「いいえ」をクリックします。
（ここでは「はい」で処理します）

「再計算」ボタンをクリックして、平均点他の再計算を実行します。

プレビューをチェックして、印刷プレビューを表示します。

プレビューをチェックすると、印刷プレビューとともに、次のメッセージが表示されます。

表示されるメッセージ。

プレビューのチェックを外すと、次のバルーンヒントが印刷ボタンを案内します。

「印刷」ボタンをクリックすると、印刷設定のダイアログが表示されます（ダイアログはプリンタにより異なります）。成績一覧表はデフォルトで「A4・縦置き」印刷に設定されます（この設定を変更することはできません）。

OKをクリックすると、印刷データがプリンタへ送信されます。送信が完了すると、次のメッセージが表示されます。

なお、これとは別に、このプログラム用に作成したExcel Book（添付したマクロ有効テンプレートのコピー）へ採点結果を出力し、成績一覧表及び個人成績票を作成する機能もこのプログラムにはありますが、これに関する説明はまた後日、このblogに掲載できたら･･･とも、考えています。が、ほとんど！！どなたにもお読みいただけないであろうMy blogですので、もしかしたらそれは、はるか未来の話になるかもしれません。

ただ、PCの操作及びExcel Bookの扱いに慣れた方なら、このプログラムに添付したマニュアル（以前のバージョンのものなので画面や内容が現行バージョンと若干異なります）と、マクロ有効のExcel Bookの式とマクロをご覧いただければ、操作方法並びに機能の概要はおわかりいただけるのではないかと考えます。

このExcel Bookに対する出力機能は、（ここに掲載した）成績一覧表を独自に作成する機能をこのプログラムに追加する以前に作成し、実際の試験の採点で何回も活用済みのものですが、こちらも動作保証等は一切ありません。もし、お使いになる場合は自己責任でお願いいたします。

以上で、成績一覧表の印刷は終了です。

もくじへ戻る

２．まとめ

今回、掲載した手書き答案採点補助プログラム（新教育課程観点別評価「知識・技能」及び「思考・判断・表現」の評価に対応）の概要は以下の通りです。

【出来ること】

（１）スキャナーで読み取った答案画像から設問ごとに解答欄を抽出して一括採点。
　　　※ 答案画像からの解答欄座標の取得は矩形認識プログラムで（半）自動実行。
（２）解答欄画像の隣に受験者氏名等を表示（予め氏名欄等の読み取り設定が必要です）。
（３）記述式の解答に対する定型文コメントの入力。
（４）採点結果を出力した返却用答案画像の作成と印刷（A4版限定・縦横指定は可能）。
　　　※ 得点合計を自動計算、返却用答案の指定位置に印刷可。
　　　※ B4やA3の答案画像は、A4サイズに縮小して印刷します。
（５）表計算ソフトを使わずに、成績一覧表（教科担任用）を作成。
（６）成績一覧表データをCSVファイルに出力（観点別評価のうち、２観点の評価に対応）。
（７）拙作マークシートリーダーを利用した試験との併用も可。
　　　※ マークシートの読み取りプログラム一式も同梱しています。
（８）PDF化した答案画像をJpeg画像化して採点（添付のPdf2Jpg.exeを使用）。

【出来ないこと】

機械学習による手書き文字の認識にも過去にチャレンジ（〇・× 及びカタカナのアイウエオを判定）したことがあるのですが、どう頑張っても認識率が１００％にならない（控えめな表現で９割程度は正しく認識するのですが、解答欄からはみ出した文字や、それは「ア」でなく「つ」と「ノ」でしょ！みたいな文字を構成する部品が極端に離れている字？や、大きく傾いた文字は正しく認識できない）ので、残念ですが、この機能は搭載を見送りました。

〇×記号やカタカナ一文字の認識結果を目視でイチイチ確認するのはどう考えても二度手間です。現時点では、ヒトが行った採点結果を機械にチェックさせる方向で活用した方がいいかもしれません。学習モデルの作成については、Pythonを利用した事例がWeb上に読み切れないほど存在しますが、（僕が実験した範囲では）それらよりMicrosoftのLobeで作成した学習モデルの方が高い認識率を示しました。このことについては当blogの過去記事でその例を幾つか紹介しています。ここで紹介した採点補助プログラムには搭載を見送った自動採点機能ですが、僕の実験結果が何かの参考になれば幸いです。

もくじへ戻る

３．お願いとお断り

もくじへ戻る

マークシートの採点結果通知（個票）及び成績一覧表の作成

ただし、表計算ソフトは使わずに。

【ご案内】20240929追記

この記事で紹介した採点結果通知作成プログラムにはバージョンアップ版が存在します。使い方の詳細は、次のリンク先の記事をご参照ください。使用要件に同意していただければ、マークシートリーダーの最新版や、その他のデジタル採点プログラムのダウンロードが可能です。

デジタル採点 All in One !

※ 記事中の「マークシートリーダー」とは、僕がDelphiで作ったマークシートリーダーのプログラムのことです。その最新バージョンと、この記事で紹介するプログラム一式を同梱したZipファイルをダウンロードできます。

【はじめに】

マークシートを利用する際、マークをミスなく読み取れたら、次に読み取り結果を適切に処理する作業が待っています。読み取り結果をCSVファイルに出力し、表計算ソフトで作業するのが一般的な処理の流れだと思いますが、表計算ソフトに苦手意識を持つ方が多いのも事実です。

そこでアンケート集計用途ではなく、試験の成績処理用途専用という「但し書き付き」ですが、『表計算ソフトを使わない』・『入力作業は必要最小限度に留める』・『作業はほぼクリックするだけでOK！』というコンセプトを決めて、マークシートリーダーで読み取り処理を行ったマークシート方式試験の採点結果通知シート（＝生徒さんに返却する答案）と成績一覧表（教科担任用）の作成にチャレンジしました。

完成までに、ほぼひと月を要しましたが、マークシートリーダーへの「後付け」成績処理プログラムが出来ました（僕自身が採点現場で動作検証を行った範囲では、期待通りに動作しました）。

マークシートリーダー（最新版を同梱）と合わせて、上記リンク先からデジタル採点プログラム一式をダウンロードできます。

【もくじ】

１．ダウンロードしたプログラムとその高速化について
２．マークシート画像に採点結果を出力
３．成績一覧表も作成
４．使い方
５．まとめ
６．お願いとお断り

１．ダウンロードしたプログラムとその高速化について

今回紹介する採点結果通知シート作成用のプログラム『ReportCard.exe』は単体では動作しません。動作には、僕のマークシートリーダーが作成したCSVファイル等が必要です。また、動作に必要なフォルダ配置その他の動作環境も、僕のマークシートリーダー専用に作成したものをそのまま利用していますので、僕のマークシートリーダー（MS_Reader.exe）が「確実に動作する環境」で実行していただく必要があります。

ここでは採点結果通知シート作成用のプログラム『ReportCard.exe』の動作検証が手軽に行えるよう、Python環境^※を除いたマークシート読み取りプログラム（最新版Version 1.1.4）に『ReportCard.exe』を同梱する形でダウンロード用zipファイルを作成し、（上に）掲載しています。もちろん、過去記事で紹介しているPython環境を組み込めば（･･･と言っても、ダウンロードして解凍したPython39-32フォルダをMS_Reader.exeがあるフォルダにコピペするだけですが）、マーク読み取り部分は、より一層高速に動作します。

Python環境^※：Python4Delphiを利用して Object Pascal に埋め込んだ Python Script を実行し、Python用の OpenCV でマークシートのマークの有無、マークした番号を読み取ります。（PCによっては）Python Engine の初期化になぜか？すごく時間がかかることもありますが、１回初期化すれば、どのPCでも大変高速に動作します。拙作マークシートリーダーの動作に必要なライブラリをすべてインストールしたプログラム埋め込み用の　Embeddable Python 一式が下記リンク先からダウンロード可能です。

この「採点結果通知シート作成」プログラムも、Python環境があれば自動的にそれを利用して動作するように設計してありますが、テストしてみた結果で率直な感想を言うと、やはり初回起動時の（必須）Python Engine の初期化に（PCによりますが）かなり時間がかかる（数分！）ことがあります。

僕のPC：Panasonic製Let’s Note CF-QV ではそのようなことはまったく起きませんが、職場で使っているPCではそれが必ず起こります。

とにかく Python Engine の初期化に「それなりに時間がかかる」PCでこのプログラムを使う場合は、例えPython環境があっても、起動直後に画面左上の「✅P4D」のチェックを外し、Python環境を利用せずにプログラムを実行していただいた方が良いかもしれません。

【過去記事へのリンクです】

マークシートリーダー

マークシートリーダーをP4Dで高速化

マークシートリーダーを教科「情報」用に設定

マークシートリーダーを数学用に設定

２．マークシート画像に採点結果を出力

採点結果通知シートのイメージは、こんな感じ（確認画面として表示する手続きは作成しましたが、画像データとして保存する手続きは「その必要なし」と考え、作成しなかったので、これは確認用画面のハードコピーです）。

･･･ですので処理は、採点結果を画面に表示 → そのまま印刷という流れになります。採点の計算は一瞬で終わり、採点画面はすぐに作成できるから、データは保存しません（そもそも保存しておいて、何回も利用するようなモノではないと思いますから）。

まず最初に考えたのは（当たり前ですが）、マーク読み取り結果と配点をマークシート画像に出力（〇の場合は配点＝得点となります）し、得点を観点別評価とともにシートの余白（設問番号付近）に表示することです。

採点マークのサイズと水平方向の表示位置は微調整が可能です（ただし、調整結果を保存する機能はありません）。

ここで、配点に加え、不正解の場合は正解も表示したくなりました。ただ、記号フォントに縦長の楕円はなかった？･･･と思うので、フォントは好みに応じて選択できるよう、思いつくままにいろいろ設定。

ふと、思い立って数字も選べるように設定。

あと、新教育課程では、観点別評価が導入されているので、観点別評価の「知識・技能」は K1、「思考・判断・表現」は K2 として評価の分類も出力できるように設定。正解マークと合わせて表示すると、こんな感じです･･･。

自分的には、コレがいちばん気に入りました！

得点合計と観点別評価ごとの得点合計は（デフォルト設定）シート右下に表示します。もちろん、フォントの大きさは任意の値を設定でき、表示位置は水平・垂直両方向に微調整が可能ですが、こちらも調整後の座標を保存することはできません。

フォントの大きさや表示位置の微調整は、凝り始めたらキリがなくなりそうで、それが表計算ソフトに代わる高い敷居となる可能性（＝危険性）を感じ、デフォルト設定で（この程度でまぁいいか？）とユーザーに判断してもらえるよう設定値を調整しました。

３．成績一覧表も作成

これがないと採点結果を記録簿に転記し（ここで間違いが発生する可能性があります）、電卓をパチパチ叩いて平均点等を計算するか、一歩進んで、プログラムが出力したCSVファイルを表計算ソフトで処理して、成績一覧表を作成しなければなりません。

転記したり、電卓を使うのは昭和のスタイルだし、働き方改革の流れにも逆行します。CSVファイルを自由自在に操れる方なら、拙作マークシートリーダーには、マーク読み取り結果をCSVファイルに出力する機能を付けてありますから、そちらをご利用ください･･･ってことでOKかな？･･･なんだけれど、「表計算はちょっと苦手で」という方も少なくありません。

PCを使って何かの処理を行うこと自体が、手作業で行ってきた作業を効率よく自動化することに他なりませんから、･･･ほんとうのことを言えば、マークシートリーダーに付属の一機能として最初から成績一覧表の作成機能を付けたかったのですが･･･マークシートリーダー開発当初は、何よりもまず、確実にマークを読み取れることが最重要課題で、それが可能になった時点で実はもう僕自身が（精神的に）ヘトヘトになっていて、（読み取り結果をCSVファイルに出力できれば、あとは表計算ソフトで･･･）みたいな思い（と強い思い込み）があり･･･

新教育課程で導入された観点別評価も、プログラミングして処理するより、表計算ソフトで処理した方がずっと簡単そうに思えたし･･･

同僚からの要望に応え、マークシートリーダーとは別に作成した「手書き答案の採点プログラム」と、マークシートによる解答を併用した採点に対応する場合でも、表計算ソフトは便利だったし･･･

このような諸々の理由から先延ばしになっていた成績一覧表の作成でしたが、2024年、冬、ここで一念発起して、マーク読み取り後の処理に表計算ソフトを一切使わず、ソフトウェアの機能として必要な帳票を出力できるプログラムを書くことに決め、ダミーデータを使って動作確認をくり返し、不具合箇所を発見するたびに少しずつ手直しして、実際に使ってみてどうかという段階にたどり着いたのが、まさに今です。

ただし、どちらかと言えば「採点結果通知シートの方が主」で、成績一覧表は「読めればイイ」程度の、言わばメモみたいなもの･･･表計算ソフトが苦手な方でも、CSVファイルに出力された採点結果を表計算ソフトで開き、得点データを他のワークシートへコピペする作業は可能で、それさえ出来ればあとは協働作業で現場はなんとか動く･･･という勝手な理由で作りは大いに簡素化。

様々な理由から、氏名は「最初の３文字のみ表示」することにしました。
罫線も、横一線のみ。

（氏名と成績はダミーデータです）

ほんとにナイよりマシ･･･というレベルで完成。T_T

プログラムは技術的な知識不足から（だと思うのですが）、罫線が上手く描画されたり、（同じプログラムなのに）PCによっては罫線が予定位置に描画されなかったり･･･。この罫線が上手く描ける場合と、描けない場合の違いがいまだによくわからないのですが、~~次のようにして無理やり解決？~~（しましたが、最終的に問題のあるコードは全面的に書き直しました）

追記

罫線が予定位置に描画されない問題は、解決できていませんでした。罫線データの描画がおかしくなる場合は、罫線の描画なしでデータを出力してください。

【罫線描画問題解決用GUI の勇姿】

CheckBoxとButtonを一つずつ用意

（１）設定 → システム → ディスプレイ設定変更画面の表示を１クリックで行えるボタンを作成。非常の場合は、これで画面の拡大率を100％に戻してもらう。拡大率100％なら確実に予定の位置に描画されるハズ。

･･･と、思ったのですが、結論から言うとこれはダメでした！！

その後、奮闘努力して問題を解決 → （３）へ

ディスプレイ設定を呼び出すコードは１行でOK！

procedure TForm1.btnDispSettingClick(Sender: TObject);
begin
  //usesにWinapi.ShellAPIが必要
  ShellExecute(0, 'open', 'ms-settings:display', nil, nil, SW_SHOWNORMAL);
end;

（２）CheckBoxを利用して「罫線を描画しない」設定を用意する。チェックOFFだと･･･

ある意味では、究極ともいえる罫線問題解決方法。
（これは、ほとんどムチャですな･･･）

（３）罫線の描画に使っていたコードそのものを新たに書き直し、TImage の Canvas と TPrinter のCanvas それぞれに罫線を描画するようにしたところ、罫線が予期しない位置に描画されてしまう問題は解決できました。最初に書いたコードで、（PCにより）罫線が正しく描画される場合とされない場合がある、その本当の理由は未だにわかりませんが･･･

追記（20240929）

上の記事で紹介した採点結果通知個票及び成績一覧表を作成・出力するプログラムを改良し、デジタル採点プログラム一式に同梱して、次のリンク先で公開しています。

デジタル採点 All in One !

４．使い方

使ってくださる方がいるとも思えませんが、使い方のマニュアルは以下の通りです。

（１）プログラムを起動

「MS_Reader.exe」と同じフォルダにある「ReportCard.exe」をダブルクリックしてプログラムを起動します。

次のメッセージが表示された場合は、「詳細情報」（画像中、赤い枠で囲んで示した部分）をクリックします（プログラムの発行元が不明である場合に、Windows のDefender機能である SmartScreen がこの表示を出すそうです。自分の責任で実行すれば、次回からこのメッセージは表示されなくなります）。

すると、次の画面が表示されます。「実行」（画像中、赤い枠で囲んで示した部分）をクリックしてプログラムを起動してください。

アメリカでは、採点結果を通知する個票のことを、高校段階までは “Report Card” と呼ぶそうです。Python4Delphiを使用していることを考えると、プログラムの名称に漢字を使用することは、極力、避けたいところです（これは、Pathに含まれる全角文字に関連するエラーに、Pythonスクリプトを書いていて、これまでさんざん悩まされた経験から）。

また、当初、アイコンは濃い目にデザインしたのですが、100 が赤だと目に痛い。そう、痛切に感じた経緯があって、通常アリエナイ色の 100点をモチーフにしたアイコンにしました。Report Card の文字は、ほぼ読めませんが！「枯れ木も山の賑わい」とお考えいただけたら幸いです。

100 という数字さえ読み取れれば、何をするプログラムなのか？
お使いいただけた方には、わかってもらえるんじゃないかと･･･。

（２）「開く」ボタンをクリックして、ProcDataフォルダ内にある採点結果通知シートを作成したいクラス（or 講座）のマークシート画像を保存したフォルダを選択。

Python環境が利用できる場合は、P4Dに自動的にチェックが入ります。
※ Python Engine の初期化に時間がかかるPCでは、起動時にチェックをOFFにしてください。

選択するのは「ファイル」ではなく「フォルダ」です。

（３）採点結果通知シートを新規に作成する（既存の採点作業の設定ファイルがない）場合は、次の表示が出るのでOKをクリックし、設問数を入力して、画面左に表示されるGridコントロールに必要事項を入力します。

設問数を最初に入力します。

次に、作業の「入力」を選択（オプションボタンをクリック）します。

配点は最も多く設定する値をデフォルト配点として指定（入力）します。

正解とするマークの番号を入力します。

配点を変更する箇所があれば、正解に続けて入力します。
最後に観点別評価の区分を入力します。「知識・技能」は半角数字で 1 を、「思考・判断・表現」は半角数字で 2 を、それぞれ間違えないように入力してください。

m(__)m：「主体的に学習に取り組む態度」の評価は、この採点システムでは行えません。

全項目の入力が完了したら、入力に間違いがないことを必ず確認してください。もし、誤りがあれば、ここで確実に発見し、訂正しておかないと･･･、後から大変なコトに･･･。

必要事項をすべて入力し、内容を確認したら採点設定を保存します。

「MySettei.csv」が（上で指定した）マークシート画像のあるフォルダに保存されます。

保存が完了すると、次の確認メッセージが表示されます。

（４）採点ボタンをクリックして、採点を実行します。

表示されている画像の座標情報を記録したテンプレートを選択します。
（テンプレートの作成は、マークシートリーダーで実行）

適切な採点オプションを選択します。

「観点含全部」を選択した場合は･･･

前述した通り、正解記号は選択肢から選択して指定できます。

（５）画像の切り替え

表示している画像の切り替えはボタンクリックで実行できます。

ボタンは左から順に「先頭へ」・「一つ前へ」・「一つ次へ」・「最後へ」

（６）印刷

「印刷」ボタンをクリックして、採点結果通知シートを印刷します。

クリックすると表示されるメッセージに答えて、全員分 or 個別印刷のいずれかを選択してください。

用紙の縦横指定を間違えないように注意してください。

（７）成績一覧表の作成

最初に「学年」と「クラス」を選択してください。

選択制の授業等、特別な編成（＝「講座」と表現）の名票は出席番号順・氏名のみのデータを予めsNameフォルダ内に分かりやすい名前を付けて、CSVファイルで準備してください。

ファイルの選択ダイアログが表示されるので、予め作成・保存しておいた講座の名票を選んでOKをクリックしてください。採点結果一覧がGridコントロールに表示されます。

続けて、平均点を正しく計算するため、未受験者の処理を行います。「編集」チェックボックスをチェックしてください。

未受験と思われるデータがある場合、次のメッセージが表示されます。

得点「０」はすべて未受験として処理した場合、採点結果の一覧は次のようになります。

「再計算」ボタンをクリックして、平均点等を更新します。

続けてプレビューをクリックするよう案内が出ます。
プレビューをクリックして成績一覧表を表示します（設定はA4・縦、50名／枚で、この設定を変更することはできません）。

なお、受験者数が51名以上の場合でも、プレビュー画面には最初の１枚目の成績一覧表が表示されます。また、任意のページをプレビュー画面に表示する機能は、このバージョンにはありません。

プレビューに問題がなければ、プレビューのチェックをOFFにして（外して）ください。
印刷ボタンがクリックできるようになります。

印刷ボタンをクリックすると、プリンターへデータが送信されます。受験者数が50名を超える場合は、プリンターへのデータ送信後、印刷最終ページが画面に表示されます。

５．まとめ

今回、拙作マークシート・リーダーのCSV出力を利用するかたちで作成したプログラム（新教育課程観点別評価「知識・技能」及び「思考・判断・表現」の評価に対応）の概要は以下の通りです。

（１）表計算ソフトを使わずに、マークシート方式試験の採点結果通知（個票）を作成。
（２）表計算ソフトを使わずに、マークシート方式試験の成績一覧表（教科担任用）を作成。
（３）マークシート方式試験の成績一覧表をCSVファイルに出力。

６．お願いとお断り

マークシートリーダーをP4Dで高速化

マークシートリーダー第２弾！
今回は Python環境を組み込んで、マークの読み取り速度を高速化します。
出来る限り丁寧に組み込み方法を説明しますので、どうか最後までお付き合いください。

前回の記事はこちらからどうぞ

追記（20240929）

当Blogで紹介してきた自作のデジタル採点プログラムを一つにまとめました。次のリンク先にその紹介とダウンロードリンクがあります。

デジタル採点 All in One !

【追記_P4D環境で読み取り実行時、エラーが発生するときは？】

Python環境を組み込んで、これを利用してマークシートの読み取りを実行する場合、次のエラーが発生することがあります。エラーの内容からは推測すると、エラーはテンプレートマッチングの際に利用するテンプレート画像のサイズに起因して起きているように見えますが、ほんとうの原因は違います。

このマークシートリーダーは、Python環境を利用して動作する際は、マークの有無を読み取るJpeg画像の名称（及びフォルダの階層）が次の規則に従っていることを前提としています。

ProcData\XXX\Sample-01.jpg
ProcData\XXX\Sample-02.jpg
ProcData\XXX\Sample-03.jpg
･･･
ProcData\XXX\Sample-40.jpg
ProcData\XXX\Sample-41.jpg

この命名規則にJpeg画像のファイル名（及びフォルダの階層）が従っていない場合、読み取りエラーが発生します。例えば、次のような場合です。

ProcData\XXX\Sample-01a.jpg
ProcData\XXX\Sample-01b.jpg
ProcData\XXX\Sample-02a.jpg
ProcData\XXX\Sample-02b.jpg
･･･
ProcData\XXX\Sample-40a.jpg
ProcData\XXX\Sample-40b.jpg
ProcData\XXX\Sample-41a.jpg
ProcData\XXX\Sample-41b.jpg

特に数学（や情報）用途で２枚１セットのJpeg画像を処理する際は、注意してください。このエラーを防止するには、ファイルメニューの「１画像変換」⇨「専用画像を作成」を利用してファイル名が必ず連番になるように読み取り専用Jpeg画像を生成して、この画像に対して、マークの読み取りを実行してください。

以下、発生するエラーメッセージの一覧です。

なお、Python環境を利用しないモード（P4Dを使用のチェックボックスをOFF：下図右上）であれば、読み取り対象Jpeg画像ファイルの名称は動作に関係しないので（読み取り速度は低下しますが）、読み取り可能です。

画面右上の □ P4Dを使用のチェックを外して、Delphi用のOpenCVで読み取りを実行。
読み取り速度は低下しますが、マークを正しく読み取っています。

【読み取り実行前に、選択肢の始まり番号も指定してください】

選択肢の番号は、デフォルト１始まりに設定してあります。教科「情報」用途で読み取りを実行する場合は、読み取り実行前に、選択肢が「１」始まりであるのか、「０」始まりであるのか、その指定を画面上の設定欄で必ず指定してください。

【もくじ】

１．Python環境を準備する（組み込み用Pythonのダウンロードリンクがあります）
２．Python環境のドッキング
３．高速化の確認
４．システムにC++ランタイムライブラリがない場合は？
５．Python Engine の初期化の問題？他
６．まとめ
７．お願いとお断り

１．Python環境を準備する

Qiita の記事で「 Embeddable Python 」なるものの存在を知り、ほぼ同時に Delphi に Python のスクリプトを埋め込んで、VCL で GUI を作成、内部的に Python のスクリプトを実行する方法を学びました。

この辺の詳しい経緯は、かなり前に記事として書いた通りです。

Delphi & Embeddable Python

2022/01/01

Download Embeddable Python and Install the library

2022/01/02

こうして出来上がった、マークシート読み取りに必要なライブラリだけをインストールした、組み込み用のPython環境の内容は、こんな感じです（組み込み用途に作成した Embeddable Python があるフォルダをコマンドプロンプトで開き、「 Python -m pip list 」コマンドを実行した結果です）

ライブラリの主役は Numpy と OpenCV-Python。
Pillow は、日本語を含む Path を読むためにインストール。

最初に用意した Embeddable Python が14MBくらいで（おー！ちいさい☆）と喜んだけど、上記のライブラリを三つ入れたら 158MB に･･･。

ライブラリを構成しているファイルの依存関係がわかれば、必要ないファイルを消しまくって、もっと小さく出来ると思うのですが･･･、その具体的な方法がわかりません！！

仕方がないので、そのまま組み込み用の「Python39-32」フォルダを作成。

フォルダ名の Python は、「Python関連のフォルダだよ！」ってコトが一目でわかるように工夫（？）しました。その次の 39 はVersion番号、ハイフンで繋いだ 32 は 32bit 用って意味です。

これを前回紹介したマークシートリーダーにドッキングさせます。

展開に少々時間がかかりますが、もし、よかったら使ってください。
MS_Reader 組み込み用 Embeddable Python です。

Python39-32.zipをダウンロード

1 ファイル 56.39 MB

ダウンロード

２．Python環境のドッキング

ダウンロードした「Python39-32.zip」を MS_Reader.exe のあるフォルダにコピー・貼り付け、展開してください。※ 動作確認が完了したら「Python39-32.zip」は削除しても OK です！

【展開前】

MS_Reader.exe とダウンロードした Python39-32.zip を同じ階層に置き、
zipファイルを展開（右クリックして「すべて展開」を選択）してください。
展開にはしばらく（１～２分）時間がかかります。

展開時のPC環境？によっては「ものすごく（20～30分）」時間がかかることが実際にありました！！（原因はわかりませんが、時間がかかるだけで、展開そのものは正しく行われました）

【展開後】

重要　MS_Reader.exe と Python39-32 フォルダは同じ階層に置いてください。

MS_Reader.exe と Python39-32 フォルダは必ず同じ階層に置いてください。

ここで念のため「Python39-32」フォルダの構造を必ず確認してください。

〇：Pathに注目してください。これならOK！

MS_Reader\Python39-32\Lib であり、また、
MS_Reader\Python39-32\Scripts であります。

これはダメです。Pathが二重になってます。

MS_Reader\Python39-32\Python39-32\Lib
MS_Reader\Python39-32\Python39-32\Scripts

上の「ダメな例のようにならない」ようにPython39-32.zipを作成しましたから、大丈夫だと思いますが･･･念のため、必ずご確認いただけますようお願いいたします。

以上が『ドッキング作業』です！！

MS_Reader.exe と同じフォルダに、Python39-32.zip をコピペして、展開すれば Python環境のドッキングは完了です。

これを夢見て、ンか月。マジ、挫けそうな時もあった･･･けど。

MS_Reader.exe をダブルクリックして、マークシートリーダーを起動してみてください。

僕のマークシートリーダーは、自動的に、高速動作モードで、起動します。

３．高速化の確認

Python環境がないと（MS_Reader.exe がある場所に Python39-32 フォルダがない場合）･･･

MS_Reader 起動時、マークシートの読み取りを高速化するP4D（PythonForDelphi）モードは利用できませんが、

Python環境があれば（MS_Reader.exe がある場所に Python39-32 フォルダがある場合）･･･

マークシートの読み取りを高速化するP4D（PythonForDelphi）モードを利用する状態で、MS_Reader は起動します。

当たり前ですが、ダミー（中が空っぽ）の「Python39-32」フォルダを作成し、設定を偽ってMS_Readerを起動しても、メリットは何一つありません！

エラーが２つ出るだけです。

実際に、空の「 Python39-32 」フォルダを作成して実験してみました！

もう一つ。

こんなコトする方は皆無と思いますが。あくまでも、プログラムの動作検証として、ご参考まで。

【動作確認】

前回、設定したテンプレートを利用して動作確認します。

いったん、「P4Dを使用」のチェックを外して読み取りを実行します。前回試行した３列25行８選択肢の１枚あたり600マークあるシート３枚の読み取りにかかる時間は･･･

１枚0.805秒で読んでます（PC環境により、数値は当然異なります）が･･･

「P4Dを使用」のチェックを ON にして再び読み取りを実行します。私の PC での結果は･･･

１枚0.245秒強で読みました。

これが速度的に「はやい」か・どうか、このソフトウェアをお使いいただく方により、その判断基準は異なりますから、その思い（感じ方）は違って当然ですが、Python環境を利用しない場合に比較して、Python環境を組み込み、これを利用した場合は（PC環境により、その数値は悉く異なると思われますが）マークの読み取り速度は間違いなく高速化されるはずです（僕の環境では、「それがない」場合に比較して、「それがある」場合は3.3倍速で動作しました）。

ただ、Python環境を組み込んだ場合、プログラム全体の大きさは、12倍以上に巨大化します･･･

プログラムサイズを選ぶか、動作速度を優先するか、
ご使用目的、お使いのPC環境に合わせて選択していただけたら幸いです。

僕は･･･

今日の空みたいな･･･

プログラムを書きたかった･･･だけです (^_^)♪

僕が、この世から消えたあとも、動く。

いつか、夢みたとおりの･･･プログラムを。

だいすきな･･･

大好きな Delphi と･･･

僕の Object Pascal で。

４．システムに Visual C++ランタイムライブラリがない場合は？

お使いのシステムに Visual C++ランタイムライブラリがインストールされていない場合は、MS_Reader 起動時に次のエラーが発生します。

『アプリケーションを正しく初期化できませんでした（0xc0150002）。「OK」をクリックしてアプリケーションを終了してください。』

英文の場合もあるようです。

このエラーが発生する原因を調べてみたところ、組み込みPython環境内にある「Python39.dll」が Visual C++ランタイムライブラリを必要とするようで、これがシステムにない場合は、プログラム起動時にバックグラウンドで行っているPython Engine の初期化に失敗して、上記のエラーメッセージが表示されることがわかりました。

お使いのPCで、Visual C++ ランタイムライブラリのインストール状況を確認するには、[スタート] ボタンを右クリックし、「ファイル名を指定して実行」をクリックして、appwiz.cpl と入力して[Enter]を押します。Python環境を組み込んだ MS_Reader が動作する環境であれば、システムにインストールされている Microsoft Visual C++ ランタイムライブラリが以下のように表示されるはずです。

現在、私のシステム（Windows 11 Pro 23H2）にインストールされているC++ランタイムライブラリの一覧。
もちろん、このシステムでPython環境を組み込んだマークシートリーダーが正常に動作しています。

システム内で起きていた別のエラーを解決するために、2023年12月上旬に工場出荷状態に戻すリカバリ作業を行いました。同時にOSを最新のバージョンに更新しました。それ以前のシステムの状態は次の通りです（OS のバージョンは 22H2）。※ 私のPCでの話です。

現在の状況とは異なっています。
この状態でもPython環境を組み込んだマークシートリーダーは正常に動作していました。

エラーを解決するには、Visual C++ランタイムライブラリをインストールすればいいわけですが、上の例のように Visual C++ ランタイムはたくさんあるので、手動でひとつひとつダウンロードしてインストールするより、Visual C++ ランタイムインストーラーを使って全ての Visual C++ ランタイムを一括インストールする方が簡単です。

システムをリカバリする前は、次のようにして Visual C++ ランタイムをインストールしていました。

【ご注意願います！】
ここで紹介する方法で Visual C++ ランタイムをインストールする場合、他のプログラムの実行環境との整合性は、一切保証できません。また、最悪の場合、Windowsが起動しなくなるトラブルが発生することも十分に考えられます。インストール作業の全てが自己責任であることを十分ご理解の上、重大な問題が発生した場合は元の環境に戻せるよう、システムのバックアップを取る・現在の設定をメモに記録する等、不具合の発生に備え、必要かつ十分な準備を整えた上で、Visual C++ ランタイムのインストールを行ってください。

以下のサイトから「Visual C++ v56.exe」をダウンロードしてインストール（私の環境にインストールする分には、なんの問題も起きませんでした。もちろん、マークシートリーダーも問題なく起動し、安定動作しました）。

Visual C++ Runtime Installer (All-In-One) v56
https://www.majorgeeks.com/files/details/visual_c_runtime_installer.html

こちらのWebサイトでも（次のリンク先Webページの下の方で）、このインストーラが紹介されています。

Microsoft Visual C ++ 再頒布可能ファイルを削除して再インストールする方法
https://www.autodesk.co.jp/support/technical/article/caas/sfdcarticles/sfdcarticles/JPN/How-to-remove-and-reinstall-Microsoft-Visual-C-Runtime-Libraries.html

インストーラーを立ち上げると、本当にインストールするかどうかを「YES」か「No」かで尋ねられるので、インストールする場合は「Y」をタイプします。その後はPCの画面に表示される英文の指示にしたがって操作してください。

ここから先は、上記のインストーラーを用いて Visual C++ ランタイムをインストールした際、私が実際に経験したトラブル？です（最終的にインストールは成功しました）。

お決まりのUAC起動後（PCの設定によっては）管理者ID 及びパスワードの入力が求められますが、これを入力すると、そのままPCがフリーズしたような状態になり、数分待機しても進展が見られないので、いったん作業を Ctrl＋Alt＋Delete でキャンセルし、再度、「Visual C++ v56.exe」を起動して Visual C++ ランタイムのインストール作業を実行、今度はトラブルなくインストールに成功する事例です。これは「ある特定のAD環境下にあるPCのすべてに共通して見られた」現象です。現在もその原因はわかりませんが、ご参考まで。

また、システムの状態によっては（現在システムにあるランタイムをアンインストールしているのか？）複数回（と言っても最高２回ですが）、再起動を求められることも（何度も）経験しました。

C++ランタイムライブラリのインストールについて、経験を加味して私がわかるのはここまでです（実は、何もわかってないのとイコールなのですが）。これ以外のエラーメッセージが表示されてインストーラーが起動しない場合も、もしかしたらあり得るかもしれません。大変恐縮ですが、そのような場合は原因の究明を含めて、自己責任でご対応ください。

５．Python Engine の初期化の問題？他

MS_Reader では、マーク読み取り時の体感速度を上げるため、FormCreate時にバックグラウンドで Python Engine の初期化を行っています。MS_Reader.exe のあるフォルダに小さなマークシートの画像とマーカー画像があるのにお気づきになった方がいらっしゃるかもしれません。これは Python Engine 初期化用に用意した画像です。

Python Engine 初期化用の画像をリソースに埋め込み、もし、それがない場合は再生して、
プログラム起動時に Python Engine の初期化が必ず行われるようにしています。

この初期化を「するか・しないか」で、MS_Reader 起動後、初めてマークを「読む」ボタンをクリックした際のプログラムの挙動がまるで違ったものになります。初期化を行った場合は、ごくスムーズにマーク読み取りが始まるのに対し、行わなかった場合は PC が一瞬フリーズしたような状態になり、その後、息を吹き返すかのようにマークの読み取りが始まります。

Python Engine の初期化コードです。

  AppDataDir:=ExtractFilePath(Application.ExeName)+'Python39-32';

  if DirectoryExists(AppDataDir) then
  begin
    //フォルダが存在したときの処理
    CheckPython.Enabled:=True;
    CheckPython.Checked:=True;
    PythonEngine1.AutoLoad:=True;
    PythonEngine1.IO:=PythonGUIInputOutput1;
    PythonEngine1.DllPath:=AppDataDir;
    PythonEngine1.SetPythonHome(PythonEngine1.DllPath);
    PythonEngine1.LoadDll;
    PythonDelphiVar1.Engine:=PythonEngine1;
    PythonDelphiVar1.VarName:=AnsiString('var1');
    PythonEngine1.Py_Initialize;
    //イニシャライズされたことを記憶
    P4D_ini:=True;
  end else begin
    CheckPython.Checked:=False;
    CheckPython.Enabled:=False;
    PythonEngine1.AutoLoad:=False;
    P4D_ini:=False;
  end;

（どこに問題があるのでしょうか？）

PC によっては、この Python Engine の初期化に非常に長い時間を要することがあるようです（エラーメッセージは出ません。この沈黙の時間が終わった後、プログラムは問題なく動作します）。偶然、ある PC でこの現象に巡り合い、あわてて時間を計ってみたところ、その PC では初期化に４分必要でした！なぜ、このような現象が発生するのか、その理由がわからないのですが、「そのようなことがある」ことだけは経験的に明らかですので、ここに書いておくことにしました。

また、マーク読み取り開始時に、マーカー画像の位置をテンプレートマッチングで確認して、それが「本当に見えている」ことをユーザーに明示的に知らせていますが、ここでもその処理に少し時間が必要なことがあります。私のPCでも、この現象は「起きたり・起きなかったり」するような気が･･･。エラーが出るわけでもなく、ただ･･･「ん？」みたいな時間があるだけなのですが･･･。こちらもその原因がよくわかりません。

以上が、現象としてはわかっているのですが、原因が解明できていないPython環境を使う上での問題点です。

それから、私の想定外の操作が行われた場合、メモリーリークが起きる可能性があります。Python環境をドッキングさせた当初は、このメモリーリークにかなり悩まされました。どう頑張っても小さなメモリーリークが発生するのを取り切れず、（ Python環境はそういうもの？）と割り切ってしまおうかと思ったこともあったくらいです。

そのたびに思い直し、メモリーリークが発生する原因を突き止めて対応することを繰り返しました。なので、私が想定した操作範囲内でのメモリーリークは全て取り切れたと思います。が、もし、それが発生した場合は、その発生を知らせるメッセージがプログラム終了直後に表示されます（ FormCreate時に実行されるコードの中にメモリーリークがあれば検出するコードを残してあります）。

  //メモリーリークがあれば検出
  ReportMemoryLeaksOnShutdown:=True;

メモリーリークが起きたことを伝えるメッセージ
（上の例のメモリーリークは故意に発生させたものです）

６．まとめ

（１）Python環境を利用するとマークシートリーダーは高速化できる。
（２）高速化できるかわりに、プログラム全体のサイズは大きくなる。
（３）原因不明のフリーズのような現象が発生することがある。

７．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。ここに記載した内容及びダウンロードしたプログラムを利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

マークシートリーダー

自分的に必要と思った機能は全部搭載しました･･･が、
プロが作った有償販売できるレベルのソフトウェアではありません。
見た目も、使い勝手も、よくないと思います。
もちろん、無料でお使いただけますが、サポートも、動作保証もありません。
ダウンロードから設定まで、ALL自己責任でお願いします。

快適と感じる速度で動作させるには、かなり高性能なCPU搭載のマシンが必要です。
私のプログラミング技術が足りない部分を、CPUパワーでカバーしてもらってます。
マシンによっては、読み取り結果のチェック等がかなりトロいかもですが･･･

それでも、もし、よかったら使ってください。
Delphiで作ったマークシートリーダーです。

【ご案内】追記（20240929）

当Blogで紹介してきた自作のデジタル採点プログラムを一つにまとめました。次のリンク先にその紹介とダウンロードリンクがあります。

デジタル採点 All in One !

当Blogで紹介したデジタル採点プログラムのすべてをまとめました！

【使い方のご案内】

１．デスクトップにMS_Reader.zipを展開（解凍）
２．高解像度ディスプレイへの対応
３．マークシート画像の読み取り準備
４．テンプレートを作成
５．マークの読み取りを実行
６．読み取り結果のチェック
７．CSVファイルへの書き出し
８．Excel Book の準備作業
９．Excel Book への書き出し
10．マークシート印刷用紙について
11．まとめ
12．お願いとお断り

どんな環境でも、100％動作する保証はできません･･･が、
私と同じ環境・条件を揃えていただければ、きっと動くと思います。

使用したPC及びOS、開発環境は、次の通りです。

・プロセッサ 11th Gen Intel(R) Core(TM) i7-1185G7 3.00 GHz
・実装 RAM 32.0 GB

・Windows 11 Pro 64ビット版
・バージョン 23H2
・OS ビルド 22631.2861

・Embarcadero® Delphi 12 バージョン 29.0.50491.5718

・設計時の画面解像度は「1366 × 768」です。これ以上の解像度でお使いください。

使い方をなるべく丁寧に説明しますので（マニュアルも同梱してありますが）、まず、ここに書かれている順番で、一通り操作してみていただけたら幸いです。

１．デスクトップにMS_Reader.zipを展開（解凍）

ダウンロードした MS_Reader.zip をお使いのPCのデスクトップにコピペして右クリックするとサブメニューが表示されます。この中の「すべて展開」をクリックしてください。

無事、展開に成功したら、MS_Readerフォルダをダブルクリックして開きます。

フォルダ内に展開されたファイルの中に MS_Reader.exe があります。これをダブルクリックしてマークシートリーダーを起動します。

すると、次の画面が表示されます。「実行」（画像中、赤い枠で囲んで示した部分）をクリックしてMS_Readerを起動してください。

２．高解像度ディスプレイへの対応

高解像度ディスプレイをお使いの場合の対応方法です。高解像度ディスプレイをお使いの場合、設定から「システム」⇨「ディスプレイ」と順にクリックすると、次のように表示されると思います。

拡大縮小に「150～200」という値が設定されていれば、高解像度ディスプレイです。

この場合、起動したマークシートリーダーの画面が小さくて見えにくいと感じることがあるかもしれません。その場合は、次のように操作してください。

MS_Reader.exe を右クリックして、表示されるサブメニューのプロパティをクリックします。

「互換性」タブをクリックします。

高DPI設定の変更をクリックします。

「高いDPIスケールの動作を上書きします。」にチェックを入れて、「拡大縮小の実行元：」は「システム」をComboBoxの選択肢から選択して指定。OKボタンをクリックします。

続けて「適用」⇨「OK」とクリックして設定は終了です。これで画面が見やすい大きさで表示されるようになります。

３．マークシート画像の読み取り準備

デスクトップに展開した MS_Reader フォルダ内に「ScanData」フォルダがあります。この中に練習用のサンプル画像が２種類（解像度150dpiと200dpi）入っています。この画像を用いて説明します。

重要　マークシートは、解像度150～200dpiでスキャンしてください。

重要　１回の操作で読み取り可能な枚数は最大９９枚です。

MS_Reader.exe をダブルクリックしてマークシートリーダーを起動したら、画面左上の「画像変換」をクリックし、表示されるメニューの「専用画像を作成」をクリックします。

画像変換用のWindowが表示されたら、画面右上の「選択」ボタンをクリックします。

「フォルダの選択」ダイアログが表示されます。ここでは「Scanner_A」フォルダを選択します。フォルダ名をクリックして、下のFolder欄に「Scanner_A」と表示されたことを確認し、「OK」をクリックします。

スキャンしたマークシート画像は「ScanData」内に適切な名前を付けたフォルダを作成し、必ずその中に保存してください！

重要　フォルダ名にハイフン（-）を使わないでください。

参考　フォルダ名には、文字の他、アンダースコア（_）が使用できます。

注意してください。選択するのは「フォルダ」で、「ファイル」ではありません。
（Scanner_Aをダブルクリックして開いても何も表示されません）

画面は、次のようになります。赤い枠で囲んだ部分にマークシート画像のサムネイルが表示されます。回転の必要性の有無と回転方向を確認してください。

この場合は、回転の必要性「有り」で、回転方向は左90°です。これを「画像の回転」のオプションボタンをクリックして指定します。

必要であれば、次に画像のリサイズ指定を行います。リサイズを指定「する・しない」の判定基準は、スキャナーでマークシート画像をスキャンした際の解像度の数値で判断してください。

「Scanner_A」フォルダ内のマークシート画像は、ScanSnap iX1500 のノーマルモードでスキャンした画像で、その解像度は 150dpi です。この場合は、ちょうどよい大きさでマークシート画像が表示されますので、画像をリサイズする必要はありません。

重要　解像度150dpi ・A4横置きの場合、リサイズは必要ありません！

重要　解像度200dpi ・A4横置き・解答マーク欄４列の場合、80％の大きさにリサイズしてください。読み取り後のチェックまで含めて、作業しやすくなります。

マークシート画像の読み取り解像度が 200dpi でも、マークシートがA4横置き、解答マーク欄の列数が３列の場合、リサイズは必要ありません。

また、A4以外の大きさのマークシートは使ったことがありません！
（用紙の左上にマーカー画像■■■を入れ、その他はここでダウンロードできるサンプルと同様に作成していただければ、用紙サイズに関係なく動作すると思いますが、試行したことがありませんので確かなことは言えません。ただ、画像のサイズが大きくなればなるほど、動作速度は間違いなく低下します。また、複合機のスキャナーを用いて、マークシートを画像化する際も、B4やA3の大きさだと私が使用している機材ではメモリがいっぱいになるのでしょうか？ 30枚程度読み込んだあたりで一旦動作が停止します。数百枚単位での読み取りにはそれなりに時間がかかります。そのような理由から、マークシートに使う紙の大きさはA4サイズ以下が適切だと思います。）

参考：プログラムを書いた本人が言うのもナンですが、自動でのリサイズはおまけ程度にお考えください。
ScanDataフォルダのScanner_Bフォルダに保存されたサンプル画像の大きさは、2338 × 1653
これを自動リサイズオプションボタンを指定して、変換してみます。
ProcDataフォルダのScanner_Bフォルダに保存されたサンプル画像の大きさは、1760 × 1248
いちおう、これでマークシート画像が横方向のはみ出し「なし」で表示されました。

重要　画像のリサイズの有無を必ずメモ（記録）してください！

⇨ 複数クラスのマークシート読み取り時に、同じ設定を適用する必要があります。

重要　大きな解像度の画像を扱う場合、動作速度が大幅に低下します！

回転の有無と方向、リサイズの有無を指定したら、画面中央右にある「参照」ボタンをクリックして、保存先のフォルダを選択します。

「フォルダの選択」ダイアログが開きます。Pathを見ると「ProcData」フォルダが指定されていることがわかると思います。なお、Procは「Processed（加工済み）」という意味です。

プログラムは「ScanData」フォルダで指定したフォルダと同名のフォルダを「ProcData」フォルダに自動作成します。この自動作成されたフォルダをクリックして選択します（しつこいようですが、選択するのは「フォルダ」で、「ファイル」ではありません）。下のFolder欄に「Scanner_A」と表示されたことを確認し、「OK」をクリックします。

読み取り用のマークシート画像は、必ず「ProcData」内の自動作成されたフォルダに保存してください！

重要　ProcData以外のフォルダには画像を保存しないでください。

読み取り用画像を保存するフォルダは自動で作成されます！
（自動作成されたフォルダをクリックして選択してください）

「変換実行」をクリックします。

次に表示される案内メッセージには「いいえ」を選択してください。

このマークシートリーダーとは別に、手書き答案の採点プログラムを作成しました（準備が整い次第、公開する予定です）。このマークシートリーダーは、そちらと連動しての動作も可能な設計にしてあるため、このメッセージが表示されます。

画像の変換が完了すると、メッセージが表示されますので、OKをクリックします。

変換された読み取り専用画像のサムネイルが表示されます。作成された読み取り用の画像ファイルには連番の名前が自動的に付きます（自動生成されたファイル名は変更しないでください）。

重要　Python環境を利用する場合はファイル名は必ず連番にしてください。

画像処理のアルゴリズムは、GDI＋を利用しています。画像の回転とリサイズが伴う場合は、変換に時間がかかります。処理が完了するまでお待ちください。

（後日、別途ご案内する予定の）手書き答案の採点プログラムと併用する場合は、採点やり直しのために必要な画像もここで作成します（Loopが二重にまわり、時間も２倍かかります）。

クラス別に処理する場合は、「画面の初期化」ボタンをクリックします。
変換元フォルダの選択から、画像の変換処理を再実行できます。

画像の変換処理が完了したら、「終了」ボタンをクリックして、この画面を閉じます。

参考：画像を変換する理由は以下の３つです！
（１）Jpeg画像のサイズを最適化するため（全体が画面内に収まるようリサイズしてください）。
（２）画像の名前が連番になるよう、自動的にリネームするため。
（３）証拠画像としてのオリジナルを残したまま、読み取りに最適な大きさの画像を生成するため。

４．テンプレートを作成

次に、マークシートの情報を記録した読み取り用のテンプレートを作成します。これを作成することにより、同じ採点を複数クラスに対して実行したり、設定（縮小処理の有無を含む）が同じマークシートを異なる考査での使いまわしが可能となる･･･

･･･ように設計したのですが、実際には使いまわしがなんとなく不安なので、考査毎にテンプレートを再生成して運用しています。ですので、同じ設定（大きさ）のマークシート画像の情報を記録したテンプレートの使いまわしが可能か・どうか、これについては未確認です。

「確実なマークシート読み取りを実行する」ためには、お手数をおかけしますが、試験ごとに使用したマークシートのテンプレートを作成していただくのが最良の方法であると思います。

メニューの「２テンプレート」をクリックして表示されるサブメニューの「テンプレートの新規登録」をクリックしてください。別のWindowが開きます。

画面右上の「取得」ボタンをクリックします。

今度は「ファイルを選択」するダイアログが表示されます。任意のマークシート画像を選んでください（１番のファイルを選ぶ方が多いのではないでしょうか？）。ファイルをクリックしてファイル名を取得し、「開く」をクリックします。

画面は次のようになります。

このプログラムでは、マーカー（特徴点）画像を利用してマークシートのマーク位置を計算しています。ですので、このプログラムで処理するマークシートには必ずマーカー（特徴点）画像が必要です。

重要　マークシート左上にマーカー画像（■■■）を必ず用意します。

重要　マーカー画像は、マークシート１枚に１つだけ用意します。

画面右の操作パネル上段にある「マーカー」オプションボタンをクリックして選択状態にします。

マークシートの画像が拡大表示され、マウスのカーソルが大きな「＋」になります。

マーカー画像の「左上」をクリックし、ボタンを押したまま「右下」へドラッグしてください。画像上には点線のラバーバンドが表示されます。

マーカー画像の左上を左クリックして、マウスの左ボタンを押したまま、マーカー画像の右下へドラッグ。
点線のラバーバンドでマーカー画像が囲まれます。

ドラッグ中の画像です（わかりやすさのため、マーカー画像より大きめにドラッグしています）。

マーカー画像の座標を正しく取得できる例です。

マウスの左ボタンから指を離すと、取得できたマーカー画像が画面右側に表示されます。

マークの読み取り時、プログラムは、コンピュータの眼である「OpenCV」のテンプレートマッチングの機能を利用して、まず、最初にマークシート画像中にあるこのマーカー（特徴点）画像を探し出します（これはマークシート画像１枚１枚について必ず行います）。

次に、マーカー（特徴点）画像左上隅を原点（0,0）として、テンプレートに記録されたマーク欄の座標からマーク一つ一つの位置を割り出して、これを切り抜いて画像化（正確に言うと、マークの切り抜き処理前に、ボカシ・二値化・白黒反転の各処理を行い、マークの切り抜き後に白面積計算処理を行って）、マークの有無を判定しています。

この方式の利点は、印刷そのものが左右にズレでも、マーカー画像と解答欄の相対的な位置関係は一定で変わりませんから、印刷がズレすぎて解答欄が印刷されなかった場合以外は、必ずマークの位置を探し出せる（＝マークの有無を判定できる）ことです。

事実、輪転機で印刷（非推奨ですが！）して、チェックから漏れた（チェックしなかった？）、正しい位置から印刷が５cmくらいズレたマークシートも、このプログラムでなんの問題もなく読み取れました･･･。印刷のズレを申告せず、そのまま解答して提出する受験者も受験者ですが･･･。A4横・４列のシートで、解答には３列めまでしか使わなかったから「４列めはなくてもOK！大丈夫」と思ったのでしょうか？それともただ単にめんどくさかったのでしょうか？たぶん、後者だと思いますが･･･

次は、そのテンプレートマッチングの機能をテストします。画面右にある「マーカー画像の読み取りテスト」ボタンをクリックしてください。テンプレートマッチングが正しく実行されると、マーカー（特徴点）画像が太い赤枠で囲まれます。

表示されるメッセージをお読みいただき、「OK」をクリックしてメッセージを閉じてください。

結果が良好であれば「選択対象」グループの「解答欄」をクリックします。

次に、マークシートのマーク（解答）欄の「行数」と「列数」及び「選択肢の数」を指定します。

マークシートの列数・行数・選択肢数の数え方は次の通りです（Scanner_Aフォルダにあるマークシート画像は、A4横置き・３列・25行・８選択肢の形式です）。

ですので、これを次のように設定します。

ComboBox に正しく設定を入力したら、その下の「採点方法の設定」の座標「１列」のオプションボタンをクリックして選択状態にします。マウスのカーソルが大きな「＋」になります。

第１列目のマーク（解答）欄の座標を取得します。マーカー（特徴点）画像の時と同様、第１列の枠のうち、設問番号欄の矩形を除いた、選択肢のマークが印刷されている欄の矩形の左上隅を（左）クリックして、そのままボタンを離さずに、枠の右下隅へドラッグします。この作業は正確に、慎重に行ってください。この作業の良し悪しでマークの読み取りの可否が決まります。

極めて重要　設問番号欄を含めて指定してはいけません！

極めて重要　指定するのはマーク欄のみ！

プログラムは、ここで取得した座標値（矩形の高さ）を行数で割り算して列を設問毎１行ずつに切り出し、さらに切り出した１行を選択肢数で割って１つ１つのマークを切り出し、その塗りつぶし面積を計算して、マークの有無を判定しています。

マーク（解答）欄の枠線と、表示されるラバーバンドがぴったり重なるようにドラッグしてください。

※ 下図は２つともドラッグ直後の結果を示しています（〇はドラッグ開始点と終了点です）。

マーク欄第１列めの左上隅を（左）クリックしてそのまま指を離さずに右下隅へドラッグ

ドラッグ中は、黒点線のラバーバンドが表示されます。これを目安に位置決めを行ってください、

指を離すと、ドラッグした範囲が赤い矩形で囲まれます。画面右側に取得できた座標が表示されます。

「再範囲選択」ボタンをクリックして、座標の取得をやり直すこともできます。

１列目が済んだら、同様にして２列目の座標を取得します。この作業を「マークシートの列数」分だけ繰り返します。

すべての列の座標を取得できたら、「保存」ボタンをクリックして取得した座標を保存します。

「保存」処理が完了すると、次のメッセージが表示されます。

参考：テンプレートの名前について
例　N_R25C03S08
N：ノーマル（通常の大きさ：解像度150～200dpi）
R：Row（行数）は25行
C：Col（列数）は３列
S：Selection（選択）は８個

「二値化テストの実行」ボタンをクリックすると、第１列めを「平滑化（ぼかし）処理＆白黒反転して二値化」した画像の状態が確認できます。「マークあり」の部分が白く表示されていればOKです！
（プログラムは、この白部分の面積を計算して、マークの有無を判定しています）

「終了」ボタンをクリックして画面を閉じ、マーク（解答）欄座標の取得作業を終了します。

二値化テストを実行した場合は、終了ボタンをクリックする前に、保存ボタンをクリックすることを忘れないでください！

二値化の閾値と平滑化（ぼかし処理）のパラメータは、まずデフォルト設定でお試しください。

５．マークの読み取りを実行

これでマークを読む準備ができました。メニューの「テンプレート」をクリックし、表示されるサブメニューの「テンプレートの選択」をクリックします。

次のように、テンプレートを選択するWindowが表示されます。マークシートの形式に合ったテンプレートをクリックして選択し、決定をクリックします。

シングル／ダブルとあるのは、数学や教科「情報」のテストで、マークシート２枚１セットの採点を行うための設定です。選択肢数が16のマークシートを選ぶと、この設定も選択できるようになります（選択肢数が16未満のマークシートでは、この設定は利用できません）。

数学及び教科「情報」用の設定は、後日別記事として掲載する予定です。

次のメッセージが表示されます。「はい」をクリックしてください。

マークの読み取りを実行したいマークシート画像のあるフォルダを選択し、「Ok」ボタンをクリックしてください。

保存してあるマーカー（特徴点）画像をもとに、自動的にテンプレートマッチングが行われ、見つかったマーカー（特徴点）画像から、マークシートのマーク（解答）欄第１列第１行目の座標が計算され、それぞれが赤い矩形で囲まれて表示されることを確認してください。

Python環境を利用する場合（ここでワンクッション置くような感じで）テンプレートマッチングにしばらく時間がかかることがあります。同じプログラムを走らせているのですが、PCにより、このフリーズしたような時間の長さが極端に違うようです･･･、その辺の理由が私にはさっぱりわかりませんが･･･。

Python環境利用時に、この画面が表示されるまで、フリーズしたようになることがあります！

ここまでの設定操作が順調に進行していれば（抜け・落ち・欠けがなければ）、間違いなくテンプレートマッチングが成功し、マーカーと１列１行目が赤い矩形で囲まれるはずです。次のメッセージが表示されますので、お読みになったら「OK」ボタンをクリックしてください。

「読む」ボタンをクリックすると、マークシートの読み取りがスタートします。

画面下部の StringGrid に読み取り結果がリアルタイムで表示されます。また、読み取り完了後、処理にかかった時間が画面左下に表示されます。

８選択肢・25行・３列だから、合計600マーク ×３枚＝1800マークの読み取りで、早ければ2013ミリ秒、遅くて2467ミリ秒で読んでます（PCの性能により、この値は変わります）。

遅かった方で１マークあたりの読み取り時間を計算すると、

2.467秒 ÷３≒ 0.82秒／枚
0.82 ÷ 600 ≒ 1.4ミリ秒／１マーク

そう書くと、すごく早いような気がしますが･･･

600マーク３枚で2.5秒だから、30枚ならその10倍で25秒かかります。平均的な高校の１学年分の生徒数を１学年８クラス320名とすると、さらに10倍で280秒程度、約５分処理時間が必要です。

300名分、５分だと慣れてくるとちょっと遅く感じてしまうかな？みたいな気が･･･

このプログラムには、内部的にPython環境を組み込んで高速動作させるモードがあります。数学用途の16選択肢・25行・３列で1200マーク／枚のマークシートで処理速度を計算・比較してみます。
（組み込みPythonの利用方法は後日ご案内します）

まず、Python環境を利用しない場合、1200マーク×40枚＝１クラス分の48000マークを読むのにかかった時間が･･･

約78秒です。２枚１セットのダブルモードならその倍になります。
1枚（1200マーク）読むのに1.95秒かかってます。

次に、Python環境を利用した場合です。同じ読み取り条件で実験すると･･･

約11.5秒。８クラスあっても２分かかりません。ダブルモードでも４分未満。
1枚0.3秒未満で読み取ってます。

何やってもダメな自分にしては、よく頑張ったって正直、思います･･･。
よほど、びみょーなマークでない限り、期待した通り、ほぼ正しく読み取ってるし･･･。
かあさん、オレ、がんばったよ☆☆☆

まぁこのプログラム作成そのものに50万枚くらい採点できる時間をかけてますから･･･

それと合算すれば、
たぶん、プラマイ０ですー！！

６．読み取り結果のチェック

マークシートリーダーで最も重要な部分は、マーク読み取りの正確さであることは言うまでもありませんが、読み取り結果のチェック機能も非常に重要であると考えます。

人によってマークの濃さや大きさは少しずつ異なり、また、マークを訂正した箇所に残る消し跡も判定に少なからぬ影響を及ぼします。常に100％正しい読み取り結果が保証されないのが現実ですから、如何に効率よく、読み取り結果をチェックできるかで、プログラムの使用感はずいぶん変わってくると思います（CPUパワーにかなり依存したプログラムを書いておいて、そう言うのもナンですが･･･）。

自分自身の書いたものがベストだなんて、到底、思えませんが、このプログラムを書くにあたり、マークの読み取り部分と同等か、それ以上に頑張って書いたのが、この読み取り結果のチェック部分です。

機械との協働。機械との融和。これをテーマに、ヒトと機械とが一体化しての「快適なチェック作業」の実現を目指しました。

･･･が、プログラミング技術の未熟。自分自身の勉強不足。見い出した妥協点。等々の理由により、視覚による機械と協働してのチェックも、聴覚（音声出力）による機械と協働してのチェックも、いずれも全面的にマシンのCPUパワーに依存した、もっさりした感のある処理となってしまいました･･･。

処理性能の高いマシンなら、それなりに快適に作業できると思うのですが。以下、チェック機能の使い方です。

上の図の左のGUIから説明します。

白紙にチェックすると、マークがひとつもないシートのチェックは行わない（飛ばす）設定で動作します。この機能はデフォルトでON（チェックあり）です。

マーク（解答）がなかった場合の読み取り結果の表示が「999」です（デフォルトOFFです。このプログラムでは、「空欄」のフラグを「999」としています。マークの番号にも、得点にも「999」は通常ないことがその理由です。ちなみに複数マークは「99」と表示しています。色は「999」が「青」、「99」が「赤」です。少しでも視覚に訴えた方がチェックしやすいと考えました）。

ごく薄い色でマークされた答案が混じっていないことが大前提ですが、答案全体（１クラス分！）のマークの濃さが十分「濃い」と保証されていれば、チェック開始時のみ「999」のチェックを外してチェック（機械がきちんと空欄を識別していることをヒトが目視して確認）、で、確実に空欄を見分けていることが確認できたら、「999」にチェックして続行。こうすれば大変スムーズな確認作業を実現することができます。あくまでもごく薄くマークされたシートがないことが大前提ですが･･･

いずれにしても「Check！」ボタンをクリックすると、プログラムは次の「空欄（999）」もしくは「複数マーク（99）」を探し、それが見つかった場合は該当箇所を赤い矩形で囲んで表示します。処理性能の高い（CPUパワーのある）マシンであれば、それなりに快適に動作しますが、そうでない場合は、かなり「もっさり」した動作になりますので、イライラするかも知れません。ごめんなさい。

【空欄と判定した場合】

【複数マークありと判定した場合】

複数マークの判定はパラメータ設定を厳し目にしてあります（上の図はそれがわかるよう、大きめに表示しました）。ごく小さなシミは「平滑化（ぼかし）」処理である程度消えますが、ある程度の面積があるシミや汚れは上のように複数マークと判定されます。

いずれの場合も、ヒトの眼で確認して、訂正の必要がなければ「Check！」ボタンをクリックしてチェックを続行。読み取り結果の訂正が必要な場合は、正しい値を直接入力します（上の場合であれば「2」と入力してください）。

【処理をスキップして次のシートへ】

「Skip」ボタンをクリックすると、現在チェックしているシートの残りの部分のチェックを省略し、次のシートのチェックへ移動します。チェック対象シートの残りの行が全部空欄であった場合などに利用してください。

【チェックの再実行】

「ReDo」をチェックすると、初めからチェックを再実行できます。

【音声読み上げ】

読み取り結果が表示されているStringGridの任意の行をクリックして、「▶」ボタンを押すとWindowsに標準搭載されている日本語の音声合成エンジン（Microsoft Haruka Desktop）の音声で読み取り結果をアナウンスしてくれます。

マークの読み取りが正しく行われているか・どうか、少しでもラクに確認できないかと考え、この機能を搭載しました。処理性能の高いマシンでないと快適な動作は期待できませんが、CPUパワーのあるマシンであればそれなりに使えると思います。

「▶」ボタンの下にある「×」ボタンをクリックすると、音声読み上げを途中で中止することができます。

【列を指定して、任意の行からその列の最後の行までのチェックをスキップ】

数学用のマークシート等で、第１問の解答をシート第１列にマーク、第２問の解答をシート第２列にマーク、第３問の解答を･･･というような設定にしたい場合、「指定列の任意の行から最後の行までをチェックの対象から外す」ことができます。以下、その方法です。

図のいちばん左にある「Skip」にチェックすると、この機能が有効になり、続けて「Check！」ボタンをクリックすると、ここでの設定に基づいたチェックを実行できます。

上の例であれば、１列目25設問あるうちの20設問目以降25設問目までのチェックをスキップ（チェックは19設問まで実行）、２列目は設問番号26から始まるので34設問目以降50設問目までを、３列目は設問番号51から始まるので70設問目以降75設問目までのチェックをそれぞれスキップします。スキップの設定はComboBoxへ入力した指定値「以降」であることにご注意ください。

また、シートの型式により、列の指定の可否をプログラムが自動的に判断し、ComboBoxのEnabled プロパティが設定されます（上の例では４列目は指定不可）。

「覚」ボタンをクリックすると、現在の設定を ini ファイルに書き込んで記憶します。「消」ボタンをクリックすると「設定なし」の状態に初期化できます。

数学用途等で２枚１セットの処理を実行する場合は、１枚目と２枚目を分けてスキップ処理の設定を行うことができます（数学用途の処理方法は後日掲載します）。

７．CSVファイルへの書き出し

マークの有無の読み取り結果は、CSVファイルとExcel Book への書き出しが可能です。

【CSVファイルへの書き出し】

「ファイルへの出力」にある「CSV」をクリックして選択し、「書き出し」ボタンをクリックしてください。

上記の場所にCSV形式で、読み取り結果が出力されます。

フィールド名として１行目に「設問番号」、レコード名としてA列に「マークシート番号」が書き込まれます。

８．Excel Book の準備作業

【Excel Bookへの書き出し準備】

Excel Book への読み取り結果の書き出しは、自分用に（あれば便利かなー☆）と思って作成したものです。ですので、式の入ったセルを保護する等、第三者が使うことへの配慮は何一つ行っていません。セルに入力された式やVBAの内容をご自身でメンテナンスできる方なら、お使いいだけるかな？という程度のシロモノです。

添付した Excel Book はこれまでに何度も「実際に使用して動作に誤りがないことを確認済み」ですが、誤って式を削除したりした場合は（当然ですが）意図した通りに動作しません。ですので、こちらも動作保証は一切ありません。ご使用はあくまでも自己責任でお願いします。この Excel Book に対しても、このプログラムの使用要件にあります免責事項がそのまま適用されますことを申し添えます。

以下、試験実施前に行っておくとよい採点準備作業です。

eFile フォルダに「一般用マークと手書き併用採点シート.xltm」というマクロ有効テンプレートがあります。これをダブルクリックすると「一般用マークと手書き併用採点シート1.xlsx」という名前で新しい Excel Book が作られます。拡張子に注意してください。「.xlsx」です。このままでは期待通りに動作しませんので、適切な名前を付け、拡張子を「.xlsm」（マクロが有効な Excel Book ）に変更して eFile フォルダ（必ずこのフォルダに保存してください！）に保存します。

ここでは test.xlsm という名前で保存したことにして説明を続けます。

【インターネットからダウンロードしたマクロ有効 Excel Book の取り扱い】

いつからこうなったのか、わかりませんが、インターネットからダウンロードした拡張子 xlsm の Excel Book をダブルクリックして開くと、次のメッセージが表示されるようになりました。

「編集を有効にする」をクリックすると･･･

マクロを動かすことができません！

こうなった時は、いったん Book を閉じて、その Excel ファイルを右クリックして表示されるサブメニューのプロパティをクリックして、全般タブのいちばん下にある「セキュリティ：」の「許可する」にチェックします（チェックする＝マクロの実行をご自身の責任で行うことになります。どうか、ご注意ください）。

全般タブの下の方にあるセキュリティの設定。
マクロの実行をご自身の責任で行う場合は、「許可する」にチェックしてください。

「許可する」にチェックした状態で、「適用」をクリックすると「セキュリティ」の表示そのものが消えます。「あなたの責任でマクロの実行が可能になりました」ということなのでしょう。「OK」をクリックしてプロパティの設定画面を閉じます。

これでマクロが実行できるようになります。

【欠席者がいた場合】

Excel Book を利用して採点する場合、大変重要な注意事項があります。それは欠席者がいた場合の処理です。該当試験に欠席者がいる場合は、その欠席者の出席番号位置に未使用のマークシートを挿入し、シートが確実に出席番号順に並んでいることを確認してから、スキャナーでスキャンしてください。
※ 可能であれば、この用途専用に未使用のマークシートを複数枚、最初から手元に準備しておくとよいと思います。

重要　未使用のマークシートを欠席者の出席番号位置に挿入しておく！

これを忘れると、あとから「すーぱーめんどくさい」コトになります（もし、忘れたらマークシートのスキャンからもう一度、採点をやり直した方が効率がいいかもしれません）。

【受験者の氏名データを準備する】

test.xlsm をダブルクリックして開き、「コンテンツの有効化」を行ったら、いちばん最初に「名票への貼付元名票」シートをクリックして開き、ここに「採点対象者全員分の氏名」を準備してください。

もっとわかりやすく言うと、採点したいテストを受験した生徒全員の「クラス・出席番号・氏名・ふりがな・性別」データを「クラスごと」に「出席番号順」で、「名票への貼付元名票」シートに用意します。なんで「ふりがな」まで必要なのか？疑問に思う方もいらっしゃるかもしれませんが、最近の若い方々のお名前は難読である場合が多く、採点結果を個票でお知らせする際に、個票の氏名欄のところに「ふりがな」も印刷しておくとスムーズに答案返却が行えます。そのための「ふりがな」準備です。

また、テストの受験者全員分の氏名データを１シートに準備する理由は、次のような使い方を想定しているからです。

（１）同じテストを受験 ⇨ クラス毎に採点用 Excel Book を用意するのは非効率的。
（２）採点用 Excel Book は１個だけ作成し、これをコピーして全クラス分を作る。

具体的には、eFile フォルダの Excel Book（test.xlsm）をコピーして、クラス別（AHR.xlsm）に名前を変えて MS_Reader.exe がある場所に保存。採点結果もコピーした Excel Book（AHR.xlsm）に書き込みます。さらに、この作業はすべてプログラムから自動実行します。

採点者は、採点結果が書き込まれた Excel Book（AHR.xlsm）を開いて、「名票への貼付元名票」シートに用意した氏名データから「A組の受験者の氏名データ（クラス・出席番号・氏名・ふりがな・性別）を範囲選択してコピーし、「名票」シートに値のみ貼り付けます。

こうすることで同じ内容のファイルを複数個準備することなく、言わば「採点原本」として利用する Excel Book を１つ作成するだけで、試験を実施した全クラス分の採点が可能となります。

ここでは「クラス」と表現しましたが、用意する氏名データを適宜変更すれば「講座」等の採点もまったく同じように行えます。※ プログラムの仕様としては、１回の採点作業で採点する人数を100名以下と想定していますが、実際の採点作業は１採点40名程度で行っています。ですので、40名程度を１つのまとまりとして採点していただく方向でお考えください。

【正解を入力】

氏名データの準備が完了したら、「正解」シートをクリックして表示し、設問毎に「正解」の選択肢の番号を入力します。設問がない場合（無解答でよい設問番号の欄）は空欄のままにしておきます。入力したら、入力内容に間違いがないか、よく確認し、上書き保存してください。

正解の入力を間違えるとたいへんなコトになります！
慎重に入力し、最低２回は間違いがないことを確認してください。

【配点を入力】

次に、「マークシート配点」シートをクリックして「配点」を入力します。入力と同時に合計が自動的に計算されます。入力が完了したら上書き保存してください。なお、この配点表の下には観点別評価の表もありますが、この表には一切入力しないでください（観点別評価の表は入力禁止です）。

【観点別評価の区分を入力】

次に、「マーク＆手書き観点別評価」シートをクリックして「観点別評価の区分」を入力します。
「知識・技能 ⇨ １」、「思考・判断・表現 ⇨ ２」として設問毎に、半角数字で入力してください。デフォルト設定では、すべての設問に「１」が入っています。解答を要しない設問は「空欄」にしてください。入力したら上書き保存します。

以上で、試験実施前の準備は終了です！

９．Excel Book への書き出し

重要　すべての Excel Book を閉じてから実行してください！

危険　Excelが起動した状態で実行すると重大なエラーが発生します！

Excel へデータを書き込む際は、上記注意事項を必ずお守りください。この注意を忘れて Excel が起動したまま、Excel Book への書き込みを実行すると最悪の場合、Excel のプロセスが幽霊のように残り、これを終了することが出来なくなって、復旧するには、システムの再起動しかない状態になります。未保存の重要なデータがあるような場合、当然そのデータは失われます。Excel Book へのデータ書き込み時は、Excel が起動していないことを（タスクバーに眠っている Excel Book がないことも含めて）十分確認した上で、書き込み作業を行ってください。

【書き出し処理】

マークシートを読み取り後、読み取り結果のチェックまで完了したら、Excel Book への読み取り結果の書き出しが可能となります。次のようにマークシートリーダーを操作してください。

最初に、ファイルへ出力の Excel のオプションボタンをクリックして選択します。すると、その右側にある「選択」ボタンがクリックできるようになりますから、このボタンをクリックしてください。

ファイル選択のダイアログが表示されますので、読み取り結果を書き込む Excel Book をクリックして選択し、その後、下にある「開く」ボタンをクリックします。Pathの指定は、デフォルトで eFile フォルダになっています。準備作業で作成した test.xlsm を eFile フォルダに保存したのは、この読み取り結果を書き込む Excel Book を選択する作業を円滑に実行するためです。

次のメッセージが表示されます。

重要　ここで Excel が起動していないことを必ず確認してください！

選択した Excel Book が書き込み先として表示されていることを確認し、「書き出し」ボタンをクリックします。

書き込みには、しばらく時間がかかります。次のメッセージが表示されるまでお待ちください。

すぐに書き込み結果を確認する場合は、「はい」をクリックします（ここでは「はい」をクリックしたものとして説明を続けます）。

「はい」をクリックした場合は、エクスプローラーが自動的に開きます。先ほど選択した「test.xlsm」のコピーが「Scanner_A.xlsm」として、eFile フォルダではなく、MS_Reader.exe のあるフォルダに生成されています。

ファイル名がなぜ「Scanner_A.xlsm」になったかというと、マークシートの読み取り元フォルダとして選択したのが、ProcData\Scanner_A であったためです。プログラムは、マークシートの読み取り元フォルダの名称をそのまま、原本「test.xlsm」をコピーして生成する読み取り結果書き込み先 Excel Book の名称として利用します。

マークシートの読み取り元フォルダの名称が、Excel Book の名称になります！

マークシートの読み取り元フォルダの名称が「R05_情報Ⅰ_1A」であれば、MS_Reader.exe のあるフォルダに「R05_情報Ⅰ_1A.xlsm」が生成されます。

ここは、この仕様に慣れるまで混乱が生じやすいところと思われます。しかし、この仕様（仕組み）を十分に理解して、マークシートリーダーを使いこなしている職場の同僚からは「よく考えられた採点システムだと思います」と言ってもらえました。うれしかったなー！！

【成績一覧表の印刷】

生成された Excel Book をダブルクリックして起動します。起動したら「名票への貼付元名票」タブをクリックして開き、採点対象クラス（等）の氏名データを範囲選択してコピーし、「名票」タブをクリックして B3 セルに値のみ貼り付けます。次に「採点」タブをクリックしてください。次のような画面が表示されます。「氏名がある場合のみチェックする」ボタンをクリックしてください。画面上方に表示されている平均点が正しく再計算されます。なお、欠席者の得点は「０」と表示されていますので、この場合は手動で「受験確認」のチェックを外し、平均点の計算対象から除外してください。

このシートは通常の印刷操作で印刷できます。ただし、デフォルト設定で100名分を２枚に分けて印刷する仕様となっているため、成績一覧表が１枚でよい場合は、次のように指定して１ページ分のみ印刷を実行してください。

【観点別評価を行う場合】

観点別評価を行う場合は、「正答率」タブをクリックして、上と同様の操作を行ってください。欠席者がいた場合の処理も同じです（このシートは印刷しません）。

【個票の印刷】

最後に、試験の採点結果を受験者に知らせる成績個票を印刷します。よー書いた。さすがに私も疲れました。あと、もぉちょっとです！

「個人表」タブをクリックします。次のような画面が表示されます（表示倍率は異なります）。まず、考査名と科目名を入力してください（忘れやすい部分です！ご注意願います）。印刷はVBAでマクロを組んであります。設問数に合った「印刷（QXX）」ボタンをクリックしてください。

重要　セルを保護していません。誤って式を消さないでください！

次の印刷フォームが表示されます。開始番号と終了番号を入力し、「印刷実行」をクリックします。

重要　印刷は途中で中止できません！

VBAではプログラム書いてない！のに、Engterキー押し下げでフォーカスが移動します･･･

この印刷は Excel の仕様上、印刷データをためてからイッキにプリンタへ送信という方法が取れません。１枚ずつ送信しますので、ちょっとギクシャクした感じで印刷が実行されます。プリンタが壊れているわけではありません。

【個票を個別に確認したい場合は？】

受験者個々の個票を確認したい場合は、A2 セルに「採点」シートの通番を入力します。いろいろなクラスの生徒が混在した講座の処理に対応するため、入力値は「出席番号とは異なる」ことにご注意願います。

個票を確認したい受験者の通番は「採点」シートを表示して確認してください。

【壊しちゃったときは？】

個人表シートを壊してしまった時は、次のようにすれば直せます。「個人票_Back」タブをクリックします（このシートは絶対に非表示にしないでください）。A 列の左、１行めの上（図の〇印を付けた部分）を右クリックしてシート全体を選択し、表示されるサブメニューのコピーをクリックします。

個人表シートに戻って、先ほどと同じ A 列の左・１行目の上を右クリックして表示されるサブメニューの「数式fx」をクリックします（罫線データ等を壊してしまった場合は、すべてを貼り付けます）。

数式が壊れた場合は数式を貼り付けます。
面倒な場合は、いちばん左の全部「貼り付け」でもOK！

１０．マークシート印刷用紙について

紙の「白さ」の度合いを「白色度」というそうです。このマークシートリーダーで読み取りに使用したマークシートはすべて「再生紙 or 再生コピー用紙」と呼ばれる紙に印刷したものです。

ですから、ここで紹介したマークシートの読み取り結果は、すべて「白色度70％」前後の「再生紙」に印刷してのもので、ホームセンターで一般的に販売されているような「白色度」が「再生紙」よりはるかに高い「真っ白に見える」用紙を用いての読み取り結果ではないことに、十分ご注意願います。

マークシートの印刷に使用する紙の「白色度」によっては、読み取りパラメータ設定の見直しが必要になるかもしれません（私自身は、実験・試行していませんので正確なことはわかりませんが）。入手可能なすべての紙について、実験することは現実的に無理でありますので、マークシートを印刷する用紙については、本ソフトウェア使用者の責任で十分な試行を行い、確実に動作するパラメータ設定を行った上で、このプログラムをお使いいただけますよう、お願いいたします。

印刷はインクジェットプリンタで行うことを推奨しましたが、長期にわたって使用していない（メンテナンスもしていない）インクジェットプリンタ（複合機）では、インクの吸い込みに問題が生じ、「いくら調整しても・何度クリーニングを行っても」期待した濃度での印刷ができないということも経験しました。サービスマンの方に伺ったところ、「こういう状態になると通常のクリーニングではなかなか復旧しない」と教えていただき、あらためて日常的に使用してインクを動かすことと、不具合が見えたらすぐにメンテナンスをお願いすることの大切さに気づいたこともあります。

そのサービスマンの方からは、マークシートに付着していた消しゴムの「屑」がスキャナーのローラー等可動部の動きを悪くして、マークシートがやや斜めにスキャンされたりする原因となり得ることも教えていただきました。実際に大量のマークシートを読み取ってきた複合機のスキャナー部分からは、かなりの量の消しゴム屑が･･･。受験者には消しゴム屑をよーく落としてから答案（マークシート）を提出するよう注意しておく必要があります。まさに塵も積もればなんとやら･･･です。

また、ご使用のスキャナーの読み取り設定によっては（デフォルトの読み取り設定が）0～255段階のグレースケールでなく、カラーであったり、ある閾値で白黒二値化しての読み取りであったりという、私の想定外の設定であることも、当然のようにあり得ると思います。それがカラー画像であった場合の影響はほとんどないと思われますが、ある閾値での白黒二値化画像であった場合は、判定に重大な影響を及ぼす可能性があります。ですので、マークシートの読み取りに、使用されるスキャナーの読み取り設定に関して、予め、使用者様の責任で十分ご確認いただけますよう、併せてお願い申し上げます。

１１．まとめ

このマークシートリーダーで出来ること、出来ないことをまとめました。

【出来ること】

・マークシートのJpeg画像を回転＆適切なサイズに縮小
・マークシート画像のマーク読み取り（１設問当たり最大16選択肢まで対応）
・読み取り結果の確認（GUI & 音声出力）
・読み取り結果のCSVファイル出力
・読み取り結果を採点結果通知用Excel Bookへ出力（新教育課程に対応）
・共通テスト形式の数学試験に対応（選択肢：-、±、0-9、記号：a～d）※ 後日掲載します。
・共通テスト形式の情報Ⅰ試験に対応（選択肢：０始まりの設定も可能）※ 後日掲載します。
・使用環境に合わせて各種パラメータ設定を変更可能
　⇨ ScanSnap iX1500のノーマルモード（解像度150dpi相当？）、もしくはEPSON PX-M7110F（解像度200dpi）でスキャンしたJpeg画像のマーク読み取りに最適化した値をデフォルト値に設定済み。

【出来ないこと】

・１設問について、複数の解答が設定された採点
・前問の解答内容に応じて、次の問いの解答が変わる採点
・その他、答案１枚のみの採点等、このプログラムで想定外の採点全て
・１回の読み取り操作で処理できるJpeg画像は99枚までで、100枚を超える枚数は処理できません。

【その他の使用方法】

MS_Reader.exe の「ヘルプ」にある「PDFを表示」をクリックすると利用方法の手引きがお使いのPDFリーダーで表示されます。マークシートの作り方等、このブログの記事にないことも書いてありますので、必要に応じてこちらも併せてご参照いただけますよう、お願いいたします。

１２．お願いとお断り

Recognize handwritten katakana characters No,4

手書きカタカナ文字をPCに認識させる（その④）

前回の記事で作成した手書きカタカナ文字「アイウエオ」の学習モデルを、My手書き答案採点プログラムで利用できるようにした。自動採点用のGUIを作成して、実際の手書き文字をどの程度正しく認識できるか検証。ついでに、ふと思い立って、「〇」記号と「×」記号の学習モデルも作成。こちらについても、正しく認識できるかどうか、実験してみた。結果は「アイウエオ」、「〇×」とも100％正しく認識することはできなかったが、よく考えれば、リアルな文字認識にチャレンジするのは今回が初めて。ここまでが長かったので、自分的には終了感満載だったけど、ここからが本当のチャレンジの始まりなんだ･･･と気づく。これまでにやってきたことは、言わば準備作業。現段階で、僕の「自動採点」は、採点作業の「補助」くらいには、使えるんじゃないか･･･と。

１．それは「イ」じゃないんですけど･･･問題への対応を考える
２．プログラムに自動採点のGUIを追加
３．自動採点を実行！（その１）
４．自動採点を実行！（その２）
５．〇×記号の学習モデルを作成
６．〇×記号の解答も自動採点
７．FormCreateでPythonEngineを初期化
８．まとめ
９．お願いとお断り

１．それは「イ」じゃないんですけど･･･問題への対応を考える

まずは、前回の記事で最後に紹介した「問題」への対応から。

前回は、学習モデルの性能を確認するため、PCの画面にマウスで描いたカタカナ文字をLobeで作成したMy学習モデルが「どの程度正しく認識できるか」を試すプログラムをDelphiで作成して検証（文字認識部分は内部に埋め込んだPythonスクリプトで実行）。

あまりにもGoooooooooooooooooooooooooooooooooood！な結果に、この結果にたどり着くまでの長かった道のりを思い出し、本人涙ぐむシーンもあったが･･･、スキャナーでスキャンした画像にみられるシミや汚れへの反応をみるため、試しに画面をワンクリックして「点」を入力し、それを認識させてみたところ･･･

信頼度は99.9％･･･でもLobeさん、それ、「イ」じゃないと思うんですけど･･･。

このあまりにも楽しい結果に、今度は涙ぐむほど大笑い。さすがMy学習モデル。夏休みの自由研究レベルをしっかりと維持しています･･･。

で、どう対策したか？

さすがにこのままでは実戦に投入できないので、文字画像に「大津の二値化」を適用した後、OpenCVのcountNonZero()関数を利用して、全ピクセルのうち、値が０（＝黒）でないピクセルの合計を求め、画像中の白黒の面積を計算。イロイロ、テストした結果、上記の画像で白面積（＝文字面積）が1.5％より大きい画像を「文字情報あり」と判断して、輪郭検出するようスクリプトを修正。これで、この問題は無事クリア☆

# 読み込んだイメージにOpenCVのcountNonZero関数を適用、白面積を計算。
wPixels = cv2.countNonZero(img)

※ 上の画像では、文字が「白」なので白面積を計算している。

２．プログラムに自動採点のGUIを追加

My手書き答案採点プログラムに自動採点のGUIを付け加えるにあたり、プログラムの64ビット化（プログラムに同梱したembeddable PythonにインストールしたTensorFlowは64ビット版しか存在しないため）と、解答欄矩形の自動検出機能の実装で不要になったGUIの整理を行った。で、空いたスペースに自動採点のGUIを作成。

操作パネルのGUIを32ビットバージョンから、次のように変更。準備段階でしか使わなかった部品があらかた消えて、（自分的には）画面がかなり「すっきり」した気が。

解答欄矩形の手動設定関連のGUIを削除して、空いたスペースに自動採点のGUIを作成

３．自動採点を実行！（その１）

（１）学習モデルを指定

選択肢だけは、たくさん用意してあるけど、現在利用できるのは「○×」と「ア行」のみ。（「カ行」以降は、もしかしたら永遠に利用できないカモ･･･）

自前で機械学習の訓練用データを作成するのは、本当に、本当に、本当に、すーぱーたいへん！答案をスキャンした画像から、文字画像の切り抜き＆クリーニング作業を、またン千枚もやるかと思うと･･･。

ポキッあっ！心の折れた音が。

（２）正解ラベルを指定

設問ごとに、正解ラベルを選択。学習モデルの識別結果と、ここで選択指定した正解ラベルを比較して、〇・× を判定。で、得点欄に入力（選択）した値を採点記号とともに解答欄の指定位置に表示する。プログラム起動後、初回の実行時にはPython Engineの初期化に数秒かかるが、２回目以降、採点自体は３５枚を１秒程度で処理できた☆ だから処理時間に起因するストレスはまったく感じない。Python Engineの初期化だけ、あとで何とかしよう･･･。

（３）自動採点を実行

「アイウエオ」の文字データは、集めたサンプルに似せて全部自分で手書きしたもの。文字の大小、濃淡、線の太さ等なるべく不揃いになるようにした（つもり）。解答用紙は新品はもったいないので、職場にあった反故紙の裏面に解答欄を印刷して利用。ホントは、もっとたくさん作成するつもりだったんだけど、３５枚書いたところでなんか用事が入り、もうその後は作業を再開する気が失せて、作業を放棄。そのような理由から、とりあえず３５枚で実験することに。

ウソ偽りのない採点結果の一例は、次の通り（「ア」を正解とした場合）。

サンプルを真似たアイウエオを書いて、My手書き答案採点プログラムで自動採点した結果

自動採点へのチャレンジを始めたのは２０２２年の１２月下旬だから、ここにたどり着くまでに2ヵ月かかっている･･･。途中、（もはや、これまで）みたいなシーンも何度かあったけど、そのたびに『誰も待ってないけど、オレはやるぞ』と自分自身を叱咤激励。

「オレはやるぞ」と言えば･･･

高校生だった頃、芸術選択はめったにない「工芸」で、すごく楽しくて･･･。焼き物の時間に、みんなは指示された通り、湯飲みとか作ってたけど、僕は「オレはやるぞ！」って文字を刻んだ粘土板（看板）を岩石風の土台に張り付けた、何の役にも立たないモニュメントを製作して、大満足。先生は笑いながらも、僕の作品（？）を炉のすみっこに入れて焼いてくださった。高校生活、最高だったなー☆

解答欄画像の切り抜きとは別に、プログラム内部では（罫線の影響を排除して）、個々の解答欄画像中の文字をOpenCVの輪郭検出で探し出し、幅64×高さ63で切り抜いて、次に示すような画像データを作成している。

なんで「イ」だけ「字の一部分だけが取得」されてるのか、そこは？？？なんだけど、その他の文字は、比較的よく検出できているのではないか･･･と思うのですが、いかがでしょう？

輪郭検出のスクリプトは、次のサイトに紹介されていたものを参考に、罫線が入らないようにするなど、様々に工夫を加えて作成。（このスクリプトの作者の方に、心から厚く御礼申し上げます）

[AIOCR]手書き日本語OCRデータセットを自動生成する[etlcdb]
https://www.12-technology.com/2021/11/aiocrocretlcdb.html

実際にキカイがどんな画像を見ているのか、気になったので調べてみると･･･

そのうちの１枚を拡大してみたところ。

この二値化の処理には、また別のWebサイトにあった次のコードを当てたんだけど･･･

thresh = 
cv2.adaptiveThreshold(blur,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,11,2)

これは「濃淡の大きな画像に対しては大変有効な処理」のようだけれど、僕の用意した文字画像の処理には向かなかったようで、そこで、ここは思い切って次のように変更。

threshold = 220
ret, thresh = cv2.threshold(blur, threshold, 255, cv2.THRESH_BINARY)

上記のように変更した結果、キカイが処理の途中で見ている画像は･･･

さっき拡大した画像は･･･

左の方に、小さなシミがまだ残っているけど、これは次のようにして輪郭として検出しないように設定。

contours = cv2.findContours(thresh, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)[0]
num = len(contours)
mylist = np.zeros((num, 4))
i = 0
# red = (0, 0, 255)
for cnt in contours:
    x, y, w, h = cv2.boundingRect(cnt)
    # 高さが小さい場合は無視（ここを調整すれば設問番号を無視できる）
    #if h < '+cmbStrHeight.Text+':　<- Delphi埋め込み用
    if h < 30:
        mylist[i][0] = 0
        mylist[i][1] = 0
        mylist[i][2] = 0
        mylist[i][3] = 0
    else:
        mylist[i][0] = x
        mylist[i][1] = y
        mylist[i][2] = x + w
        mylist[i][3] = y + h
        #cv2.rectangle(img, (x, y), (x+w, y+h), red, 2)

    i += 1

まとめとしては（自分的には）、「ア」のみについて見れば、この設問20問のうち、15問正解で正解率は75％と決して高くはないけれど、「ア」以外のデータはちゃんと見分けているから、ほんとに満足。悔しい気持ちとか、全然、湧いてこない。2022年末のチャレンジで正解率91％だった時は、もう口惜しさの塊みたいになってたのに。なんで全然悔しくないんだろー？人間ってほんと不思議。

まぁ、これに「自動採点」と銘打って、誰かに販売してお金もらったら完全な詐欺だと思うけど、『発展途上の自動採点モード付き手書き答案採点補助プログラムです。こんなんでも、もし、よかったら、使ってくださいねー！』･･･というスタンスで仲間にタダでプレゼントする分には（合計点自動計算機能や返却用答案印刷機能等、採点プログラムとしての必須機能が完全に動作すれば）何の問題もないかと･･･。

さらに自動採点と言いながらも、採点の最後にヒトのチェックが必ず必要なのは言うまでもないので、その時、キカイが間違えた５問については、ヒトが「違うよー☆」ってやさしく訂正してあげれば、それこそヒトとキカイの美しい協働･･･じゃないのかなー☆☆☆

いいえ。
そういうのを世間一般には
「言い訳」と言います。

ってか、ここまでは全部、自動採点の準備作業で、ここからが本質的には「始まり」･･･なんだけど、自分的には、かなりヘトヘトになって終了感満載･･･

もしかして、ぼくは、とほーもないことにチャレンジしているのではないか？と、コトここに至って初めて気づく･･･

だって、「アイウエオ」と「〇×」のたった７つPCに教えるのに2ヵ月かかったんだよ。「点くのが遅い蛍光灯のようなお子さんですね」と担任の先生に評された（母親談）という、小学校低学年の児童生徒だったぼくでも、アイウエオくらいは半日で覚えたぞ･･･。

あぁ　カー　カー　キクケコ
サシスセソー

まだいっぱいあるー☆

４．自動採点を実行！（その２）

文字や記号が印刷された解答欄への対応も、実際問題としては必須。
例えば、次のような画像。

上に示したスクリプトがうまく動作してくれるとイイのだけれど。そう思いながら祈るような気持ちで、上の画像の設問に対して自動採点を実行･･･（正解ラベルは「エ」）。

で、結果は？
なんと１００％正解。もしかして、夏休みの自由研究レベルじゃなかった？
予想外の成果に、僕はもう、大満足☆

スキャナーで読み込む際の縮小率とかの問題は未検証だけど、９ポイント程度の大きさで設問番号等は印刷してもらえば、だいたいOKのようだ。手書き文字が小さすぎる場合はどうしようもないけれど、それは事前に「ちいさな文字で解答してはいけません！」と案内しておけば、ある程度は防げるハズ。それでも、ちいさな文字で書くヒトは「チャレンジャー」と見なして･･･

５．〇×記号の学習モデルを作成

２月末、自動採点のGUIを作成しようと、いつもの通り、午前２時に起きて（ジジィは朝が好き／でも出勤はいちばん遅い）「さぁ、やるか」と思った時、なぜか前の晩、眠るときにふと、〇×記号の自動採点用の学習モデルならすぐ作れるんじゃないか･･･と思ったことを思い出し、GUI作りは後回しにして、朝までの４時間で〇×記号の学習モデルを作成することに、当日第１部の予定を変更。

「〇」記号は、ETLデータベースにあったような気がしたので、まずはこちらから。

解凍？してあったETL文字データベースの文字・記号が入ったフォルダを一つずつ開けて内容を確認。「48」のフォルダ内に目的の画像を発見。これが1423枚もあれば、訓練用データとしては十分だろうと思い、このデータを機械学習用に加工。

まず、すべてのファイルが連番になるよう、リネーム。

import os
import glob

path = r".\（Pathを指定）\maru"
files = glob.glob(path + '/*')

files = glob.glob(path + '/*')

for i, f in enumerate(files):
    # すべてのファイルを連番でリネームする
    os.rename(f, os.path.join(path, "maru"+'{0:04d}'.format(i) + '.png'))

次に「輝度反転」。

# 輝度反転
from PIL import Image
import numpy as np
from matplotlib import pylab as plt

for i in range(1423):

    # 画像の読み込み
    im = np.array(Image.open(r".\（Pathを指定）\maru"+r"\maru"+"{0:04d}".format(i) + ".png").convert("L"))

    # 読み込んだ画像は、uint8型なので　0~255 の値をとる
    # 輝度反転するためには、入力画像の画素値を 255 から引く
    im = 255 - im[:,:]

    print(im.shape, im.dtype)

    #保存
    Image.fromarray(im).save(r".\（Pathを指定）\maru"+r"\r_maru"+"{0:04d}".format(i) + ".png")

さらに、二値化する。
もしかしたら、上の輝度を反転させた画像のまま、機械学習を実行してもいいのかも？とチラっと思ったが、一度、最も極端な方向（＝二値化で白黒にする）に振ってみて実験し、その結果を見てから判断することに決めて、二値化を実行。

import cv2
import os
import glob

path = r".\（Pathを指定）\maru_nichika"
files = glob.glob(path + '/*')

for f in files:
    # 読み込み
    im = cv2.imread(f)

    # グレースケールに変換
    im_gray = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY)

    # 大津の二値化
    th, im_gray_th_otsu = cv2.threshold(im_gray, 0, 255, cv2.THRESH_OTSU)

    # 書き込み
    cv2.imwrite(f, im_gray_th_otsu)

二値化した画像中に訓練用データとして不適切な画像がないか、念のため、チェックしたところ、いくつかの不適切なデータを発見したため、それらは削除した。

訓練用データとして、不適切と思われる画像その①（いちばん左の画像は複数枚存在する）

これで「〇」記号の訓練用データは完成。次は「×」記号。

残念ながら、「×」記号のデータはETL文字データベースにはないようだ･･･。しかし、代替できそうなデータを「43」のフォルダに発見。それは「＋」記号。これを45度ほど右か左へ回転させてあげれば、「×」に見えるんじゃないか？と･･･。

画像の回転スクリプトは･･･

from PIL import Image
import os
import glob

path = r".\（Pathを指定）\batsu"
files = glob.glob(path + '/*')

for f in files:
    # ファイルを開く
    im = Image.open(f)

    # 回転
    im_rotate = im.rotate(45)

    # グレースケールへ変換
    img_gray = im_rotate.convert("L")

    # 画像のファイル保存
    img_gray.save(f)

「×」記号ではあるけど、倒れかかった十字架のようで、なんとなく違和感がある･･･。

普通の「×」記号は、「\」が短くて、「／」が長い。上の画像は、ことごとくそれが逆だから違和感を覚えるんだと気づき、さらに90度回転させる。

で、「〇」記号と同様に、リネーム＆輝度反転させて、二値化。

次は、Lobeで機械学習を実行。「〇：maru」と「×：batsu」だから「mb」という名前のフォルダを作成。「〇」記号はフォルダ名を半角数字の「0：ゼロ」、「×」記号はフォルダ名を半角数字の「1」に設定（認識結果の正解ラベルが 0 or 1 で返るようにするため）。

データが準備できたので、Lobeを起動。機械学習を実行。最終的に用意できた訓練データは「〇」記号が「1406」、「×」記号が「1323」。ここまで、なんだ・かんだで３時間半。さらに待つこと３０分。東の空が明るくなる頃、ついに「〇×」記号の学習モデルが完成した。シャワーを浴びて出勤。さぁ今日も第２部の始まりだー☆

６．〇×記号の解答も自動採点

プログラムの中では、次のようにして、採点対象を切り替えている。

  strScrList.Add('    if 黒の面積 > 1.5:');  # 白->黒へ訂正(20230306)
                          ･･･画像ファイルへのPathを設定等･･･
  strScrList.Add('        if os.path.isfile(img):');
                              ･･･画像ファイルを開く･･･
  if cmbAS.Text='○×' then
  begin
    strScrList.Add('            if outputs["label"] == "0":');
    strScrList.Add('                var1.Value = str("○") + "," + ･･･ 
    strScrList.Add('            elif outputs["label"] == "1":');
    strScrList.Add('                var1.Value = str("×") + "," + ･･･ 
    strScrList.Add('            else:');
    strScrList.Add('                var1.Value = str("Unrecognizable")');
    strScrList.Add('        else:');
    strScrList.Add('            var1.Value = str("Could not find image file")');
    strScrList.Add('    else:');
    strScrList.Add('        var1.Value = str("XXX")');
  end;

  if cmbAS.Text='ア行' then
  begin
    strScrList.Add('            if outputs["label"] == "0":');
    strScrList.Add('                var1.Value = str("ア") + "," + ･･･
    strScrList.Add('            elif outputs["label"] == "1":');
    strScrList.Add('                var1.Value = str("イ") + "," + ･･･
    strScrList.Add('            elif outputs["label"] == "2":');
    strScrList.Add('                var1.Value = str("ウ") + "," + ･･･
    strScrList.Add('            elif outputs["label"] == "3":');
    strScrList.Add('                var1.Value = str("エ") + "," + ･･･
    strScrList.Add('            elif outputs["label"] == "4":');
    strScrList.Add('                var1.Value = str("オ") + "," + ･･･
    strScrList.Add('            else:');
    strScrList.Add('                var1.Value = str("Unrecognizable")');
    strScrList.Add('        else:');
    strScrList.Add('            var1.Value = str("Could not find image file")');
    strScrList.Add('    else:');
    strScrList.Add('        var1.Value = str("XXX")');
  end;

正解を「〇」記号として、自動採点してみた結果は･･･

何とも理解に苦しむ摩訶不思議な採点結果が２個あるが、その他は良好と言っていい結果になった。

空欄であるにもかかわらず、正解となっている画像をよく調べてみると･･･

高さが30未満である場合は、輪郭検出しない設定のはずなんだが･･･。他には何にも見つけられないので、原因はコレしか考えられない。いったいナニがどうなっているんだろう？？？　結局、コレは謎のままに。

同じデータに対して、正解を「×」記号として自動採点すると･･･

１０個目のデータの切り抜き画像を調べてみると･･･

どうやら元画像の「色が薄い」 or 「画像の線が太い」と問題が発生する傾向が強い気がしてきた。僕はこの実験に「えんぴつ」を使ったが、普通、試験時解答に使うのはシャーペンだから線が太くなることはあまり考えられない、むしろ、なるべく濃く書くことを注意事項に入れるべきかもしれない。なお、幅が狭くなっているように見えるのは、画像を強制的に幅64×高さ63にリサイズしているためだ。

「アイウエオ」同様、「〇×」記号の自動採点も残念ながらヒトの最終チェックがどうしても必要だという結果になった。が、こちらも「採点補助」程度には使えるぞ。

７．FormCreateでPythonEngineを初期化

何度も実験していると、プログラム起動後、初回の自動採点実行時、Python Engineの初期化に数秒を要するところを何とかしたくなってきた。これは起動後、毎回必ず発生する現象なので、マウスカーソルを待機状態にするとか、そういうレベルで誤魔化せる話ではない。なるべくユーザーの気づかないところで（ソッと）初期化してしまわなくてはならない。

いちばんイイのはプログラム起動時だ。マークシートリーダーを作った時にもこのことが気になったため、スプラッシュ画面を表示して（画像は自前で準備した画像ではなく、Webで販売している画像を購入して使用するという暴挙に出た）、その裏側で初期化作業を行うよう設定。今回も、このやり方を踏襲。

（１）初期化に使う画像をリソースに準備

Python Engineを初期化するには画像が必要なので、専用画像をリソースに準備。

心をこめて製作したmaru.png

（２）初期化処理を実行

プログラム起動時、FormCreate手続きの中で、次のように初期化処理を実行。

まず、リソースに埋め込んだ初期化用画像ファイルを再生。

    //リソースに読み込んだ初期化用ファイルを再生

    //ファイルの位置を指定
    strFileName:=ExtractFilePath(Application.ExeName)+'imgAuto\tmp\maru.png';

    //ファイルの存在を確認
    if not FileExists(strFilename) then
    begin
      //リソースを再生
      with TResourceStream.Create(hInstance, 'pngImage_1', RT_RCDATA) do
      begin
        try
          SaveToFile(strFileName);
        finally
          Free;
        end;
      end;
    end;

次に、Python Engineそのものを初期化。

    //embPythonの存在の有無を調査
    AppDataDir:=ExtractFilePath(Application.ExeName)+'Python39-64';

    if DirectoryExists(AppDataDir) then
    begin
      //フォルダが存在したときの処理
      PythonEngine1.AutoLoad := True;
      PythonEngine1.IO := PythonGUIInputOutput1;
      PythonEngine1.DllPath := AppDataDir;
      PythonEngine1.SetPythonHome(PythonEngine1.DllPath);
      PythonEngine1.LoadDll;
      //PythonDelphiVar1のOnSeDataイベントを利用する
      PythonDelphiVar1.Engine := PythonEngine1;
      PythonDelphiVar1.VarName := AnsiString('var1');
      //初期化
      PythonEngine1.Py_Initialize;
    end else begin
      //MessageDlg('Python実行環境が見つかりません！',mtInformation,[mbOk], 0);
      PythonEngine1.AutoLoad := False;
    end;

最後に初期化用画像を読み込んで、１回だけ自動採点を実行する。

    //スプラッシュ画面を表示してPython Engineを初期化
    try
      theSplashForm.Show;
      theSplashForm.Refresh

      //Scriptを入れるStringList
      strScrList := TStringList.Create;
      //結果を保存するStringList
      strAnsList := TStringList.Create;

      try
        strScrList.Add('import json');
        ･･･略（自動採点用のPythonスクリプトをStringListに作成）･･･

        //０による浮動小数除算の例外をマスクする
        MaskFPUExceptions(True);
        //Execute
        PythonEngine1.ExecStrings(strScrList);
        
        //先頭に認識した文字が入っている
        if GetTokenIndex(strAnsList[0],',',0)='○' then
        begin
          //ShowMessage('The Python engine is now on standby!');
          theSplashForm.StandbyLabel.Font.Color:=clBlue;
          theSplashForm.StandbyLabel.Caption:='The P_Engine is now on standby!';
          theSplashForm.StandbyLabel.Visible:=True;
          Application.ProcessMessages;
          //カウントダウン
          for j:= 2 downto 1 do
          begin
            theSplashForm.TimeLabel.Caption:=Format('起動まであと%d秒', [j]);
            Application.ProcessMessages;
            Sleep(1000);
          end;
        end else begin
          ShowMessage('Unable to initialize python engine!');
          MessageDlg('Auto-scoring is not available!'+#13#10+
          'Please contact your system administrator.',mtInformation,[mbOk],0);
        end;

      finally
        //StringListの解放
        strAnsList.Free;
        strScrList.Free;
      end;

    finally
      theSplashForm.Close;
      theSplashForm.Destroy;
    end;

これで「自動採点GroupBox」内の「実行」ボタンをクリックした際の処理が、ほぼ待ち時間なしで行われるようになった。これをやっておくのと、おかないのとでは、プログラムの使用感がまったく異なってくる･･･。上記のプログラムの for j := 2 downto 1 do 部分を「ムダ」だと思う方もいらっしゃるかもしれませんが、「画像の使用権を購入」してまで表示したスプラッシュ画面なので、せめて２秒間だけ！必要以上に長く表示させてください･･･。

８．まとめ

準備に2ヵ月を要したが、なんとか手書きカタカナ文字の自動採点まで到達。結果は自分的には概ね満足できるものであったが、「実用に適するか」という点では、まだまだブラッシュアップが必要。今回の実験で得たことは、学習モデルを適用する「文字画像の切り抜き精度」の重要性。Lobeで作成した学習モデルは間違いなく優秀。その性能を遺憾なく発揮させる「場」を、僕は準備・提供しなければならない。これこそが今後の課題。

あいん　つばい　どらい
唯歩めば至る･･･

コトここに至ってようやく･･･
これは、とほーもないチャレンジだと気づいたけれど。

もう行くしかない。
僕も、プログラムも、きっともっとよくなれる。

よくなるんだ！

９．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。ここに記載した内容を利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

本記事内で紹介させていただいた実験結果は、あくまでも私自身が用意した文字データに対してのものであり、別データで実験した場合、同様の結果が得られることを保証するものではありません。

Rectangle Detector

矩形検出器

手書き答案をスキャナーで画像化して採点するソフトを書いた。概ね、思った通りにカタチになったが、解答欄の位置座標を取得するのに、解答欄の数だけ、その左上隅から右下隅へマウスでドラッグする作業を繰り返さなくてはならない。（もし、これが自動化できたら･･･）そう思って書いたのが、このプログラム。

１．矩形の検出方法
２．字数制限のある解答欄の作り方
３．GUIはDelphiで作成
４．矩形検出器の使い方
５．まとめ
６．お願いとお断り

１．矩形の検出方法

キーワードを『矩形　検出』にしてGoogle先生にお伺いをたてると、思った通りOpenCVを活用する方法がいくつもヒットする。しかも、そのほとんどすべてがPythonでの活用方法だ。Delphi用のOpenCVもあるようだけれど、次の理由から矩形の検出はPython用のOpenCVで行うことにした。

Pythonを使う利点は、まず、何と言っても、情報が豊富なことだ。マイ・プログラミング環境では、わからないことはすべてGoogle先生に教えてもらうしかないので、情報が入手しやすいことは、他のすべてに優先する。

（メインの開発環境がDelphiなのは、上記の内容と大いに矛盾しますが･･･）

さらに、手書き答案の採点ソフトより前に、マークシートリーダーを作った時、マーク欄の座標を得るために、やはりPythonとOpenCVのお世話になった。マークシートリーダーも、手書き答案の採点ソフトも、embeddable pythonに入れたOpenCVと一緒のフォルダに詰め込んでユーザーに配布しているから、Pythonを内包して使う環境は既に完成済み。PythonのスクリプトをDelphiのコードに埋め込んで、PythonForDelphiを使って実行する方法は勉強済みだから安心。Delphi用のOpenCVは、情報も少ないし、何よりその使い方がわからない･･･。

Setup Python4Delphi

Download Embeddable Python and Install the library

他人様に使っていただくプログラムはDelphiで書くけれど、自分専用のToolはPython環境を利用して作ることが多い。ちょっと特別なことをしたい時、Pythonはとても便利だ。いろいろ紆余曲折はあったけれど、現在はSDカードにWinPythonとAtomエディタを入れて持ち運べるPython環境を作っている。

そのSDカードに入れたPython環境で、いつものようにAtomを起動し、Web上にあったいくつものScriptをコピペして試してみる。

まず、OpenCVで「ハフ変換」なるものを利用する例だが、ハフ変換はノイズの除去で苦労しそうだ。ノイズの発生源が多数存在する解答用紙の矩形検出でパラメータを適切に設定することが果たしてできるだろうか？経験がない自分にはちょっと厳しそうだ。

次に、LSD（Line Segment Detectorの略とのこと）という直線検出器を試した。試した瞬間、（もう、これしかない！）と思うほど、これは凄かった。使い方も超カンタンで、LSDをこれでもか！とばかりに並べるだけ。

from pylsd.lsd import lsd
Mylines = lsd(picture)

【検出結果】

さらに驚くべきことに、こういう作業には付き物の引数も一切ない。つまり、パラメータを調整する必要など『ない』ということなのだろう･･･。ただ、LSDはそのライセンス形態がAGPLであると知り、使用を断念。MITやBSDでないと自分的にはやはり困る･･･。

最後に試したのが、OpenCVのfindContours関数。これを使うには前処理として、まず、画像をグレースケールに変換し、さらに白黒反転させて二値化しなければならない。

import cv2
import numpy as np
from PIL import Image

# Pillowで画像ファイルを開く（全角文字対応の確認用にファイル名は「ひらがな」）
pil_img = Image.open("./img/さんぷる.jpg")
# PillowからNumPyへ変換
img = np.array(pil_img)

# グレースケールに変換する
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 白黒を反転
gray = 255 - gray
# 2値化する
ret, bin_img = cv2.threshold(gray, 20, 255, cv2.THRESH_BINARY)

Pillowで画像ファイルを開いているのは、OpenCVのimread関数が日本語（全角文字）に対して拒絶反応を示すので、これを回避するため。もし、ファイル名とそこまでのPathに全角文字が含まれないという確実な保証があるなら、次のようにしてもいいようだ。これなら１行で済む。

# 8ビット1チャンネルのグレースケールとして画像を読み込む
img = cv2.imread("全角文字のないPathと画像ファイル名", cv2.IMREAD_GRAYSCALE)

で、準備が出来たらfindContours関数を使って輪郭を検出する。

# すべての輪郭を同じ階層として取得する
contours, hierarchy = cv2.findContours(bin_img, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)

解答欄には、その性格上、小さな矩形が多く使われることが多いので、閾値以下の面積の矩形は削除する。※ 閾値は整数型の数値で指定する。

# 閾値以下の面積の矩形（小さい輪郭）は削除
contours = list(filter(lambda x: cv2.contourArea(x) > 閾値, contours))

よりスムーズに作業するためには、予め、小さな矩形を消去した機械読み取り用の解答欄（解答用紙）をヒト用の解答用紙のコピーから作成し、これを用いて解答欄座標を取得した方がよい（国語の縦書き解答用紙は、ワープロソフトではなく、表計算ソフトで作成する方法が業界では一般的らしいので、機械読み取り用の解答用紙はそれほど手間をかけなくても、カンタンに作成できる･･･はず）。

解答欄矩形をちゃんと認識できているか・どうかを確認するため、検出した輪郭を描画する。このPythonのスクリプトをDelphiのObject Pascalに埋め込んで実行する際は、ここが最大の「見せ場」になる。検出した矩形をグラブハンドル付きのラバーバンドで表示する方法は後述。

# 検出した輪郭を描画する
cv2.drawContours(img, contours, -1, color=(0, 0, 255), thickness=2)

最後に解答欄矩形の座標を取得する（これが最終的な目標）。取得した座標は、採点順になるよう、並べ替えて表示する（並べ替え方法は後述）。

# 矩形の座標を表示（左上の座標, 右下の座標）
for i in range(len(contours)):
    x, y, w, h = cv2.boundingRect(contours[i])
    print(str(x)+','+str(y)+','+str(x+w)+','+str(y+h))

数値より、画像（絵）で見た方がわかりやすいのは言うまでもない。

# 保存
cv2.imwrite('./img/lined.jpg', img)
# 画像を表示
cv2.imshow("Image", img)
# キー入力で終了
cv2.waitKey()

ここまでの Python Script をまとめて示せば、次の通り。

import cv2
import numpy as np
from PIL import Image

# Pillowで画像ファイルを開く
pil_img = Image.open("./img/さんぷる.jpg")
# PillowからNumPyへ変換
img = np.array(pil_img)

# グレースケールに変換する
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 白黒を反転
gray = 255 - gray
# 2値化する
ret, bin_img = cv2.threshold(gray, 20, 255, cv2.THRESH_BINARY)

# すべての輪郭を同じ階層として取得する
contours, hierarchy = cv2.findContours(bin_img, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)

# 閾値以下の面積の矩形（小さい輪郭）は削除
contours = list(filter(lambda x: cv2.contourArea(x) > 数値, contours))

# 検出した輪郭を描画する
cv2.drawContours(img, contours, -1, color=(0, 0, 255), thickness=2)

# 矩形の座標を表示（左上の座標, 右下の座標）
for i in range(len(contours)):
    x, y, w, h = cv2.boundingRect(contours[i])
    print(str(x)+','+str(y)+','+str(x+w)+','+str(y+h))

# 保存
cv2.imwrite('./img/lined.jpg', img)
# 画像を表示
cv2.imshow("Image", img)
# キー入力で終了
cv2.waitKey()

OpenCVのfindContours関数を使って検出した輪郭（＝解答欄の矩形）の例。
（解答用紙画像はLSDを試した時と同じものを使用）

解答用紙中の ■ や □ を検出しないよう、検出下限の閾値を設定したこともあり、期待した通りの満足できる結果が得られた。OpenCVのハフ変換や、LSDでは日本語に対する反応が見られたが、findContours関数は（適切な閾値を設定してあげれば）日本語に反応しないようだ。

答案の「答」には「口」、問にも「口」、漢字にはたくさんの矩形が使われている。適切な閾値を設定することで、誤認識を減らせることも理想的。

【実験してみた！】

閾値を「700」として、□ に対する反応を実験して確認した。結果は次の通り。

28ポイントの「□」から反応するが、40ポイントの「問」には無反応。通常使用される解答用紙であれば、フォントの大きさに制限を設ける必要性はなさそう。

もう少し細かい矩形を使った解答用紙で、閾値700で実験すると･･･

閾値1400までは･･･

閾値を1500にすると･･･

少し、細かい矩形を用いた解答用紙であれば、閾値1500くらいから試せば狙った通りに解答欄の座標だけを取得することができそうだ。

閾値に上限を設定すれば、さらに良い結果を得られるかも･･･と思ったが、数学の解答用紙には他の教科ではあり得ない巨大な矩形が普通に使用される。矩形を取得できなければ、検出器とは言えない。さらに、解答欄全体を一つの大きな矩形として認識してしまうのはプログラムの性格上、絶対に回避できないから、閾値の上限は設けずに、むしろ、不要な矩形の座標を削除しやすいプログラム（GUIを作成）を書けばいいと気づく。

さらに、ユーザーが矩形座標の編集（修正）を自由にできるようにプログラムを工夫すれば、理想的な矩形検出器ができるはず。

これでDelphiでGUIを作成する際の方向性も見えてきた。

２．字数制限のある解答欄の作り方

解答欄の矩形を検出する上で、大きなハードルになるだろうと予想していたのが『字数制限が設定された解答欄』。

上の解答用紙は、ヒト用の解答用紙の問題番号部分にあった小さな矩形を消去して、機械読み取り処理用に作成した解答用紙。この状態で矩形を検出（閾値1500）すると･･･

閾値を「3100」に設定して、ようやく･･･

閾値を大きく設定すれば、何とかなることは上の例でわかったが、閾値を大きくすれば当然必要な解答欄の座標を取得できなくなる可能性も生じてくるわけで･･･。

ところが別の国語用解答用紙を処理している際に、閾値を気にせずに字数制限のある解答欄を作成する良い方法があることを偶然発見。それは･･･

字数制限を設定したり、完全解答で正解としたい解答欄は内側の罫線を点線にする！

これなら問題２の（１）・（２）が作る大きな矩形の座標のみ削除すればOK！
点線を活用することで、一番大きな問題を難なくクリアできることが判明。
やったー☆

【embeddable Pythonのバージョンとインストールしたライブラリの一覧】

Python 3.9.9

Package Version
numpy 1.21.5
opencv-python 4.5.4.60
Pillow 9.3.0
pip 22.3.1
setuptools 60.1.0
wheel 0.37.1

３．GUIはDelphiで作成

取得した解答欄の座標を編集するGUIはDelphiで作成。最終的にはこうなった。

画面下の「操作」グループ内のVCLを左から右へ順にクリックして行けば、解答用紙画像から解答欄の矩形が取得・表示できる仕組み。

左から右へ順に操作して解答欄矩形の座標を取得する。

取得した解答欄矩形の座標は、画面右上に一覧形式で採点順に表示されるようにプログラミングした。

横書き答案が指定された場合は、ｙ座標の値が昇順になるよう並べ替え（ｙ座標が同じなら、ｘ座標でさらに昇順に並べ替え）。

縦書き答案が指定された場合は、ｘ座標の値が降順になるよう並べ替え（ｘ座標が同じなら、ｙ座標でさらに昇順に並べ替え）。

こうすれば、座標の並び方が「ほぼ採点する順番になる」はず。なお、並べ替えはカンマで区切った解答欄矩形の座標を入れたStringListを対象として実行（解答欄数は多くても100未満のはず･･･だから、並べ替えの速度はまったく考えていない）。そのアルゴリズムは次の通り。まず、グローバルに使う変数、ソート用のプロパティと関数を準備。

  private
    { Private 宣言 }
    x1,x2:integer;
    y1,y2:integer;
    //Pythonから送られたデータを保存する
    strAnsList:TStringList;

var
  Form1: TForm1;

type TSStyle = (ssText,ssInteger);
var
  //ソート用のプロパティ
  fAscending : Boolean;
  fIndex : Integer; //項目番号
  fStyle : TSStyle; //テキストか整数か

implementation

uses
  System.UITypes;

function GetCommaText(aStr:String; aIndex:Integer):string;
  var
    subList:TStringList;
begin
  subList := TStringList.Create;
  subList.Delimiter := ',';
  subList.DelimitedText := aStr;
  Result := subList.Strings[aIndex];
  subList.Free;
end;

function MyCustomSort(List: TStringList; Index1, Index2: Integer): Integer;
begin
  case fStyle of
    ssText:begin
      Result:=CompareText(GetCommaText(List.Strings[Index1],
      fIndex),
      GetCommaText(List.Strings[Index2],fIndex));
    end;
    ssInteger:begin
      //一重ソート
      //Result:=StrToInt(GetCommaText(List.Strings[Index1],fIndex))
      //          -StrToInt(GetCommaText(List.Strings[Index2],fIndex));
      //二重ソート
      Result:=StrToInt(GetCommaText(List.Strings[Index1],fIndex))
                -StrToInt(GetCommaText(List.Strings[Index2],fIndex));
      if Result=0 then
        //-1することで１番目の項目がソートキーになる
        Result:=StrToInt(GetCommaText(List.Strings[Index1],fIndex-1))  
                  -StrToInt(GetCommaText(List.Strings[Index2],fIndex-1));
      if fAscending then
      begin
        Result:=Result*-1;
      end else begin
        Result:=Result*1;
      end;
    end;
  else
    //これを入れておかないとコンパイラが警告を表示する
    Result:=0;
  end;
end;

で、「解答欄座標を取得」ボタンがクリックされたら、PythonForDelphiを通じてPythonのScriptを内部的に実行して座標を取得し、上記関数を呼び出して並べ替えを実行、結果をMemo2に表示する。

procedure TForm1.btnGetSquareClick(Sender: TObject);
var
  //PythonのScriptを入れる
  strScrList:TStringList;
  //Pythonから送られたデータを保存する -> グローバル変数化
  //strAnsList:TStringList;
  //Sort
  i:integer;
  strFileName:string;
  strList:TStringList;
begin
  //初期化
  Memo1.Clear;
  //Scriptを入れるStringList
  strScrList:=TStringList.Create;
  //結果を保存するStringList
  strAnsList:=TStringList.Create;

  try
    //Python Script
    strScrList.Add('import cv2');
    strScrList.Add('import numpy as np');
    //strScrList.Add('img = cv2.imread("./ProcData/sample2.jpg")');
    strScrList.Add('img = cv2.imread(r"./ProcData/'+ExtractFileName(StatusBar1.SimpleText)+'")');
    strScrList.Add('gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)');
    strScrList.Add('gray = 255 - gray');
    strScrList.Add('ret, bin_img = cv2.threshold(gray, 20, 255, cv2.THRESH_BINARY)');
    strScrList.Add('contours, hierarchy = cv2.findContours(bin_img, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)');
    strScrList.Add('contours = list(filter(lambda x: cv2.contourArea(x) > '+cmbThreshold.Text+', contours))');
    strScrList.Add('for i in range(len(contours)):');
    strScrList.Add('    im_con = img.copy()');
    strScrList.Add('    x, y, w, h = cv2.boundingRect(contours[i])');
    strScrList.Add('    var1.Value =str(x)+","+str(y)+","+str(x+w)+","+str(y+h)');
    //Scriptを表示
    Memo1.Lines.Assign(strScrList);
    //Execute
    PythonEngine1.ExecStrings(Memo1.Lines);
    //結果を表示
    Memo2.Lines.Assign(strAnsList);
  finally
    //StringListの解放
    strAnsList.Free;
    strScrList.Free;
  end;

  strFileName:=ExtractFilePath(StatusBar1.SimpleText)+'Temp.csv';
  Memo2.Lines.SaveToFile(strFileName);

  strList := TStringList.Create;
  try
    for i := 0 to Memo2.Lines.Count-1 do
    begin
      strList.Add(Memo2.Lines[i]);
    end;
    //fAscending := True; //昇順で
    fAscending := False;
    fIndex := 1; //２番目の項目を
    fStyle := ssInteger; //整数型でソート
    strList.CustomSort(MyCustomSort); //ソート
    //データ抽出
    Memo2.Clear;
    for i := 0 to strList.Count - 1 do
    begin
      //Memo2.Lines.Add(GetCommaText(strList.Strings[i],fIndex));
      Memo2.Lines.Add(strList[i]);
    end;
  finally
    strList.Free;
  end;

end;

上記のアルゴリズムは、次のWebサイトに紹介されていた情報を元に作成。
カンマ区切りのデータの並べ替えは初めて行った。採点順に座標を並べたかったので、プログラムコードをよく読んで、二重ソートになるよう工夫した。
貴重な情報を投稿してくださった方に心から感謝申し上げます。

[delphi-users:1175] カンマ区切りのデータの並べ替え
https://groups.google.com/g/delphi-users/c/Ck2mQXNFTvw

４．矩形検出器の使い方

ここまでの操作で解答欄の座標はすべて取得できたはずなので、不要な矩形のデータをいかに効率よく削除するかを主眼に、GUIの操作方法を考えた。

まず、取得できた座標データの先頭にセットフォーカスし、そのデータが示す矩形を赤いラバーバンドで囲んで表示する。ユーザーは、ラバーバンドで囲まれた矩形を見て、その要・不要を判断。

不要な矩形であった場合は、「編集」ボタンをクリック。不要なデータを自動で選択状態に設定。

手続きは次の通り。

procedure TForm1.BitBtn1Click(Sender: TObject);
var
  i:integer;
begin

  //行番号をLines[i]で取得
  i:=StrToInt(LBRow.Caption)-1;

  EditTF:= not EditTF;
  if EditTF then
  begin
    BitBtn1.Caption:='編集中';
    BitBtn1.Font.Color:=clRed;
    Memo2.ReadOnly:=False;
    btnSave.Enabled:=False;

    //i行目の文字全てを選択状態にしたい場合
    //先頭にカーソルをセット
    Memo2.SelStart:=Memo2.Perform(EM_LINEINDEX, i, 0);
    //全ての文字を選択
    Memo2.SelLength:=Length(WideString(Memo2.Lines[i]));
    //Memo2.Perform(WM_VSCROLL,SB_TOP,0); //先頭にスクロール

  end else begin

    BitBtn1.Caption:='編　集';
    BitBtn1.Font.Color:=clBlack;
    Memo2.ReadOnly:=True;
    Memo2.SelStart:=SendMessage(Memo2.Handle,EM_LineIndex,i,0);
    btnSave.Enabled:=True;
    Memo2Click(Sender);

  end;

  //SetFocus
  Memo2.SetFocus;

end;

Delete or Backspaceキーで不要なデータを削除すると同時に、Memoの行も削除する。で、ボタンを「編集」（＝意味的には「編集したい場合はクリックせよ」）に戻す。次のデータをラバーバンドで囲む。この一連の動作がすべて自動的に流れ作業で行われるように手続きを作成。

コードは次の通り。

procedure TForm1.Memo2KeyUp(Sender: TObject; var Key: Word; Shift: TShiftState);
var
  LineNo:integer;
begin
  //現在、カーソルがある行を取得
  LineNo:=Memo2.Perform(EM_LINEFROMCHAR, UINT(-1), 0);
  //空欄なら行を削除
  if Memo2.Lines[LineNo]='' then
  begin
    Memo2.Lines.Delete(LineNo);
  end;
  //表示
  GetLinePos;
  if not EditTF then
  begin
    Memo2Click(Sender);
  end else begin
    BitBtn1Click(Sender);
  end;
end;

procedure TForm1.GetLinePos;
var
  CurPos,Line:Integer;
begin
  with Memo2 do
  begin
    CurPos:=SelStart;
    Line:=Perform(EM_LINEFROMCHAR, CurPos, 0);
    //LBRowは現在フォーカスがある行番号を表示するラベル
    LBRow.Caption:=Format('%d', [Line+1]);
    LBRow2.Left:=LBRow.Left+LBRow.Width;
    LBRow2.Caption:='行目';
  end;
end;

procedure TForm1.Memo2Click(Sender: TObject);
var
  i:integer;
  p1,p2:TPoint;

  function RemoveToken(var s:string;delimiter:string):string;
  var
    p:Integer;
  begin
    p:=Pos(delimiter,s);
    if p=0 then Result:=s
    else Result:=Copy(s,1,p-1);
    s:=Copy(s,Length(Result)+Length(delimiter)+1,Length(s));
  end;

  function GetTokenIndex(s:string;delimiter:string;index:Integer):string;
  var
    i:Integer;
  begin
    Result:='';
    for i:=0 to index do
      Result:=RemoveToken(s,delimiter);
  end;

begin

  if not EditTF then
  begin

    //座標を取得
    i:=Memo2.Perform(EM_LINEFROMCHAR, Memo2.SelStart, 0);

    //エラー対策
    if Memo2.Lines[i]='' then Exit;

    x1:=StrToInt(GetTokenIndex(Memo2.Lines[i],',',0));
    y1:=StrToInt(GetTokenIndex(Memo2.Lines[i],',',1));
    x2:=StrToInt(GetTokenIndex(Memo2.Lines[i],',',2));
    y2:=StrToInt(GetTokenIndex(Memo2.Lines[i],',',3));

    if Assigned(plImage1) then begin
      FreeAndNil(plImage1);
    end;

    //コンポーネントを生成し，イベントを定義し，位置を指定して画像を表示
    plImage1:=TplResizeImage.Create(Self);
    plImage1.Parent:=ScrollBox1;
    plImage1.TransEvent:=True;
    //クライアント座標をスクリーン座標へ変換
    //GetSystemMetrics(SM_CYCAPTION) -> タイトルバーの高さ
    //GetSystemMetrics(SM_CYFRAME) -> ウィンドウの枠幅
    p1.X:=x1-(GetSystemMetrics(SM_CYFRAME) div 2);
    p1.Y:=y1-GetSystemMetrics(SM_CYCAPTION)-(GetSystemMetrics(SM_CYFRAME) div 2);
    p2.X:=x2-(GetSystemMetrics(SM_CYFRAME) div 2);
    p2.Y:=y2-GetSystemMetrics(SM_CYCAPTION)-(GetSystemMetrics(SM_CYFRAME) div 2);
    p1:=Image1.ClientToScreen(p1);
    p2:=Image1.ClientToScreen(p2);
    plImage1.SetBounds(p1.X, p1.Y, p2.X-p1.X, p2.Y-p1.Y);

    //SelectedプロパティをTrueにするとラバーバンドとグラブハンドルが表示される
    plImage1.Selected := True;
    plImage1.BringToFront;

  end;

end;

ラバーバンドはMr.XRAYさんのWebサイトにあったplResizeImageを使わせていただいて作成。これまでにもどれだけ助けていただいたことか･･･。このような素晴らしい素材を提供し続けてくださっているMr.XRAYさんに今回も心から感謝申し上げます。

157_移動リサイズ可能な TImage ラバーバンドとグラブハンドル
http://mrxray.on.coocan.jp/Delphi/plSamples/157_MoveResize_GrabHandle.htm

ラバーバンドで囲まれた矩形が必要な矩形であった場合は、下のMemo3へ「移動」ボタンをクリックしてデータを移す。で、次の矩形をラバーバンドで囲んで表示する。

この作業を順次繰り返すと、最終的に必要な矩形の座標のみがMemo3に移動。不要な矩形の座標はすべて削除されることになる。

最終的に過不足がないか・どうか、Memo3の先頭座標データをクリック、ラバーバンドで該当矩形を囲んで表示、下向きの矢印キーを次へ次へと押して、フォーカスを下の座標データへ移動、ラバーバンドを表示して確認、これを最後の座標データまで繰り返し。

採点順を含めて、必要な座標データがすべて揃っていることを先頭データから順に確認する。

必要な座標がすべて取得できていることを確認したら、「保存」ボタンをクリックして手書き答案採点ソフトが実行時に読み込む、様々な採点設定を記録するための iniファイルに解答欄の座標データを保存する。

【任意の範囲を指定したい場合】

複数の解答欄を抱き合わせて、完全解答で正解としたい場合などに対応するため、任意の範囲を矩形選択できるようにした。

画面中央左の追加ボタンをクリックすると、画面の中央にラバーバンドが表示される。これを任意の位置へドラッグする。

追加ボタンをクリックしてラバーバンドを表示

ボタンのCaptionは、自動で「取得」に変更。

ボタンのCaptionを変更

任意の範囲をラバーバンドで囲んだら（＝範囲指定完了）、「取得」ボタンをクリック。取得された座標がボタンの右のEditに表示され、同時にクリップボードへ送られる。

Memo3上の「追加」ボタンをクリックすると、Memo3が編集可能になるので、採点順を確認して、適切な行に座標のデータを追加（クリップボードから貼り付けても、データを見ながら手動入力してもよい）。

ラバーバンドを使わなくても、解答欄の左上と右下を、それぞれポイントすればその座標をラベルに表示する機能も追加したので、上の図のように、Memo3を編集モードにして、座標を任意の行へ直接入力することも可能。

マウスでポイントした場所の座標をリアルタイムで表示する

クライアント座標の取得と表示を行う手続きは、次の通り。

procedure TForm1.Image1MouseMove(Sender: TObject; Shift: TShiftState; X,
  Y: Integer);
var
  PtInput:TPoint;
begin
  //スクリーン座標を取得
  GetCursorPos(PtInput);
  //で、そのコントロールのクライアント領域に対するカーソルの座標を取得
  PtInput := Image1.ScreenToClient(PtInput);

  //補正する必要はない（確認済み）
  //表示
  Label2.Caption:=
    Format(' クライアント座標  '+'X : %d, Y : %d', [PtInput.X, PtInput.Y]);
end;

【矢印キーの押し下げを拾う】

最も難しかったのが、フォーカスが「どこにあるか」で矢印キーの挙動を制御すること。以前にStringGridのセルのフォーカスの移動を制限した時に学んだ内容が今回も役に立った。

Disable left and right arrow keys on StringGrid

今回は、Memoにフォーカスがある場合と、ラバーバンドにフォーカスがある場合、さらにラバーバンドにフォーカスがある場合のうち、Shiftキーと同時に矢印キーが押し下げられているのか（＝ラバーバンドの大きさの変更）、それとも矢印キーが単独で押し下げられているのか（＝ラバーバンドの表示位置の移動）、この３パターンを見分けてそれぞれにあった動作を行わせたいと考えた。最終的には次のコードで対応。

  private
    { Private 宣言 }

    //ある（矢印他）キーが押されたことを知る
    procedure AppMessage(var Msg: TMsg; var Handled: Boolean);

上のように手続きを宣言して、Shift＋Ctrl＋Cで手続きを生成。

procedure TForm1.AppMessage(var Msg: TMsg; var Handled: Boolean);
var
  StrText: string;
begin
  //何かキーが押し下げられたら
  if Msg.message = WM_KEYDOWN then
  begin
    try
      if ActiveControl is TMemo then
      begin
        //キー操作を「通常動作」にするおまじない
        case Msg.Message of
          WM_USER + $0500:
          Handled := True;
        end;
      end else begin
        //上位ビットが1ならShiftキーが押されている
        if GetKeyState(VK_SHIFT) and $8000 <> 0 then
        begin
          if plImage1.Visible then
          begin
            //右矢印キー
            if Msg.wParam=VK_RIGHT then
            begin
              plImage1.Width := plImage1.Width + 1;
              Msg.wParam:=0;
            end;
            //左矢印キー
            if Msg.wParam=VK_LEFT then
            begin
              plImage1.Width := plImage1.Width - 1;
              Msg.wParam:=0;
            end;
            //上矢印キー
            if Msg.wParam=VK_UP then
            begin
              plImage1.Height := plImage1.Height - 1;
              Msg.wParam:=0;
            end;
            //下矢印キー
            if Msg.wParam=VK_DOWN then
            begin
              plImage1.Height := plImage1.Height + 1;
              Msg.wParam:=0;
            end;
          end;
        end else begin
          //Shiftキーは押されていない
          //対象を限定（どちらでも動いた）
          //if TplResizeImage(ActiveControl).Visible then
          if plImage1.Visible then
          begin
            //右矢印キー
            if Msg.wParam=VK_RIGHT then
            begin
              plImage1.Left := plImage1.Left +1;
              Msg.wParam:=0;
            end;
            //左矢印キー
            if Msg.wParam=VK_LEFT then
            begin
              plImage1.Left := plImage1.Left -1;
              Msg.wParam:=0;
            end;
            //上矢印キー
            if Msg.wParam=VK_UP then
            begin
              plImage1.Top := plImage1.Top - 1;
              Msg.wParam:=0;
            end;
            //下矢印キー
            if Msg.wParam=VK_DOWN then
            begin
              plImage1.Top := plImage1.Top + 1;
              Msg.wParam:=0;
            end;
            //Deleteキー
            if Msg.wParam=VK_DELETE then
            begin
              //plImage1を解放
              if Assigned(plImage1) then begin
                FreeAndNil(plImage1);
              end;
              Msg.wParam:=0;
            end;
          end;
        end;
      end;
    except
      on E: Exception do
      begin
        StrText := E.ClassName + sLineBreak + E.Message;
        Application.MessageBox(PChar(StrText), '情報', MB_ICONINFORMATION);
      end;
    end;
  end;
end;

plImage1が生成されないうちに上の手続きが呼ばれると、当然、一般保護違反のエラーが発生するので、FormCreate時にplImage1を生成しておく。

procedure TForm1.FormCreate(Sender: TObject);
var
  //Python39-32へのPath
  AppDataDir:string;
  i:integer;
begin

  //メモリーリークがあれば検出
  ReportMemoryLeaksOnShutdown:=True;

  //有効にする（忘れないこと！）
  Application.OnMessage := AppMessage;

  //[Enter]でコントロールを移動させるために、Form上のコンポーネント
  //より先にFormがキーボードイベントを取得する。
  KeyPreview:=True;

  //コンポーネントを生成 -> インスタンス（実体）をつくる
  // = 一般保護違反エラーの防止
  //plImage1はグローバル変数として宣言しているから未定義の識別子エラーは発生しない
  //でも、Create（生成）してからでなければ使えない！
  plImage1:=TplResizeImage.Create(Self);

  //編集フラグ（編集中ではない）
  EditTF:=False;
  PlusTF:=False;
  Memo2.ReadOnly:=True;

  //StatusBar1の設定
  StatusBar1.SimplePanel:=True;

  //Formを最大化して表示(幅も最大化される)
  Form1.WindowState:=wsMaximized;

  //Embeddable Pythonの存在の有無を調査
  AppDataDir:=ExtractFilePath(Application.ExeName)+'Python39-32';
  if DirectoryExists(AppDataDir) then
  begin
    //フォルダが存在したときの処理    
    PythonEngine1.AutoLoad:=True;
    PythonEngine1.IO:=PythonGUIInputOutput1;
    PythonEngine1.DllPath:=AppDataDir;
    PythonEngine1.SetPythonHome(PythonEngine1.DllPath);
    PythonEngine1.LoadDll;
    //PythonDelphiVar1のOnSeDataイベントを利用する
    PythonDelphiVar1.Engine:=PythonEngine1;
    PythonDelphiVar1.VarName:=AnsiString('var1');  //プロパティで直接指定済み
    //初期化
    PythonEngine1.Py_Initialize;
  end else begin    
    PythonEngine1.AutoLoad:=False;
  end;

  //面積の閾値の選択肢を設定
  for i := 1 to 200 do
  begin
    cmbThreshold.Items.Add(IntToStr(i*100));
  end;

  //画面のちらつきを防止する
  DoubleBuffered := True;

end;

で、メモリーリーク発生の原因とならないよう、アプリの終了時に忘れずに解放。

procedure TForm1.FormCloseQuery(Sender: TObject; var CanClose: Boolean);
begin
  //メモリーリークを防止する
  PythonEngine1.Py_Finalize;
  PythonDelphiVar1.Finalize;
  FreeAndNil(plImage1);
end;

５．まとめ

（１）矩形の検出は、OpenCVのfindContours関数を利用する。
（２）矩形の検出を回避するには「点線」を利用する。
（３）GUIはDelphiで作成し、必要な座標だけ保存できるように工夫。
（４）「フォーカスがどこにあるか」で矢印キーの動作を制御。
（５）コントロール生成のタイミングと確実な破棄にも注意する。

６．お願いとお断り

このサイトの内容を利用される場合は、自己責任でお願いします。記載した内容を利用した結果、利用者および第三者に損害が発生したとしても、このサイトの管理者は一切責任を負えません。予め、ご了承ください。

Mark Sheet Reader (Basic version)

「マークシートリーダーをつくる（基礎編）」

DelphiでGUIを作成、マークシート画像はPythonにインストールしたOpenCVとNumpyで読み取り＆計算処理して、結果をMemoに表示するマークシートリーダーの練習プログラム。

０．準備
１．使用するプログラムとマークシート画像について
２．マークシート画像を読み込む
３．マークシート読み取り処理のアルゴリズム
４．マークシート読み取り処理の実際（Object Pascalのコード）
５．さらに進化
６．著作権表示の記載方法
７．お願いとお断り

マークシートリーダー

ここで紹介している練習用プログラムを、実際の採点業務で使用できるようにした拙作マークシートリーダーです。

０．準備

マークシートリーダー作成にあたって、以下の事前準備が必要です。

・PythonForDelphiのインストール
・Embeddable Pythonのダウンロードと必要なライブラリのインストール
（作業後、このプログラムへの埋め込み用にフォルダ名を「Python39-32」に変えて、このプログラム（マークシートリーダー）のexeがある場所へコピーする）
・アプリケーションの表示画面のリサイズ対応（縦編）

（いずれも、当Blogの記事で過去に紹介）

Setup Python4Delphi

Download Embeddable Python and Install the library

重要　上の記事の手順で、OpenCVとNumpyをインストールしたEmbeddable Pythonが入ったフォルダを「Python39-32」という名前で、以下のフォルダ内にコピーする。

C:\Users\ xxx \ Project1.dprojファイルのあるフォルダ \Win32\Debug\

Installing The Splitter & Resizing Height of the VCL Components

１．使用するプログラムとマークシート画像について

当Blogの過去記事『～主として「高さ」の変更に関する覚書～』で作成したDelphiのGUIをそのまま使用します。

画面サイズの変更に対応できるよう、以下のコードを記述。

unit Unit1;

interface

uses
  Winapi.Windows, Winapi.Messages, System.SysUtils, System.Variants,
  System.Classes, Vcl.Graphics, Vcl.Controls, Vcl.Forms, Vcl.Dialogs,
  Vcl.ExtCtrls, Vcl.Grids, Vcl.StdCtrls;

type
  TForm1 = class(TForm)
    Panel1: TPanel;
    Panel2: TPanel;
    Panel3: TPanel;
    Splitter1: TSplitter;
    ScrollBox1: TScrollBox;
    Image1: TImage;
    Memo1: TMemo;
    procedure FormCreate(Sender: TObject);
    procedure FormResize(Sender: TObject);
    procedure Splitter1Moved(Sender: TObject);
  private
    { Private 宣言 }
    //Panel1の幅とFormの高さを記憶する変数
    intPH, intFH:integer;
    //Formの表示終了イベントを取得
    procedure CMShowingChanged(var Msg:TMessage); message CM_SHOWINGCHANGED;
  public
    { Public 宣言 }
  end;

var
  Form1: TForm1;

implementation

{$R *.dfm}

{ TForm1 }

procedure TForm1.CMShowingChanged(var Msg: TMessage);
begin
  inherited; {通常の CMShowingChagenedをまず実行}
  if Visible then
  begin
    Update; {完全に描画}
    //Formの表示終了時に以下を実行
    Panel1.Height:=intPH;
    intPH:=Panel1.Height;
    intFH:=Form1.Height;
  end;
end;

procedure TForm1.FormCreate(Sender: TObject);
begin
  //Panel1とFormの高さを記憶する変数を初期化
  intPH:=200;
  intFH:=480;
end;

procedure TForm1.FormResize(Sender: TObject);
begin
  //比率を維持してPanel1の高さを変更
  Panel1.Height:=Trunc(Form1.Height * intPH/intFH);
end;

procedure TForm1.Splitter1Moved(Sender: TObject);
begin
  //Panel1とFormの高さを取得
  intPH:=Panel1.Height;
  intFH:=Form1.Height;
end;

end.

マークシート画像は、以下の画像を使用。

マークシート画像は、以下の場所に「MarkSheet」という名前のフォルダを作成して、その中に保存。

C:\Users\ xxx \ Project1.dprojファイルのあるフォルダ \Win32\Debug\Marksheet

２．マークシート画像を読み込む

Delphiを起動して、Project1.dproj（マークシート読み取り用GUIの保存してあるフォルダ内のDelphiのプロジェクトファイル）を開き、Panel3をクリックして選択しておいて、Panel3上にButton1を作成。Button1のNameプロパティはButton1のまま、Captionプロパティを「画像を表示」に変更。Button1の位置は下図を参照。

OpenDialog1をForm上に置く。

次に、Form上のButton1をダブルクリックして、procedure TForm1.Button1Click(Sender: TObject);を作成。

procedure TForm1.Button1Click(Sender: TObject);
begin

end;

作成した手続きではJpeg画像を扱うので、画面を上にスクロールして、implementation部の下に Vcl.Imaging.Jpeg を uses する。

implementation

uses
  Vcl.Imaging.Jpeg; //Jpeg画像を読み込む

{$R *.dfm}

Button1Clickプロシージャにvar宣言を追加して、Jpeg画像読み込み用の変数jpgを宣言。

procedure TForm1.Button1Click(Sender: TObject);
var
  jpg: TJPEGImage;
begin

end;

beginとend;の間に、以下のコードを記述。

  //OpenDialogのプロパティはExecuteする前に設定
  With OpenDialog1 do begin
    //表示するファイルの種類を設定
    Filter:='JPEG Files (*.jpg, *.jpeg)|*.jpg;*.jpeg';
    //データの読込先フォルダを指定
    InitialDir:=ExtractFilePath(Application.ExeName)+'MarkSheet';
  end;

  if not OpenDialog1.Execute then Exit;  //キャンセルに対応
  //オブジェクトを生成
  jpg := TJPEGImage.Create;
  try
    //読み込み
    jpg.LoadFromFile(OpenDialog1.FileName);
    //Image1に表示
    Image1.Picture.Assign(jpg);
  finally
    //オブジェクトを破棄
    jpg.Free;
  end;

上書き保存（Ctrl＋S）して、実行（F9）。データの読み込み先を指定しておくと、目的のフォルダが一発で開くので便利。

マークシート画像が表示される。が、ごく一部しか見えない。

これはImage1のAutoSizeプロパティがデフォルトFalseに設定されているため。 Image1 のAutoSizeプロパティをTrueにするコードを追加（オブジェクトインスペクタで Image1 のAutoSizeプロパティを直接指定してもOK）。

  try

    //読み込み
    jpg.LoadFromFile(OpenDialog1.FileName);
    //Image1に表示
    Image1.Picture.Assign(jpg);

    //追加
    Image1.AutoSize:=True;

  finally

上書き保存（Ctrl＋S）して、実行（F9）。画像の表示を確認する。

うまくいったように見える。Formを最大化してSplitterを下げて、さらに確認。

画像が表示される位置を、画面の左側へ移動するコードを手続きの先頭に追加する。

begin

  //Imageの表示位置を指定
  Image1.Top := 25;
  Image1.Left := 40;

  //OpenDialogのプロパティはExecuteする前に設定しておくこと
  With OpenDialog1 do begin

上書き保存（Ctrl＋S）して、実行（F9）。画像の表示を再度確認する。

参考：画像読み込みのコード（全体）

implementation

uses
  Vcl.Imaging.Jpeg; //Jpeg画像を読み込む

{$R *.dfm}

{ TForm1 }

procedure TForm1.Button1Click(Sender: TObject);
var
  jpg: TJPEGImage;
begin

  //Imageの表示位置を指定
  Image1.Top := 25;
  Image1.Left := 40;

  //OpenDialogのプロパティはExecuteする前に設定しておく
  With OpenDialog1 do begin
    //表示するファイルの種類を設定
    Filter:='JPEG Files (*.jpg, *.jpeg)|*.jpg;*.jpeg';
    //データの読込先フォルダを指定
    InitialDir:=ExtractFilePath(Application.ExeName)+'MarkSheet';
  end;

  if not OpenDialog1.Execute then Exit;  //キャンセルに対応
  //オブジェクトを生成
  jpg := TJPEGImage.Create;
  try

    //読み込み
    jpg.LoadFromFile(OpenDialog1.FileName);
    //Image1に表示
    Image1.Picture.Assign(jpg);

    //追加
    Image1.AutoSize:=True;

  finally
    //オブジェクトを破棄
    jpg.Free;
  end;

end;

３．マークシート読み取り処理のアルゴリズム

まず最初にマークシートの左上にある特徴点（マーカー）画像： ■■■（トリプルドット）をOpenCVのテンプレートマッチングで探す。

特徴点（マーカー）画像が見つかったら、特徴点（マーカー）画像左上位置を基準にして、「マークシートの周囲の枠部分のみ」を矩形選択して切り出し。

参考①：あらかじめ測定しておいた特徴点（マーカー）画像の位置（単位はピクセル）
左上のX座標=65
左上のY座標=28
右下のX座標=121（マークシート矩形の座標計算には使用しない）
右下のY座標=43（マークシート矩形の座標計算には使用しない）

参考②：あらかじめ測定しておいたマークシート矩形の座標（単位はピクセル）
左上の X座標=65
左上の Y座標=61
右下の X 座標=419
右下の Y 座標=497

参考　上記の各座標をマークシート画像から計測し、テンプレートとして用意したマークシートごとに登録（座標値を保存）するプログラムを別途作成した。なお、座標原点（0,0）は画像の左上である（使い慣れた数学の座標系とちょっと違うことに注意！）。

この座標を元にして、特徴点（マーカー）画像からの距離で、マークシート矩形を切り出す。

マークシート矩形において、（W1、H1）が左上位置を、（W2、H2）が右下位置を示す座標となる。

上の例では、マークシートの列数は「１」、行数は「１０」と数えることにする。列数が「１」の場合、W1は「ほぼ０（ゼロ）」になり、値としての意味がないように思われるが、このプログラムを実用化した場合は、下の例のように、複数の列があるマークシートを用いることになるので、２列めのマークシート矩形の座標は、左上が（W3,H3）、右下が（W4,H4）、３列めのマークシート矩形の座標は左上が（W5,H5）、右下が（W6,H6）のように指定でき、W値が０ではない場合が生じる。

マークシート用紙の作成に、私はWordを用いたが、Wordのバージョンによっては、あろうことか、上書き保存時に、マーカー画像（■■■）の位置が数ミリ程度、勝手に左へ移動するという予期しないトラブル（Wordの仕様？）が発生。このような点も考慮して、W1の座標は敢えて（０として）定数化していない。

マークシートの作成例（実験用に使用）
列数３、１列あたりの行数25、１行あたりの選択肢の数は16
この用紙の場合、総マーク数は３×25×16＝1200個/枚となる
つまり用紙１枚につき、1200回マークの有無の判定が必要

実際の作業では、マークシート画像をスキャナーで読み取って、グレースケールのJpeg画像としてデータ化するので、マークシート（用紙）に「しわ」があったり、状況によっては「折られ」ていたりする関係上、読み取り画像を１枚ずつ比較すると、その上下・左右にどうしても微妙なブレ・ズレが生じてしまう。しかし、同じ印刷機で、同時に印刷したマークシートであれば、特徴点（マーカー）画像とマークシートの行列位置の関係は絶対であり、これが１枚ごとに変化することはありえない。つまり、スキャンした画像が余程大きく傾きでもしていない限り、テンプレートマッチングで、特徴点（マーカー）画像さえ発見できれば、予め測定・記録しておいた座標の相対的位置関係からマークシート矩形は容易に切り出せる。

次の画像は、別データとして保存してある特徴点（マーカー）画像を元に、OpenCVのテンプレートマッチングをマークシート画像に対して行ったもの。類似度の高い部分を赤枠で囲んで示すようプログラミングしている。

マーカー

次に、上に述べた方法で計算したマークシート矩形を列単位で切り出す。切り出した画像は、マークの（＝列）数・行数の整数倍のサイズになるようリサイズする（これは、このあと画像を細かく分割して処理するので、切り出す行や列の計算を簡単にするための工夫 → 整数倍にリサイズすれば、列数分＆行数分廻すLoop処理の中で処理しやすい）。

マークシート用紙は、一般的なマークシート用紙のような厚みのある（高級感あふれる）専用紙でなく、ホームセンターでも「売ってない！」ような見た目が灰色の再生紙を用いている。このためか、あちらこちらにゴミのような黒い点や、細いすじが入っていることがある。これらの黒点やすじを判定プログラムが「マークあり」と誤認しないようにするため、次に「平滑化（ボカシ）処理」を行う。

平滑化（ボカシ）処理には「ガウシアンフィルタ」を用いた。これは、正規（ガウス）分布を利用して「注目画素からの距離に応じて近傍の画素値に重みをかける」という処理を行うもので、自然な平滑化が実現できるとのこと。次の画像は、上の切り出したマークシート矩形に対して、この平滑化処理を行ったもの。

img = cv2.GaussianBlur(img,(35,35),0)　※引数は奇数を指定する必要がある

引数の値が大きいほど正規分布のピークが低く、広がりは広くなる（＝より均一に、より全体にボカシがかかる）。ここでは引数をかなり大きめにとり「35」としている。こうすることで、ゴミやシミを画像からほぼ完全に除去できる。

さらに、この画像を「ある閾値」を元に白と黒に二値化処理する。この処理で枠線やマークされていないマーク部分が「すべて白」になり、鉛筆で濃くマークされている部分だけが「黒」になった白黒画像が得られる。当初は、以下のように引数を指定して二値化画像を作成した。

ret, img = cv2.threshold(img, 140, 255, cv2.THRESH_BINARY)

現在は、次のように閾値の設定を自動で行う「大津の二値化」を利用している。

ret, img = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)

式中の第２引数は閾値だが、大津の二値化では自動計算させるので０(ゼロ)を指定。第３引数は0-255の256段階でグレースケール化しているから、最大値の255を指定する。これによって、次の画像が得られる。

さらに、これを白黒反転させた画像を作成する。式は以下の通り。

img = 255 - img

これにより、次の画像が得られる。

次に、この画像を「行」単位に分割して切り出す。

１行目を切り出した画像

次に、選択肢の数で、均等に分割する。ここでは選択肢の数が「８」なので、上の画像を等幅で８個に分割する。下は、その１個目の切り出し画像である。

このように細かく分割して切り出した画像１つ１つについて、画素が白なら値を255・黒なら０として面積あたりの合計値を計算し、マークされている部分の面積の中央値を算出、これを閾値として、下の式では、マークされている（白い部分の）面積が他より３倍以上あるものを「マークあり！」と判定している。この数値が大きいほど、判定はきびしくなる。

result.append(area_sum > np.median(area_sum) * 3)

このマークシート読み取り処理のアルゴリズムの主要部分は全て、GitHubの次の記事に紹介されていたものです。素晴らしい記事を投稿してくださった作成者の方に、心から感謝申し上げます。

PythonとOpenCVで簡易OMR（マークシートリーダ）を作る
URL：https://qiita.com/sbtseiji/items/6438ec2bf970d63817b8

参考　列が複数あるマークシートの読み取り処理について

上記記事では、特徴点（マーカー）画像をマークシートの上下に複数個用意し、テンプレートマッチングを行っています。確かに、マークシートの左上と右下に特徴点（マーカー）画像を用意すれば、より簡単にマークシート矩形の切り出しが可能でした。これは素晴らしいアイデアです。

私も当初は特徴点（マーカー）画像を複数個用意してマークシートを作成していたのですが、列数を２列、３列と増やすと、さまざまな問題が生じることに気が付きました。

第一に、特徴点（マーカー）画像を変えないと、列ごとの切り出しが困難だということです。つまり、３列あるマークシートでは、最も左の列用の特徴点を■■■、真ん中の列用の特徴点を■□■、最も右側の列用の特徴点を■□□として、Loop処理の中でテンプレートマッチングに使用する特徴点（マーカー）画像を切り替えて、目的とするマークシート矩形を切り出せるようにしてみた（□□■や□□□も含めればさらに多くの列が作成可能）のですが、この方法では、うまく特徴点（マーカー）画像を認識してくれないことがあり、安定感に欠ける気がしました。

第二に、万一、回答者が特徴点（マーカー）画像に意図的に変更を加える（例： ■□□ → ■■□）等の暴挙に出た場合、対応が難しいこと。

第三に、マーカー画像が多いと、マークシートの見た目もなんだか騒がしくて、個人的にはマーカー画像を複数個用意する方法はなるべく避けたいと考えたこと。

これらの理由から、「なんとか特徴点（マーカー）画像が１個で済まないか」と、私なりに工夫して、当ブログで紹介した方法を考えました。

創意工夫の過程で一時は、回答者が意図的に変更できるようなマーカー（例： □ ）がなければOKかとも思い、別の特徴点（マーカー）画像も使ってみたのですが、それはそれでまた別の問題を起こすことがわかりました。

例えば、下のように、ヒトなら簡単に両者の違いを判別できる画像を用意します。

用意した特徴点（マーカー）画像

これに対して、左側の画像でテンプレートマッチングを行うと･･･

機械はヒトと違うモノの見方をしていることが、大変良くわかりました。

４．マークシート読み取り処理の実際（Object Pascalのコード）

Form上に、Buttonを１つ、PythonForDelphi関連のVCLコンポーネントを３つ配置する。Button2は、Panel3の中央付近に置き、Nameプロパティはそのまま、Captionプロパティを「読み取り」に変更する。PythonForDelphi関連のVCLコンポーネントは、すべて非ビジュアルコンポーネントなので、位置はどこでもよく、Nameプロパティもデフォルトのままとする。 PythonForDelphi関連で配置するコンポーネントは以下の通り。

以下のように、PythonForDelphi関連のコンポーネントのプロパティとイベントを設定

・PythonEngine1のAutoLoadプロパティはFalseに設定。

・PythonEngine1のDllNameプロパティはpython39.dllを指定（埋め込みPythonのバージョンに合わせて設定する）。ここでは3.9.9以下のバージョンのPythonでないとNumpyが非対応（2021年12月現在）であり、用意した埋め込みPythonのバージョンは3.9.9なのでpython39.dllに変更する。

・PythonEngine1のIOにはPythonGUIInputOutput1を指定。

・PythonGUIInputOutput1は他で利用するならプロパティのOutPutに「Memo1」などとするところだけれど、ここでは何も設定しない。

・PythonDelphiVar1のVarNameはプログラムコードの記述に合わせて「var1」とする。var1と入力後、Enterで確定すること！（青く反転表示されるのを確認する）

Formが生成される時、PythonEngine1を初期化する。Formのタイトルバーの上をクリックして選択し、オブジェクトインスペクタのイベントタブをクリックしてOnCreateイベントの右に表示されている「FormCreate」をダブルクリックして、コードの入力に切り替える。

参考：エラー対応方法（20220724追加）

P4D使用時にImageコントロールの bsClear を使うとエラーが発生します。

[dcc32 エラー] Unit02_MSReader.pas(1199): E2010 'TBrushStyle' と 'Enumeration' には互換性がありません

これはPythonEngine.pasの中で bsClear が定義（使用）されているためです。次に示す例のように、Image1の方のbsClearを明示的に Vcl.Graphics.bsClear として対応します。

  //矩形を描画
  with Image1 do
  begin
    //Canvas.Brush.Style:=bsClear;
    Canvas.Brush.Style:=Vcl.Graphics.bsClear;
  end;

以上、エラー対応でした。解説を続けます。

表示は次のようになっている（はず）。ここにコードを追加する。

procedure TForm1.FormCreate(Sender: TObject);
begin

  //Panel1とFormの高さを記憶する変数を初期化
  intPH:=200;
  intFH:=480;

end;

追加するコード

procedure TForm1.FormCreate(Sender: TObject);
var
  //Python39-32へのPath（追加）
  AppDataDir:string;
begin

  //Panel1とFormの高さを記憶する変数を初期化
  intPH:=200;
  intFH:=480;

  //以下のコードを追加
  //embPythonの存在の有無を調査
  AppDataDir:=ExtractFilePath(Application.ExeName)+'Python39-32';

  if DirectoryExists(AppDataDir) then
  begin
    //フォルダが存在したときの処理
    MessageDlg('Embeddable Pythonが利用可能です。',
      mtInformation, [mbOk] , 0);
    PythonEngine1.AutoLoad:=True;
    PythonEngine1.IO:=PythonGUIInputOutput1;
    PythonEngine1.DllPath:=AppDataDir;
    PythonEngine1.SetPythonHome(PythonEngine1.DllPath);
    PythonEngine1.LoadDll;
    //PythonDelphiVar1のOnSeDataイベントを利用する
    PythonDelphiVar1.Engine:=PythonEngine1;
    PythonDelphiVar1.VarName:=AnsiString('var1');  //プロパティで直接指定済み
    //初期化
    PythonEngine1.Py_Initialize;
  end else begin
    MessageDlg('Embeddable Pythonが見つかりません！',
      mtInformation, [mbOk] , 0);
    PythonEngine1.AutoLoad:=False;
  end;

end;

ここでMessageDlgを使用しているので、以下のように System.UITypes を uses に追加する。

implementation

uses
  Vcl.Imaging.Jpeg, System.UITypes;  // <-追加

  //Jpeg:Jpeg画像を読み込む
  //System.UITypesはMessageDlgの表示に必要

{$R *.dfm}

プライベートメンバー変数 intCnt（カウンタとして利用する）と strAnsList（Pythonから返された計算結果を保存する）を２つ、Private宣言で新しく宣言する。

  private
    { Private 宣言 }

    //for Python（追加）
    //Counter
    intCnt:integer;
    //Pythonから送られたデータを保存
    strAnsList:TStringList;

    //Panel1の幅とFormの高さを記憶する変数
    intPH, intFH:integer;
    //Formの表示終了イベントを取得
    procedure CMShowingChanged(var Msg:TMessage); message CM_SHOWINGCHANGED;

  public
    { Public 宣言 }
  end;

Form上のButton2（読み取りボタン）をダブルクリックして、手続きを作成し、以下の内容を入力する。

procedure TForm1.Button2Click(Sender: TObject);
var
  StrList:TStringList;
  strJCnt,strColCnt,strRowCnt,strSelCnt:String;
  TopLX, TopLY, TLX1, TLY1, BRX1, BRY1:integer;
  strPicName:string;
begin

  //初期化
  Memo1.Clear;
  intCnt:=1;

  //座標
  TopLX:=65;
  TopLY:=28;
  //BtmRX:=121;
  //BtmRY:=43;
  TLX1:=65;
  TLY1:=61;
  BRX1:=419;
  BRY1:=497;

  //マークシート数Check(+1することを忘れない)
  strJCnt:=IntToStr(2);

  //列数Check(+1することを忘れない)
  strColCnt:=IntToStr(2);

  //１列あたりの行数Check
  strRowCnt:=IntToStr(10);

  //選択肢数Check
  strSelCnt:=IntToStr(8);

  //マークシート名
  strPicName:='ms';

  //結果を保存するStringList
  strAnsList := TStringList.Create;

  //Scriptを入れるStringList
  StrList := TStringList.Create;

  try

    //Python Script
    StrList.Add('import cv2');
    StrList.Add('import numpy as np');

    //for JPN(日本語に対応)
    StrList.Add('def imread(filename, flags=cv2.IMREAD_GRAYSCALE, dtype=np.uint8):');
    StrList.Add('    try:');
    StrList.Add('        n = np.fromfile(filename, dtype)');
    StrList.Add('        img = cv2.imdecode(n, flags)');
    StrList.Add('        return img');
    StrList.Add('    except Exception as e:');
    StrList.Add('        return None');

    //マーカー画像を読み込む
    StrList.Add('template = imread("marker.png", cv2.IMREAD_GRAYSCALE)');

    //マークシートの枚数
    StrList.Add('for j in range(1,'+strJCnt+'):');

    //列数
    StrList.Add('    for i in range(1,'+strColCnt+'):');

    //マークシートへのパスを取得
    StrList.Add('        if j < 10:');
    StrList.Add('            MS_Name = r".\Marksheet\'+ strPicName +'0"+ str(j) +".jpg"');
    StrList.Add('        else:');
    StrList.Add('            MS_Name = r".\Marksheet\'+ strPicName +'"+ str(j) +".jpg"');

    //画像を読み込む
    StrList.Add('        img = imread(MS_Name)');
    //画像をグレースケールで読み込む
    StrList.Add('        img_gray = imread(MS_Name, 0)');

    //テンプレートマッチングの実行(比較方法cv2.TM_CCORR_NORMED)
    StrList.Add('        result = cv2.matchTemplate(img, template, cv2.TM_CCORR_NORMED)');

    //類似度が最小,最大となる画素の類似度、位置を調べ代入する
    StrList.Add('        min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result)');
    //最も似ている領域の左上の座標を取得
    StrList.Add('        top_left = max_loc');
    StrList.Add('        if i == 1:');

    //補正値を取得（高さ）
    StrList.Add('            h1 = ' + IntToStr(TLY1 - TopLY));
    StrList.Add('            h2 = ' + IntToStr(BRY1 - TopLY));
    //補正値を取得（幅）
    StrList.Add('            w1 = ' + IntToStr(TLX1 - TopLX));
    StrList.Add('            w2 = ' + IntToStr(BRX1 - TopLX));

    //矩形の左上の座標を計算 [0]-> X, [1]-> Y
    StrList.Add('        TL = (top_left[0] + w1, top_left[1] + h1)');
    //矩形の右下の座標を計算
    StrList.Add('        BR = (top_left[0] + w2, top_left[1] + h2)');
    //画像を切り出し img[top_Y : bottom_Y, left_X : right_X]
    StrList.Add('        img = img_gray[TL[1] : BR[1], TL[0] : BR[0]]');

    //選択肢数
    StrList.Add('        n_col = '+ strSelCnt);

    //解答欄１列あたりの行数
    StrList.Add('        n_row = '+ strRowCnt);
    StrList.Add('        margin_top = 0');
    StrList.Add('        margin_bottom = 0');
    StrList.Add('        n_row = n_row + margin_top + margin_bottom');

    //マークの列数・行数の整数倍のサイズになるようリサイズ
    StrList.Add('        img = cv2.resize(img, (n_col*100, n_row*100))');

    //保存して確認
    //StrList.Add('        cv2.imwrite("01_ReSize.png", img)');

    //平滑化の度合い
    StrList.Add('        img = cv2.GaussianBlur(img,(35,35),0)');

    //保存して確認
    //StrList.Add('        cv2.imwrite("02_GaussianBlur.png", img)');

    //二値化の閾値
    //50を閾値として2値化
    //imgはグレースケール画像でなければならない
    //第２引数はしきい値で，
    //画素値を識別するために使用(指定)
    //第３引数は最大値でしきい値以上
    //(指定するフラグ次第では以下)の値を持つ
    //画素に対して割り当てられる値
    //StrList.Add('        ret, img = cv2.threshold(img, 140, 255, cv2.THRESH_BINARY)');

    //大津の二値化で閾値の設定を自動化
    //第１引数には画像データを設定
    //(グレースケール画像でなければならない)
    //第２引数はしきいだが自動計算させるので０(ゼロ)を指定
    //第３引数は0-255の256段階でグレースケール化しているから
    //最大値の255を指定
    StrList.Add('        ret, img = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)');

    //保存して確認
    //StrList.Add('        cv2.imwrite("03_threshold.png", img)');

    //白黒を反転
    StrList.Add('        img = 255 - img');

    //保存して確認(追加)
    StrList.Add('        cv2.imwrite("04_threshold.png", img)');

    //全マークを判定
    StrList.Add('        result = []');
    StrList.Add('        for row in range(margin_top, n_row - margin_bottom):');
    StrList.Add('            tmp_img = img [row*100:(row+1)*100,]');
    StrList.Add('            area_sum = []');
    StrList.Add('            for col in range(n_col):');
    StrList.Add('                area_sum.append(np.sum(tmp_img[:,col*100:(col+1)*100]))');
    StrList.Add('            result.append(area_sum > np.median(area_sum) * 3)');

    //判定結果を出力
    StrList.Add('        for x in range(len(result)):');
    StrList.Add('            res = np.where(result[x]==True)[0]+1');
    StrList.Add('            if len(res)>1:');
    StrList.Add('                var1.Value = "99"');
    StrList.Add('            elif len(res)==1:');
    StrList.Add('                s = str(res)');
    StrList.Add('                var1.Value = s[1]');
    StrList.Add('            else:');
    StrList.Add('                var1.Value = "999"');

    //Execute
    PythonEngine1.ExecStrings(StrList);

    //結果を表示
    Memo1.Lines.Assign(strAnsList);

    //Userへ案内
    MessageDlg('読み取り完了！', mtInformation, [mbOk] , 0);

  finally
    //解放
    StrList.Free;
    strAnsList.Free;
  end;

end;

Pythonから返された計算結果を受け取るため、PythonDelphiVar1のOnSetDataイベントの手続きを作成する。Form上のPythonDelphiVar1をクリックして選択し、オブジェクトインスペクタのOnSetDataイベントの右側をダブルクリックして、コード入力画面で以下の内容を入力する。

procedure TForm1.PythonDelphiVar1SetData(Sender: TObject; Data: Variant);
begin
  //値がセットされたら動的配列に値を追加
  strAnsList.Add(Data);
  intCnt:=intCnt+1;
  Application.ProcessMessages;
end;

上書き保存（Ctrl＋S）して、実行（F9）。次の画像のように、マークシートが正しく読み取り処理されることを確認する。

複数マークを許可する場合には、判定結果を出力する部分のコードを次のように変更する。マークシートの読み取り結果をCSVファイルに出力したり、Excelに書き出したりして利用する場合には、複数回答は99、未回答は999のように処理した方が、後々の処理がラクになる（･･･と思う）。

    //判定結果を出力（複数回答は99、未回答は999で表示）
    {コメント化ここから
    StrList.Add('        for x in range(len(result)):');
    StrList.Add('            res = np.where(result[x]==True)[0]+1');
    StrList.Add('            if len(res)>1:');
    StrList.Add('                var1.Value = "99"');
    StrList.Add('            elif len(res)==1:');
    StrList.Add('                s = str(res)');
    StrList.Add('                var1.Value = s[1]');
    StrList.Add('            else:');
    StrList.Add('                var1.Value = "999"');
    ここまで}

    //判定結果を出力（複数回答の詳細を表示）
    StrList.Add('        for x in range(len(result)):');
    StrList.Add('            res = np.where(result[x]==True)[0]+1');
    StrList.Add('            if len(res)>1:');
    StrList.Add('                var1.Value = str(res)+ '+'"！複数回答！"');
    StrList.Add('            elif len(res)==1:');
    StrList.Add('                s = str(res)');
    StrList.Add('                var1.Value = s[1]');
    StrList.Add('            else:');
    StrList.Add('                var1.Value = " *未回答*"');

PythonEngineが正しく初期化され、Embeddable Pythonが利用できることが確認できたら、このメッセージは必要ないのでコメント化しておく。

procedure TForm1.FormCreate(Sender: TObject);
var
  //Python39-32へのPath
  AppDataDir:string;
begin
  ・・・
  if DirectoryExists(AppDataDir) then
  begin
    //フォルダが存在したときの処理（コメント化）
    //MessageDlg('Embeddable Pythonが利用可能です。',
    //  mtInformation, [mbOk] , 0);
    PythonEngine1.AutoLoad:=True;

５．さらに進化

さまざまな機能を追加したマークシートリーダー
（ファイルの名称を連番で変更／画像の回転／グリッド指示位置と画像の連動／グリッド指示位置を画像上で矩形選択／閾値等各種パラメータの調整と保存機能／音声読み上げ関連機能の搭載／回答チェック機能（空欄＆複数回答対応）／CSV形式でのデータ出力／ExcelBookへのデータ出力／様式の異なるマークシートをテンプレートとして登録して利用可能／抱き合わせ採点の実施機能／共通テスト（数学の様式）に対応等、考えつく限りの機能を搭載／さらに進化します！）

このプログラムでは、「マークシート画像の表示」と、「読み取り処理」の間に何も関連がないが、このプログラムをさらに発展させて、複数枚数の処理を可能にし、読み取り結果を画面上で確認するような機能を追加する際には、マークシート画像の表示はどうしても必要な機能になる。

さらに、画面の左側などに読み込んだマークシートがリスト形式で表示されるようにして、ここから任意のマークシート画像を選んで表示できるような機能も追加するとよいと思う。

読み取り結果も、ここではMemoに表示しているが、CSVやExcelへ出力して利用することを考えると、ここはGridコントロールに変更したい。

Gridコントロール上で選択したデータの該当回答欄に相当する画像が自動的に画面上に表示され、かつ、表示されたマークシート画像上の該当回答欄が矩形で選択され、ユーザーがチェックしやすいGUIにするとなお良いだろう。

また、チェック時にはユーザーがマークシート画像を見ながら確認作業が行えるよう、Gridコントロールの数字をアナウンスしてくれる音声読み上げ機能があると大変便利だ。それから、回答の必要がない、全マークシートが空欄となっている部分は、予め指定することで、チェックから除外できる機能も欲しい。

さらに、スキャナーから読み込んだ画像データを回転させたり、連番で扱いやすい名前に変更したり、様式の異なるマークシートをテンプレートとして登録できるような機能も搭載したい。

より一層ユーザーに優しい、夢に見たようなマークシートリーダーを開発したい。この希望の実現に向けて、日々努力する私でありたい。

Web上に貴重な資料を公開してくださった多くの皆さまに心より深く御礼申し上げます。ほんとうにありがとうございました。

６．著作権表示の記載方法

参考：Python4DelphiのLicenseについて

GitHubのPython4Delphiのダウンロードページには「The project is licensed under the MIT License.」とある。これは「改変・再配布・商用利用・有料販売すべてが自由かつ無料」であること、及び使用するにあたっての必須条件はPython4Delphiの「著作権を表示すること」と「MITライセンスの全文」or 「 MITライセンス全文へのLink」をソフトウェアに記載する、もしくは、別ファイルとして同梱しなさい･･･ということを意味する。

したがってPython4Delphiを利用したプログラムの配布にあたっては、ソフトウェアの中で、次のような著作権表示を行うか、もしくは P4DフォルダのルートにあるLicenseフォルダをプログラムに同梱して配布すればよいことになる。

Python4Delphiを利用した場合の著作権表示の記載例：

Copyright (c) 2018 Dietmar Budelsky, Morgan Martinet, Kiriakos Vlahos
Released under the MIT license
https://opensource.org/licenses/mit-license.php

７．お願いとお断り

【関連記事】

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！ 2025年7月7日
デジタル採点手書きフリーで検索したら、その後 2025年4月20日
デジタル採点　手書き　フリー　で検索したら 2025年4月6日
１０より大きいマークを使うマークシートの作り方 2025年3月8日
ファイル名が連番であることを確認したい！ 2025年3月1日
Python4Delphiが突然、実行できなくなった！ 2025年2月22日
組み合わせ採点を実現したい！ 2024年12月27日
デジタル採点 All in One ! 2024年9月29日
塗りつぶさないマークシート 2024年7月7日
１００選択肢対応マークシートを使用した試験の実施方法 2024年6月28日

How to use Python4Delphi

「PythonForDelphiの使い方（Delphiのプログラム内でPythonを動かす）」

１．Delphiで埋め込みPythonを使う
２．準備
３．ノートPCの電池残量を表示するプログラムを作成
４．PythonEngineのメモリリーク
５．Delphi11のIDEが真っ白になってしまう問題への対応方法
６．著作権表示の記載方法
７．お願いとお断り

こちらで紹介した方法の応用版として、自作のマークシートリーダーの読み取り速度をPython4Delphiで高速化。プログラムのダウンロード（無料）も可能です。もし、よかったら次のリンク先記事もご参照ください。

マークシートリーダー

マークシートリーダーをP4Dで高速化

デジタル採点 All in One !

１．Delphiで埋め込みPythonを使う

ノートPCの電池残量を表示する練習プログラムを、埋め込みPythonを使ってDelphiで書いてみる。
埋め込み用途のembeddable pythonをDelphiで使うには？というテーマで悩んでいらっしゃる方の参考になれば、望外の喜びです。なお、以下の内容はDelphiで開発経験のある方を対象としています。IDEの基本的な操作方法等は省略していますので、予めご了承ください。

２．準備

（１）DelphiにPython4Delphi（P4D）のパッケージを予めインストールしておく。

Setup Python4Delphi

（２）埋め込み用のEmbeddable Pythonをダウンロードし、各種ライブラリをインストール（下記リンク先ではNumpyとOpenCVライブラリをインストール）。

Download Embeddable Python and Install the library

（３）Embeddable PythonにノートPCの電池残量を表示するため、psutilライブラリをインストール（ Embeddable Python のダウンロードと設定方法は上の（２）を参照してください）。

「python -m pip install psutil」と入力してEnterキーを押す

（４）Delphiを起動して「ファイル」→「新規作成」→「Windows VCL アプリケーション」の順にクリックして新しいプロジェクトを準備する。

３．ノートPCの電池残量を表示するプログラムを作成

（１）プロジェクトに名前を付けて保存する
（２）GUIを作成
（３）コンパイル & Python環境をコピー
（４）Python関連のVCLコンポーネントを配置
（５）Python関連のVCLコンポーネントのプロパティを設定
（６）エラー対応（ライブラリパスの確認）
（７）閉じるボタンのコードを書く
（８）FormのCreateでPython39-32の有無を確認する
（９）Messageダイアログを使う
（10）埋め込みPythonと接続する
（11）OnSetDataイベントを利用する
（12）プログラムの完成と動作確認

（１）プロジェクトに名前を付けて保存する

新しいフォルダを作成（名称は任意：ここではBTRC_byP4Dとしている）し、Unit1.pasを保存（Unit1を別名にしてもよいが、名称をメモしておく）。

参考　BTR：Battery（電池）／ C：Charging（充電）／ P4D：PythonForDelphi

つづけて、プロジェクトファイル（Project1.dproj）を同じフォルダに保存。
Project1は別名にしてもよいが、上のpasファイルと同じ名称にしないこと。
また、別名にした場合は、名称を忘れないようにメモしておく。

（２）GUIを作成

画面にVCLコンポーネントを配置してGUIを作る。
Memoを２つ（Memo1とMemo2）、
Buttonを２つ（Button1とButton2）が最低限必要。

DelphiのIDEの基本的な操作方法や、VCLコンポーネントの配置方法は、次のリンク先の解説がわかりやすい。

はじめてのDelphiアプリケーション (VCL Form編) (Delphi プログラミング)
URL：https://www.ipentec.com/document/delphi-first-application-vcl-form-application

※ Formの大きさの変更にMemoの大きさやButtonの表示位置を追随させる方法は、別途解説する予定。

Button1のCaptionプロパティを「実行」に変更。
Button2のCaptionプロパティを「終了」に変更。

Button1のCaptionプロパティを「実行」に変更。 Button2も同様にして「終了」に変更する。

（３）コンパイル & Python環境をコピー

ビルド構成（Debug）のまま、ここで１回コンパイルしてexeを生成。

※ ツールバーの実行（F9）をクリックして実行した場合は、生成されたexeが実行されてFormが表示されるので、表示されたFormを右上の閉じるボタンをクリックして閉じる。

コンパイルに成功すると、BTRC_byP4Dフォルダの中にWin32フォルダが、さらにその下にDebugフォルダがそれぞれ自動的に作成される。このDebugフォルダを開き、別途作成しておいたEnbeddable Pythonの入ったフォルダをコピーして、貼り付ける（下の例では Enbeddable Pythonの入ったフォルダ名をpython39-32としている）。

Embeddable Pythonのダウンロードと各種ライブラリのインストール方法は以下のリンク先を参照してください。

Download Embeddable Python and Install the library

（４）Python関連のVCLコンポーネントを配置

DelphiにPythonのスクリプトを埋め込んで実行するには、PythonForDelphiが必要。
PythonForDelphi（またはPython4Delphi さらに略すと P4D）をDelphiにセットアップする方法は以下のリンク先で解説。

Setup Python4Delphi

（Python4Delphiのパッケージがインストールされた）Delphiのパレットのいちばん下にPython4Delphiの非ビジュアルコンポーネントがあるので、この中から次の３つのコンポーネント

「PythonEngine、PythonGUIInputOutput、PythonDelphiVar」

をForm上にドラッグ＆ドロップ（各非ビジュアルコンポーネントをダブルクリックしてもよい）。

※ 非ビジュアルとは、「実行時に見えなくなる」コンポーネントを意味する。

非ビジュアルコンポーネントは表示しない設定にすることも出来る（忘れっぽい私は常に表示している）。

（５） Python関連のVCLコンポーネントのプロパティを設定

・PythonEngine1のAutoLoadプロパティをFalseに設定

Form上にパレットからPythonEngineコンポーネントをドラッグ＆ドロップすると、名称は自動的に PythonEngine1になる。上の図のようにこれをクリックして選択すると、オブジェクトインスペクタにPythonEngine1のプロパティが表示されるので、その中のAutoLoadプロパティをFalseに変更する（デフォルトTrueに設定されているので、チェックボックスのチェックを外す）。

練習ではなく、本格的にプログラミングする際、私はビジュアルコンポーネントについては、その名称を必ず変更するようにしている。理由はButtonコントールなどは使用数が多く、わかりやすい名前を付けておいた方がプログラミングしやすいからだ。

　例：OKボタンなら、そのNameプロパティを button1→btnOK へ変更

しかし、非ビジュアルコンポーネントの場合は、同じコンポーネントを複数配置することは稀なので、Delphiが自動的に割り振った名前をそのまま利用している。ここでもその例にならって、非ビジュアルコンポーネントの名称は Delphiが自動的に割り振った名前をそのまま利用することにする。

・PythonEngine1のDllNameプロパティは、python39.dllを予め指定（組み込み用のPythonのバージョンに合わせて設定する）。

最新版のPython4Delphiでは「python310.dll」がデフォルト値になっていた。

python39.dllは、上でDebugフォルダ内に張り付けたPython39-32フォルダ内にある。

・PythonEngine1のIOプロパティにはPythonGUIInputOutput1を指定する。

・PythonGUIInputOutput1のOutPutプロパティに「Memo2」のように出力先を指定したくなるが、ここでは敢えて何も設定しない。

・PythonDelphiVar1のVarNameプロパティは、プログラムコードの記述に合わせるため「var1」とする。※var1と入力後、Enterで確定すること！（青く反転表示されるのを確認する）

・この状態で実行（F9）した際に「Python Engineが見つかりません」というようなエラーメッセージが表示される場合は、P4Dのパッケージをインストールした際のライブラリパス設定に誤りがないか、確認する。

画面下のメッセージ欄の表示：[dcc32 致命的エラー] Unit1.pas(7): F2613 ユニット ‘PythonEngine’ が見つかりません。

（６）エラー対応（ライブラリパスの確認）

GitHubから入手したPython4DelphiのフォルダのSourceフォルダ以下にある、このプログラムの動作に必要なファイルへのライブラリパスが正しく設定されていることを確認する。設定されていない場合は、（灰色で表示されている誤ったパスを削除して）ライブラリパスを再設定する。

「ツール」→「オプション」の順にクリックして、次の画面を表示する。

「言語」→「Delphi」→「ライブラリ」とクリックして、赤枠囲みの中をクリック。

ライブラリパスを正しく設定する。

PCを新しくした場合等、再設定する必要があるかもしれないので、
設定内容をメモしておく。

ライブラリパスの設定が完了したら、再度コンパイル（実行：F9）してエラーが発生しないことを確認する。

参考：コンパイルとビルドの違い

・メニューの「プロジェクト」 →「Project1をコンパイル」
　（ショートカットは「Ctrl＋F9」）

前回のビルド以降に変更されたファイルと、それに依存するファイルのみをコンパイルして EXE を生成するが、アプリケーションは起動しない。

・メニューの「プロジェクト」 →「Project1をビルド」
　（ショートカットは「Shift＋F9」）

変更の有無に関わらず、全てのユニットを再コンパイルして EXE を生成するが、アプリケーションは起動しない。ユニット数が多ければ当然それだけ遅くなる。

・実行（ショートカットはF9）

変更されたソースコードをすべてコンパイルする。コンパイルが成功した場合は、アプリケーションを実行するので、そのアプリケーションを IDE でテストできるようになる。

・デバッガを使わずに実行。（ショートカットは「Shift＋Ctrl＋F9」）

変更があったユニットだけをコンパイルしてexeを生成し、アプリケーションを起動する（exe単体での起動と同じ）。

（７）閉じるボタンのコードを書く

Formの「終了」ボタンをダブルクリックすると画面は次のようになる。ここに終了ボタン（Button2）がクリックされた時のProcedure（手続き）を記述する。

procedure TForm1.Button2Click(Sender: TObject);
begin

end;

beginとend;の間に次のように記入する。

procedure TForm1.Button2Click(Sender: TObject);
begin
  //プログラムの終了
  Close;
end;

//は１行をコメント化（コンパイラはコメント部分を無視する）

Closeは、Formを閉じる命令（正確にはメソッドだから方法？）。アプリケーションのメインフォームを閉じると、そのアプリケーションは終了する。
（ここはApplication.TerminateでもOKだが、 Windowsでは、Application.Terminate でアプリケーションを強制終了させた場合には、OnCloseQueryイベントが実行されない仕様になっているとのこと）。← これは不具合ではなく、Windowsの仕様。

もし、アプリケーション終了時（Windowsの終了やログアウト時も含む）に、何らかの終了処理（中止を含む）を行いたい場合は、OnCloseQueryイベントが実行されるCloseを使用する。（今回は行わないがForm生成時に、例えばTStringListをCreateしてプログラム内で利用するような場合には、CreateしてTry文で使用（～Finally ここで解放 End;）の一般的流れが使えないので、 OnCloseQueryイベントもしくはOnDestroyイベントで、TStringList.Freeのようにして確実に解放しなければならない。）

実行（F9）してFormが表示されたら、「終了」ボタンでアプリケーションを終了できることを確認する。

（８）FormのCreateでPython39-32の有無を確認する

FormがCreateされる時に、Embeddable Python（Python39-32 フォルダ）があることを確認し、必要な諸設定を行う。F12を押すとFormとUnitの表示を交互に切り替えることができる。画面をFormに切り替え、アクティブ（Formのどこかをシングルクリック）にし、オブジェクトインスペクタのイベントタブをクリックして、下にスクロールさせ、OnCreateイベントの右の空白部分をダブルクリックする。自動的にUnit画面に表示が切り替わり、下のようにForm.Create手続き部が生成される。

procedure TForm1.FormCreate(Sender: TObject);
begin

end;

Python39-32フォルダのパスを入れる変数を宣言する。procedureとbeginの間にvar（宣言）を入力して、改行＆字下げを行い、文字列型変数AppDataDirを宣言する。必要であればコメントで変数の用途を書いておく。

procedure TForm1.FormCreate(Sender: TObject);
var
  //Python39-32へのPath
  AppDataDir:string;
begin

end;

次に、beginとend;の間にForm.Create手続きで行いたい内容を記述する。

begin

  //Embeddable Pythonの存在の有無を調査
  AppDataDir:=ExtractFilePath(Application.ExeName)+'Python39-32';

  if DirectoryExists(AppDataDir) then
  begin
    //フォルダが存在したときの処理
    MessageDlg('Embeddable Pythonが利用可能です。',
      mtInformation, [mbOk] , 0);
    PythonEngine1.AutoLoad:=True;
    PythonEngine1.IO:=PythonGUIInputOutput1;
    PythonEngine1.DllPath:=AppDataDir;
    PythonEngine1.SetPythonHome(PythonEngine1.DllPath);
    PythonEngine1.LoadDll;
    //PythonDelphiVar1のOnSeDataイベントを利用する
    PythonDelphiVar1.Engine:=PythonEngine1;
    PythonDelphiVar1.VarName:=AnsiString('var1');  //プロパティで直接指定済み
    //初期化
    PythonEngine1.Py_Initialize;
  end else begin
    MessageDlg('Embeddable Pythonが見つかりません！',
      mtInformation, [mbOk] , 0);
    PythonEngine1.AutoLoad:=False;
  end;

end;

Ctrl+Sでコードを上書き保存。保存したら実行（F9）。
ここまでの操作にミスがなければ次のメッセージが表示される。

続けてFormが表示されるので、終了ボタンをクリックして閉じる。
画面下のメッセージ欄に次のヒントが表示されることを確認する。

（９） Messageダイアログを使う

[dcc32 ヒント] Unit1.pas(118): H2443 インライン関数 ‘MessageDlg’ はユニット ‘System.UITypes’ が USES リストで指定されていないため展開されません

ヒントの言う通り、 ‘System.UITypes’ を USES リストで指定する。以下のように、30行目付近の implementation （実装・実現部）宣言と、その下のコンパイラ指令 {$R *.dfm}の間が空白行になっているので、ここに「uses」と「 System.UITypes ;」を記述。なお、System.UITypes の後ろには行末を意味するセミコロン；を半角で入力する。

implementation

{$R *.dfm}

implementation の下に「uses」と入力してEnter ＆字下げ（TABキー）、
で、次の行に「System.UITypes;」を記述。

implementation

uses
  System.UITypes;  // <-入力する

{$R *.dfm}

{$R *.dfm} はコメントではなく、dfmファイルを見つけて実行ファイルにリンクさせるコンパイラ指令（命令）。「不要なコメントである」と勘違いして、消してはいけない。

以上が入力した状態。上書き保存（Ctrl＋S）して、実行（F9）。メッセージにヒントが表示されないことを確認。表示されたらメッセージ欄を確認。確認後、Formを閉じる。

（10）埋め込みPythonと接続する

次に、いよいよ埋め込みPythonと接続する。Unitが表示されている場合はF12キーを押してFormの画面に切り替え、左下の「実行」ボタンをダブルクリックする。表示は自動的に以下のように、Button1Click手続きに切り替わる。

procedure TForm1.Button1Click(Sender: TObject);
begin

end;

初めにPythonのスクリプトを入れる文字列型リストと、Pythonから送られたデータを保存する文字列型リストをローカル変数として、以下のように宣言する。

procedure TForm1.Button1Click(Sender: TObject);
var
  //PythonのScriptを入れる
  strScrList:TStringList;
  //Pythonから送られたデータを保存する
  strAnsList:TStringList;
begin

end;

最初に、Memo1を初期化し、データの入れ物をそれぞれ準備する。

begin

  //初期化
  Memo1.Clear;

  //Scriptを入れるStringList
  strScrList:=TStringList.Create;
  //結果を保存するStringList
  strAnsList:=TStringList.Create;

end;

準備したStringListが処理の最後にきちんと解放されるよう、try文を用いて処理する。
tryと入力してEnterキーを押すと、次の画面のようにfinallyとend;が自動入力される。

begin

  //初期化
  Memo1.Clear;

  //Scriptを入れるStringList
  strScrList:=TStringList.Create;
  //結果を保存するStringList
  strAnsList:=TStringList.Create;

  try

  finally

  end;

end;

StringListの解放処理を先に書いてしまう。これで万一、トラブルが発生しても必ずStringListは処理の最後に解放（メモリが空く）される。

  //Scriptを入れるStringList
  strScrList:=TStringList.Create;
  //結果を保存するStringList
  strAnsList:=TStringList.Create;

  try

  finally
    //StringListの解放
    strAnsList.Free;
    strScrList.Free;
  end;

最後に、バッテリー残量を取得するPython Scriptを文字列型リストへ、１行ずつ書き込んで、Memo1に表示、Python側でMemo1に表示されたスクリプトを実行し、返ってきた結果を文字列型リストに読み込んで、Memo2に表示するコードを記述する。

  try
    //バッテリー残量を取得するPython Script
    strScrList.Add('import psutil');
    //バッテリー残量
    strScrList.Add('btr = psutil.sensors_battery()');
    //バッテリー残量を表示
    strScrList.Add('var1.Value = str("残量：") 
      + str(btr.percent) + str("％")');
    //Scriptを表示
    Memo1.Lines.Assign(strScrList);
    //Execute
    PythonEngine1.ExecStrings(Memo1.Lines);
    //結果を表示
    Memo2.Lines.Assign(strAnsList);
  finally
    //StringListの解放
    strAnsList.Free;
    strScrList.Free;
  end;

入力したら上書き保存（Ctrl＋S）して、実行（F9）する。Formが表示されたら、Form上の「実行」ボタンをクリックする。結果は次のようになる。

Memo1には、意図した通り、StringListに入れたPythonのScritが表示されているが、
Memo2は空欄のままである。

Object Pascalのコードをよく読むとPythonEngineをExecuteしてPythonに電池残量を計算させるところまではOKだが、Pythonが計算した結果を「Delphi側が受け取れていない」ことがわかる。

    //Execute
    PythonEngine1.ExecStrings(Memo1.Lines);

    { ここでPythonからの結果通知を受け取る必要がある }

    //結果を表示
    Memo2.Lines.Assign(strAnsList);

（11） OnSetDataイベントを利用する

では、Pythonからの結果通知を受け取るにはどうしたらいいかというと、残念ながらその処理はこのprocedure内には書けない。

結論から言うと、Pythonの返した結果は、Formに配置したPythonDelphiVar1コンポーネントのOnSetDataイベントで受け取ることができる。その処理を実現するため、プログラムに必要な変更を加える。

まず、実行ボタンがクリックされた時の手続きの冒頭で、「結果を保存するStringList」として「strAnsList」というローカル変数を宣言したが、今、結果は「PythonDelphiVar1のOnSetDataイベントで受け取る」ことにした＝つまり「別の手続きの中で受け取る」ことになるから、この変数をプログラムのあちこちから使える（見える）プライベートメンバー変数（クラス内部でのみ利用可能な変数）に変更することにする。以下、その処理を示す。

まず、 Button1Click手続きでローカル変数として宣言したstrAnsList変数をコメント化する。

procedure TForm1.Button1Click(Sender: TObject);
var
  //PythonのScriptを入れる
  strScrList:TStringList;
  //Pythonから送られたデータを保存する
  //strAnsList:TStringList;  //コメント化してしまう
begin

22行目付近のprivate部に、このクラス内部でのみ利用可能なプライベートメンバー変数として、strAnsList変数を再宣言する。

  private
    { Private 宣言 }
    //Pythonから送られたデータを保存する
    strAnsList:TStringList;
  public
    { Public 宣言 }
  end;

これでstrAnsList変数は、プライベートメンバー（クラス内部でのみ利用）化され、異なる手続きの中でアクセスできるようになった。

続けて、PythonDelphiVar1のOnSetDataイベントの処理を実装する。F12を押して画面をFormの方に切り替えて、PythonDelphiVar1をクリックして選択する。

選択する

画面左下のオブジェクトインスペクタにPythonDelphiVar1が表示されていることを確認して、イベントタブをクリックし、下にスクロールしてOnSetDataイベント部分の右の空白をダブルクリックする。

PythonDelphiVar1SetData手続きが自動的に生成されるので、次のコードを記述する。

procedure TForm1.PythonDelphiVar1SetData(Sender: TObject; Data: Variant);
begin
  //値がセットされたら文字列リストに値を追加
  strAnsList.Add(Data);
  Application.ProcessMessages;
end;

これでPython側からDelphi側へ、計算結果を渡せるようになった。ここでは単純な処理しかしていないので実質不要であるが、例えばループ処理を行って何度も結果が返るなど、より複雑な計算処理をPython側で行わせる場合に、確実に結果を受け取れるよう、 Application.ProcessMessagesを「おまじない」として入れてある。

Application.ProcessMessages メソッドは、「Windows がイベントに応答できるようアプリケーションの実行を一時的に停止」する命令であるとのこと。このメソッドについては下記リンク先の説明が詳しい。

Article: 待ち関数の必要性
URL：http://gumina.sakura.ne.jp/CREATION/OLD/COLUMN/CD1MATI.htm

（12）プログラムの完成と動作確認

これで、最低限の機能だけは組み込んだノートPCの電池の残容量を表示するプログラムの完成である。上書き保存（Ctrl＋S）して、実行（F9）し、結果を確認する。

４． PythonEngineのメモリリーク

参考　PythonEngineのメモリリークが起きた時は･･･

別のプログラムでPythonEngineがメモリリークを起こしたことがある。この問題について、次のようにFormのOnDestroyイベントでFinalize処理を行うよう対応したところ、メモリリークは解消された。備忘録として記しておく。

procedure TFormZZZ.FormDestroy(Sender: TObject);
begin
  //これでメモリーリークは発生しなくなった
  //PythonDLLによって割り当てられたすべてのメモリが解放される
  //旧バージョンのPythonEngineの場合
  //PythonEngine1.Finalize;
  //最新バージョン（2021年12月現在）のPythonEngineの場合
  PythonEngine1.Py_Finalize;
  PythonDelphiVar1.Finalize;
end;

５． Delphi11のIDEが真っ白になってしまう問題への対応方法

参考リンク　Delphi11のIDEが真っ白になってしまう問題への対応方法

RAD Studio 11のプロジェクトファイル(.dproj、.cbproj)をダブルクリックしてIDEを起動し、デバッグ実行すると、IDEの各ウィンドウが白く表示される
URL：上のLinkをクリックしてください。

６．著作権表示の記載方法

参考：Python4DelphiのLicenseについて

Python4Delphiを利用した場合の著作権表示の記載例：

Copyright (c) 2018 Dietmar Budelsky, Morgan Martinet, Kiriakos Vlahos
Released under the MIT license
https://opensource.org/licenses/mit-license.php

７．お願いとお断り

【関連記事】

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！ 2025年7月7日
デジタル採点手書きフリーで検索したら、その後 2025年4月20日
デジタル採点　手書き　フリー　で検索したら 2025年4月6日
ファイル名が連番であることを確認したい！ 2025年3月1日
Python4Delphiが突然、実行できなくなった！ 2025年2月22日
デジタル採点 All in One ! 2024年9月29日
１００選択肢対応マークシートを使用した試験の実施方法 2024年6月28日
１００選択肢に対応したマークシートリーダー 2024年6月23日
無料で使える手書き答案採点補助プログラム 2024年3月30日
マークシートの採点結果通知（個票）及び成績一覧表の作成 2024年3月24日

Download Embeddable Python and Install the library

「埋め込み用Pythonのダウンロードとライブラリのインストール方法」

１．始めに
２．Embeddable Python をダウンロード
３．必要なライブラリをインストールする準備
４．Numpyのインストール
５．OpenCVのインストール
６．単体で動作確認（検証）
７．まとめ
８．お願いとお断り

１．始めに

なぜ、Embeddable（埋め込み用）なのかというと、内部的なデータ処理にPythonのOpenCV ＆ Numpyライブラリを使うと、アプリケーションをより一層高速化できることがわかったから。
それから、Python環境のアップデートとは関係なく、安定動作する実行環境を、PCの操作にあまり詳しくないユーザーに提供できるから。

重要

このような特殊な目的ではなく、学習用にPythonを導入したい場合は、埋め込み用途に配布されている Embeddable Python はお勧めできません！普通にインストーラを使用して、普通のPython環境をPCにセットアップしてください。

もし、PC環境を変更せずに、（持ち運びも可能な）Pythonが実行できる環境を作りたい場合は、WinPythonが便利！ WinPythonならUSBメモリやSDカードにセットアップして、PC環境に変更を加えずに利用可能。なお、この場合は･･･

スタートボタン → 設定 → アプリ → アプリと機能 → その他の設定 → アプリ実行エイリアス → アプリインストーラー（項目のいちばん下）のPythonとPython3をオフ

･･･にしてから、外部メディアにセットアップしたWinPythonを実行。

WinPythonのDL先URL：https://winpython.github.io/

２．Embeddable Python をダウンロード

Embeddable Python は https://www.python.org/downloads/windows/ からダウンロード可能。

上記のサイトに行くと、古い2.X.Xから最新版の3.11.0（テスト用）まで、これまでにリリースされた Embeddable Python すべてがある。どれを選んでよいか、困ってしまう（実際、困った）。だから、使用目的（＆条件）に合わせてダウンロードする Embeddable Python を選択しなければならない。

私の場合、まず Stable Release （安定動作版：様々な動作検証がそれなりに行われたバージョンってこと？）であること。さらに、数値演算用のNumpyライブラリと、コンピュータの眼として利用する画像処理用のOpenCVがインストールできること。最低限、この３つを満たしていればOK！だ。

それから、32 or 64bitバージョンのどちらを選択するか、ちょっと迷ったが、よく考えたら（私が）、Delphi11で設定しているVCLのターゲットプラットフォームは32bitアプリケーション。だから32bitバージョンを選択すべきだと気付く。

あとは･･･新しいのか、ちょっと前のか、すごく古いのか、どれを選べばいいんだろー？？？　2.X.Xはもう既にサポートがないから、3.X.X なのは絶対だけど。。。3.6.X？　3.7.X？　3.8.X？　それとも3.9.X？　最新版は3.10.1があるけどー。

うー。うーー。うーーー。（悩む私）

※ 実はマイナーバージョンごとの違いすらまったくわかってない。

たぶん（根拠無し）、最新版でいいだろー☆（←完全な思い込み）

単純極まりない私は、Stable Release のいちばん上にある

Python 3.10.1 – Dec. 6, 2021 ←これをポチ！しちゃった
Note that Python 3.10.1 cannot be used on Windows 7 or earlier

「Win7より前のOSには使えません」･･･って注意書きしかないし、この時点での私はNumpyが3.10.1に非対応（2021年12月現在）だということを、誰も教えてくれないから当然知らない（調べろ！）し、なにより、普通の人（？）は、最新版が取り敢えず良さそうに思えちゃうものじゃないですか。

3.10.1のダウンロード＆解凍作業完了！　続いてライブラリのインストール。

コマンドプロンプトを開いて･･･。解凍先フォルダへ行って･･･。ラッタッタッタ。

python -m pip install numpy　で、ポチ！

ERROR: Could not build wheels for numpy, which is required to install pyproject.toml-based projects

･･･と、表示され、あっけなく阻止される。なんでー

エラーメッセージの内容をよく読んでみると･･･

setup.py:63: RuntimeWarning: NumPy 1.21.5 may not yet support Python 3.10.

確かに。たいへんよくわかりました。はい。

インストールするライブラリが、どのPythonのマイナーバージョンに対応しているか？なんて、対応状況をあらかじめ調査するなんてこと、まずやるわけない私のようなド素人が（無茶を承知で） Python3.10.1 にNumpyライブラリを強制インストールする凶行に及んでも、ちゃんと阻止してくれるんですね。

できればこういう大事なことは、N○Kの朝と晩の７時の全国放送で毎日しつこくアナウンスするとか、誰もがTopページにしているであろう某サイトのいちばん見やすい場所に広告として日々表示してほしい☆･･･と夜空の星に願いつつ、

「使いたいライブラリがどのバージョンに対応しているか、ダウンロード前にきちんと調べる」という貴重な教訓を得て、ここで初めて検索キーワード「numpy python 対応バージョン」でGoogle先生にお伺いをたてると、以下の情報がヒット！

Python向け科学計算パッケージNumPyの開発チームは、最新版となる「NumPy 1.20.0」を1月30日（現地時間）にリリースした。
「NumPy 1.20.0」はこれまでで最大となるアップデートで、Python 3.7～3.9をサポートし、Python 3.6のサポートは終了している。
１月30日とあるのは2021年のこと。この記事は https://codezine.jp/article/detail/13574 より引用

わかった☆OK これでバージョン3.10.1は除外。とりあえず3.9.Xのどれかにしよう。

もうひとつ、どうしても入れたいのがコンピュータの眼「OpenCV」ライブラリ。そこで、PythonとNumpyとOpenCVの関係について調べてみると･･･

opencv-python 4.5.1.48が最新です。
pythonのバージョンは3.6以上とされていますが、numpyについては特に指定はありません。
pipのバージョンは19.3以上
teratailのPythonに関する質問（https://teratail.com/questions/323063）より引用

わかった☆OK これを近所の３歳児でもわかるように言い換えてみよう。

OpenCVとNumpyは仲がイイ。

ダウンロードするPythonのバージョンは、この情報をもとに 3.9.X の中でいちばん新しい 3.9.9 に決定。

理由は次の通り。

Pythonのバージョンを意味する番号は前から順に、メジャー.マイナー.マイクロのそれぞれを意味するそうで、Pythonのメジャーバージョンは２or３。サポート状況から、これは当然「３」を選択。マイナーバージョンは、これもやはりサポート期限を考えるといちばん長いのは3.9.Xで「2025年10月」までだから、これを根拠に「3.9.X」に決定。で、さらにマイクロバージョンは「バグ修正リリース」に相当し、マイクロバージョン間については、互換性が保証されるとのこと。ならば最もバグが消えているのは「3.9.9」なのかなー。みたいな･･･

Pythonのバージョンによる違いについては、次のサイトの解説が詳しい。

Pythonの複数バージョンの扱い方（Windowsの場合）
URL：https://gammasoft.jp/python/python-version-management/

あらためて気合を入れなおし Embeddable Python3.9.9 のダウンロードを持てる全力を挙げて決行！

（正直ポチ！するだけだけど）

控えめに言えば、Python3.9.9-32bitのEmbeddable Packageを選択してダウンロード。

３．必要なライブラリをインストールする準備

ダウンロードした Package を任意のフォルダに解凍し、ライブラリのインストールに pip が使えるよう、設定を変更（ pythonNN._pthファイルを修正）する。

デスクトップに新しいフォルダーを作成して、そこにDLしたPackageを保存（Zipファイルの大きさはたったの7.3MB！）。

これを解凍すると、

python-3.9.9-embed-win32ができる（大きさは14.0MBとかなり小さい）

python-3.9.9-embed-win32 フォルダを開き、pythonNN._pthファイルを見つけて修正を加える（NNはPythonのバージョンを示す数字）。その方法は下記の通り。

→ バージョン3.9.9をダウンロードしたから、修正するファイルは python39._pth。見つけたらテキストエディタで開いて、いちばん下の行･･･

このナンバーを削除する→ # import site

を、

import site

とコメント解除する。（※ 正確には、削除するのは＃とその後ろの半角スペース）

【補足】
3.9.10では「#import site」となっており、ナンバー#の後ろには「半角スペースがありません」でした！（20220822追記）

コメント解除したら、上書き保存（Ctrl＋S）する。

※ 以前、こんな場面で「上書き保存」ではなく「名前を付けて保存」し、あろうことか、ファイル名が「例：XXXXX._pth.txt」になってしまったコトが･･･

次に、ライブラリのインストールに必要な pip を実行するためのScriptファイル get-pip.py を入手する。get-pip.py は次のリンクからダウンロードできる。ちなみにダウンロードした get-pip.py をテキストエディタで開いたら、内容が知らない言語（もしかして、コレが宇宙語？）で書かれており、驚愕。びっくり。もうあけない。

get-pip.py の入手先はこちら（https://bootstrap.pypa.io/get-pip.py）

で、ダウンロードした get-pip.py を python-3.9.9-embed-win32 フォルダへコピー。これで get-pip.py が使えるので、次に説明する方法で、まずpipをインストール。

ここからはコマンドプロンプトで作業する（PowerShellでは、モジュールエラーとなり、実行出来ないようだ：情報のみ、未検証です）。

スタートボタンを右クリック→ファイル名を指定して実行→「cmd」と入力して「OK」をクリック→コマンドプロンプトが起動→「cd」＋半角スペースを入力→エクスプローラーから「 python-3.9.9-embed-win32 フォルダ」をドラッグ＆ドロップしてEnterキーを押す。

で、画面に表示されている > の後ろに「python get-pip.py」と入力してEnterキーを押す（下図赤のアンダーライン部分）。正しく操作が行われていれば、下の画面のようにpipのダウンロードとインストールが自動的に行われる。

Consider adding this directory to PATH（このディレクトリをPATHに追加することを検討してください）と警告されるが、これは気にしない。Embeddable Python を使う目的そのものが、PATHなんかどこにも通さずに

「好き勝手にPythonを使う」

ことだから。

参考：もし、ここで「’python’ は、内部コマンドまたは外部コマンド、操作可能なプログラムまたはバッチファイルとして認識されていません。」というエラーが出る場合は、コマンドプロンプトの現在位置（カレントディレクトリ）をよく確認すること。Python.exeがある（見える）フォルダじゃないと、>python ～コマンドは使えない。

pipがきちんとインストールされたことを、ここで確認しておく。

python -m pip list と入力してEnter

「python -m pip list」で「python.exe: No module named pip」が返る場合は、 pythonNN._pthファイルの修正（# import siteの前にある記号#（ナンバー）とその後ろの半角スペースを削除して import site だけにするコメント化の解除手続き）が正しく行われていない可能性が高い。
また、複数のライブラリのインストールを行うと、 pythonNN._pthファイルが修正前の状態に戻されてしまうこともあるようだ。要確認。

４．Numpyのインストール

続いて「愛しのNumpy」をインストール。

>python -m pip install numpy と入力してEnter！

警告：Consider adding this directory to PATH （このディレクトリをPATHに追加することを検討してください）は、まったく気にしない。Numpyが入ればいいのだ。わはは*(^_^)*♪

５．OpenCVのインストール

さらに、視力0.01かつ老眼＆緑内障の恐れありと診断（２万ン千円も払ったのにイタいことばかり言いやがって：チ○ショー！「我が愛と哀しみの人間ドック2021年の記録」より抜粋）された私の眼に代わるSecret Weapon、目にも止まらぬ走召高速！でマークシートを読んでくれる機械の眼という意味がほぼない長い前置きを乗り越え、今、怒涛のクライマックス。「OpenCV」ライブラリがいよいよ My PC へ！

サぁイレントナァイ～　ホぉリィナァイ～（さらに意味なし）

>python -m pip install opencv-python と入力してEnter！

注意：「opencv」に続けて「-python」が必要。

念願のOpenCVのインストールについに成功した･･･その日、彼は狂喜乱舞して泣き崩れたという。彼の日記の末尾には「OpenCVよ。永遠なれー」の文字が。

ちなみに、この時点で「Numpy」と「OpenCV」を入れた「python-3.9.9-embed-win32」フォルダの内容は152MB！と他を圧する勢いで巨大化していた。最初は15MB程度しかなかったのに10倍に膨れ上がっている･･･。

なんということか。すでに語るべき言葉を私は持たない。大きな広い美しい心で、この変化をありのままに･･･、そうだ、謙虚に受け止めよう。さぁ深呼吸だ。おぉ空気がうまい。生きてるってことは素晴らしい。

そう言えば、私が書いたDelphiのプログラムをことごとく「ウイルス扱い」して「隔離」しやがる某有名ウイルス対策ソフトも、今日は静かにしてるじゃないか。人間、すべからく、受容することが肝心だ。別にPCの重さがいつの間にか10倍になって、持ち運び困難になったわけではないのだから。

６．単体で動作確認（検証）

作成したEmbeddable Pythonのフォルダ「python-3.9.9-embed-win32」は名前が長く、ちょっと扱いにくいので、フォルダ名をもう少し短く、わかりやすい名前に変更してから、動作検証を行う。

変更前： python-3.9.9-embed-win32 → 変更後：python39-32

フォルダ名の意味：前から順に「Pythonが入っているフォルダで、そのメジャーバージョンは「３」、マイナーバージョンは「９」で、ターゲットプラットフォームは32ビット版だよ」と、全世界のユーザーにやさしくＰＲ（どこかのサイトでこの表記法を見て感動！）。

【動作検証の準備】

上で作成した「python39-32」フォルダと同じ階層に、新しく「psf」という名前のフォルダを作成する。ここにテスト用のScriptファイルや画像データを保存する。

【説明】psf：「P」ythonの「S」criptが入っている「F」older ･･･という意味。

【動作検証用の環境変数設定バッチファイルを作成】

最終的にはDelphiから操作する予定のEmbeddable Pythonだが、ここでは動作検証用のバッチファイルを作成し、これを起動してテスト用のScriptを走らせる。

最初に環境変数をセットするバッチファイルを作成する（バッチファイルの作成に関しては、下記参考リンク先：「Windowsでpythonを使う/配布する時に便利！Python embeddable package使い方」に大変詳しい解説があります。作成した方に心から感謝 m(__)m ）。

以下の３行をテキストエディタに入力（コピペ）し、文字コードはUTF-8を指定して「setmyenv.bat」という名前を付けて、上の図の「新しいフォルダー」に保存する。

SET DP0=%~dp0
SET PATH=%DP0%\python39-32;%PATH%
SET PYTHON_PATH=%PYTHON_PATH%;%PYTHON_PATH%\Scripts

１行目で、バッチファイルのあるフォルダをカレントディレクトリに指定
２行目で、PATHにEmbeddable Pythonを入れたフォルダへのパスを設定
３行目で、Python.exeとpip.exeへのパスを設定

【動作検証用のスクリプト実行バッチファイルを作成】

続いてScriptを実行するためのバッチファイルを作成する。以下の５行をテキストエディタに入力（コピペ）し、文字コードはUTF-8を指定して「python_script.bat」という名前を付けて「新しいフォルダー」に保存する。

@echo off
cd /D %~dp0
call setmyenv.bat
cd psf
cmd

１行目は、コマンドプロンプトの画面表示を抑制して見やすくする
２行目は、バッチファイルのあるフォルダをカレントディレクトリに指定
３行目は、環境変数設定用バッチファイルを内部的に呼び出して実行
４行目で、画面に表示するディレクトリへ移動
５行目は、コマンドプロンプトを表示する

【検証用スクリプトを作成】

Embeddable PythonにインストールしたNumpyとOpenCVをインポートして動作する検証用のScriptを作成する。以下の内容をテキストエディタに入力（コピペ）し、文字コードはUTF-8を指定して「test.py」という名前を付けて「psf」フォルダーに保存する。

import numpy as np
import cv2

img = cv2.imread("test.jpg")
print(type(img))   # Numpy配列に画像データが読み込まれたことを確認
print(img.shape)   # OpenCVが読んだ画像情報（縦横画素数他）を表示

【検証用画像を用意】

任意のJpeg形式の画像を「test.jpg」という名前で「psf」フォルダーに用意する。画像ファイル名に日本語は使えないことに注意する（OpenCVの読み書きコマンドは日本語に対応していないため、日本語が混じっているとエラーになる）。この問題への対応方法は下記参考リンクをご参照ください。

【検証】

（１）「python_script.bat」をダブルクリックしてコマンドプロンプトを起動。

（２）赤で示した下線部に「python test.py」と入力してEnterキーを押す。

黄色の枠内に結果より正しく動作したことがわかる。
<class ‘numpy.ndarray’>：データ形式はNumpyの配列、
(284, 283, 3)は、縦・横の画素数とチャンネル数を示す。

【参考URL】

Windowsでpythonを使う/配布する時に便利！Python embeddable package使い方
URL：https://hituji-ws.com/code/python/python-emb-usage/

Python OpenCV の cv2.imread 及び cv2.imwrite で日本語を含むファイルパスを取り扱う際の問題への対処について
URL：https://qiita.com/SKYS/items/cbde3775e2143cad7455

WindowsでPython3.7の実行環境を手早く作る方法
URL：https://qiita.com/hirohiro77/items/377dfc0a264acb3db222

７．まとめ

（１）使用目的や使用条件、必要なライブラリのインストール上の制約（どのバージョンのPythonに対応しているか）、何bitのアプリケーションに埋め込むのか等、事前に必要事項を十分調査した上でダウンロードするEmbeddable Pythonのバージョンを決める。

（２）ライブラリのインストールは必ず「Python -m」を付ける。→ 付けないとモジュール参照パスの指定等に問題が発生（構成を壊してしまうとの情報あり：参考リンク「WindowsでPython3.7の実行環境を手早く作る方法」を参照）するようだ。

Python -m pip install （ライブラリ名）

（３）必要なライブラリをインストール後、実際にそれらをimportして動くPython Script をEmbeddable Pythonで動かし、確実に動作することを確認する。Delphiに埋め込んでから余計なトラブルに悩まされないよう、ここで必ず単体で動作することを確かめておく。

８．お願いとお断り

【関連記事】

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！ 2025年7月7日
デジタル採点手書きフリーで検索したら、その後 2025年4月20日
デジタル採点　手書き　フリー　で検索したら 2025年4月6日
ファイル名が連番であることを確認したい！ 2025年3月1日
Python4Delphiが突然、実行できなくなった！ 2025年2月22日
デジタル採点 All in One ! 2024年9月29日
１００選択肢対応マークシートを使用した試験の実施方法 2024年6月28日
１００選択肢に対応したマークシートリーダー 2024年6月23日
無料で使える手書き答案採点補助プログラム 2024年3月30日
マークシートの採点結果通知（個票）及び成績一覧表の作成 2024年3月24日

Delphi & Embeddable Python

「なぜ Delphi & Embeddable Python なのか？」

自分ひとりで使うにはPythonはとても便利だ。カプセル化してある高機能なライブラリのおかげで、わずか数行Scriptを書くだけで、とんでもない処理が誰にでも簡単に実現できる。

必要な大抵の処理は、自分で書かなくても、どこかの優秀な方が作ったサンプルが、Web上のあちこちで公開されているから、ほとんどすべてそれで間に合ってしまう。だから、Pythonに関する限り、自分で書くというよりは、誰かが書いたものを探している時間の方が多い･･･というのは、私だけではないだろう。

それらを写経して、切ったり、貼ったりして業務をこなす。便利であること、この上ない。ラクをしたその分だけ、プログラミングする楽しさや喜びが失われたような、そんな気がすることもあるが･･･。

ただ、他人様に使っていただくモノについては、これが当てはまらない。

「マニュアルを読まなければ使えないようなプログラムは、ダメなプログラムだ。」･･･という、もはや信念と化した、狂気に近い思い込みが私にはある。

「マニュアルを読まなくても使えるプログラム」

それを実現するのがGUIなのだが、簡単・高速に、そのインターフェイスを作る機能は残念ながらPythonにはない。tkinterやPyQtを試したこともあったけど、Delphiのようにはいかなかった。直感的な操作という点で、どうしてもPythonで使えるGUI環境作成ツールはどれもこれもDelphiのそれに見劣りする（･･･と私は思う）。

唯一、2018年から開発が始まったというPySimpleGUIだけは、ちょっと違ったが。

さらに、実行形式のexeファイルにする作業もPythonだと困ることが多い。以前、業務で使用するプログラムをPythonで書き、exe化したら何と300MBを超える巨大なexeができちゃった･･･ことがある。ちゃんと動いたけど。必要なライブラリを全部！詰め込んだから、おなかいっぱいになっちゃった･･･んだろう。たぶん。

ところで逆に、Delphiで業務で使用するマークシートリーダーを開発した際、Delphiから利用できるOpenCVライブラリを使ったのだが、100枚読み取るのに４～５分を要した。読み取るA4横のマークシートは１枚が「１行あたりマーク数16個×25行×３列」という仕様（これは必須）なので、１枚あたり判定必要数はなんと1200！で、これが100枚あるとすると合計12万！

PCは、マークされている場所だけ読み取る･･･なんてヒト並みの芸当は絶対にできないから、白紙のマークシートであっても地道に１個１個･･･１枚についてきちんと1200回、白・黒の判定を繰り返す（実際の処理は、スキャナーで読み取ったマークシート画像にゴミ取り用のガウシアンぼかしをかけてから、ある閾値で二値化して、白黒反転させ、１行ずつ元画像から切り出して、さらにその画像を１行あたりのマーク数で細かく均等に分割して、１枚について1200個生成される画像１つ１つについて画素が白の部分の面積を計算し、白面積が最も大きい画像をマークありぃ！と判定している）。

私なら、１枚でやめます。･･･ってか、１行分でも多分無理です。

読み取りに「５分」かかったとすると、５分は300秒。12万個のマークを300秒で読むから、１秒あたりの読み取りマーク数は400個。１枚に３列（1200個）あるから１列１秒、１枚３秒で読んでおり、ヒトがそれをやるのに比べれば、これでも十分に高速なのだが･･･。

ところがPythonで同じ処理を書いてみたら、速いのだ。コレが･･･。

１枚250ms以下で読み取ってしまう。処理の流れはどちらも同じ（どちらも書いたのは私）だから、Python環境での処理速度は、Delphi環境のそれの12倍も速いことになる･･･。100枚を30秒未満で処理できる実力。これをどうにかして生かしたい。

そんな時、Embeddable Python というモノが存在することを、私は知ってしまったのだ。

Python Embeddableとは、超軽量なPythonの実行環境でファイルサイズがとても小さく、Windowsのシステムを汚さずに環境構築ができ、配布するのも簡単という特徴があります。
Webエンジニアの仕事見聞録（https://engineer-milione.com/programming/python-embeddable.html）より引用

Delphiで創ったコレが･･･

マークシートリーダー

拙作マークシートリーダーは上記リンク先ページからダウンロードできます。

PythonのOpenCVという視力を得たなら･･･どういうコトになるか？と思うと･･･

年甲斐もなく、ドキドキしてくるじゃありませんか！皆さん

まとめ

（１）DelphiはGUI環境を簡単・高速に作成できる。

（２）Pythonには強力無比の数値演算ライブラリがある。

（３）DelphiでGUIを作成し、内部的な演算処理はPythonで実行。

（４）それを可能にするのがEmbeddable Python

（５）誰が言ったか知らんけど、

為せば成る！

俺はやるぞ！

お願いとお断り

【関連記事】

手書き答案の「デジタル採点補助プログラム」のつもりで作った僕のAC_Reader に自動採点機能みたいなモノを搭載しました！ 2025年7月7日
デジタル採点手書きフリーで検索したら、その後 2025年4月20日
デジタル採点　手書き　フリー　で検索したら 2025年4月6日
１０より大きいマークを使うマークシートの作り方 2025年3月8日
ファイル名が連番であることを確認したい！ 2025年3月1日
Python4Delphiが突然、実行できなくなった！ 2025年2月22日
組み合わせ採点を実現したい！ 2024年12月27日
デジタル採点 All in One ! 2024年9月29日
塗りつぶさないマークシート 2024年7月7日
１００選択肢対応マークシートを使用した試験の実施方法 2024年6月28日

【もくじ】

【注意事項】

【追記_20250823】

【追記_20250825】

【追記_20250826】

【追記_20250924】

１．論より証拠

２．自動採点機能の使い方

【採点の準備】

【採点設定ファイルとフォルダの関係】

【採点方法】

【ここから自動採点の実行方法の説明です】

【修正が必要な場合】

【採点結果の保存方法】

３．推論用画像データの確認

４．プログラムのダウンロード

５．お願いとお断り

追記_返却用答案の印刷方法について

【もくじ】

１．さらに勉強した理由

２．HOGを知る

３．気分は「写経」

追記_20250421

もっとラクできたかな･･･

別の意味と価値がある

まぁ、全部をまとめて言えば･･･

人生は必ず ± ０になるということでしょうか？

４．今後の抱負

５．まとめ

６．お願いとお断り

正直。うれしいより先に

やばい！

・・・と、思いました。

【もくじ】

１．32ビット版で自動採点機能を搭載できないか？

２．Tesseract-OCR を使う

３．scikit_learnを使う

(1) Embeddable Python へのインストール

scikit-learn です！

(2) 学習モデルを作成して認識テスト

うぎゃ！Zoräth ✷ fel∅, ∞’ka selenïv! ⧖ Trål’xon que！

(T▽T;) やっちまったぁ！！

４．とんでもない認識結果に驚愕する

これなら手書き文字認識に十分、使えるのではないでしょうか？

さぁ AC_Reader の改造だ！

５．まとめ

６．お願いとお断り

プログラムのダウンロード（ZIPファイル）

【心からのお詫び】

【追記_20250825】

【追記_20250922】

【もくじの前書き】

今回の記事では、採点プログラムそれぞれについて、ダウンロードしていただいたZIPファイルを展開すればすぐに試せる簡単な試用方法をご紹介しています。

実際の試験においては、スキャナーを使用してマークシートや手書き答案の画像化処理を行ったり、専用プログラムを使用して、マークシートや手書き答案の解答欄の座標を取得する等、採点の事前準備作業が必要です。

【もくじ】

１．マークシートの読み取り

重要 数学採点用途で使用される場合は、当Blogの過去記事「マークシートリーダーを数学用に設定」にあります使用方法を必ずご確認ください。

２．手書き答案のデジタル採点

３．マークシートと手書きを併用した試験のデジタル採点

４．採点結果通知の作成

ReportCard_2024の使い方

５．お願いとお断り

追記（20250702）

【もくじ】

追記（20240929）

追記（20250702）

１．事前の準備と受験者への注意事項

２．スキャナーでマークシートをスキャンしてJpeg画像に変換

３．指定のフォルダ内にフォルダを作成してスキャンした画像をコピー

４．採点専用画像に変換

５．テンプレートとして登録

【重要】複数マークを許可する場合は「複数マークによる採点を実施」チェックボックスをクリックして、チェックが入った状態 にしてください！！

GUIのデザインが悪いためか、作った本人でも！ この設定の操作を時々忘れます。複数選択可能なマークシートのテンプレート設定を行う場合は、くれぐれも注意してください。

【重要】この作業にマーク読み取りの成否がかかっています！くれぐれも慎重に、正確に、作業してください。

６．マーク読み取りを実行

【重要】二値化閾値の修正方法（20240707追加）

「塗りつぶす」方式でなく、より簡易な「線を引く」方式でマークするシートを用いて行った読み取りテストの例

７．マーク読み取り結果のチェック方法

８．CSV形式で出力

９．採点結果通知シートの作成方法

人生は必ず ± ０になる
ということでしょうか？

これなら手書き文字認識に
十分、使えるのでは
ないでしょうか？

重要　数学採点用途で使用される場合は、当Blogの過去記事「マークシートリーダーを数学用に設定」にあります使用方法を必ずご確認ください。

【重要】
複数マークを許可する場合は「複数マークによる採点を実施」チェックボックスをクリックして、チェックが入った状態にしてください！！

GUIのデザインが悪いためか、作った本人でも！この設定の操作を時々忘れます。複数選択可能なマークシートのテンプレート設定を行う場合は、くれぐれも注意してください。

【重要】
この作業にマーク読み取りの成否がかかっています！
くれぐれも慎重に、正確に、作業してください。

追記　改良したプログラムに更新しました（20240625）

塗りつぶし形式のマークシートは、解答に時間がかかります！
「塗りつぶさないマークシート」の改良版が上記リンク先からダウンロードできます。こちらもあわせてお試しください。

重要　白黒の二値化画像としてスキャンしないでください。

重要　スキャンした画像は、必ず「ScanData」フォルダ内にフォルダを作成し、保存してください。

重要　ScanDataフォルダ内のフォルダに階層構造を作らないでください。

重要　採点用画像には、必ずこの画像変換プログラムが生成したJpeg画像を使ってください。それ以外の方法で作成した画像は使用できません！

重要　ProcDataフォルダ以外の場所は、作業フォルダに出来ません！

重要　実際に試験で使用した解答用紙の画像を使用する

重要　採点作業の名称にはクラス名を入れないでください。

重要　RectangleDetector.exeを直接起動しないでください

重要　矩形検出機能はAC_Readerから呼び出して使ってください

重要　ここではフォルダではなく、ファイルを選択します。

重要　実際の試験で使用した解答用紙の画像で作業します。

参考　横書き答案の場合、解答欄矩形の座標はｘ軸方向については左から右へ、Y軸方向については上から下へという順番で読み取ります。

参考　縦書き答案の場合、解答欄矩形の座標はｘ軸方向については右から左へ、Y軸方向については上から下へという順番で読み取ります。

注意　「追加中」状態で作業しないとエラーが発生します！

重要　横書き答案の採点時のみに利用できる機能です。

重要　「解答欄の高さの最小値を超えない高さ」で範囲指定してください。